ISO 639

För lista över koder, komplett för ISO 639-1, -2 och -5, se Lista över språkkoder i ISO 639.

ISO 639 är en internationell standard för språkkoder utgiven av Internationella standardiseringsorganisationen, som anger 2–3 bokstäver långa koder för namnen på världens språk. Genom att ersätta språkens namn är koderna användbara i många sammanhang. De används för att på ett otvetydigt och språkoberoende sätt kunna hänvisa till olika språk i biblioteksregister, webbsidor, och i många sammanhang där det förekommer informationshantering på olika språk, inklusive för datoriserade system.^[1]

Språkkoder skall inte förväxlas med landskoder i ISO 3166, eller toppdomän i domännamn på Internet, som syftar till att identifiera enskilda länder. Till exempel är landskoden för Sverige enligt ISO 3166 ”SE”, medan språkkoden för svenska språket enligt ISO 639-1 är ”sv”. Wikipedias olika språkversioner har webbadresser vars första del i stort sett följer ISO 639-1.

Standarden

Standarden ges ut i fem^[1] delar, som revideras individuellt. Det är också olika organisationer som är registeransvariga för de olika delarna, och som har ansvaret för granskning och uppdatering.^[2] De har dock gemensamt att de alla har namn på två av ISO:s tre officiella språk^[3] som följer samma mönster:

På engelska: ISO 639-n:yyyy Codes for the representation of names of languages — Part n: ...
På franska: ISO 639-n:yyyy Codes pour la représentation des noms de langue — Partie n: ...

Standard	Deltitel på engelska och franska (kursivt)	Beskrivning	Ansvarigt institut	Senaste utgåva	Senast granskad
ISO 639-1:2002	Part 1: Alpha-2 code^[4] Partie 1: Code alpha-2^[5]	Koder med två bokstäver – Ursprungligen framtagna med hänsyn till terminologi, lexikografi och lingvistik, men är idag flitigt använda även i andra sammanhang.^[4]	Austrian Standards International^[2]^[6]	2002-07^[4]	Senast granskad	2019^[4]
ISO 639-2:1998	Part 2: Alpha-3 code^[7] Partie 2: Code alpha-3^[8]	Koder med tre bokstäver för språken i del 1 samt ytterligare många språk.^[9] Den innehåller dessutom en del språkgrupper och språkfamiljer.^[10] Vissa språk i standarden har två koder – en för bibliografiskt syfte och en för terminologi.^[9]	Library of Congress^[2]	1998-11^[7]	2021^[7]
ISO 639-3:2007	Part 3: Alpha-3 code for comprehensive coverage of languages^[11] Partie 3: Code alpha-3 pour un traitement exhaustif des langues^[12]	Koder med tre bokstäver för i princip alla språk som talas eller har talats, oavsett om de saknar skriftspråk. Skall i princip täcka alla kända språk, oavsett hur stora de är, eller om de talas eller är utdöda.^[11]^[13]	SIL International^[2]	2007-02^[11]	2021^[11]
ISO 639-4:2010	Part 4: General principles of coding of the representation of names of languages and related entities, and application guidelines^[14] Principes généraux pour le codage de la représentation des noms de langue et d'entités connexes, et lignes directrices pour la mise en oeuvre^[15]	Riktlinjer och allmänna principer för språkkodning.^[14]	ISO/TC 37/SC 2 (ISO)^[14]	2010-07^[14]	2016^[14]
ISO 639-5:2008	Part 5: Alpha-3 code for language families and groups^[16] Partie 5: Code alpha-3 pour les familles de langues et groupes de langues^[17]	Koder med tre bokstäver för levande och utdöda språkfamiljer och geografiskt grupperade språkgrupper.^[16]^[13]	Library of Congress^[10]	2008-05^[16]	2022^[16]

Under perioden 2009–2014 fanns det även en sjätte del av standarden, med fyrställiga bokstavskoder, men denna del befanns inte fylla någon funktion. Den var dessutom svår att utveckla och underhålla, så den drogs tillbaka.^[18]

Om språkfamiljer och språkgrupper

Språkfamiljer och språkgrupper finns delvis med redan i del 2. Den listan är dock begränsad, och är bara med i syfte att kunna ange språk som inte har någon egen kod.^[19] I del 5 finns betydligt fler språkfamiljer och -grupper med, och syftet är att vara, eller bli, heltäckande för levande och döda språkgrupper och -familjer.^[16] Den ansvariga institutionen, Library of Congress, tar därför emot ansökningar om revideringar eller tillägg, och uppdaterar standarden efter hand.^[19]

Notera dock att syftet med standarden är att ange koder för språkens, språkvarieteternas och språkfamiljernas namn, inte att klassificera språken vetenskapligt. Även om del 5 innehåller ett förslag på hierarki inom språkfamiljerna, så är detta förslag endast en antydan, inte en fastslagen del av standarden. Det finns inte heller någon koppling av enstaka språk till någon av familjerna i standarden.^[19] Syftet är snarare att vara ett hjälpmedel för forskningssamhället, och för registrering av språk.^[20]

Makrospråk

I ISO 639-3 definieras många koder för språk som i ISO 639-1 och ISO 639-2 är samlade under en gemensam kod. Delstandarden definierar därför begreppet makrospråk för ett språk vars varieteter i olika kontexter antingen kan ses som egna språk, eller som en varietet av ett makrospråk.^[21] Till exempel är det i vissa sammanhang praktiskt att hantera alla varieteter av arabiska som ett språk (ISO 639-1: ar). I andra sammanhang är det viktigt att skilja på tourkou och hassaniyya, eller tunisisk arabiska och irakisk arabiska.

Redan i ISO 639-1 och ISO 639-2 förekommer vissa makrospråk.^[22] Till exempel förekommer för norska följande beteckningar:^[23]

Makrospråk			Språkvarietet
Språk	ISO 639-1	ISO 639-2	Språk	ISO 639-1	ISO 639-2
Norska	no	nor	Nynorska	nn	nno
Norska	no	nor	Bokmål	nb	nob

Specialkoder och reserverade kodpunkter

ISO 639-2 och ISO 639-3 innehåller fyra stycken koder med speciell funktion: mis – Övrigt språk (kod saknas); mul – Flerspråkigt; und – Odefinierat språk; och zxx – Icke-språkligt.^[24] Koderna används bland annat i bibliotekskataloger för att klassificera medium som saknar språkligt innehåll, flerspråkiga verk, och verk på språk som det inte har definierats någon kod för.^[25] ISO 639-1 saknar motsvarande koder.^[24]

Del 2 och 3 har också reserverat ett antal koder för lokalt bruk. De 520 koderna qaa–qtz är garanterade att aldrig definieras, så att de kan utnyttjas på ett sätt som användare behöver. De skall dock aldrig finnas med vid delning av data till andra användare, då detta motverkar syftet med dem. Del 1 har inga reserverade koder på samma sätt, men qa–qt är idag ounyttjade.^[24]

Hierarkier

Del 5, standarden för språkfamiljer och språkgrupper, definierar också ett sätt att ange att ett språk eller en familj eller grupp tillhör en viss angiven familj eller grupp. Denna hierarkiska ordning för släktskaper eller grupptillhörigheter anges i standarden med den större gruppen före det språk eller den familj som tillhör gruppen. Nivåerna avskiljs med kolon.^[26]

Till exempel:

Sydsamiska är ett samiskt språk, en grupp av finsk-ugriska språk inom den uraliska språkfamiljen.

Anges som:

urj : fiu : smi : sma

Hierarkin i sig anger inte nödvändigtvis släktskap, så "cau : ccs : kat" behöver inte betyda att författaren avser att georgiska tillhör familjen kaukasiska språk, bara att kartvelska språk tillhör den gruppen, till exempel genom geografisk närhet eller språkförbund.

Användning

Standarden används inom många områden där registrering av språk förekommer. I Sverige används den bland annat av bibliotekskatalogen Libris (ISO 639-2^[a]).^[25] och SCB (ISO 639-3) för statistik om undervisning i språk och hemspråk, och för Sveriges nationella minoritetsspråk.^[27]

För internetorganisationen IETF:s språkkoder, som är baserade bland annat på ISO 639 (del 1, 2, 3),^[28] kan en språkkod från ISO 639 kombineras med en landskod från ISO 3166 för att specificera en lokal variant av ett språk, exempelvis ”fr-CH” för språket franska i landet Schweiz, om behovet finns att skilja det från franska i Frankrike (”fr-FR”) eller Kanada (”fr-CA”). I detta fall kan en språkkod även kombineras med en skriptkod från ISO 15924 för att för skriftspråk ange vilket skriftsystem som används. Detta används främst för språk som ofta skrivs i olika skriftsystem, till exempel serbiska, som alternativt skrivs med latinska bokstäver (”sr-Latn”) eller med kyrilliska bokstäver (”sr-Cyrl”).^[28]

Eftersom även World Wide Web Consortium använder ISO 639-1 i standarden HTML så är den oerhört central för språkidentifiering av sidor på internet.^[29]

Omfattning och omfång

ISO 639-3 delar in språkkoderna i klasser (engelska: scope) efter kodens funktion, som individuellt språk, makrospråk eller specialkod.^[30] Till dessa klasser tillkommer ISO 639-5 med språkgrupper och språkfamiljer. Eftersom koderna i del 2 har en motsvarighet antingen i del 3 eller 5 så kan även de klassificeras enligt ovanstående schema. Detsamma gäller koderna i del 1, som definierar en delmängd av koderna i del 2.

Antalet koder varierar, främst för att nya koder tillkommer i del 3.^[31] Enligt den 2022 aktuella datan i de registeransvariga institutionernas databaser för del 2,^[23] del 3,^[30] och del 5^[32] så är följande antal koder definierade:

Klass	ISO 639-1	ISO 639-2	ISO 639-3	ISO 639-5	Kommentar
Individuellt språk	149	359	7 844		Indelning enligt ISO 639-3
Makrospråk	34	58	62
Specialkoder		4	4
Språkgrupper	1	65		115	Inklusive språkfamiljer
Summa	184	486	7 910	115
Reserverade koder		520	659		Koder specifika för ISO 639-2 (B) och ISO 639-5 är reserverade i ISO 639-3
Alternativa koder		20			De koder som är unika för ISO 6339-2 (B)
Utfasade koder	6	4	368		Serbokroatiska är utfasad i del 1, men kvar i del 3 (makrospråk).
Outnyttjade koder	486	16 641	8 639	17 461	Koder som hittills inte har blivit tilldelade språk
Totalt	676	17 576	17 576	17 576

Koder från ISO 639-1

Se även: Lista över språkkoder i ISO 639

Kod	Språk
aa	afar
ab	abchaziska
ae	avestiska
af	afrikaans
ak	akan
am	amhariska
an	aragonska
ar	arabiska
as	assamesiska
av	avariska
ay	aymara
az	azerbajdzjanska
ba	basjkiriska
be	belarusiska
bg	bulgariska
bh	bihari
bi	bislama
bm	bambara
bn	bengali
bo	tibetanska
br	bretonska
bs	bosniska
ca	katalanska
ce	tjetjenska
ch	chamorro
co	korsikanska
cr	cree
cs	tjeckiska
cu	fornkyrkoslaviska
cv	tjuvasjiska
cy	kymriska
da	danska
de	tyska
dv	divehi
dz	dzongkha
ee	ewe
el	grekiska

Kod	Språk
en	engelska
eo	esperanto
es	spanska
et	estniska
eu	baskiska
fa	persiska
ff	fula
fi	finska
fj	fijianska
fo	färöiska
fr	franska
fy	frisiska
ga	iriska
gd	gaeliska
gl	galiciska
gn	guarani
gu	gujarati
gv	manx
ha	hausa
he	hebreiska
hi	hindi
ho	hirimotu
hr	kroatiska
ht	haitiska
hu	ungerska
hy	armeniska
hz	herero
ia	interlingua
id	indonesiska
ie	interlingue
ig	igbo (ibo)
ii	sichuan yi^[b]
ik	iñupiaq
io	ido
is	isländska
it	italienska
iu	inuktitut

Kod	Språk
ja	japanska
jv	javanesiska
ka	georgiska
kg	kikongo
ki	kikuyu
kj	kuanyama
kk	kazakiska
kl	grönländska
km	khmer
kn	kannada
ko	koreanska
kr	kanuri
ks	kashmiri
ku	kurdiska
kv	komi
kw	korniska
ky	kirgiziska
la	latin
lb	luxemburgiska
lg	luganda
li	limburgiska
ln	lingala
lo	lao
lt	litauiska
lu	luba-katanga^[c]
lv	lettiska
mg	malagassiska
mh	marshallesiska
mi	maori
mk	makedonska
ml	malayalam
mn	mongoliska
mr	marathi
ms	malajiska
mt	maltesiska
my	burmesiska

Kod	Språk
na	nauruanska
nb	bokmål
nd	nordndebele
ne	nepali
ng	ndonga
nl	nederländska
nn	nynorska
no	norska
nr	sydndebele
nv	navajo
ny	nyanja
oc	occitanska
oj	ojibwa
om	oromo
or	oriya
os	ossetiska
pa	punjabi
pi	pali
pl	polska
ps	pashto
pt	portugisiska
qu	quechua
rm	rätoromanska
rn	kirundi
ro	rumänska
ru	ryska
rw	kinyarwanda
sa	sanskrit
sc	sardiska
sd	sindhi
se	nordsamiska
sg	sango
si	singalesiska
sk	slovakiska
sl	slovenska
sm	samoanska
sn	shona

Kod	Språk
so	somaliska
sq	albanska
sr	serbiska
ss	siswati
st	sesotho
su	sundanesiska
sv	svenska
sw	swahili
ta	tamil
te	telugu
tg	tadzjikiska
th	thai
ti	tigrinska
tk	turkmenska
tl	tagalog
tn	setswana
to	tonganska
tr	turkiska
ts	tsonga
tt	tatariska
tw	twi^[d]
ty	tahitiska
ug	uiguriska
uk	ukrainska
ur	urdu
uz	uzbekiska
ve	venda
vi	vietnamesiska
vo	volapük
wa	vallonska
wo	wolof
xh	xhosa
yi	jiddisch
yo	yoruba
za	zhuang
zh	kinesiska
zu	zulu

Se även

Lista över språkkoder i ISO 639
Systematisk lista över språk
ISO 15924 – Anger koder för namn på skriftsystem.
ISO 3166 – Anger koder för namn på länder.

Anmärkningar

Källor

För listan över ISO 639-1-koder

Listan är senast uppdaterad i juni 2022, med data från följande källor:

ISO 639-2 Registration Authority (21 december 2017). ”Codes for the Representation of Names of Languages – Codes arranged alphabetically by alpha-3/ISO 639-2 Code” (på engelska). ISO 639-2. Library of Congress. https://www.loc.gov/standards/iso639-2/php/code_list.php. Läst 20 juni 2022.
ISO 639-3 Registration Authority (2022). ”ISO 639-3 Downloads” (på engelska). ISO 639-3. SIL International. https://iso639-3.sil.org/code_tables/download_tables. Läst 20 juni 2022.
ISO 639-3 Registration Authority (2022). ”ISO 639 Code Tables” (på engelska). ISO 639-3. SIL International. https://iso639-3.sil.org/code_tables/639/data. Läst 20 juni 2022.
ISO 639-5 Registration Authority (11 februari 2013). ”Codes for the Representation of Names of Languages – Part 5: Alpha-3 code for language families and groups – ISO 639-5 codes ordered by Identifier” (på engelska). ISO 639-5. Library of Congress. https://www.loc.gov/standards/iso639-5/id.php. Läst 20 juni 2022.

Fotnoter

Externa länkar

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[a]

[27]

[28]

[29]

[30]

[31]

[32]

[b]

[c]

[d]

Search