ISO 639

internationell standard för språkkoder
För lista över koder, komplett för ISO 639-1, -2 och -5, se Lista över språkkoder i ISO 639.

ISO 639 är en internationell standard för språkkoder utgiven av Internationella standardiseringsorganisationen, som anger 2–3 bokstäver långa koder för namnen på världens språk. Genom att ersätta språkens namn är koderna användbara i många sammanhang. De används för att på ett otvetydigt och språkoberoende sätt kunna hänvisa till olika språk i biblioteksregister, webbsidor, och i många sammanhang där det förekommer informationshantering på olika språk, inklusive för datoriserade system.[1]

Språkkoder skall inte förväxlas med landskoder i ISO 3166, eller toppdomän i domännamnInternet, som syftar till att identifiera enskilda länder. Till exempel är landskoden för Sverige enligt ISO 3166 ”SE”, medan språkkoden för svenska språket enligt ISO 639-1 är ”sv”. Wikipedias olika språkversioner har webbadresser vars första del i stort sett följer ISO 639-1.

Standarden

Standarden ges ut i fem[1] delar, som revideras individuellt. Det är också olika organisationer som är registeransvariga för de olika delarna, och som har ansvaret för granskning och uppdatering.[2] De har dock gemensamt att de alla har namn på två av ISO:s tre officiella språk[3] som följer samma mönster:

  • engelska: ISO 639-n:yyyy Codes for the representation of names of languages — Part n: ...
  • franska: ISO 639-n:yyyy Codes pour la représentation des noms de langue — Partie n: ...
StandardDeltitel på engelska
och franska (kursivt)
BeskrivningAnsvarigt institutSenaste
utgåva
Senast
granskad
ISO 639-1:2002Part 1: Alpha-2 code[4]
Partie 1: Code alpha-2[5]
Koder med två bokstäver – Ursprungligen framtagna med hänsyn till terminologi, lexikografi och lingvistik, men är idag flitigt använda även i andra sammanhang.[4]Austrian Standards International[2][6]2002-07[4]2019[4]
ISO 639-2:1998Part 2: Alpha-3 code[7]
Partie 2: Code alpha-3[8]
Koder med tre bokstäver för språken i del 1 samt ytterligare många språk.[9] Den innehåller dessutom en del språkgrupper och språkfamiljer.[10] Vissa språk i standarden har två koder – en för bibliografiskt syfte och en för terminologi.[9]Library of Congress[2]1998-11[7]2021[7]
ISO 639-3:2007Part 3: Alpha-3 code for comprehensive coverage of languages[11]
Partie 3: Code alpha-3 pour un traitement exhaustif des langues[12]
Koder med tre bokstäver för i princip alla språk som talas eller har talats, oavsett om de saknar skriftspråk. Skall i princip täcka alla kända språk, oavsett hur stora de är, eller om de talas eller är utdöda.[11][13]SIL International[2]2007-02[11]2021[11]
ISO 639-4:2010Part 4: General principles of coding of the representation of names of languages and related entities, and application guidelines[14]
Principes généraux pour le codage de la représentation des noms de langue et d'entités connexes, et lignes directrices pour la mise en oeuvre[15]
Riktlinjer och allmänna principer för språkkodning.[14]ISO/TC 37/SC 2
(ISO)[14]
2010-07[14]2016[14]
ISO 639-5:2008Part 5: Alpha-3 code for language families and groups[16]
Partie 5: Code alpha-3 pour les familles de langues et groupes de langues[17]
Koder med tre bokstäver för levande och utdöda språkfamiljer och geografiskt grupperade språkgrupper.[16][13]Library of Congress[10]2008-05[16]2022[16]

Under perioden 2009–2014 fanns det även en sjätte del av standarden, med fyrställiga bokstavskoder, men denna del befanns inte fylla någon funktion. Den var dessutom svår att utveckla och underhålla, så den drogs tillbaka.[18]

Om språkfamiljer och språkgrupper

Språkfamiljer och språkgrupper finns delvis med redan i del 2. Den listan är dock begränsad, och är bara med i syfte att kunna ange språk som inte har någon egen kod.[19] I del 5 finns betydligt fler språkfamiljer och -grupper med, och syftet är att vara, eller bli, heltäckande för levande och döda språkgrupper och -familjer.[16] Den ansvariga institutionen, Library of Congress, tar därför emot ansökningar om revideringar eller tillägg, och uppdaterar standarden efter hand.[19]

Notera dock att syftet med standarden är att ange koder för språkens, språkvarieteternas och språkfamiljernas namn, inte att klassificera språken vetenskapligt. Även om del 5 innehåller ett förslag på hierarki inom språkfamiljerna, så är detta förslag endast en antydan, inte en fastslagen del av standarden. Det finns inte heller någon koppling av enstaka språk till någon av familjerna i standarden.[19] Syftet är snarare att vara ett hjälpmedel för forskningssamhället, och för registrering av språk.[20]

Makrospråk

I ISO 639-3 definieras många koder för språk som i ISO 639-1 och ISO 639-2 är samlade under en gemensam kod. Delstandarden definierar därför begreppet makrospråk för ett språk vars varieteter i olika kontexter antingen kan ses som egna språk, eller som en varietet av ett makrospråk.[21] Till exempel är det i vissa sammanhang praktiskt att hantera alla varieteter av arabiska som ett språk (ISO 639-1: ar). I andra sammanhang är det viktigt att skilja på tourkou och hassaniyya, eller tunisisk arabiska och irakisk arabiska.

Redan i ISO 639-1 och ISO 639-2 förekommer vissa makrospråk.[22] Till exempel förekommer för norska följande beteckningar:[23]

MakrospråkSpråkvarietet
SpråkISO 639-1ISO 639-2SpråkISO 639-1ISO 639-2
NorskanonorNynorskannnno
Bokmålnbnob

Specialkoder och reserverade kodpunkter

ISO 639-2 och ISO 639-3 innehåller fyra stycken koder med speciell funktion: mis – Övrigt språk (kod saknas); mul – Flerspråkigt; und – Odefinierat språk; och zxx – Icke-språkligt.[24] Koderna används bland annat i bibliotekskataloger för att klassificera medium som saknar språkligt innehåll, flerspråkiga verk, och verk på språk som det inte har definierats någon kod för.[25] ISO 639-1 saknar motsvarande koder.[24]

Del 2 och 3 har också reserverat ett antal koder för lokalt bruk. De 520 koderna qaa–qtz är garanterade att aldrig definieras, så att de kan utnyttjas på ett sätt som användare behöver. De skall dock aldrig finnas med vid delning av data till andra användare, då detta motverkar syftet med dem. Del 1 har inga reserverade koder på samma sätt, men qa–qt är idag ounyttjade.[24]

Hierarkier

Del 5, standarden för språkfamiljer och språkgrupper, definierar också ett sätt att ange att ett språk eller en familj eller grupp tillhör en viss angiven familj eller grupp. Denna hierarkiska ordning för släktskaper eller grupptillhörigheter anges i standarden med den större gruppen före det språk eller den familj som tillhör gruppen. Nivåerna avskiljs med kolon.[26]

Till exempel:

Sydsamiska är ett samiskt språk, en grupp av finsk-ugriska språk inom den uraliska språkfamiljen.

Anges som:

urj : fiu : smi : sma

Hierarkin i sig anger inte nödvändigtvis släktskap, så "cau : ccs : kat" behöver inte betyda att författaren avser att georgiska tillhör familjen kaukasiska språk, bara att kartvelska språk tillhör den gruppen, till exempel genom geografisk närhet eller språkförbund.

Användning

Standarden används inom många områden där registrering av språk förekommer. I Sverige används den bland annat av bibliotekskatalogen Libris (ISO 639-2[a]).[25] och SCB (ISO 639-3) för statistik om undervisning i språk och hemspråk, och för Sveriges nationella minoritetsspråk.[27]

För internetorganisationen IETF:s språkkoder, som är baserade bland annat på ISO 639 (del 1, 2, 3),[28] kan en språkkod från ISO 639 kombineras med en landskod från ISO 3166 för att specificera en lokal variant av ett språk, exempelvis ”fr-CH” för språket franska i landet Schweiz, om behovet finns att skilja det från franska i Frankrike (”fr-FR”) eller Kanada (”fr-CA”). I detta fall kan en språkkod även kombineras med en skriptkod från ISO 15924 för att för skriftspråk ange vilket skriftsystem som används. Detta används främst för språk som ofta skrivs i olika skriftsystem, till exempel serbiska, som alternativt skrivs med latinska bokstäver (”sr-Latn”) eller med kyrilliska bokstäver (”sr-Cyrl”).[28]

Eftersom även World Wide Web Consortium använder ISO 639-1 i standarden HTML så är den oerhört central för språkidentifiering av sidor på internet.[29]

Omfattning och omfång

ISO 639-3 delar in språkkoderna i klasser (engelska: scope) efter kodens funktion, som individuellt språk, makrospråk eller specialkod.[30] Till dessa klasser tillkommer ISO 639-5 med språkgrupper och språkfamiljer. Eftersom koderna i del 2 har en motsvarighet antingen i del 3 eller 5 så kan även de klassificeras enligt ovanstående schema. Detsamma gäller koderna i del 1, som definierar en delmängd av koderna i del 2.

Antalet koder varierar, främst för att nya koder tillkommer i del 3.[31] Enligt den 2022 aktuella datan i de registeransvariga institutionernas databaser för del 2,[23] del 3,[30] och del 5[32] så är följande antal koder definierade:

KlassISO 639-1ISO 639-2ISO 639-3ISO 639-5Kommentar
Individuellt språk1493597 844Indelning enligt ISO 639-3
Makrospråk345862
Specialkoder44
Språkgrupper165115Inklusive språkfamiljer
Summa1844867 910115
Reserverade koder520659Koder specifika för ISO 639-2 (B) och ISO 639-5 är reserverade i ISO 639-3
Alternativa koder20De koder som är unika för ISO 6339-2 (B)
Utfasade koder64368Serbokroatiska är utfasad i del 1, men kvar i del 3 (makrospråk).
Outnyttjade koder48616 6418 63917 461Koder som hittills inte har blivit tilldelade språk
Totalt67617 57617 57617 576

Koder från ISO 639-1

KodSpråk
aaafar
ababchaziska
aeavestiska
afafrikaans
akakan
amamhariska
anaragonska
ararabiska
asassamesiska
avavariska
ayaymara
azazerbajdzjanska
babasjkiriska
bebelarusiska
bgbulgariska
bhbihari
bibislama
bmbambara
bnbengali
botibetanska
brbretonska
bsbosniska
cakatalanska
cetjetjenska
chchamorro
cokorsikanska
crcree
cstjeckiska
cufornkyrkoslaviska
cvtjuvasjiska
cykymriska
dadanska
detyska
dvdivehi
dzdzongkha
eeewe
elgrekiska
KodSpråk
enengelska
eoesperanto
esspanska
etestniska
eubaskiska
fapersiska
fffula
fifinska
fjfijianska
fofäröiska
frfranska
fyfrisiska
gairiska
gdgaeliska
glgaliciska
gnguarani
gugujarati
gvmanx
hahausa
hehebreiska
hihindi
hohirimotu
hrkroatiska
hthaitiska
huungerska
hyarmeniska
hzherero
iainterlingua
idindonesiska
ieinterlingue
igigbo (ibo)
iisichuan yi[b]
ikiñupiaq
ioido
isisländska
ititalienska
iuinuktitut
KodSpråk
jajapanska
jvjavanesiska
kageorgiska
kgkikongo
kikikuyu
kjkuanyama
kkkazakiska
klgrönländska
kmkhmer
knkannada
kokoreanska
krkanuri
kskashmiri
kukurdiska
kvkomi
kwkorniska
kykirgiziska
lalatin
lbluxemburgiska
lgluganda
lilimburgiska
lnlingala
lolao
ltlitauiska
luluba-katanga[c]
lvlettiska
mgmalagassiska
mhmarshallesiska
mimaori
mkmakedonska
mlmalayalam
mnmongoliska
mrmarathi
msmalajiska
mtmaltesiska
myburmesiska
KodSpråk
nanauruanska
nbbokmål
ndnordndebele
nenepali
ngndonga
nlnederländska
nnnynorska
nonorska
nrsydndebele
nvnavajo
nynyanja
ococcitanska
ojojibwa
omoromo
ororiya
osossetiska
papunjabi
pipali
plpolska
pspashto
ptportugisiska
ququechua
rmrätoromanska
rnkirundi
rorumänska
ruryska
rwkinyarwanda
sasanskrit
scsardiska
sdsindhi
senordsamiska
sgsango
sisingalesiska
skslovakiska
slslovenska
smsamoanska
snshona
KodSpråk
sosomaliska
sqalbanska
srserbiska
sssiswati
stsesotho
susundanesiska
svsvenska
swswahili
tatamil
tetelugu
tgtadzjikiska
ththai
titigrinska
tkturkmenska
tltagalog
tnsetswana
totonganska
trturkiska
tstsonga
tttatariska
twtwi[d]
tytahitiska
uguiguriska
ukukrainska
ururdu
uzuzbekiska
vevenda
vivietnamesiska
vovolapük
wavallonska
wowolof
xhxhosa
yijiddisch
yoyoruba
zazhuang
zhkinesiska
zuzulu

Se även

Anmärkningar

Källor

För listan över ISO 639-1-koder

Listan är senast uppdaterad i juni 2022, med data från följande källor:

Fotnoter

Externa länkar