ISO 639 — набор стандартов Международной организации по стандартизации, связанный со стандартизацией названий языков и языковых групп.

Название ISO 639 является также наименованием оригинального стандарта, утверждённого в 1967 году (как ISO 639/R)[1] и прекратившего действие в 2002 году[2]. ISO 639 состоит из шести частей.

Применение

Определённые стандартом ISO 639 коды языков применяются для указания языков, на которых написаны тексты. Например, применяются в ссылках на статьи Википедии.

В документе RFC 3066 описывается использование в Интернете кодов языков по ISO 639.

Примеры кодов ISO для языков
Язык[1]639-1639-2
Английский языкeneng
Русский языкrurus
Немецкий языкdeger, deu

Части стандарта

Части стандарта
СтандартНаименованиеЗаведующая организацияПервая редакцияТекущая редакцияПозиций в списке
ISO 639-1Часть 1: коды Альфа-2Infoterm[en]1967 (как ISO 639)2002184
ISO 639-2Часть 2: коды Альфа-3Библиотека Конгресса19981998>450
ISO 639-3Часть 3: коды Альфа-3 для всеобъемлющего охвата языковSIL International200720077704 + локальный диапазон
ISO 639-4Часть 4: руководства и общие принципы языкового кодированияISO/TC 37[en]2010-07-162010-07-16(без списка)
ISO 639-5Часть 5: коды Альфа-3 для языковых семей и группБиблиотека Конгресса2008-05-152008-05-15114
ISO 639-6Часть 6: коды Альфа-4 для всеобъемлющего охвата вариантов языковGeoLang2009-11-17Отозван

Языковые стандарты ISO 639 открыты, то есть, могут дополняться. Сопровождением стандарта занимается Агентство по техническому обеспечению. При необходимости Агентство добавляет коды или меняет статусы кодов.

Классификация кодов

Области применения:

  • отдельные языки;
  • языковые макросемьи (часть 3);
  • коллекции языков (части 1, 2 и 5);
    • языковые группы (часть 1 содержит только одну языковую группу — группу bh; коды для большинства языковых групп даются в части 2; несколько кодов добавлено в часть 5);
    • остальные группы;
  • диалекты;
  • зарезервированные для локального использования (части 2, 3);
  • особые ситуации (части 2, 3).

Виды (для отдельных языков):

  • живые языки (части 2, 3) (все макросемьи живых языков)[3];
  • мёртвые языки (части 2, 3) (437 позиций[4]; четыре в части 2: chb, chg, cop, sam; ни одного в части 1);
  • древние языки (части 1-3) (112 позиций[5]; девятнадцать в части 2, и 5 из них, а именно ave, chu, lat, pli и san — также имеют соответствующий код в части 1: ae, cu, la, pi, sa);
  • исторические языки (части 2, 3) (63 позиции[6]; шестнадцать из них находятся в части 2; ни один не имеет соответствия в части 1);
  • искусственные языки (части 2, 3) (19 позиций[7]; девять в части 2: epo, ina, ile, ido, vol, afh, jbo, tlh, zbl; пять в части 1: eo, ia, ie, io, vo).

Библиографические и терминологические коды:

  • библиографические (часть 2);
  • терминологические (лексикографические) (часть 2).

Диапазоны кодов

Альфа-2

Коды «альфа-2» состоят из двух букв базового латинского алфавита, используются в ISO 639-1. На сегодняшний день на Земле насчитывается около шести или семи тысяч языков[8]. Так как в латинском алфавите 26 букв и из двух букв можно составить 262 = 676 двухбуквенных комбинаций, даже при большом желании невозможно охватить весь широкий спектр языков.

Альфа-3

Коды «альфа-3» состоят из трёх букв базового латинского алфавита, используются в ISO 639-2, в ISO 639-3 и в ISO 639-5. В латинском алфавите 26 букв; из трёх букв можно составить 263 = 17 576 трёхбуквенных комбинаций. Из этих комбинаций следующие уже использовались:

  • четыре специальных кода из ISO 639-2: mis (язык в стандарте (пока) отсутствует), mul (текст на двух и более языках, но указать можно только один код), und (язык неизвестен), zxx (языком не является);
  • зарезервированный диапазон qaa-qtz (всего 20×26 = 520 кодов);
  • двадцать три дублирующие записи («B/T» — библиографические и терминологические (лексикографические) коды).

В сумме 4+520+23 = 547 кодов, которые не могли использоваться в части 3 для кодификации языков или в части 5 для кодификации языковых семей и групп. Для «альфа-3» осталось 17 576 - 547 = 17 029 кодов.

ISO 639-2 отличается от ISO 639-1 тем, что в нём не определены коды для сербохорватского и молдавского языков, и определены коды для вариантов языка. Например, для французского языка в ISO 639-1 определён только один код — fr, а в ISO 639-2 определены четыре кода: fre и fra для современного французского, frm для средневекового французского (англ. french, medieval; 1400—1800 годы) и fro для старофранцузского (англ. french, old; 842—1400 годы).

На сегодняшний день на Земле насчитывается около шести или семи тысяч языков[8]. Используя 17 029 кодов, можно каждому языку присвоить уникальный код, но это может привести к тому, что некоторым языкам будут даны произвольные коды, комбинация букв которых не будет соответствовать традиционному названию языка.

Альфа-4

Коды «Альфа-4» состоят из четырёх букв базового латинского алфавита, используются в ISO 639-6. Используя четырёхбуквенные комбинации из 26 букв, можно закодировать 264 = 456 976 языков и диалектов.

См. также

Примечания

Ссылки

🔥 Top keywords: Заглавная страницаЯндексДуров, Павел ВалерьевичСлужебная:ПоискYouTubeЛунин, Андрей АлексеевичПодносова, Ирина ЛеонидовнаВКонтактеФоллаут (телесериал)WildberriesTelegramРеал Мадрид (футбольный клуб)Богуславская, Зоя БорисовнаДуров, Валерий СемёновичРоссияXVideosСписок умерших в 2024 годуЧикатило, Андрей РомановичFallout (серия игр)Список игроков НХЛ, забросивших 500 и более шайбПопков, Михаил ВикторовичOzon17 апреляИльин, Иван АлександровичMail.ruСёгун (мини-сериал, 2024)Слово пацана. Кровь на асфальтеПутин, Владимир ВладимировичЛига чемпионов УЕФАГагарина, Елена ЮрьевнаБишимбаев, Куандык ВалихановичЛига чемпионов УЕФА 2023/2024Турнир претендентов по шахматам 2024Манчестер СитиMGM-140 ATACMSРоссийский миротворческий контингент в Нагорном КарабахеЗагоризонтный радиолокаторПинапВодительское удостоверение в Российской Федерации