Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

ISO 639 - это набор стандартов Международной организации по стандартизации, который касается представления названий языков и языковых групп .

Это также название исходного стандарта, утвержденного в 1967 году (как ISO 639 / R ) [1] и отмененного в 2002 году. [2] Набор ISO 639 состоит из пяти частей.

Использование кодов ISO 639 [ править ]

Коды языков, определенные в нескольких разделах ISO 639, используются в библиографических целях и в компьютерных средах и в Интернете как ключевой элемент данных локали . Коды также находят применение в различных приложениях, таких как URL-адреса Википедии для разных языковых версий.

Текущие и исторические части стандарта [ править ]

Каждая часть стандарта поддерживается агентством по техническому обслуживанию, которое добавляет коды и при необходимости изменяет их статус. Стандарт ISO 639-6 был отменен в 2014 году. [8]

Характеристики индивидуальных кодов [ править ]

Области применения:

  • Индивидуальные языки
  • Макроязыки (часть 3)
  • Сборники языков (части 1, 2, 5). Часть 1 содержит только одну коллекцию ( bh), некоторые коллекции уже были в Части 2, а другие были добавлены только в Части 5:
    • Остальные группы: 36 коллекций в Части 2 и 5 относятся к этому типу (включая одну, которая также была закодирована в Части 1) - для совместимости с Частью 2, когда Часть 5 еще не была опубликована, остальные группы не содержат никаких языков и коллекций. это уже было закодировано в Части 2 (однако новые приложения, совместимые с Частью 5, могут обрабатывать эти группы включительно, если они соблюдают иерархию включения, опубликованную в Части 5, и используют наиболее конкретную коллекцию при группировании языков);
    • Обычные группы: 29 коллекций в Частях 2 и 5 относятся к этому типу - для совместимости с Частью 2 они не могут содержать другие группы;
    • Семейства: 50 новых коллекций, закодированных только в Части 5 (включая одну, содержащую обычную группу, уже закодированную в Части 2) - для совместимости с Частью 2 они могут содержать другие коллекции, кроме остаточных групп.
  • Диалекты : они должны были быть включены в Часть 6 (предложена, но теперь отозвана).
  • Особые ситуации (части 2, 3).
  • Зарезервировано для местного использования (части 2, 3). Также иногда используется в приложениях, где требуется код alpha-2, например стандартные коды в частях 1 и 2 (где специальный код misне подходит), или код alpha-3 для коллекций, таких как стандартные коды в части 5.

Типы (для отдельных языков):

  • Живые языки (части 2, 3) (все макроязыки являются живыми языками) [9]
  • Вымершие языки (части 2, 3) (608, [10] 5 из них находятся в части 2: chb, chg, cop, lui, sam, ни один из них в части 1)
  • Древние языки (части 1, 2, 3) (124, [11] 19 из них находятся в части 2, и 5 из них, а именно ave, chu, lat, pliи san, также имеют код в Части 1: ae, cu, la, pi, sa)
  • Исторические языки (части 2, 3) (83, [12] 16 из них находятся в Части 2; ни одного - в Части 1)
  • Искусственные языки (Части 1, 2, 3) (22, [13] : 9 из них в части 2 afh, epo, ido, ile, ina, jbo, tlh, vol, zbl, 5 из них в части 1: eo, ia, ie, io, vo)

Отдельные языки и макроязыки с двумя различными альфа-3 кодами в Части 2:

  • Библиографические (некоторые из них устарели, ни один не был определен в Части 3): это устаревшие коды (основанные на названиях языков на английском языке).
  • Терминологические (также определенные в Части 3): это предпочтительные коды (основанные на именах на родном языке, при необходимости латинизированные).
  • Все остальные (включая наборы языков и специальные / зарезервированные коды) имеют только один код alpha-3 для обоих применений.

Отношения между частями [ править ]

Различные части ISO 639 разработаны для совместной работы таким образом, что никакой код не означает одно в одной части и что-то другое в другой. Однако не все языки присутствуют во всех частях, и существует множество различных способов обработки определенных языков и других элементов в разных частях. Это зависит, например, от того, включен ли язык в Части 1 или 2, имеет ли он отдельные коды B / T в Части 2 или классифицируется как макроязык в Части 3 и т. Д.

Эти различные методы лечения подробно описаны в следующей таблице. В каждой группе строк (по одной для каждой области применения ISO 639-3) последние четыре столбца содержат коды для репрезентативного языка, который иллюстрирует конкретный тип отношения между частями ISO 639, второй столбец дает объяснение взаимосвязи. , а в первом столбце указано количество элементов, имеющих этот тип связи. Например, есть четыре элемента, которые имеют код в Части 1, имеют код B / T и классифицируются как макроязыки в Части 3. Одним из представителей этих четырех элементов является «персидский» fa/ per/ fas.

Эти различия обусловлены следующими факторами.

В ISO 639-2 22 отдельным языкам были присвоены два различных кода, а именно код библиографии и код терминологии (коды B / T). [14] B-коды были включены по историческим причинам, поскольку в предыдущих широко используемых библиографических системах использовались языковые коды, основанные на английском названии языка. В отличие от этого, коды ISO 639-1 основывались на собственном названии языка, и было также сильное желание иметь коды 639-2 (T-коды) для этих языков, которые были бы похожи на соответствующий двухсимвольный код в ISO 639-1.

  • Например, немецкий язык (Часть 1 :) deимеет два кода в Части 2: ger(B-код) и deu(T-код), тогда как в Части 2 есть только один код engдля английского языка .
  • 2 прежних кода B были отозваны, и сегодня осталось только 20 пар кодов B / T.

Отдельные языки в Части 2 всегда имеют код в Части 3 (там повторно используется только терминологический код Части 2), но могут иметь или не иметь код в Части 1, как показано в следующих примерах:

  • Часть 3 engсоответствует Части 2 engи Части 1en
  • Часть 3 astсоответствует Части 2, astно в Части 1 отсутствует код.

Некоторые коды (62) в Части 3 являются макроязыками. Это группы, состоящие из нескольких отдельных языков, которые хорошо понимают друг друга и обычно смешиваются или путаются. Некоторые макроязыки разработали стандартную форму по умолчанию на одном из своих отдельных языков (например, китайский макроязык по умолчанию используется для китайского макроязыка, другие отдельные языки могут по-прежнему выделяться, если это необходимо, но конкретный код cmnдля китайского редко используется).

  • Макроязык 1 имеет код Части 2 и Код Части 1, в то время как отдельные языки, входящие в его состав, также имеют коды в Части 1 и Части 2: nor/ noсодержит non/ nn, nob/ nb; или же
  • 4 макроязыка имеют два кода Части 2 (B / T) и код Части 1: per/ fas/ fa, may/ msa/ ms, alb/ sqi/ sqи chi/ zho/ zh;
  • 28 макроязыков имеют код Части 2, но не Код Части 1;
  • 29 других макроязыков имеют коды только в части 3.

Коллективные коды в Части 2 имеют код в Части 5: например, ausв Частях 2 и 5, что означает австралийские языки .

  • Один коллективный код в Части 2 также имеет код в Части 1: bih/ bh.
  • Некоторые коды были добавлены в Части 5, но не имели кода в Части 2: например, sqj

Части 2 и 3 также имеют зарезервированный диапазон и четыре специальных кода:

  • Коды до qaaконца qtzзарезервированы для местного использования.
  • Существует четыре специальных кода: misдля языков, которым еще не назначен код, mulдля «нескольких языков», undдля «не определено» и zxxдля «без лингвистического содержания, неприменимо».

Пространство кода [ править ]

Кодовое пространство Alpha-2 [ править ]

Коды «Alpha-2» (для кодов, состоящих из 2 букв основного латинского алфавита ISO ) используются в ISO 639-1 . Когда требовались коды для более широкого диапазона языков, которые могли охватывать более двух буквенных комбинаций (максимум 26 2 = 676), ISO 639-2 был разработан с использованием кодов Alpha-3. (Однако последняя была официально опубликована первой. [15] [16] )

Кодовое пространство Alpha-3 [ править ]

Коды «Alpha-3» (для кодов, состоящих из 3 букв основного латинского алфавита ISO ) используются в ISO 639-2 , ISO 639-3 и ISO 639-5 . Количество языков и языковых групп, которые могут быть представлены таким образом, составляет 26 3 = 17 576.

Обычное использование кодов Alpha-3 тремя частями ISO 639 требует некоторой координации в рамках более крупной системы.

Часть 2 определяет четыре специальные коды mis, mul, und, zxx, зарезервированный диапазон qaa-qtz(20 × 26 = 520 кодов) и имеет 20 двойных записей (в B / T коды), а также 2 записи с устаревшими B-кодов. В сумме получается 520 + 22 + 4 = 546 кодов, которые нельзя использовать в части 3 для представления языков или в части 5 для представления языковых семей или групп. Остаток 17 576 - 546 = 17 030.

Сегодня на Земле существует около шести или семи тысяч языков. [17] Таким образом, этих 17 030 кодов достаточно для присвоения уникального кода каждому языку, хотя некоторые языки могут иметь произвольные коды, которые не похожи на традиционные названия этого языка.

Пробел кода Alpha-4 (отозван) [ править ]

Коды «Alpha-4» (для кодов, состоящих из 4 букв основного латинского алфавита ISO ) предлагалось использовать в ISO 639-6 , который был отозван. Верхний предел количества языков и диалектов, которые могут быть представлены, составляет 26 4 = 456 976.

См. Также [ править ]

  • Языковые теги IETF (на основе ISO 639)
  • ISO 3166 (коды стран)
  • ISO 15924 (коды для систем письма )
  • Коды для сконструированных языков
  • Код языка
  • Языковые семьи и языки
  • Список языков
  • Список официальных языков
  • Список кодов ISO 639-1
  • Список кодов ISO 639-2

Примечания и ссылки [ править ]

  1. ^ "ISO / R 639: 1967" . Iso.org. 1988-03-01 . Проверено 5 августа 2012 .
  2. ^ «ISO 639: 1988» . Iso.org . Проверено 5 августа 2012 .
  3. ^ «Коды расположены в алфавитном порядке по коду альфа-3 / ISO 639-2» . Библиотека Конгресса. 2013-07-25 . Проверено 10 января 2019 .
  4. ^ "Коды ISO-639-2" . Библиотека Конгресса . Проверено 10 января 2019 .
  5. ^ «Кодовые таблицы ISO 639» . Sil.org . Проверено 4 февраля 2020 .
  6. ^ «Уведомление об изменении ISO 639-5» . Офис развития сети и стандартов MARC . Библиотека Конгресса . Проверено 12 декабря 2018 года .
  7. ^ «Коды ISO 639-5, упорядоченные по идентификатору» . Офис развития сети и стандартов MARC . Библиотека Конгресса . Проверено 12 декабря 2018 года .
  8. ^ ISO 639-6: 2009 , ISO .
  9. ^ «Кодовые таблицы ISO 639: макроязыки» . Sil.org . Проверено 5 августа 2012 .
  10. ^ «Кодовые таблицы ISO 639: вымершие» . Sil.org . Проверено 5 августа 2012 .
  11. ^ «Кодовые таблицы ISO 639: древние» . Sil.org . Проверено 10 января 2019 .
  12. ^ «Кодовые таблицы ISO 639: исторические» . Sil.org . Проверено 5 августа 2012 .
  13. ^ «Кодовые таблицы ISO 639: построены» . Sil.org . Проверено 3 февраля 2019 .
  14. ^ «ISO 639-2 - Часто задаваемые вопросы» . loc.gov. 2014-05-05 . Проверено 12 декабря 2014 .
  15. ^ «Коды для представления названий языков - Часть 2: Код Alpha-3» . Международная организация по стандартам . ISO . Проверено 10 января 2019 . Дата публикации: 1998-10
  16. ^ «Коды для представления названий языков - Часть 1: Код Alpha-2» . Международная организация по стандартам . ISO . Проверено 15 февраля 2018 . Дата публикации: 07.2002
  17. ^ «Статистические сводки» . Этнолог . Проверено 5 августа 2012 .

Внешние ссылки [ править ]

  • Официальный информационный термин ISO 639-1 / RA (Регистрирующий орган)
  • Официальный ISO 639-2 / RA (Орган регистрации) Библиотека Конгресса
  • Официальный ISO 639-3 / RA (Орган регистрации) SIL International
  • Официальный ISO 693-5 / RA (Орган регистрации) Библиотека Конгресса
  • Официальный ISO 639-6 / RA (Регистрирующий орган) Geolang
  • Общий репозиторий данных локали, который содержит переводы кодов ISO 639 на другие языки в формате XML. Обследование инструмент CL также содержит более читаемый формат данных.