Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

ISO-IR-111 [1] или KOI8-E [2] - это 8-битный набор символов. Это многонациональное расширение KOI-8 для белорусского , македонского , сербского и украинского языков (кроме Ґ ґ, добавляемого в KOI8-F ). Название «ISO-IR-111» относится к его регистрационному номеру в реестре ISO-IR и обозначает его как набор, который можно использовать с ISO / IEC 2022 .

Он был определен в первом (1986) издании ECMA-113 [3], который является международным стандартом Ecma, соответствующим ISO / IEC 8859-5 , и как таковой также соответствует черновой версии ISO-8859-5 1987 года. [4] Опубликованные редакции ISO / IEC 8859-5 вместо этого соответствуют последующим редакциям ECMA-113, которые определяют другую кодировку. [5]

Путаница в именах [ править ]

ISO-IR-111, редакция ECMA-113 1985 г. (также называемая «ECMA-Cyrillic» или «KOI8-E»), была основана на редакции ГОСТ 19768 1974 г. (т. Е. KOI-8 ). В 1987 году ECMA-113 был модернизирован. [5] Эти новые редакции ECMA-113 эквивалентны ISO-8859-5 , [5] [6] и не соответствуют структуре KOI. Эта путаница привела к распространенному заблуждению о том, что ISO-8859-5 был определен в ГОСТ 19768-74 или основан на нем. [6]

Возможно, как еще одно следствие этого, RFC  1345 ошибочно перечисляет другую кодовую страницу под именами «ISO-IR-111» и «ECMA-Cyrillic», напоминающую ISO-8859-5 с переупорядоченными строками и частично совместимую с Windows-1251. . [7] [6] Из-за опасений, что существующие реализации могут использовать определение RFC 1345 для этих двух меток, было предложено, чтобы IANA дополнительно распознала KOI8-Eв качестве метки для контента ECMA-113: 1985, [7] и в настоящее время IANA перечисляет этот ярлык как псевдоним. [2]

Набор символов [ править ]

В следующей таблице показана кодировка ISO-IR-111. Каждый символ отображается с его эквивалентной кодовой точкой Unicode .

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный

Расширенная и измененная версии [ править ]

Модифицированная версия с именем KOI8 Unified или KOI8-F был использован в программном обеспечении , разрабатываемое Fingertip Software, добавив Гп в его KOI8-U месте (замена мягкого дефиса и вытесняя универсальный знак валюты ), и добавив некоторые графические символы в контроле C1 области кодов , в основном из KOI8-R и Windows-1251 . [4] [6] [8] [9]

Неправильная кодовая страница RFC 1345 [ править ]

RFC  1345 ошибочно перечисляет другую кодовую страницу под именем ISO-IR-111, кодируя те же кириллические символы, но с другим макетом. Он напоминает смесь Windows-1251 и ISO-8859-5 . [7] В частности, линия A_ соответствует ISO-8859-5, строки C_ - F_ соответствуют Windows-1251 [6] (эквивалент строкам B_ - E_ ISO-8859-5), а линия B_ почти соответствует строке F_ ИСО-8859-5, за исключением из § заменяется на ¤ .

Некоторые коды напоминают ISO-IR-111 с перевернутым регистром букв, что, возможно, способствовало путанице. Большинство из них различаются и показаны ниже с жирной рамкой.

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный  Отклонение от ISO-IR-111 (исключая отклонения только в случае)

См. Также [ править ]

  • Кодировки символов KOI

Ссылки [ править ]

  1. ECMA (1 августа 1985 г.). Правая часть кириллического алфавита (PDF) . ITSCJ / IPSJ . ISO-IR -111.
  2. ^ a b «Наборы символов» . IANA.
  3. ^ ECMA-113. Наборы 8-битных однобайтовых графических символов - латинский / кириллица (1-е изд., Июнь 1986 г.)
  4. ^ a b Czyborra, Роман (1998-11-30) [1998-05-25]. «Суп с кириллической кодировкой» . Архивировано из оригинала на 2016-12-03 . Проверено 3 декабря 2016 .
  5. ^ а б в ECMA-113. Наборы 8-битных однобайтовых графических символов - латинский / кириллица (2-е изд., Июнь 1988 г.)
  6. ^ a b c d e Нечаев, Валентин (2013) [2001]. «Обзор вселенной 8-битных кодировок кириллицы» . Архивировано 5 декабря 2016 года . Проверено 5 декабря 2016 .
  7. ^ a b c Соколов, Михаил (05.04.2003). "ECMA-кириллический псевдоним iso-ir-111 sore" . Список рассылки кодировок IETF .
  8. ^ "KOI8 Unified" . Программное обеспечение для пальцев. Архивировано из оригинала на 1998-01-09 . Проверено 11 февраля 2020 .
  9. ^ Лейшер, Марк (2008) [1998-03-05]. «Унифицированная таблица преобразования кириллицы в Unicode 2.1 KOI8» . Департамент математических наук Государственного университета Нью-Мексико . Проверено 2 мая 2020 .