Из Википедии, бесплатной энциклопедии
  (Перенаправлено с ISO-8859-5 )
Перейти к навигации Перейти к поиску

ISO / IEC 8859-5: 1999 , Информационные технологии - 8-битные однобайтовые графические наборы символов - Часть 5: Латинский / кириллица , является частью серии стандартных кодировок символов на основе ASCII ISO / IEC 8859 , первое издание опубликовано в 1988 году. Неофициально называется Latin / Cyrillic . Он был разработан для охвата языков, использующих кириллицу, таких как болгарский , белорусский , русский , сербский и македонский, но так и не получил широкого распространения. Это было бы также использовать для украинца в Советском Союзес 1933–1990 гг., но в нем отсутствует украинская буква ge ,, которая требовалась в украинской орфографии до и после, а также в течение этого периода за пределами Советской Украины . В результате IBM создала кодовую страницу 1124 .

ISO-8859-5 - предпочтительное название набора символов IANA для этого стандарта, если оно дополнено управляющими кодами C0 и C1 из ISO / IEC 6429 .

Гораздо чаще используются 8-битные кодировки KOI8-R и KOI8-U , CP866 , а также Windows-1251 . В отличие от Windows-1252 и ISO 8859-1 , Windows-1251 не имеет тесного отношения к ISO 8859-5. Страница Windows , код для ISO-8859-5 является кодовой страницей 28595 аки Windows-28595 . [3]

В основном блоке кириллицы Unicode используется макет, основанный на ISO-8859-5.

Макет кодовой страницы [ править ]

Каждый символ отображается с его эквивалентом в Юникоде .

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный

История и связанные кодовые страницы [ править ]

Стандарт ECMA-113 был эквивалентен ISO-8859-5 со времени его второго издания, [4] его первое издание ( ISO-IR-111 ) было расширением более раннего KOI-8 (определено ГОСТ 19768-74). , в котором русские буквы располагаются так же, как и их римские эквиваленты в кодировке ASCII, где это возможно. Первоначальный проект ISO-8859-5 (DIS-8859-5: 1987) следовал ISO-IR-111, но был пересмотрен [4] после того, как ГОСТ 19768-74 был заменен [5] новым ISO-IR-153 в 1987, в котором русские буквы были переставлены в алфавитном порядке (кроме Ё). [5] [6]ISO-IR-153 содержит русские буквы, включая Ё, неразрывный пробел и мягкий дефис, тогда как полный набор кириллицы ISO-8859-5 также называется ISO-IR-144. [7]

Возможно, как следствие этой путаницы, RFC  1345 ошибочно перечисляет еще одну кодовую страницу как «ISO-IR-111», комбинируя порядок букв и регистр ISO-8859-5 с порядком строк ISO-IR-111 (и следовательно, не совместим ни с одним на практике, но на практике частично совместим [2] с Windows-1251 ). [8] [2]

Кодовая страница IBM 915 является расширением ISO / IEC 8859-5, добавляя некоторые полуграфические и другие символы в область C1 . Кодовая страница IBM 1124 в основном идентична ISO-8859-5, но заменяет ѓ на ґ для украинского использования.

ISO-IR-200 , «Уральский дополнительный набор кириллицы», [9] был зарегистрирован в 1998 году компанией Everson Gunn Teoranta (директором которой был Майкл Эверсон до основания Evernote в 2001 году) [10], и несколько изменяет некоторые из нерусские буквы для поддержки кильдинского саамского , коми и ненецкого языков, не поддерживаемые самим стандартом ISO-8859-5. Майкл Эверсон также представил Mac OS Barents Cyrillic для тех же языков в классической Mac OS.

ISO-IR-201, «Дополнительный набор кириллицы для Волги », [11] был аналогичным образом введен Эверсоном Ганном Теоранта для поддержки чувашского , коми , марийского и удмуртского языков, на которых говорят в титульных республиках России .

Ссылки [ править ]

  1. ^ Наборы символов , Internet Assigned Numbers Authority (IANA), 2018-12-12
  2. ^ a b c Нечаев, Валентин (2013) [2001]. «Обзор вселенной 8-битных кодировок кириллицы» . Архивировано 5 декабря 2016 года . Проверено 5 декабря 2016 .
  3. ^ Идентификаторы кодовой страницы
  4. ^ а б ECMA-113. Наборы 8-битных однобайтовых графических символов - латинский / кириллица (2-е изд., Июнь 1988 г.)
  5. ^ a b Czyborra, Роман (1998-11-30) [1998-05-25]. «Суп с кириллической кодировкой» . Архивировано из оригинала на 2016-12-03 . Проверено 3 декабря 2016 .
  6. ^ http://czyborra.com/charsets/gost19768-87.txt.gz
  7. ^ "ISO-IR-144" (PDF) . 1 мая 1988 г.
  8. ^ Соколов, Михаил (2003-04-05). "ECMA-кириллический псевдоним iso-ir-111 sore" . Список рассылки кодировок IETF .
  9. ^ a b «ISO-IR 200: Uralic Additional Cyrillic Set» (PDF) .
  10. ^ Ганн, Марион; Эверсон, Майкл (20 сентября 2001 г.). "Everson Gunn Teoranta (EGT) & Everson Typography" . Архив почтового списка Unicode . Консорциум Unicode.
  11. ^ a b «ISO-IR 201: Volgaic Supplementary Cyrillic Set» (PDF) .

Внешние ссылки [ править ]

  • ИСО / МЭК 8859-5: 1999
  • Стандартный ECMA-113 : 8-битные однобайтовые графические наборы символов - латинский / кириллица, 3-е издание (декабрь 1999 г.)
  • ISO-IR 144 Кириллица латинского / кириллического алфавита (1 мая 1988 г., из 2-й версии ISO 8859-5)