Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Кодовая страница 866 ( CCSID 866) [2] (CP 866, «DOS Cyrillic Russian») [3] - это кодовая страница, используемая под DOS и OS / 2 [4] в России для написания кириллицы . [5] [6] Он основан на «альтернативной кодовой странице» ( русский язык : Альтернативная кодировка ), разработанной в 1984 г. в IHNA АН СССР и опубликованной в 1986 г. исследовательской группой Академии наук СССР. [7] Кодовая страница была широко используется в эпоху DOS , поскольку она сохраняет все псевдографических символов изкодовая страница 437 (в отличие от « Основной кодовой страницы » или кодовой страницы 855 ) и поддерживает алфавитный порядок (хотя и не непрерывно) кириллических букв (в отличие от KOI8-R ). Изначально эта кодировка была доступна только в русской версии MS-DOS 4.01 (1990 г.), а с MS-DOS 6.22 - в любой языковой версии.

WHATWG Encoding Standard, который указывает кодировки символов допускается в HTML5 , которые должны поддерживать совместимые браузеры, [8] содержит код страницы 866. [9] Это единственный однобайтная кодирующим списке , который не назван в качестве ISO 8859 части, Mac Кодировка для ОС, кодировка для Microsoft Windows ( Windows-874 или Windows-125x ) или вариант KOI-8 . [9] Авторам новых страниц и разработчикам новых протоколов рекомендуется использовать вместо этого UTF-8 . [10]

Не идентичные, но две очень похожие кодировки стандартизированы в ГОСТ Р 34.303-92 [11] как KOI-8 N1 и KOI-8 N2 (не путать с исходным KOI-8 ).

Набор символов [ править ]

Каждый символ отображается с его эквивалентной кодовой точкой Unicode . Отображается только вторая половина таблицы (кодовые точки 128–255), первая половина (кодовые точки 0–127) совпадает с кодовой страницей 437 .

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный  В отличие от альтернативной кодовой страницы

Варианты [ править ]

Существовало несколько вариантов кодовой страницы, но различия были в основном в последних 16 кодовых точках (240–255).

Альтернативная кодовая страница [ править ]

Исходная версия кодовой страницы Брябрина и др. (1986) [7] называется «Альтернативная кодовая страница» ( русский язык : Альтернативная кодировка ), чтобы отличать его от «Основной кодовой страницы» ( русский язык : Основная кодировка ) тех же авторов. Поддерживает только русский и болгарский языки . Это в основном так же , как кодовая страница 866, для кодов , за исключением F2 гекс через F7 гекса (который кодовая страница 866 изменений в украинском и белорусских букв) и коды F8 шестигранной через FB гекса (где кодовая страница 866 ссылок кодовая страница 437вместо). Другой ряд показан ниже.

  Позже символы были изменены на кодовой странице 866

Измененная кодовая страница 866 [ править ]

Неофициальный вариант с кодовыми точками 240–255, идентичный кодовой странице 437 . Однако буква Ёё обычно ставится на 240 и 241. [18] Эта версия поддерживает только русский и болгарский языки . Другой ряд показан ниже.

  Отличается от совместимой кодовой страницы 866 для соответствия OEM-США

Литовские варианты [ править ]

KBL [ править ]

KBL код страницы, неофициально известный как код страницы 771, [19] является самым ранним DOS кодировку символов для Литвы. [20] Он в основном соответствует кодовой странице 866 и альтернативной кодовой странице, но заменяет последнюю строку и некоторые символы блока буквами литовского алфавита, которые иначе не присутствуют в ASCII. Русский Ё / ё не поддерживается, [20] аналогично KOI-7 .

Также существует измененная версия, Кодовая страница 773 , которая заменяет кириллические буквы латышскими и эстонскими буквами. [20]

  Отличается от кодовой страницы 866 и альтернативной кодовой страницы

LST 1284 [ править ]

Литовский стандарт LST 1284: 1993, известный как кодовая страница 1119 или неофициально как кодовая страница 772, [19] в основном соответствует «модифицированной» кодовой странице 866, за исключением добавления кавычек в последней строке и замены смешанного сингла -двойной прямоугольник отрисовки символов литовскими буквами (сравните кодовую страницу 850 ). В отличие от КБЛ, сохранено русское Ё / ё .

Он сопровождает LST 1283 ( кодовая страница 774/1118 ), который кодирует дополнительные литовские буквы в тех же местах, что и LST 1284, но вместо этого основан на кодовой странице 437 . Позже он был заменен LST 1590-1 ( кодовая страница 775 ), [19], который кодирует эти литовские буквы в тех же местах, но не включает кириллические буквы, заменяя их латышскими и эстонскими буквами. [20]

  Отличается от "модифицированной" кодовой страницы 866

Украинский и белорусский варианты [ править ]

Украинский стандарт RST 2018-91 обозначен IBM как Code page 1125 (CCSID 1125), [25] сокращенно CP1125, а также известен как CP866U, CP866NAV или RUSCII. [26] Это соответствует оригинальному Alternative кодовой страницы для всех точек F2 , кроме гекса через F9 шестигранные включительно, которые заменены украинскими буквы. [27] Кодовая страница / CCSID 1131 [28] [29] соответствует кодовой странице 866 для всех точек F8 кроме гекса , F9 шестнадцатеричного и FC гекса через FE шестигранные включительно, которые заменяются иначе пропущенным украинским и белорусБуквы, в процессе вытесняя символ маркеров (∙) от F9 гекса до FE гекса . [30] [31] Различные строки показаны ниже.

  Кодовая страница 1125 отличается от Альтернативной кодовой страницы
  Кодовая страница 1131 отличается от кодовой страницы 866

Обновления знака евро [ править ]

Кодовая страница IBM / CCSID 808 является вариантом кодовой страницы / CCSID 866; со знаком евро (€, U + 20AC) в шестнадцатеричной позиции FD вместо знака универсальной валюты (¤). [38] [39] [40]

Кодовая страница IBM / CCSID 848 - это вариант кодовой страницы / CCSID 1125 со знаком евро в шестнадцатеричном коде FD , заменяющим ¤. [41] [42] [43]

Кодовая страница IBM / CCSID 849 - это вариант кодовой страницы / CCSID 1131 со знаком евро в шестнадцатеричном коде FB , заменяющим ¤. [44] [45] [46]

ГОСТ Р 34.303-92 [ править ]

Стандарт ГОСТ Р 34.303-92 определяет два варианта. Более обширный вариант, KOI-8 N2 (но не путать с кодировкой KOI-8 , которой он не следует), соответствует кодовой странице 866 и альтернативной кодовой странице до последней строки (коды с 240 по 255 или F0 гекс через FF гекса ). В последней строке он поддерживает буквы для белорусского и украинского языков в дополнение к русскому, но в макете, не связанном с кодовой страницей 866 или 1125. Примечательно, что даже русский Ё / ё (который не изменился между альтернативной кодовой страницей и кодовой страницей 866 ) находится в другом месте. Другой ряд показан ниже. [11]

  Отличается от кодовой страницы 866 и альтернативной кодовой страницы

Другой вариант, KOI-8 N1, представляет собой подмножество KOI-8 N2, в котором не используются нерусские буквы кириллицы и смешанные символы рисования в виде одинарной / двойной строки , оставляя их пустыми для дальнейшей интернационализации (сравните с кодовой страницей 850 ). Затронутые строки показаны ниже. [11]

Ленер – чешская модификация [ править ]

Неофициальная модификация, используемая в программном обеспечении, разработанном Майклом Ленером и Питером Р. Чехом . Он заменяет три математических символа на кирки и знак сечения, которые обычно используются в русском языке. (Ленер и Чешский также создали ряд альтернативных наборов символов для других европейских языков, в том числе один, основанный на CWI-2 для венгерского языка , один на основе Каменицкого для чешского и словацкого языков , мазовецкий вариант для польского языка и, казалось бы, уникальную кодировку для Литовский . Измененный ряд показан ниже.

  Отличается от кодовой страницы 866

Латышский вариант [ править ]

Латышский вариант, поддерживаемый принтерами Star и FreeDOS, - это кодовая страница 3012 . Эта кодировка получила название «РусЛат». [47]

  Отличается от кодовой страницы 866

FreeDOS [ править ]

FreeDOS предоставляет дополнительные неофициальные расширения кодовой страницы 866 для различных неславянских языков: [48]

  • 30002 - кириллица таджикская
  • 30008 - кириллица абхазская и осетинская
  • 30010 - кириллица гагаузская и молдавская
  • 30011 - кириллица Южный округ России ( калмыцкий , карачаево-балкарский , осетинский , северокавказский )
  • 30012 - кириллица русских Сибирских и Дальневосточных округов ( Алтайский , Бурятский , Хакасский , Тувинский , Якутский , Тунгусский , Палео-Сибирский )
  • 30013 - Кириллица Поволжья - тюркские языки ( башкирский , чувашский , татарский )
  • 30014 - Кириллица Поволжья - финно-угорские языки ( марийский , удмуртский )
  • 30015 - кириллица ханты
  • 30016 - кириллица манси
  • 30017 - кириллица Северо-Западного округа (кириллица ненецкая , латинская карельская , латинская вепсская )
  • 30018 - Латинский татарский и русская кириллица
  • 30019 - Латинский чеченский и русская кириллица
  • 58152 - Кириллица казахский с евро
  • 58210 - кириллица азербайджанский
  • 59234 - кириллица татарская
  • 60258 - Латинский азербайджанский и русская кириллица
  • 62306 - кириллица узбекская

Кодовая страница 900 [ править ]

До того, как окончательная кодовая страница Microsoft для русской версии MS-DOS 4.01 была зарегистрирована в IBM Францем Рау из Microsoft как CP866 в январе 1990 года, ее черновые версии, разработанные Юрием Стариковым (Юрий Стариков) из Dialogue, все еще назывались кодовой страницей 900 внутри компании. Хотя документация была скорректирована, чтобы отразить новое название перед выпуском продукта, эскизы более ранних черновых версий по-прежнему назывались кодовой страницей 900 и без украинских и белорусских букв, которые были добавлены осенью 1989 года, были опубликованы в российской прессе в 1990 году. . [49] кодовая страница 900 проскользнула в распределение 5,0 Россия MS-DOS LCD.CPI информации кодовой файла. [50]

Заметки [ править ]

  1. ^ Включает отчетливо украинская и русинская букву Е и Ї , но не І отличается от латинского I , и орудие советской орфографии, т.е. опускает Ґ . Они добавлены в некоторых модификациях.
  2. ^ Включает однозначно белорусский Ў , но не І, отличный от латинского I (хотя это добавлено в некоторых модификациях).

Ссылки [ править ]

  1. ^ Наборы символов , Internet Assigned Numbers Authority (IANA), 2018-12-12
  2. ^ "Информационный документ CCSID 866" . Архивировано из оригинала на 2016-03-27.
  3. ^ a b Стил, Шон (1996-04-24). "CP866.TXT: cp866_DOSCyrillicRussian to Unicode table" . Консорциум Unicode .
  4. ^ "OS / 2" . Архивировано из оригинала на 2016-08-13 . Проверено 19 июня 2016 .
  5. ^ a b "Кодовая страница 866 информационного документа" . Архивировано из оригинала на 2016-03-16.
  6. ^ «Кодовые страницы, поддерживаемые Windows: кодовые страницы OEM» . Go Глобальный центр развития . Microsoft. Архивировано из оригинала на 2011-11-02 . Проверено 11 октября 2011 .
  7. ^ Б (на русском языке ) Брябрин В. М., Ландау И. Я., Неменман М. Е. О системе кодирования для личных ЭВМ // Микропроцессорные средства и системы. - 1986. - № 4. - С. 61–64.
  8. ^ «8.2.2.3. Кодировки символов» . HTML 5.1 2-е издание . W3C . Пользовательские агенты должны поддерживать кодировки, определенные в стандарте WHATWG Encoding, включая, но не ограничиваясь, […]
  9. ^ a b van Kesteren, Энн . «Устаревшие однобайтовые кодировки» . Стандарт кодирования . WHATWG .
  10. ^ ван Кестерен, Энн . «Имена и ярлыки» . Стандарт кодирования . WHATWG .
  11. ^ Б с (на русском языке ) ГОСТ Р 34.303-92. Наборы 8-битных кодированных символов. 8-битный код обмена и обработки информации. = 8-битные наборы символов. 8-битный код для обмена информацией.
  12. ^ "OEM 866" . Go Глобальный центр развития . Microsoft. Архивировано из оригинала на 2012-02-04 . Проверено 17 октября 2011 .
  13. ^ ван Кестерен, Энн (2018-01-06). «Индекс index-ibm866» . Стандарт кодирования . WHATWG .
  14. ^ Кодовая страница CPGID 00866 (pdf) (PDF) , IBM
  15. ^ Кодовая страница CPGID 00866 (txt) , IBM
  16. ^ Международные компоненты для Unicode (ICU), ibm-866_P100-1995.ucm , 2002-12-03
  17. ^ (На русском языке ) Брябрин В. М., Ландау И. Я., Неменман М. Е. О системе кодирования для личных ЭВМ // Микропроцессорные средства и системы. - 1986. - № 4. - С. 64.
  18. ^ (На русском языке ) Фигурнов В. Э. IBM PC для пользователя. - 2-е изд. - М .: 1992. - С. 279.
  19. ^ a b c «Кодовые страницы: полный список» . Айвосто.
  20. ^ a b c d "Rašmenų koduotės" . Lietuvi kalba informacinėse technologijose (на литовском языке).
  21. ^ "771 kodų lentelė" (на литовском языке). Ликит.
  22. ^ "771 kodų lentelė" . Lietuvi kalba informacinėse technologijose - Rašmenų koduotės (на литовском языке).
  23. ^ "772 kodų lentelė" (на литовском языке). Ликит.
  24. ^ "772 kodų lentelė" . Lietuvi kalba informacinėse technologijose - Rašmenų koduotės (на литовском языке).
  25. ^ "Информационный документ CCSID 1125" . Архивировано из оригинала на 2014-12-02.
  26. ^ Нечаев, Валентин (2013) [2001]. «Обзор вселенной 8-битных кодировок кириллицы» . Архивировано 5 декабря 2016 года.
  27. ^ a b Кодовая страница CPGID 01125 (pdf) (PDF) , IBM
  28. ^ "Информационный документ CCSID 1131" . Архивировано из оригинала на 2016-03-27.
  29. ^ "Кодовая страница 1131 информационного документа" . Архивировано из оригинала на 2016-03-17.
  30. ^ IBM. «Идентификаторы кодовой страницы: CP 01131» . IBM Globalization . Архивировано из оригинала на 2016-03-17.
  31. ^ IBM. «Кодовая страница 01131» (PDF) . Архивировано из оригинального (PDF) 08.07.2015.
  32. ^ Кодовая страница CPGID 01125 (txt) , IBM
  33. ^ Международные компоненты для Unicode (ICU), ibm-1125_P100-1997.ucm , 2002-12-03
  34. ^ (на украинском языке) РСТ УРСР 2018-91. Система обробки інформації. Кодування символів української абетки 8-бітними кодами.
  35. ^ Кодовая страница CPGID 01131 (pdf) (PDF) , IBM
  36. ^ Кодовая страница CPGID 01131 (txt) , IBM
  37. ^ Международные компоненты для Unicode (ICU), ibm-1131_P100-1997.ucm , 2002-12-03
  38. ^ "Информационный документ CCSID 808" . Архивировано из оригинала на 2014-12-01.
  39. ^ Кодовая страница CPGID 00808 (pdf) (PDF) , IBM
  40. ^ Кодовая страница CPGID 00808 (txt) , IBM
  41. ^ "Информационный документ CCSID 848" . Архивировано из оригинала на 2016-03-27.
  42. ^ Кодовая страница CPGID 00848 (pdf) (PDF) , IBM
  43. ^ Кодовая страница CPGID 00848 (txt) , IBM
  44. ^ "Информационный документ CCSID 849" . Архивировано из оригинала на 2016-03-26.
  45. ^ Кодовая страница CPGID 00849 (pdf) (PDF) , IBM
  46. ^ Кодовая страница CPGID 00849 (txt) , IBM
  47. ^ "Матричный принтер LC-8021, Руководство пользователя" (PDF) .
  48. ^ "CPIDOS - файлы CPX (информация о кодовой странице) Pack v3.0 - кодовые страницы DOS" . FreeDOS . Архивировано из оригинала на 2018-05-12 . Проверено 30 января 2018 .
  49. Стариков, Юрий (11 апреля 2005 г.). "15-летию русской MS-DOS 4.01 посвящается" [ 15-летию русской MS- DOS 4.01]. Архивировано 4 декабря 2016 года . Проверено 7 мая 2014 .
  50. ^ Пол, Маттиас Р. (2001-06-10) [1995]. «Обзор кодовых страниц DOS, OS / 2 и Windows» (файл CODEPAGE.LST) (предварительная редакция 1.59). Архивировано 20 апреля 2016 года . Проверено 20 августа 2016 .

Дальнейшее чтение [ править ]

  • Корнаи, Андрас; Бирнбаум, Дэвид Дж .; да Круз, Франк; Дэвис, Бур; Фаулер, Джордж; Пейн, Ричард Б .; Паперно, Слава; Simonsen, Keld J .; Thobe, Glenn E .; Вулис, Дмитрий; ван Винген, Йохан В. (13 марта 1993 г.). «FAQ по КИРИЛИЧЕСКОМУ КОДИРОВАНИЮ Версия 1.3» . 1.3 . Проверено 4 июня 2020 .