Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Windows-1251 - это 8-битная кодировка символов , предназначенная для языков, использующих кириллицу, таких как русский , болгарский , сербский кириллица и другие языки. Это наиболее широко используемая кодировка для болгарского , сербского и македонского языков. [ необходима цитата ] По состоянию на декабрь 2020 года 0,9% всех (и 0,6% из первой тысячи [1] ) веб-сайтов используют Windows-1251. [2] [3] Однако его используют 9,9% российских (.ru) сайтов, [4]где это второй по популярности вариант после UTF-8. В Linux эта кодировка известна как cp1251. [5] IBM использует кодовую страницу 1251 ( CCSID 1251 и расширенный CCSID 5347 для знака евро ) для Windows-1251. [6] [7] [8] [9] [10] [11] [12]

Windows-1251 и KOI8-R (или его украинский вариант KOI8-U ) используются гораздо чаще, чем ISO 8859-5 (который «используется менее чем на 0,1% веб-сайтов»). [13] В отличие от Windows-1252 и ISO 8859-1 , Windows-1251 не имеет тесного отношения к ISO 8859-5.

Unicode предпочтительнее Windows-1251 или других кодировок кириллицы в современных приложениях, особенно в Интернете, что делает UTF-8 доминирующей кодировкой для веб-страниц. (Для дальнейшего обсуждения полного охвата Unicode и того, как однобайтовые кодировки символов, такие как Windows-1251 и KOI8-R , не могут этого обеспечить, см. Кириллица в Unicode .)

Набор символов [ править ]

В следующей таблице показана Windows-1251. Каждый символ отображается с его эквивалентом в Юникоде и его десятичным кодом.

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный

Казахский вариант [ править ]

Измененная версия Windows-1251 была стандартизирована в Казахстане как казахстанский стандарт STRK1048 и известна под этикеткой KZ-1048. Он отличается в строках, показанных ниже:

Вариант Amiga [ править ]

В российских системах Amiga OS использовалась версия кодовой страницы 1251, которая соответствует Windows-1251 для русского подмножества кириллических букв, но в остальном в основном соответствует ISO-8859-1 . Эта версия известна как Amiga-1251 , [16] под именем которой она зарегистрирована в IANA . [17]

  Отличается от Windows-1251 для соответствия ISO-8859-1
  Отличается как от Windows-1251, так и от ISO-8859-1

Сноски [ править ]

  1. ^ Соответствие ISO-8859-15 ; в другом месте, чем в Windows-1251.
  2. ^ Присутствует в Windows-1251, но в другом месте; отсутствует в ISO-8859-1 / 15.

Ссылки [ править ]

  1. ^ «Обзор использования кодировок символов с разбивкой по рейтингам» . w3techs.com . Проверено 25 января 2021 .
  2. ^ «Исторические тенденции использования кодировок символов, январь 2021 г.» . Проверено 25 января 2021 .
  3. ^ «Часто задаваемые вопросы» .
  4. ^ «Распределение кодировок символов среди сайтов, использующих .ru» . w3techs.com . Проверено 25 января 2021 .
  5. ^ "cp1251 (7) - страница руководства Linux" . man7.org . Проверено 1 июля 2018 .
  6. ^ "Кодовая страница 1251 информационного документа" . Архивировано из оригинала на 2016-03-03.
  7. ^ "Информационный документ CCSID 1251" . Архивировано из оригинала на 2014-11-29.
  8. ^ "Информационный документ CCSID 5347" . Архивировано из оригинала на 2014-11-29.
  9. ^ Кодовая страница CPGID 01251 (pdf) (PDF) , IBM
  10. ^ Кодовая страница CPGID 01251 (txt) , IBM
  11. ^ Международные компоненты для Unicode (ICU), ibm-1251_P100-1995.ucm , 2002-12-03
  12. ^ Международные компоненты для Unicode (ICU), ibm-5347_P100-1998.ucm , 2002-12-03
  13. ^ «Статистика использования кодировок символов для веб-сайтов» . w3techs.com . Архивировано 20 февраля 2011 года.
  14. ^ Стил, Шон (1998). CP1251 в таблицу Unicode . Консорциум Unicode . CP1251.TXT.
  15. ^ Уистлер, Кен (2007). KZ-1048 в Unicode . Консорциум Unicode . KZ1048.TXT.
  16. ^ a b Малышев, Михаил (2003). "Amiga-1251 в таблицу Unicode". Регистрация новой кодировки [Amiga-1251] . IANA.
  17. ^ «Наборы символов» . IANA.

Дальнейшее чтение [ править ]

  • Корнаи, Андрас; Бирнбаум, Дэвид Дж .; да Круз, Франк; Дэвис, Бур; Фаулер, Джордж; Пейн, Ричард Б.; Паперно, Слава; Simonsen, Keld J .; Thobe, Glenn E .; Вулис, Дмитрий; ван Винген, Йохан В. (13 марта 1993 г.). «FAQ по КИРИЛИЧЕСКОМУ КОДИРОВАНИЮ Версия 1.3» . Проверено 24 июня 2020 .

Внешние ссылки [ править ]

  • Справочная таблица Windows 1251
  • Регистрация имени кодировки IANA
  • Отображение Unicode окон 1251 с "наилучшим соответствием"
  • Universal Cyrillic decoder , онлайн-программа, которая может помочь восстановить нечитаемые кириллические тексты с неработающей кодировкой Windows-1251 или другими кодировками .