Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Кодовая страница Windows 1253 («греческий - ANSI») [1], широко известная под своим зарегистрированным IANA именем Windows-1253 [2] или сокращенно cp1253 , [3] [4] - это кодовая страница Microsoft Windows, используемая для написания современных Греческий . Он не может поддерживать старый политонический греческий язык .

Он не полностью совместим с ISO 8859-7, потому что несколько символов, включая букву Ά , расположены в разных байтовых значениях:

  • µ[a] идобавляются в свои местоположения из Windows-1252 и ISO 8859-1 ( 0x B5 и 0xB6). Это противоречит положениям΅иΆ, соответственно, в ISO 8859-7.
  • и перемещаются из своих местоположений ISO 8859-7 (0xA1 и 0xA2) в свои местоположения Windows-1252 (0x91 и 0x92). Смещаются ΅и Άперемещаются в освободившееся пространство в 0xa1 и 0xA2 соответственно.
  • ¤и ¥добавляются в своих местах из Windows-1252 и ISO 8859-1 (0xA4 и 0xA5). Это противоречит дополнениям, внесенным в ISO 8859-7 в 2003 году, когда и, соответственно, были добавлены в одни и те же места. Он был добавлен в Windows-1253 по адресу 0x80, в том же месте, куда он был добавлен в Windows-1252. Йота нижний индекс () также был добавлен в ISO 8859-7 при 0хАА; это остается нераспределенным в Windows-1253.
  • Несколько дополнительных символов добавляются в их местоположения в Windows-1252, хотя остальные не противоречат ISO 8859-7.

IBM использует кодовую страницу 1253 ( CCSID 1253 и расширенный CCSID 5349 для знака евро ) для Windows-1253. [5] [6] [7]

Unicode предпочтительнее для греческого языка в современных приложениях, особенно в кодировке UTF-8 в Интернете. Unicode предоставляет гораздо больше глифов для полного охвата, см. Греческий алфавит в Unicode и древнегреческую музыкальную нотацию для таблиц.

Набор символов [ править ]

В следующей таблице показана Windows-1253. Каждый символ отображается с его эквивалентом в Юникоде .

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный

Отличия от ISO 8859-7 показаны более темным оттенком поверх цвета легенды.

См. Также [ править ]

  • ISO 8859-7
  • ISO 5428

Сноски [ править ]

  1. ^ Это дополнение к существующему поμадресу 0xEC, которое остается на месте. Unicode вызывает один в 0xB5 « микрознак » (U + 00B5) и один в 0xEC «греческая строчная буква Mu» (U + 03BC), хотя первый отображается на второй с помощью нормализации Unicode NFKC (хотя и не NFC). См. Также Дублирующиеся символы в Unicode § Дублирующий и производный символ .

Ссылки [ править ]

  1. ^ a b Microsoft . «Кодовая страница 1253: греческий - ANSI» . Консорциум Unicode .
  2. ^ Lazhintseva, Катя (1996-05-03). «Регистрация новой кодировки MIME: Windows-1253» . IANA .
  3. ^ a b Стил, Шон (1998-04-15). «CP1253.TXT: cp1253 в таблицу Unicode, версия 2.01» . Консорциум Unicode .
  4. ^ «7.2.3. Стандартные кодировки» . Документация по Python 3.6 . Фонд программного обеспечения Python.
  5. ^ "Кодовая страница 1253 информационного документа" . Архивировано из оригинала на 2016-03-03.
  6. ^ "Информационный документ CCSID 1253" . Архивировано из оригинала на 2016-03-27.
  7. ^ "Информационный документ CCSID 5349" . Архивировано из оригинала на 2014-11-29.
  8. ^ Кодовая страница CPGID 01253 (pdf) (PDF) , IBM
  9. ^ Кодовая страница CPGID 01253 (txt) , IBM
  10. ^ Международные компоненты для Unicode (ICU), ibm-1253_P100-1995.ucm , 2002-12-03
  11. ^ Международные компоненты для Unicode (ICU), ibm-5349_P100-1998.ucm , 2002-12-03

Внешние ссылки [ править ]

  • Кодовая страница 1253 справочная таблица
  • Диаграмма WHATWG для верхней (не ASCII) половины Windows-1253