Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Windows-1255 - это кодовая страница, используемая в Microsoft Windows для записи на иврите . Это почти совместимый надмножество ISO 8859-8  - большинство символов находятся в тех же позициях (за исключением A4, который является «знаком шекеля» в Windows-1255, но «общим знаком валюты» в ISO 8859-8 и за исключением DF, который не определен в Windows-1255, но «двойная нижняя линия» в ISO 8859-8), но Windows-1255 добавляет гласные и другие знаки в нижних позициях.

IBM использует кодовую страницу 1255 ( CCSID 1255, расширенный CCSID 5351 для знака евро и еще более расширенный CCSID 9447) для Windows-1255. [1] [2] [3] [4]

Современные приложения предпочитают Unicode Windows-1255, особенно в Интернете; [5] означает UTF-8 , доминирующую кодировку для веб-страниц (или UTF-16, но не в Интернете по соображениям безопасности). Windows-1255 используется менее чем на 0,1% веб-сайтов. [6]

Набор символов [ править ]

В следующей таблице показана Windows-1255. Каждый символ отображается с его эквивалентом в Юникоде .

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный  Отличия от ISO 8859-8

Использование [ править ]

Windows-1255 Иврит всегда в логическом порядке (в отличие от визуального). Продукты Microsoft иврита (Windows, Office и Internet Explorer) сделали логически упорядоченный иврит повсеместным, в результате чего Windows-1255 является кодировкой иврита, которую можно найти больше всего в Интернете, вытеснив визуально упорядоченный ISO-8859-8 , и предпочтительнее логически упорядоченного ISO-8859-8-I, потому что он обеспечивает точки гласных.

Отношение к Unicode [ править ]

Юникода блок иврит (U + 0590-U + 05FF) следующим образом Окна-1255 путем кодирования как буквы , так и гласных точек в одних и тех же относительных положениях , как Windows-1255. Unicode идет дальше в кодировании кантиляционных знаков в нижних позициях. Юникод на иврите всегда в логическом порядке.

Для современных приложений предпочтительной кодировкой является UTF-8 или UTF-16 .

См. Также [ править ]

  • 7-битный иврит в соответствии с ISO 646
  • Кодовая страница 862
  • ISO 8859-8
  • LMBCS-3

Ссылки [ править ]

  1. ^ "Кодовая страница 1255 информационного документа" . Архивировано из оригинала на 2016-03-04.
  2. ^ "Информационный документ CCSID 1255" . Архивировано из оригинала на 2016-03-27.
  3. ^ "Информационный документ CCSID 5351" . Архивировано из оригинала на 2014-11-29.
  4. ^ "Информационный документ CCSID 9447" . Архивировано из оригинала на 2016-03-26.
  5. ^ Джон, Николас А. (2013). «Строительство многоязычного Интернета: Юникод, иврит и глобализация» . Журнал компьютерных коммуникаций . 18 (3): 321–338. DOI : 10.1111 / jcc4.12015 . ISSN 1083-6101 . Предыстория: проблема иврита и Интернета 
  6. ^ «Статистика использования Windows-1255 для веб-сайтов, январь 2019» . w3techs.com . Проверено 17 января 2019 .
  7. ^ Таблица сопоставления Unicode для Windows 1255
  8. ^ Отображение Unicode окон 1255 с "наилучшим соответствием"
  9. ^ Кодовая страница CPGID 01255 (pdf) (PDF) , IBM
  10. ^ Кодовая страница CPGID 01255 (txt) , IBM
  11. ^ Международные компоненты для Unicode (ICU), ibm-1255_P100-1995.ucm , 2002-12-03
  12. ^ Международные компоненты для Unicode (ICU), ibm-1251_P100-1995.ucm , 2002-12-03
  13. ^ Международные компоненты для Unicode (ICU), ibm-5351_P100-1998.ucm , 2002-12-03

Внешние ссылки [ править ]

  • Регистрация имени кодировки IANA для windows-1255