Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

ISO / IEC 8859-8 , Информационные технологии - 8-битные однобайтовые наборы графических символов - Часть 8: Латинский / еврейский алфавит , является частью серии стандартных кодировок символов на основе ASCII ISO / IEC 8859 . ИСО / МЭК 8859-8: 1999 с 1999 года представляет собой его вторую и текущую редакцию, которой предшествует первая редакция ИСО / МЭК 8859-8: 1988 в 1988 году. Она неофициально называется Latin / Hebrew . ИСО / МЭК 8859-8 охватывает все буквы иврита , но не содержит гласных иврита . IBM присвоила ему кодовую страницу 916 ( CCSID 916 и 5012). [2][3] [4] Этот набор символов также был принят израильским стандартом SI1311: 2002 с некоторыми расширениями.

ISO-8859-8 - предпочтительное название набора символов IANA для этого стандарта, если оно дополнено управляющими кодами C0 и C1 из ISO / IEC 6429 . Текст (обычно) находится в логическом порядке, поэтому для отображения требуется обработка двунаправленного текста. Номинально ISO-8859-8 ( кодовая страница 28598 ) предназначен для «визуального порядка», а ISO-8859-8- I ( кодовая страница 38598 ) - для логического порядка. Но обычно на практике и требуется для XML-документов, [ ссылка ] ISO-8859-8 также обозначает текст в логическом порядке. WHATWG Кодирование Стандартный используется HTML5обрабатывает ISO-8859-8 и ISO-8859-8- I как отдельные кодировки с одинаковым отображением из-за влияния на направление компоновки, но отмечает, что это больше не относится к ISO-8859-6 (арабский), только к ISO- 8859-8. [5]

Также существует ISO-8859-8-E, который якобы требует явного указания направленности с помощью специальных управляющих символов; этот последний вариант на практике не используется.

Microsoft Windows кодовая страница для иврита, Windows-1255 , в основном является расширение стандарта ISO / IEC 8859-8 без контроля С1, за исключение отсутствия двойного подчеркивания за исключением, и замена родового знака валюты ( ¤ ) с знаком шекеля (₪). Он добавляет поддержку гласных в качестве комбинированных символов и некоторые дополнительные знаки препинания.

Спустя более десяти лет после публикации этого стандарта Unicode является предпочтительным, по крайней мере, для Интернета [6] (что означает UTF-8 , доминирующую кодировку для веб-страниц). ISO-8859-8 используется менее чем на 0,1% веб-сайтов. [7]

Макет кодовой страницы [ править ]

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный

  Отличается от DEC Hebrew (8-бит) для соответствия ISO-8859-1 .
  Отличается как от DEC Hebrew (8-bit), так и от ISO-8859-1 .

FD - это знак слева направо (U + 200E), а FE - знак справа налево (U + 200F), как указано в новой поправке в ISO / IEC 8859-8: 1999.

Расширения Израильского стандарта 2002 г. [ править ]

Израильский стандарт SI1311: 2002 соответствует ISO / IEC 8859-8: 1999, за исключением ряда дополнительных символов для знака евро , нового знака шекеля и более продвинутого явного двунаправленного форматирования . [12]

  Отсутствует в ISO / IEC 8859-8: 1999, добавлен в SI1311: 2002.

См. Также [ править ]

  • 8-битный иврит DEC (аналогичная кодовая страница DEC)
  • Кодовая страница 1255 (аналогичная кодовая страница Windows)
  • SI 960
  • 7-битный DEC иврит

Ссылки [ править ]

  1. ^ Наборы символов , Internet Assigned Numbers Authority (IANA), 2018-12-12
  2. ^ "Кодовая страница 916 информационного документа" . Архивировано из оригинала на 2017-02-16.
  3. ^ "Информационный документ CCSID 916" . Архивировано из оригинала на 2014-11-29.
  4. ^ "Информационный документ CCSID 5012" . Архивировано из оригинала на 2016-03-27.
  5. ^ ван Кестерен, Энн . «9. Устаревшие однобайтовые кодировки» . Стандарт кодирования . WHATWG . Примечание: ISO-8859-8 и ISO-8859-8- I - разные имена кодировки, потому что ISO-8859-8 влияет на направление компоновки. И хотя исторически это могло быть так и для ISO-8859-6 и «ISO-8859-6- I », это уже неверно.
  6. ^ Джон, Николас А. (2013). «Строительство многоязычного Интернета: Юникод, иврит и глобализация» . Журнал компьютерных коммуникаций . 18 (3): 321–338. DOI : 10.1111 / jcc4.12015 . ISSN 1083-6101 . Предыстория: проблема иврита и Интернета 
  7. ^ «Статистика использования ISO-8859-8 для веб-сайтов, январь 2019» . w3techs.com . Проверено 17 января 2019 .
  8. ^ Кодовая страница CPGID 00916 (pdf) (PDF) , IBM
  9. ^ Кодовая страница CPGID 00916 (txt) , IBM
  10. ^ Международные компоненты для Unicode (ICU), ibm-916_P100-1995.ucm , 2002-12-03
  11. ^ Международные компоненты для Unicode (ICU), ibm-5012_P100-1999.ucm , 2002-12-03
  12. ^ a b Институт стандартов Израиля . «ISO-IR 234: набор символов латиницы / иврита для 8-битных кодов» (PDF) . Комиссия по стандартам информационных технологий Японии (ITSCJ / IPSJ ).

Внешние ссылки [ править ]

  • ИСО / МЭК 8859-8: 1999
  • Изменения стандарта ECMA :
    • Стандартный ECMA-121 - 8-битные однобайтовые графические наборы символов - латинский / еврейский алфавит (PDF) (1-е изд.). Европейская ассоциация производителей компьютеров (ECMA). Июль 1987. Архивировано 15 февраля 2017 года (PDF) . Проверено 15 февраля 2016 .
    • Стандартный ECMA-121 - 8-битные однобайтовые графические наборы символов - латинский / еврейский алфавит (PDF) (2-е изд.). Европейская ассоциация производителей компьютеров (ECMA). Декабрь 2000. Архивировано (PDF) из оригинала 15.02.2017 . Проверено 15 февраля 2016 .( [1] )
  • Израильский стандарт SI1311: 2002 (иврит)
  • Регистрации ISO-IR:
    • Из ECMA-121: 1987 и согласно ISO / IEC 8859-8: 1988: Европейская ассоциация производителей компьютеров (1987-07-31). ISO-IR 138 - латинский / еврейский алфавит (PDF) . Комиссия по стандартам информационных технологий Японии (ITSCJ / IPSJ ). Архивировано (PDF) из оригинала на 2017-02-15 . Проверено 17 августа 2019 .
    • Согласно ISO / IEC 8859-8: 1999 и ECMA-121: 2000: Институт стандартов Израиля (1998-05-01). ISO-IR 198 - Латинский / еврейский алфавит (PDF) . Комиссия по стандартам информационных технологий Японии (ITSCJ / IPSJ ). Архивировано (PDF) из оригинала на 2017-02-15 . Проверено 15 февраля 2017 .
    • Из SI 1311: 2002: Институт стандартов Израиля (2004-07-20). ISO-IR 234 - набор символов латиницы / иврита для 8-битных кодов (PDF) . Комиссия по стандартам информационных технологий Японии (ITSCJ / IPSJ ). Архивировано (PDF) из оригинала на 2017-02-15 . Проверено 15 февраля 2017 .