Из Википедии, свободной энциклопедии
  (Перенаправлено с ISO-8859-6 )
Перейти к навигации Перейти к поиску

ISO / IEC 8859-6: 1999 , Информационные технологии - 8-битные однобайтовые графические наборы символов - Часть 6: Латинский / арабский алфавит , является частью серии стандартных кодировок символов на основе ASCII ISO / IEC 8859 , первое издание опубликовано в 1987 году. Неофициально он называется латинским / арабским . Он был разработан для арабского языка . Кодируются только номинальные буквы, предварительная форма букв отсутствует, поэтому для отображения требуется обработка формования. Он не включает дополнительные буквы, необходимые для написания большинства языков с арабской графикой, кроме самого арабского (таких как персидский, урду и т. Д.).

ISO-8859-6 является предпочтительным названием кодировки IANA для этого стандарта, если он дополнен управляющими кодами C0 и C1 из ISO / IEC 6429 . Текст находится в логическом порядке, поэтому для отображения требуется обработка BiDi . Номинально ISO-8859-6 ( кодовая страница 28596 ) предназначен для «визуального порядка», а ISO-8859-6-I ( кодовая страница 38596 ) - для логического порядка. Но на практике и требуется для документов HTML и XML, ISO-8859-6 также обозначает текст логического порядка. Также есть ISO-8859-6-Eкоторый предположительно требует явного указания направленности с помощью специальных управляющих символов; этот последний вариант на практике не используется. IBM присвоила кодовую страницу / CCSID 1089 стандарту ISO 8859-6. [2] [3] Это эмуляция их операционной системы AIX .

Unicode предпочтительнее ISO-8859-6 в современных приложениях, особенно в Интернете; что означает доминирующую кодировку UTF-8 для веб-страниц (см. также арабский шрифт в Unicode , для полного охвата, в отличие, например, от ISO-8859-6 или Windows 1256, которые не охватывают дополнительные функции). 0,1% всех веб-страниц используют ISO-8859-6. [4] [5]

История [ править ]

ASMO 708 был разработан ныне несуществующей Арабской организацией по стандартизации и метрологии [6] в 1986 году как 8-битный стандарт для использования в арабоязычных странах. Дизайн этого набора символов был вдохновлен предыдущим 7-битным стандартом - ASMO 449 - но это не просто 7-битный набор символов, перемещенный в верхнюю часть; есть некоторые отличия.

ASMO 708 - это двунаправленный набор символов. Нижняя часть набора символов отличается от стандарта ISO 646 цифрами и некоторыми пунктуацией. В зависимости от контекста (находятся ли числа в латинском или арабском шрифте) цифры отображаются либо как латинские, либо как арабские цифры. Кроме того, в зависимости от контекста симметричные знаки препинания меняются местами, то есть всякий раз, когда есть открывающий знак препинания, форма отображается по-разному в соответствии с направлением сценария.

В верхней части набора символов есть только арабские буквы, арабская пунктуация, отличная от латинской, а также несколько других символов.

ASMO 708 был разработан в тесном сотрудничестве [7] с ECMA , которая приняла его в качестве собственного стандарта ECMA-114 в 1986 году. Он также был утвержден в качестве стандарта ISO как ISO 8859-6 . [8] Он также был зарегистрирован в Международном регистре наборов кодированных символов как IR 127 [9] в 1986 году.

Связь с другими наборами символов [ править ]

Некоторые другие наборы символов относятся к ASMO 708:

  • ASMO 708 / French 1 [10] добавляет французские строчные буквы;
  • Французский 1 / ASMO 708 [10] добавляет французские символы нижнего регистра в их кодовые точки ISO 8859-1 и перемещает арабские символы ;
  • ISO / IR 167 [11] добавляет французские и немецкие символы;
  • Кодовая страница 708 Microsoft для MS-DOS добавляет французские символы в их типичные кодовые точки из кодовой страницы 437 и добавляет символы рисования прямоугольников;
  • И кодовая страница Microsoft 710 (прозрачный арабский), и кодовая страница Microsoft 720 (прозрачный ASMO) для MS-DOS добавляют французские символы в их типичные кодовые точки из кодовой страницы 437, но смещают арабские символы, чтобы можно было рисовать символы из кода страница 437 должна быть в исходном коде;
  • Microsoft Windows 1256 добавляет французские символы нижнего регистра в свои кодовые точки Windows 1252 и перемещает арабские символы ;

Таблица кодов [ править ]

  Письмо  Число  Пунктуация  Условное обозначение  Другой  Неопределенный

Кодовые значения 0xEB – 0xF2 назначаются для комбинирования символов .

См. Также [ править ]

  • ASMO 449
  • ISO 8859
  • Windows-1256 (арабская кодовая страница Windows)

Ссылки [ править ]

  1. ^ Наборы символов , Internet Assigned Numbers Authority (IANA), 2018-12-12
  2. ^ "Кодовая страница 1089 информационного документа" . Архивировано из оригинала на 2016-03-17.
  3. ^ "Информационный документ CCSID 1089" . Архивировано из оригинала на 2016-03-27.
  4. ^ «Статистика использования ISO-8859-6 для веб-сайтов, январь 2019» . w3techs.com . Проверено 17 января 2019 .
  5. ^ https://w3techs.com/faq
  6. ^ Le codage informatique de l'écriture arabe: d'ASMO 449 à Unicode et ISO / CEI 10646
  7. ^ Стандартный ECMA-114
  8. ^ ИСО / МЭК 8859-6: 1999
  9. ^ "Правая часть латинского / арабского алфавита" (PDF) . Архивировано из оригинального (PDF) 21 декабря 2016 года . Проверено 20 февраля 2017 .
  10. ^ a b Справочное руководство программиста-программиста эмуляции ACA Printronix
  11. ^ Арабский / французский / немецкий набор
  12. ^ "ISO 8859-6: 1999 в Unicode" . 1999-07-27.
  13. ^ Кодовая страница CPGID 01089 (pdf) (PDF) , IBM
  14. ^ Кодовая страница CPGID 01089 (txt) , IBM
  15. ^ Международные компоненты для Unicode (ICU), ibm-1089_P100-1995.ucm , 2002-12-03

Внешние ссылки [ править ]

  • ИСО / МЭК 8859-6: 1999
  • Стандартный ECMA-114 : 8-битные однобайтовые графические наборы символов - латинский / арабский алфавит, 2-е издание (декабрь 2000 г.)
  • ISO-IR 127 Правая часть латинского / арабского алфавита (30 ноября 1986 г.)