MIME / IANA | ISO-8859-6 |
---|---|
Псевдоним (а) | iso-ir-127, ECMA-114, ASMO-708, арабский, csISOLatinArabic [1] |
Стандарт | ASMO 708, ECMA-114, ISO / IEC 8859-6 |
Классификация | расширенный ASCII , ISO 8859 |
Расширения | OEM-708 , Mac OS арабский (почти) |
Предшествует | ASMO 449 |
Другая связанная кодировка (и) | Windows-1256 (несовместимо, перемещает несколько букв) |
ISO / IEC 8859-6: 1999 , Информационные технологии - 8-битные однобайтовые графические наборы символов - Часть 6: Латинский / арабский алфавит , является частью серии стандартных кодировок символов на основе ASCII ISO / IEC 8859 , первое издание опубликовано в 1987 году. Неофициально он называется латинским / арабским . Он был разработан для арабского языка . Кодируются только номинальные буквы, предварительная форма букв отсутствует, поэтому для отображения требуется обработка формования. Он не включает дополнительные буквы, необходимые для написания большинства языков с арабской графикой, кроме самого арабского (таких как персидский, урду и т. Д.).
ISO-8859-6 является предпочтительным названием кодировки IANA для этого стандарта, если он дополнен управляющими кодами C0 и C1 из ISO / IEC 6429 . Текст находится в логическом порядке, поэтому для отображения требуется обработка BiDi . Номинально ISO-8859-6 ( кодовая страница 28596 ) предназначен для «визуального порядка», а ISO-8859-6-I ( кодовая страница 38596 ) - для логического порядка. Но на практике и требуется для документов HTML и XML, ISO-8859-6 также обозначает текст логического порядка. Также есть ISO-8859-6-Eкоторый предположительно требует явного указания направленности с помощью специальных управляющих символов; этот последний вариант на практике не используется. IBM присвоила кодовую страницу / CCSID 1089 стандарту ISO 8859-6. [2] [3] Это эмуляция их операционной системы AIX .
Unicode предпочтительнее ISO-8859-6 в современных приложениях, особенно в Интернете; что означает доминирующую кодировку UTF-8 для веб-страниц (см. также арабский шрифт в Unicode , для полного охвата, в отличие, например, от ISO-8859-6 или Windows 1256, которые не охватывают дополнительные функции). 0,1% всех веб-страниц используют ISO-8859-6. [4] [5]
История [ править ]
ASMO 708 был разработан ныне несуществующей Арабской организацией по стандартизации и метрологии [6] в 1986 году как 8-битный стандарт для использования в арабоязычных странах. Дизайн этого набора символов был вдохновлен предыдущим 7-битным стандартом - ASMO 449 - но это не просто 7-битный набор символов, перемещенный в верхнюю часть; есть некоторые отличия.
ASMO 708 - это двунаправленный набор символов. Нижняя часть набора символов отличается от стандарта ISO 646 цифрами и некоторыми пунктуацией. В зависимости от контекста (находятся ли числа в латинском или арабском шрифте) цифры отображаются либо как латинские, либо как арабские цифры. Кроме того, в зависимости от контекста симметричные знаки препинания меняются местами, то есть всякий раз, когда есть открывающий знак препинания, форма отображается по-разному в соответствии с направлением сценария.
В верхней части набора символов есть только арабские буквы, арабская пунктуация, отличная от латинской, а также несколько других символов.
ASMO 708 был разработан в тесном сотрудничестве [7] с ECMA , которая приняла его в качестве собственного стандарта ECMA-114 в 1986 году. Он также был утвержден в качестве стандарта ISO как ISO 8859-6 . [8] Он также был зарегистрирован в Международном регистре наборов кодированных символов как IR 127 [9] в 1986 году.
Связь с другими наборами символов [ править ]
Некоторые другие наборы символов относятся к ASMO 708:
- ASMO 708 / French 1 [10] добавляет французские строчные буквы;
- Французский 1 / ASMO 708 [10] добавляет французские символы нижнего регистра в их кодовые точки ISO 8859-1 и перемещает арабские символы ;
- ISO / IR 167 [11] добавляет французские и немецкие символы;
- Кодовая страница 708 Microsoft для MS-DOS добавляет французские символы в их типичные кодовые точки из кодовой страницы 437 и добавляет символы рисования прямоугольников;
- И кодовая страница Microsoft 710 (прозрачный арабский), и кодовая страница Microsoft 720 (прозрачный ASMO) для MS-DOS добавляют французские символы в их типичные кодовые точки из кодовой страницы 437, но смещают арабские символы, чтобы можно было рисовать символы из кода страница 437 должна быть в исходном коде;
- Microsoft Windows 1256 добавляет французские символы нижнего регистра в свои кодовые точки Windows 1252 и перемещает арабские символы ;
Таблица кодов [ править ]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | ||||||||||||||||
1_ 16 | ||||||||||||||||
2_ 32 | SP 0020 | ! 0021 | « 0022 | # 0023 | 0024 долл. США | % / ٪ 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * / ٭ 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0/٠ 0030 | 1/ 0031 | 2 февраля 0032 | 3/٣ 0033 | 4 января 0034 | 5 мая 0035 | 6 июня 0036 | 7 августа 0037 | 8 августа 0038 | 9 сентября 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | I 0049 | J 004A | K 004B | L 004C | M 004D | № 004E | O 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | Т 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | а 0061 | b 0062 | c 0063 | d 0064 | e 0065 | f 0066 | г 0067 | h 0068 | я 0069 | j 006A | k 006B | l 006C | м 006D | № 006E | o 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | v 0076 | w 0077 | х 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | |
8_ 128 | ||||||||||||||||
9_ 144 | ||||||||||||||||
A_ 160 | NBSP 00A0 | ¤ 00A4 | ، 060C | SHY 00AD | ||||||||||||
B_ 176 | ؛ 061B | ؟ 061F | ||||||||||||||
C_ 192 | ء 0621 | آ 0622 | أ 0623 | ؤ 0624 | إ 0625 | ئ 0626 | ا 0627 | ب 0628 | ة 0629 | ت 062A | ث 062B | ج 062C | ح 062D | خ 062E | د 062F | |
D_ 208 | ذ 06:30 | ر 0631 | ز 0632 | س 0633 | ش 0634 | ص 0635 | ض 0636 | ط 0637 | ظ 0638 | ع 0639 | غ 063A | |||||
E_ 224 | 0640 | ف 0641 | ق 0642 | ك 0643 | ل 0644 | م 0645 | ن 0646 | ه 0647 | و 0648 | ى 0649 | ي 064A | ◌ً 064B | ◌ٌ 064C | ◌ٍ 064D | ◌َ 064E | ◌ُ 064F |
F_ 240 | ◌ِ 0650 | ◌ّ 0651 | ◌ْ 0652 |
Письмо Число Пунктуация Условное обозначение Другой Неопределенный
Кодовые значения 0xEB – 0xF2 назначаются для комбинирования символов .
См. Также [ править ]
- ASMO 449
- ISO 8859
- Windows-1256 (арабская кодовая страница Windows)
Ссылки [ править ]
- ^ Наборы символов , Internet Assigned Numbers Authority (IANA), 2018-12-12
- ^ "Кодовая страница 1089 информационного документа" . Архивировано из оригинала на 2016-03-17.
- ^ "Информационный документ CCSID 1089" . Архивировано из оригинала на 2016-03-27.
- ^ «Статистика использования ISO-8859-6 для веб-сайтов, январь 2019» . w3techs.com . Проверено 17 января 2019 .
- ^ https://w3techs.com/faq
- ^ Le codage informatique de l'écriture arabe: d'ASMO 449 à Unicode et ISO / CEI 10646
- ^ Стандартный ECMA-114
- ^ ИСО / МЭК 8859-6: 1999
- ^ "Правая часть латинского / арабского алфавита" (PDF) . Архивировано из оригинального (PDF) 21 декабря 2016 года . Проверено 20 февраля 2017 .
- ^ a b Справочное руководство программиста-программиста эмуляции ACA Printronix
- ^ Арабский / французский / немецкий набор
- ^ "ISO 8859-6: 1999 в Unicode" . 1999-07-27.
- ^ Кодовая страница CPGID 01089 (pdf) (PDF) , IBM
- ^ Кодовая страница CPGID 01089 (txt) , IBM
- ^ Международные компоненты для Unicode (ICU), ibm-1089_P100-1995.ucm , 2002-12-03
Внешние ссылки [ править ]
- ИСО / МЭК 8859-6: 1999
- Стандартный ECMA-114 : 8-битные однобайтовые графические наборы символов - латинский / арабский алфавит, 2-е издание (декабрь 2000 г.)
- ISO-IR 127 Правая часть латинского / арабского алфавита (30 ноября 1986 г.)