ISO / IEC 8859-5: 1999 , Информационные технологии - 8-битные однобайтовые графические наборы символов - Часть 5: Латинский / кириллица , является частью серии стандартных кодировок символов на основе ASCII ISO / IEC 8859 , первое издание опубликовано в 1988 году. Неофициально называется Latin / Cyrillic . Он был разработан для охвата языков, использующих кириллицу, таких как болгарский , белорусский , русский , сербский и македонский, но так и не получил широкого распространения. Это было бы также использовать для украинца в Советском Союзес 1933–1990 гг., но в нем отсутствует украинская буква ge ,, которая требовалась в украинской орфографии до и после, а также в течение этого периода за пределами Советской Украины . В результате IBM создала кодовую страницу 1124 .
Псевдоним (а) | ISO-IR-144, кириллица, csISOLatinCyrillic [1] |
---|---|
Язык (и) | Русский , болгарский , белорусский , македонский , сербский , украинский (частично) |
Стандарт | ISO / IEC 8859-5, ECMA-113 (с издания 1988 г.) |
Классификация | Расширенный ASCII , ISO 8859 |
Расширяется | US-ASCII , ISO-IR-153 |
На основе | Основная кодовая страница [2] |
Расширения | IBM-915 |
Предшествует | ECMA-113: 1986 ( ISO-IR-111 ) |
Другая связанная кодировка (и) | IBM-1124 |
ISO-8859-5 - предпочтительное название набора символов IANA для этого стандарта, если оно дополнено управляющими кодами C0 и C1 из ISO / IEC 6429 .
Гораздо чаще используются 8-битные кодировки KOI8-R и KOI8-U , CP866 , а также Windows-1251 . В отличие от Windows-1252 и ISO 8859-1 , Windows-1251 не имеет тесного отношения к ISO 8859-5. Страница Windows , код для ISO-8859-5 является кодовой страницей 28595 аки Windows-28595 . [3]
В основном блоке кириллицы Unicode используется макет, основанный на ISO-8859-5.
Макет кодовой страницы
Каждый символ отображается с его эквивалентом в Юникоде .
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | ||||||||||||||||
1_ 16 | ||||||||||||||||
2_ 32 | SP 0020 | ! 0021 | « 0022 | # 0023 | 0024 долл. США | % 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | I 0049 | J 004A | K 004B | L 004C | M 004D | № 004E | O 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | Т 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | а 0061 | b 0062 | c 0063 | d 0064 | e 0065 | f 0066 | г 0067 | h 0068 | я 0069 | j 006A | k 006B | l 006C | м 006D | № 006E | o 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | v 0076 | w 0077 | х 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | |
8_ 128 | ||||||||||||||||
9_ 144 | ||||||||||||||||
A_ 160 | NBSP 00A0 | Ё 0401 | Ђ 0402 | Ѓ 0403 | Є 0404 | Ѕ 0405 | І 0406 | Ї 0407 | Ј 0408 | Љ 0409 | Њ 040A | Ћ 040B | Ќ 040C | SHY 00AD | Ў 040E | Џ 040F |
B_ 176 | А 0410 | Б 0411 | В 0412 | Г 0413 | Д 0414 | Е 0415 | Ж 0416 | З 0417 | И 0418 | № 0419 | К 041A | Л 041B | М 041C | Н 041D | О 041E | П 041F |
C_ 192 | Р 0420 | С 0421 | Т 0422 | У 0423 | Ф 0424 | Х 0425 | Ц 0426 | Ч 0427 | Ш 0428 | Щ 0429 | Ъ 042A | Ы 042B | Ь 042C | Э 042D | Ю 042E | Я 042F |
D_ 208 | а 0430 | б 0431 | в 0432 | г 0433 | д 0434 | е 0435 | ж 0436 | з 0437 | и 0438 | © 0439 | к 043A | л 043Б | м 043C | н 043D | о 043E | п 043F |
E_ 224 | р 0440 | с 0441 | т 0442 | у 0443 | ф 0444 | х 0445 | ц 0446 | ч 0447 | ш 0448 | щ 0449 | ъ 044A | ы 044B | ь 044C | э 044D | ю 044E | я 044F |
F_ 240 | № 2116 | ё 0451 | ђ 0452 | ѓ 0453 | є 0454 | ѕ 0455 | і 0456 | ї 0457 | ј 0458 | љ 0459 | њ 045A | ћ 045B | ќ 045C | § 00A7 | ў 045E | џ 045F |
Письмо Число Пунктуация Символ Другой Неопределенный
Стандарт ECMA-113 был эквивалентен ISO-8859-5 со времени его второго издания, [4] его первое издание ( ISO-IR-111 ) было расширением более раннего KOI-8 (определено ГОСТ 19768-74). , в котором русские буквы располагаются так же, как и их римские эквиваленты в ASCII, где это возможно. Первоначальный проект ISO-8859-5 (DIS-8859-5: 1987) следовал ISO-IR-111, но был пересмотрен [4] после того, как ГОСТ 19768-74 был заменен [5] новым ISO-IR-153 в 1987, в котором русские буквы были переставлены в алфавитном порядке (кроме Ё). [5] [6] ISO-IR-153 содержит русские буквы, включая Ё, неразрывный пробел и мягкий дефис, тогда как полный набор кириллицы ISO-8859-5 также называется ISO-IR-144. [7]
Возможно, как следствие этой путаницы, RFC 1345 ошибочно перечисляет еще одну кодовую страницу как «ISO-IR-111», комбинируя порядок букв и регистр ISO-8859-5 с порядком строк ISO-IR-111 (и следовательно, не совместим ни с одним на практике, но на практике частично совместим [2] с Windows-1251 ). [8] [2]
Кодовая страница IBM 915 является расширением ISO / IEC 8859-5, добавляя некоторые полуграфические и другие символы в область C1 . Кодовая страница IBM 1124 в основном идентична ISO-8859-5, но заменяет ѓ на ґ для украинского использования.
ISO-IR-200 , «Уральский дополнительный набор кириллицы», [9] был зарегистрирован в 1998 году компанией Everson Gunn Teoranta (директором которой был Майкл Эверсон до основания Evernote в 2001 году) [10], и несколько изменяет некоторые из нерусские буквы для поддержки кильдинского саамского , коми и ненецкого языков, не поддерживаемые самим стандартом ISO-8859-5. Майкл Эверсон также представил Mac OS Barents Cyrillic для тех же языков в классической Mac OS.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
. . . | ||||||||||||||||
A_ 160 | NBSP 00A0 | Ё 0401 | Ӈ 04C7 | Ӓ 04D2 | Ӭ 04EC | Ҍ 048C | І 0406 | Ӧ 04E6 | Ҋ 048A | Ӆ 04C5 | Ӊ 04C9 | « 00AB | Ӎ 04CD | SHY 00AD | Ҏ 048E | ʼ 02BC |
. . . | ||||||||||||||||
F_ 240 | № 2116 | ё 0451 | ӈ 04C8 | ӓ 04D3 | ӭ 04ED | ҍ 048D | і 0456 | ӧ 04E7 | ҋ 048B | ӆ 04C6 | ӊ 04CA | » 00BB | ӎ 04CE | § 00A7 | ҏ 048F | ˮ 02EE |
ISO-IR-201, «Дополнительный набор кириллицы для Волги », [11] был аналогичным образом введен Эверсоном Ганном Теоранта для поддержки чувашского , коми , марийского и удмуртского языков, на которых говорят в титульных республиках России .
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
. . . | ||||||||||||||||
A_ 160 | NBSP 00A0 | Ё 0401 | Ӑ 04D0 | Ӓ 04D2 | Ӗ 04D6 | Ҫ 04AA | І 0406 | Ӧ 04E6 | Ӥ 04E4 | Ӝ 04DC | Ҥ 04A4 | Ӹ 04F8 | Ӟ 04DE | SHY 00AD | Ӱ 04F0 | Ӵ 04F4 |
. . . | ||||||||||||||||
F_ 240 | № 2116 | ё 0451 | ӑ 04D1 | ӓ 04D3 | ӗ 04D7 | ҫ 04AB | і 0456 | ӧ 04E7 | ӥ 04E5 | ӝ 04DD | ҥ 04A5 | ӹ 04F9 | ӟ 04DF | § 00A7 | ӱ 04F1 | ӵ 04F5 |
Рекомендации
- ^ Наборы символов , Управление по присвоению номеров в Интернете (IANA), 12 декабря 2018 г.
- ^ а б в Нечаев, Валентин (2013) [2001]. «Обзор вселенной 8-битных кодировок кириллицы» . Архивировано 5 декабря 2016 года . Проверено 5 декабря 2016 .
- ^ Идентификаторы кодовой страницы
- ^ а б ECMA-113. Наборы 8-битных однобайтовых графических символов - латинский / кириллица (2-е изд., Июнь 1988 г.)
- ^ а б Чиборра, Роман (1998-11-30) [1998-05-25]. «Суп с кириллической кодировкой» . Архивировано из оригинала на 2016-12-03 . Проверено 3 декабря 2016 .
- ^ http://czyborra.com/charsets/gost19768-87.txt.gz
- ^ «ИСО-ИК-144» (PDF) . 1 мая 1988 г.
- ^ Соколов, Михаил (2005-04-05). "ECMA-кириллический псевдоним iso-ir-111 sore" . Список рассылки кодировок IETF .
- ^ а б «ISO-IR 200: Уральский дополнительный набор кириллицы» (PDF) .
- ^ Ганн, Марион; Эверсон, Майкл (20 сентября 2001 г.). "Everson Gunn Teoranta (EGT) & Everson Typography" . Архив почтового списка Unicode . Консорциум Unicode.
- ^ а б «ISO-IR 201: Volgaic Supplementary Cyrillic Set» (PDF) .
Внешние ссылки
- ИСО / МЭК 8859-5: 1999
- Стандартный ECMA-113 : 8-битные однобайтовые графические наборы символов - латинский / кириллица, 3-е издание (декабрь 1999 г.)
- ISO-IR 144 Кириллица латинского / кириллического алфавита (1 мая 1988 г., из 2-й версии ISO 8859-5)