Псевдоним (а) | ISO-IR-111 |
---|---|
Язык (и) | Русский , белорусский , македонский , сербский , украинский (частично) |
Стандарт | ECMA-113: 1986 |
Классификация | Расширенный ASCII , KOI |
Расширяется | КОИ8-Б |
Преемник | ECMA-113: 1988 ( ISO-8859-5 ) |
Другая связанная кодировка (и) | КОИ8-Ф |
ISO-IR-111 [1] или KOI8-E [2] - это 8-битный набор символов. Это многонациональное расширение KOI-8 для белорусского , македонского , сербского и украинского языков (кроме Ґ ґ, добавляемого в KOI8-F ). Название «ISO-IR-111» относится к его регистрационному номеру в реестре ISO-IR и обозначает его как набор, который можно использовать с ISO / IEC 2022 .
Он был определен в первом (1986) издании ECMA-113 [3], который является международным стандартом Ecma, соответствующим ISO / IEC 8859-5 , и как таковой также соответствует черновой версии ISO-8859-5 1987 года. [4] Опубликованные редакции ISO / IEC 8859-5 вместо этого соответствуют последующим редакциям ECMA-113, которые определяют другую кодировку. [5]
Путаница в именах [ править ]
ISO-IR-111, редакция ECMA-113 1985 г. (также называемая «ECMA-Cyrillic» или «KOI8-E»), была основана на редакции ГОСТ 19768 1974 г. (т. Е. KOI-8 ). В 1987 году ECMA-113 был модернизирован. [5] Эти новые редакции ECMA-113 эквивалентны ISO-8859-5 , [5] [6] и не соответствуют структуре KOI. Эта путаница привела к распространенному заблуждению о том, что ISO-8859-5 был определен в ГОСТ 19768-74 или основан на нем. [6]
Возможно, как еще одно следствие этого, RFC 1345 ошибочно перечисляет другую кодовую страницу под именами «ISO-IR-111» и «ECMA-Cyrillic», напоминающую ISO-8859-5 с переупорядоченными строками и частично совместимую с Windows-1251. . [7] [6] Из-за опасений, что существующие реализации могут использовать определение RFC 1345 для этих двух меток, было предложено, чтобы IANA дополнительно распознала KOI8-E
в качестве метки для контента ECMA-113: 1985, [7] и в настоящее время IANA перечисляет этот ярлык как псевдоним. [2]
Набор символов [ править ]
В следующей таблице показана кодировка ISO-IR-111. Каждый символ отображается с его эквивалентной кодовой точкой Unicode .
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | ||||||||||||||||
1_ 16 | ||||||||||||||||
2_ 32 | SP 0020 | ! 0021 | « 0022 | # 0023 | 0024 долл. США | % 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | I 0049 | J 004A | K 004B | L 004C | M 004D | № 004E | O 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | Т 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | а 0061 | b 0062 | c 0063 | d 0064 | e 0065 | f 0066 | г 0067 | h 0068 | я 0069 | j 006A | k 006B | l 006C | м 006D | № 006E | o 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | v 0076 | w 0077 | х 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | |
8_ 128 | ||||||||||||||||
9_ 144 | ||||||||||||||||
A_ 160 | NBSP 00A0 | ђ 0452 | ѓ 0453 | ё 0451 | є 0454 | ѕ 0455 | і 0456 | ї 0457 | ј 0458 | љ 0459 | њ 045A | ћ 045B | ќ 045C | SHY 00AD | ў 045E | џ 045F |
B_ 176 | № 2116 | Ђ 0402 | Ѓ 0403 | Ё 0401 | Є 0404 | Ѕ 0405 | І 0406 | Ї 0407 | Ј 0408 | Љ 0409 | Њ 040A | Ћ 040B | Ќ 040C | ¤ 00A4 | Ў 040E | Џ 040F |
C_ 192 | ю 044E | а 0430 | б 0431 | ц 0446 | д 0434 | е 0435 | ф 0444 | г 0433 | х 0445 | и 0438 | © 0439 | к 043A | л 043Б | м 043C | н 043D | о 043E |
D_ 208 | п 043F | я 044F | р 0440 | с 0441 | т 0442 | у 0443 | ж 0436 | в 0432 | ь 044C | ы 044B | з 0437 | ш 0448 | э 044D | щ 0449 | ч 0447 | ъ 044A |
E_ 224 | Ю 042E | А 0410 | Б 0411 | Ц 0426 | Д 0414 | Е 0415 | Ф 0424 | Г 0413 | Х 0425 | И 0418 | № 0419 | К 041A | Л 041B | М 041C | Н 041D | О 041E |
F_ 240 | П 041F | Я 042F | Р 0420 | С 0421 | Т 0422 | У 0423 | Ж 0416 | В 0412 | Ь 042C | Ы 042B | З 0417 | Ш 0428 | Э 042D | Щ 0429 | Ч 0427 | Ъ 042A |
Письмо Число Пунктуация Символ Другой Неопределенный
Расширенная и измененная версии [ править ]
Модифицированная версия с именем KOI8 Unified или KOI8-F был использован в программном обеспечении , разрабатываемое Fingertip Software, добавив Гп в его KOI8-U месте (замена мягкого дефиса и вытесняя универсальный знак валюты ), и добавив некоторые графические символы в контроле C1 области кодов , в основном из KOI8-R и Windows-1251 . [4] [6] [8] [9]
Неправильная кодовая страница RFC 1345 [ править ]
Язык (и) | Русский , белорусский , македонский , сербский |
---|---|
Стандарт | RFC 1345 |
Классификация | Расширенный ASCII |
Преобразует / кодирует | ISO-IR-111 |
Другая связанная кодировка (и) | ISO-8859-5 , Windows-1251 |
RFC 1345 ошибочно перечисляет другую кодовую страницу под именем ISO-IR-111, кодируя те же кириллические символы, но с другим макетом. Он напоминает смесь Windows-1251 и ISO-8859-5 . [7] В частности, линия A_ соответствует ISO-8859-5, строки C_ - F_ соответствуют Windows-1251 [6] (эквивалент строкам B_ - E_ ISO-8859-5), а линия B_ почти соответствует строке F_ ИСО-8859-5, за исключением из § заменяется на ¤ .
Некоторые коды напоминают ISO-IR-111 с перевернутым регистром букв, что, возможно, способствовало путанице. Большинство из них различаются и показаны ниже с жирной рамкой.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8_ 128 | ||||||||||||||||
9_ 144 | ||||||||||||||||
A_ 160 | NBSP 00A0 | Ё 0401 | Ђ 0402 | Ѓ 0403 | Є 0404 | Ѕ 0405 | І 0406 | Ї 0407 | Ј 0408 | Љ 0409 | Њ 040A | Ћ 040B | Ќ 040C | SHY 00AD | Ў 040E | Џ 040F |
B_ 176 | № 2116 | ё 0451 | ђ 0452 | ѓ 0453 | є 0454 | ѕ 0455 | і 0456 | ї 0457 | ј 0458 | љ 0459 | њ 045A | ћ 045B | ќ 045C | ¤ 00A4 | ў 045E | џ 045F |
C_ 192 | А 0410 | Б 0411 | В 0412 | Г 0413 | Д 0414 | Е 0415 | Ж 0416 | З 0417 | И 0418 | № 0419 | К 041A | Л 041B | М 041C | Н 041D | О 041E | П 041F |
D_ 208 | Р 0420 | С 0421 | Т 0422 | У 0423 | Ф 0424 | Х 0425 | Ц 0426 | Ч 0427 | Ш 0428 | Щ 0429 | Ъ 042A | Ы 042B | Ь 042C | Э 042D | Ю 042E | Я 042F |
E_ 224 | а 0430 | б 0431 | в 0432 | г 0433 | д 0434 | е 0435 | ж 0436 | з 0437 | и 0438 | © 0439 | к 043A | л 043Б | м 043C | н 043D | о 043E | п 043F |
F_ 240 | р 0440 | с 0441 | т 0442 | у 0443 | ф 0444 | х 0445 | ц 0446 | ч 0447 | ш 0448 | щ 0449 | ъ 044A | ы 044B | ь 044C | э 044D | ю 044E | я 044F |
Письмо Число Пунктуация Символ Другой Неопределенный Отклонение от ISO-IR-111 (исключая отклонения только в случае)
См. Также [ править ]
- Кодировки символов KOI
Ссылки [ править ]
- ↑ ECMA (1 августа 1985 г.). Правая часть кириллического алфавита (PDF) . ITSCJ / IPSJ . ISO-IR -111.
- ^ a b «Наборы символов» . IANA.
- ^ ECMA-113. Наборы 8-битных однобайтовых графических символов - латинский / кириллица (1-е изд., Июнь 1986 г.)
- ^ a b Czyborra, Роман (1998-11-30) [1998-05-25]. «Суп с кириллической кодировкой» . Архивировано из оригинала на 2016-12-03 . Проверено 3 декабря 2016 .
- ^ а б в ECMA-113. Наборы 8-битных однобайтовых графических символов - латинский / кириллица (2-е изд., Июнь 1988 г.)
- ^ a b c d e Нечаев, Валентин (2013) [2001]. «Обзор вселенной 8-битных кодировок кириллицы» . Архивировано 5 декабря 2016 года . Проверено 5 декабря 2016 .
- ^ a b c Соколов, Михаил (05.04.2003). "ECMA-кириллический псевдоним iso-ir-111 sore" . Список рассылки кодировок IETF .
- ^ "KOI8 Unified" . Программное обеспечение для пальцев. Архивировано из оригинала на 1998-01-09 . Проверено 11 февраля 2020 .
- ^ Лейшер, Марк (2008) [1998-03-05]. «Унифицированная таблица преобразования кириллицы в Unicode 2.1 KOI8» . Департамент математических наук Государственного университета Нью-Мексико . Проверено 2 мая 2020 .