Язык (и) | Русский , болгарский |
---|---|
Стандарт | СТ СЭВ 358-88, ГОСТ Р 34.303-92 (см. Ниже ) |
Классификация | Расширенный ASCII |
На основе | Основная кодовая страница [1] |
Расширения | ISO-8859-5 , IBM-1124 , ISO-IR-200 , ISO-IR-201 |
Предшествует | КОИ8-Б [2] |
ISO-IR-153 [3] (СТ СЭВ 358-88) - это 8-битный набор символов , охватывающий русский и болгарский алфавиты. В отличие от кодировок KOI , эта кодировка перечисляет кириллические буквы в их правильном традиционном порядке. Это стало основой для ISO / IEC 8859-5 и блока Cyrillic Unicode .
Стандарты и наименования [ править ]
ISO-IR-153 - это подмножество ISO / IEC 8859-5 (синхронизировано с ECMA -113 с 1988 г.). [4] В документации ISO-IR-153 в качестве исходного стандарта цитируется СТ СЭВ 358-88. [3] Хотя он также ссылается на более ранний ГОСТ 19768-74 [3] (который определяет KOI-8 и соответствует первой версии ECMA-113, то есть ISO-IR-111 ), [4] он не следует KOI-8 макет (а , используя тесную модификацию буквы макета из главной кодовой страницы ) [1]так что это похоже на ошибку. Кодировка ISO-IR-153 была предназначена для замены ГОСТ 19768-74 и иногда упоминается как ГОСТ-19768-87. [2] [5] Эта путаница привела к распространенному заблуждению о том, что ISO-8859-5 был определен в ГОСТ 19768-74 или основан на нем. [1]
Независимо от степени их точности, в IANA списки GOST_19768-74
, ST_SEV_358-88
и в iso-ir-153
качестве меток , которые могут быть использованы для кодирования ISO-IR-153 в Интернете , со ссылкой на RFC 1345, который присваивает ему эти ярлыки. [6] [7]
ГОСТ Р 34.303-92 включает кодовую страницу ISO-IR-153 и дублирует ее KOI-8 V1 (в дополнение к использованию KOI-8 N1 и KOI-8 N2 для двух вариантов альтернативной кодовой страницы / кодовой страницы 866 ). [8]
Набор символов [ править ]
В следующей таблице показана кодировка ISO-IR-153. Каждый символ отображается с его эквивалентной кодовой точкой Unicode .
Кодировка очень похожа на буквенное подмножество кириллической части главной кодовой страницы , за исключением перемещения верхнего регистра Ё с 0x F0 на 0xA1. ISO-8859-5 - это расширенный набор.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8_ | ||||||||||||||||
9_ | ||||||||||||||||
A_ | NBSP 00A0 | Ё 0401 | SHY 00AD | |||||||||||||
B_ | А 0410 | Б 0411 | В 0412 | Г 0413 | Д 0414 | Е 0415 | Ж 0416 | З 0417 | И 0418 | № 0419 | К 041A | Л 041B | М 041C | Н 041D | О 041E | П 041F |
C_ | Р 0420 | С 0421 | Т 0422 | У 0423 | Ф 0424 | Х 0425 | Ц 0426 | Ч 0427 | Ш 0428 | Щ 0429 | Ъ 042A | Ы 042B | Ь 042C | Э 042D | Ю 042E | Я 042F |
D_ | а 0430 | б 0431 | в 0432 | г 0433 | д 0434 | е 0435 | ж 0436 | з 0437 | и 0438 | © 0439 | к 043A | л 043Б | м 043C | н 043D | о 043E | п 043F |
E_ | р 0440 | с 0441 | т 0442 | у 0443 | ф 0444 | х 0445 | ц 0446 | ч 0447 | ш 0448 | щ 0449 | ъ 044A | ы 044B | ь 044C | э 044D | ю 044E | я 044F |
F_ | ё 0451 |
Письмо Число Пунктуация Условное обозначение Другой Неопределенный
См. Также [ править ]
- ISO-IR-111
Ссылки [ править ]
- ^ a b c Нечаев, Валентин (2013) [2001]. «Обзор вселенной 8-битных кодировок кириллицы» . Архивировано 5 декабря 2016 года . Проверено 5 декабря 2016 .
- ^ a b Czyborra, Роман (1998-11-30) [1998-05-25]. «Суп с кириллической кодировкой» . Архивировано из оригинала на 2016-12-03 . Проверено 3 декабря 2016 .
[…] Тем временем ГОСТ пережил некоторую перестройку и объявил установленную базу и соответствие KOI менее важным и пересмотрел свой стандарт 19768 с 1974 по 1987 год в несовместимый новый ГОСТ 19768-87 […]
- ^ a b c d ISO-IR-153 (1 декабря 1989 г.)
- ^ а б ECMA-113. Наборы 8-битных однобайтовых графических символов - латинский / кириллица (2-е изд., Июнь 1988 г.)
- ^ http://czyborra.com/charsets/gost19768-87.txt.gz
- ^ «Наборы символов» . IANA.
- ^ Simonsen, Keld (1992). «Мнемоника символов и наборы символов» . Запросы на комментарии . IETF . DOI : 10.17487 / rfc1345 . RFC 1345.
- ^ (На русском языке ) ГОСТ Р 34.303-92. Наборы 8-битных кодированных символов. 8-битный код обмена и обработки информации. = 8-битные наборы символов. 8-битный код для обмена информацией.