КОИ8-Р


KOI8-R (RFC 1489) — 8-битная кодировка символов , полученная из кодировки KOI-8 программистом Андреем Черновым в 1993 году и предназначенная для охвата русского языка , в котором используется кириллица . KOI8-R был основан на русской азбуке Морзе , которая была создана из фонетической версии латинской азбуки Морзе . В результате буквы русской кириллицы расположены в псевдоримском порядке, а не в обычном кириллическом алфавитном порядке. Хотя это может показаться неестественным, если 8-й бит удален, текст частично читается в ASCII и может преобразоваться в синтаксически правильный KOI7.. Например, «Русский Текст» в KOI8-R становится РУССКИЙ ТЕКСТ («Русский текст»).

KOI8 означает Код Обмена Информацией, 8 бит ( русский : Код Обмена Информацией, 8 бит ), что означает «Код для обмена информацией, 8 бит». В Microsoft Windows KOI8-R назначается номер кодовой страницы 20866. В IBM KOI8-R назначается кодовая страница 878. [1] [2] KOI8-R также охватывает болгарский язык , но не использовался для этой цели. так как CP1251 был принят. Использование этих старых кодовых страниц заменяется Unicode как более распространенным способом представления кириллицы вместе с другими языками.

Unicode предпочтительнее KOI-8 и его вариантов или других кодировок кириллицы в современных приложениях, особенно в Интернете, что делает UTF-8 доминирующей кодировкой для веб-страниц. (Для дальнейшего обсуждения полного охвата Unicode, 436 кириллических букв/кодовых точек, в том числе для старой кириллицы , и того, как однобайтовые кодировки символов, такие как варианты Windows-1251 и KOI8, не могут обеспечить это, см. Кириллический сценарий в Unicode .)

В следующей таблице показана кодировка KOI8-R. Каждый символ показан с эквивалентной ему кодовой точкой Unicode .