Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

ИСО / МЭК 8859-2: 1999 , Информационные технологии - 8-битные однобайтовые графические наборы символов - Часть 2: Латинский алфавит № 2 , является частью серии стандартных кодировок символов на основе ASCII ИСО / МЭК 8859 , первая Издание вышло в 1987 году. Неофициально именуется "Latin-2". Как правило, он предназначен для языков Центральной [1] или «Восточной Европы», которые пишутся латинскими буквами. Обратите внимание, что ISO / IEC 8859-2 сильно отличается от кодовой страницы 852 (MS-DOS Latin 2, PC Latin 2), которая также называется «Latin-2» в чешских и словацких регионах. [2] Кодовая страница 912 является расширением.

ISO-8859-2 - предпочтительное название набора символов IANA для этого стандарта, если оно дополнено управляющими кодами C0 и C1 из ISO / IEC 6429 . В декабре 2018 года 0,1% всех веб-страниц используют ISO 8859-2. [3] Microsoft присвоила ISO-8859-2 кодовую страницу 28592, также известную как Windows-28592, в Windows. IBM присвоила кодовую страницу 1111 стандарту ISO 8859-2.

Windows-1250 похожа на ISO-8859-2 и имеет все печатаемые символы и многое другое. Однако некоторые из них переставлены (в отличие от Windows-1252 , в которой все печатаемые символы из ISO-8859-1 хранятся в одном месте).

Языковой охват [ править ]

Эти кодовые значения могут использоваться для следующих языков:

  1. ^ Полностью совместим с ISO / IEC 8859-1 для немецких текстов.

Его также можно использовать для румынского языка , но он не очень подходит для этого языка из-за отсутствия букв s и t с запятыми ниже, хотя он предоставляет s и t седильи, выглядящие одинаково . Эти буквы были унифицированы в первых версиях стандарта Unicode , что означало, что появление с седилем или запятой рассматривалось как выбор глифа, а не как отдельные символы; Поэтому шрифты, предназначенные для использования с румынским, теоретически должны содержать символы с запятой ниже в этих кодовых точках.

На самом деле Microsoft не предоставляла такие шрифты для компьютеров, продаваемых в Румынии. Тем не менее, ISO / IEC 8859-2 и Windows-1250 (с той же проблемой) широко используются для румынского языка. Юникод впоследствии отделил варианты запятой от вариантов седильи и с тех пор стал лидером для веб-страниц, которые, однако, часто имеют s и t с седилем. Юникод отмечает, что с 2014 года [ необходима ссылка ], что разделение букв запятой ниже было ошибкой, вызывающей искажение румынских данных: ранее существовавшие данные и методы ввода по-прежнему будут содержать старые кодовые точки седильи, что усложняет поиск по тексту.

Макет кодовой страницы [ править ]

В следующей таблице символы показаны вместе с соответствующими им кодовыми точками Unicode . Отличия от ISO-8859-1 показаны более темным оттенком поверх цветов легенды.

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный

См. Также [ править ]

  • Кодировка символов
  • Польские кодовые страницы

Ссылки [ править ]

  1. ^ «Кодировки сообщений Microsoft Outlook» .
  2. ^ Объяснение путаницы в кодировке чешских и словацких символов
  3. ^ https://w3techs.com/technologies/history_overview/character_encoding

Внешние ссылки [ править ]

  • ISO 8859-2: 1999
  • Стандартный ECMA-94 : 8-битные однобайтовые графические наборы символов - латинские алфавиты с № 1 по № 4, 2-е издание (июнь 1986 г.)
  • ISO-IR 101 Правая часть латинского алфавита № 2 (1 февраля 1986 г.)
  • Ресурсы по ISO 8859-2 (Latin 2)