Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

ISO / IEC 8859-15: 1999 , Информационные технологии - 8-битные однобайтовые наборы графических символов - Часть 15: Латинский алфавит № 9 , является частью серии стандартных кодировок символов на основе ASCII ISO / IEC 8859 , первая Издание вышло в 1999 году. Неофициально оно обозначается как Latin-9 (а некоторое время - Latin-0 ). Он похож на ISO 8859-1 и, таким образом, также предназначен для «западноевропейских» языков, но заменяет некоторые менее распространенные символы знаком евро и некоторыми буквами, которые были сочтены необходимыми: [1]

ISO-8859-15 является предпочтительным названием кодировки IANA для этого стандарта с добавлением управляющих кодов C0 и C1 из ISO / IEC 6429 .

Microsoft присвоила ISO-8859-15 кодовую страницу 28605, также известную как Windows-28605 . IBM присвоила кодовую страницу 923 ( CCSID 923) стандарту ISO 8859-15. [2] [3]

Все печатаемые символы из ISO / IEC 8859-1 и ISO / IEC 8859-15 также находятся в Windows-1252 . С октября 2016 года 0,1% всех веб-сайтов используют ISO-8859-15. [4] [5]

История [ править ]

Идентификатор ISO 8859-15 был предложен для саамских языков в 1996 году, который в конечном итоге был отклонен, но был принят как ISO-IR 197 . [6] [7] [8]

Предложение под названием ISO 8859-0 было сделано в 1997 году, чтобы заменить 4 неиспользуемых или редко используемых символа ISO 8859-1 ( ¤ , ¨ , ´ и ¸ ) на , Œ , œ и Ÿ . [9] Евро стало необходимым, когда был введен евро . Œ и œ французские лигатуры, а Ÿ необходимо для того, чтобы французский текст можно было преобразовать из строчных букв в заглавные и обратно без потерь. Как ни странно, последние три уже присутствовали в DEC «s Многонациональная набора символов(MCS) в 1983 году, набор символов, из которого были получены ECMA-94 (1985) и ISO-8859-1 (1987). Поскольку их исходные кодовые точки теперь были заняты другими символами, для их повторного введения пришлось выбрать менее логичные кодовые точки.

В том же предложении также рекомендовалось заменить еще 6 символов ( ¢ , ¦ , ± , ¼ , ½ , ¾ ) на «некоторые другие символы, чтобы охватить максимум языков».[9] Для знака евро некоторые хотели заменить знак «плюс-минус» вместо знака валюты. Знак валюты используется в некоторых приложениях как разделитель полей, а в некоторых других - для обозначения промежуточных итогов.). Этому было решительное противодействие. Один человек сказал: «Предлагаемый« + - »не является адекватным отступлением, поскольку эта последовательность, хотя и редко используется, уже имеет фиксированное математическое значение, совершенно отличное от« ± »; и, даже если читатель сделает вывод о предполагаемом то есть, «±», из контекста, «+ -» вместо «±» будет больно Эстетическая чувства физика по крайней мере столько же , сколько «ае» в равносильном аи лигатуры франкоязычный в ..» [10] в конец ± и ¢ не были заменены. В итоге было выбрано четыре символа: Š , š , Ž и ž [ необходима ссылка ] , которые используются в финском и эстонском языках.для транслитерации в русский заимствований и именах. Предложение было переименовано в ISO 8859-15. [ когда? ]

Были попытки сделать ISO 8859-15 набором символов по умолчанию для 8-битной связи, но он так и не смог заменить популярный ISO 8859-1. Он действительно видел некоторое использование в качестве набора символов по умолчанию для текстовой консоли и терминальных программ под Linux, когда требовался знак евро, но использование полного Unicode было непрактичным, но с тех пор он был заменен на UTF-8 .

Покрытие [ править ]

ISO 8859-15 кодирует то, что он именует « латинским алфавитом № 9». Этот набор символов используется в Северной и Южной Америке , Западной Европе , Океании и большей части Африки . Он также обычно используется в большинстве стандартных латинизации восточноазиатских языков.

Каждый символ кодируется как одно восьмибитовое кодовое значение. Эти кодовые значения могут использоваться практически в любой системе обмена данными для общения на следующих языках:

Современные языки с полным охватом их алфавита
Заметки
  1. ^ Полная поддержка, за исключением отсутствующих Ǿ / ǿ. Ǿ / ǿ можно заменить на Ø / ø за счет увеличения неоднозначности.
  2. ^ Обычно поддерживается с почти полным охватом голландского алфавита, так как отсутствующие IJ , ij всегда должны быть представлены как двухсимвольные IJ или ij в электронной форме.
  3. ^ США и современные британцы.
  4. ^ Новая орфография.
  5. ^ Базовая классическая орфография.
  6. ^ Базовая классическая орфография.
  7. ^ Сценарий Руми .
  8. Букмол и Нюнорск.
  9. ^ Европейский и бразильский.

Покрытие знаков препинания и апострофов [ править ]

Для некоторых языков, перечисленных выше, отсутствуют правильные типографские кавычки , поскольку включены только «,», «и '.

Кроме того, эта кодировка не обеспечивает правильный символ для апострофа и ориентирована на одинарные высокие кавычки, хотя в некоторых текстах используется пространственный серьезный акцент и промежуточный острый акцент, которые являются частью ISO 8859-1 вместо 6-образного / 9-образные кавычки или апострофы (и это надежно работает с некоторыми стилями шрифтов, где все эти символы отображаются как наклонные клиновидные глифы).

Макет кодовой страницы [ править ]

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный   Отличия от ISO-8859-1

Псевдонимы [ править ]

ISO 8859-15 также имеет следующие псевдонимы, зависящие от поставщика:

  • WE8ISO8859P15 ( база данных Oracle ) [14]

См. Также [ править ]

  • Наборы символов западной латыни (вычисления)

Ссылки [ править ]

  1. ^ "ISO-8859-15" . IANA . Проверено 8 марта +2016 .
  2. ^ "Кодовая страница 923 информационного документа" . Архивировано из оригинала на 2013-02-28.
  3. ^ "Информационный документ CCSID 923" . Архивировано из оригинала на 2014-12-01.
  4. ^ «Исторические тенденции использования кодировок символов, ноябрь 2018» . w3techs.com .
  5. ^ «Часто задаваемые вопросы» . w3techs.com .
  6. ^ "Саамский дополнительный латинский набор № 2" (PDF) . www.itscj.ipsj.or.jp . Проверено 5 января 2019 .
  7. ^ Эверсон, Майкл. «Предлагаемый ISO 8859-15» . Проверено 26 февраля 2017 года .
  8. ^ Эверсон, Майкл. «Предлагаемый ISO 8859-14 (позднее 15)» . Проверено 26 февраля 2017 года .
  9. ^ а б Эверсон, Майкл. «Предлагаемый стандарт ISO 8859-0 (позднее 15)» . Проверено 26 февраля 2017 года .
  10. Штольц, Отто (11 июля 1997 г.). «Re: Новый проект ISO 8859-0» . Список рассылки Unicode (список рассылки).
  11. ^ Кодовая страница CPGID 00923 (pdf) (PDF) , IBM
  12. ^ Кодовая страница CPGID 00923 (txt) , IBM
  13. ^ Международные компоненты для Unicode (ICU), ibm-923_P100-1998.ucm , 2002-12-03
  14. ^ Бэрд, Кэти; Чиба, Дэн; Чу, Уинсон; Вентилятор, Джессика; Хо, Клэр; Закон, Саймон; Ли, Джефф; Линсли, Питер; Мацуда, Кени; Осрофт, Тамзин; Такеда, Шиге; Танака, Линус; Тозава, Макото; Трюте, Барри; Цудзимото, Маюми; Ву, Инь; Яу, Майкл; Ю, Тим; Ван, Чао; Вонг, Саймон; Чжан, Вейран; Чжэн, Лэй; Чжу, Ян; Мур, Валари (2002) [1996]. «Приложение A: Данные о локали». Руководство по поддержке глобализации баз данных Oracle9i (PDF) (выпуск 2 (9.2), ред.). Корпорация Oracle . Оракул A96529-01. Архивировано (PDF) из оригинала на 2017-02-14 . Проверено 14 февраля 2017 .

Внешние ссылки [ править ]

  • ИСО / МЭК 8859-15: 1999
  • ISO / IEC 8859-15: 1998 - 8-битные однобайтовые графические наборы символов, Часть 15: Латинский алфавит № 9 (черновик от 1 августа 1997 г .; заменен ISO / IEC 8859-15: 1999, опубликован 15 марта). , 1999)
  • ISO Latin 9 по сравнению с ISO Latin 1
  • ISO-IR 203, дополнительный европейский латинский набор (16 сентября 1998 г.)