MIME / IANA | ISO-8859-15 |
---|---|
Псевдоним (а) | латинский-9, латинский-0 |
Стандарт | ISO / IEC 8859 |
Классификация | ISO 8859 ( расширенный ASCII , ISO 4873 уровень 1) |
Расширяется | US-ASCII |
На основе | ISO-8859-1 |
Предшествует | ISO-8859-1 |
ISO / IEC 8859-15: 1999 , Информационные технологии - 8-битные однобайтовые наборы графических символов - Часть 15: Латинский алфавит № 9 , является частью серии стандартных кодировок символов на основе ASCII ISO / IEC 8859 , первая Издание вышло в 1999 году. Неофициально оно обозначается как Latin-9 (а некоторое время - Latin-0 ). Он похож на ISO 8859-1 и, таким образом, также предназначен для «западноевропейских» языков, но заменяет некоторые менее распространенные символы знаком евро и некоторыми буквами, которые были сочтены необходимыми: [1]
A4 | A6 | A8 | B4 | B8 | до н.э | BD | БЫТЬ | |
---|---|---|---|---|---|---|---|---|
8859-1 | ¤ | ¦ | ¨ | ´ | ¸ | ¼ | ½ | ¾ |
8859-15 | € | Š | š | Ž | ž | Œ | œ | Ÿ |
ISO-8859-15 является предпочтительным названием кодировки IANA для этого стандарта с добавлением управляющих кодов C0 и C1 из ISO / IEC 6429 .
Microsoft присвоила ISO-8859-15 кодовую страницу 28605, также известную как Windows-28605 . IBM присвоила кодовую страницу 923 ( CCSID 923) стандарту ISO 8859-15. [2] [3]
Все печатаемые символы из ISO / IEC 8859-1 и ISO / IEC 8859-15 также находятся в Windows-1252 . С октября 2016 года 0,1% всех веб-сайтов используют ISO-8859-15. [4] [5]
История [ править ]
Идентификатор ISO 8859-15 был предложен для саамских языков в 1996 году, который в конечном итоге был отклонен, но был принят как ISO-IR 197 . [6] [7] [8]
Предложение под названием ISO 8859-0 было сделано в 1997 году, чтобы заменить 4 неиспользуемых или редко используемых символа ISO 8859-1 ( ¤ , ¨ , ´ и ¸ ) на € , Œ , œ и Ÿ . [9] Евро стало необходимым, когда был введен евро . Œ и œ французские лигатуры, а Ÿ необходимо для того, чтобы французский текст можно было преобразовать из строчных букв в заглавные и обратно без потерь. Как ни странно, последние три уже присутствовали в DEC «s Многонациональная набора символов(MCS) в 1983 году, набор символов, из которого были получены ECMA-94 (1985) и ISO-8859-1 (1987). Поскольку их исходные кодовые точки теперь были заняты другими символами, для их повторного введения пришлось выбрать менее логичные кодовые точки.
В том же предложении также рекомендовалось заменить еще 6 символов ( ¢ , ¦ , ± , ¼ , ½ , ¾ ) на «некоторые другие символы, чтобы охватить максимум языков».[9] Для знака евро некоторые хотели заменить знак «плюс-минус» вместо знака валюты. Знак валюты используется в некоторых приложениях как разделитель полей, а в некоторых других - для обозначения промежуточных итогов.). Этому было решительное противодействие. Один человек сказал: «Предлагаемый« + - »не является адекватным отступлением, поскольку эта последовательность, хотя и редко используется, уже имеет фиксированное математическое значение, совершенно отличное от« ± »; и, даже если читатель сделает вывод о предполагаемом то есть, «±», из контекста, «+ -» вместо «±» будет больно Эстетическая чувства физика по крайней мере столько же , сколько «ае» в равносильном аи лигатуры франкоязычный в ..» [10] в конец ± и ¢ не были заменены. В итоге было выбрано четыре символа: Š , š , Ž и ž [ необходима ссылка ] , которые используются в финском и эстонском языках.для транслитерации в русский заимствований и именах. Предложение было переименовано в ISO 8859-15. [ когда? ]
Были попытки сделать ISO 8859-15 набором символов по умолчанию для 8-битной связи, но он так и не смог заменить популярный ISO 8859-1. Он действительно видел некоторое использование в качестве набора символов по умолчанию для текстовой консоли и терминальных программ под Linux, когда требовался знак евро, но использование полного Unicode было непрактичным, но с тех пор он был заменен на UTF-8 .
Покрытие [ править ]
ISO 8859-15 кодирует то, что он именует « латинским алфавитом № 9». Этот набор символов используется в Северной и Южной Америке , Западной Европе , Океании и большей части Африки . Он также обычно используется в большинстве стандартных латинизации восточноазиатских языков.
Каждый символ кодируется как одно восьмибитовое кодовое значение. Эти кодовые значения могут использоваться практически в любой системе обмена данными для общения на следующих языках:
- Современные языки с полным охватом их алфавита
|
|
|
|
|
- Заметки
- ^ Полная поддержка, за исключением отсутствующих Ǿ / ǿ. Ǿ / ǿ можно заменить на Ø / ø за счет увеличения неоднозначности.
- ^ Обычно поддерживается с почти полным охватом голландского алфавита, так как отсутствующие IJ , ij всегда должны быть представлены как двухсимвольные IJ или ij в электронной форме.
- ^ США и современные британцы.
- ^ Новая орфография.
- ^ Базовая классическая орфография.
- ^ Базовая классическая орфография.
- ^ Сценарий Руми .
- ↑ Букмол и Нюнорск.
- ^ Европейский и бразильский.
Покрытие знаков препинания и апострофов [ править ]
Для некоторых языков, перечисленных выше, отсутствуют правильные типографские кавычки , поскольку включены только «,», «и '.
Кроме того, эта кодировка не обеспечивает правильный символ для апострофа и ориентирована на одинарные высокие кавычки, хотя в некоторых текстах используется пространственный серьезный акцент и промежуточный острый акцент, которые являются частью ISO 8859-1 вместо 6-образного / 9-образные кавычки или апострофы (и это надежно работает с некоторыми стилями шрифтов, где все эти символы отображаются как наклонные клиновидные глифы).
Макет кодовой страницы [ править ]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | ||||||||||||||||
1_ 16 | ||||||||||||||||
2_ 32 | SP 0020 | ! 0021 | « 0022 | # 0023 | 0024 долл. США | % 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | I 0049 | J 004A | K 004B | L 004C | M 004D | № 004E | O 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | Т 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | а 0061 | b 0062 | c 0063 | d 0064 | e 0065 | f 0066 | г 0067 | h 0068 | я 0069 | j 006A | k 006B | l 006C | м 006D | № 006E | o 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | v 0076 | w 0077 | х 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | |
8_ 128 | ||||||||||||||||
9_ 144 | ||||||||||||||||
A_ 160 | NBSP 00A0 | ¡ 00A1 | ¢ 00A2 | £ 00A3 | € 20AC | ¥ 00A5 | Š 0160 | § 00A7 | š 0161 | © 00A9 | ª 00AA | « 00AB | ¬ 00AC | SHY 00AD | ® 00AE | ¯ 00AF |
B_ 176 | ° 00B0 | ± 00B1 | ² 00B2 | ³ 00B3 | Ž 017D | µ 00B5 | ¶ 00B6 | · 00B7 | ž 017E | ¹ 00B9 | º 00BA | » 00BB | Œ 0152 | œ 0153 | Ÿ 0178 | ¿ 00BF |
C_ 192 | À 00C0 | Á 00C1 | Â 00C2 | Ã 00C3 | Ä 00C4 | Å 00C5 | Æ 00C6 | Ç 00C7 | È 00C8 | É 00C9 | Ê 00CA | Ë 00CB | Ì 00CC | Í 00CD | Î 00CE | Ï 00CF |
D_ 208 | Ð 00D0 | Ñ 00D1 | Ò 00D2 | Ó 00D3 | Ô 00D4 | Õ 00D5 | Ö 00D6 | × 00D7 | Ø 00D8 | Ù 00D9 | Ú 00DA | Û 00 дБ | Ü 00DC | Ý 00DD | Þ 00DE | ß 00DF |
E_ 224 | à 00E0 | á 00E1 | â 00E2 | ã 00E3 | ä 00E4 | å 00E5 | æ 00E6 | ç 00E7 | è 00E8 | é 00E9 | ê 00EA | ë 00EB | ì 00EC | í 00ED | î 00EE | • 00EF |
F_ 240 | ð 00F0 | ñ 00F1 | ò 00F2 | ó 00F3 | ô 00F4 | х 00F5 | ö 00F6 | ÷ 00F7 | ø 00F8 | ù 00F9 | ú 00FA | û 00FB | ü 00FC | ý 00FD | þ 00FE | ÿ 00FF |
Письмо Число Пунктуация Символ Другой Неопределенный Отличия от ISO-8859-1
Псевдонимы [ править ]
ISO 8859-15 также имеет следующие псевдонимы, зависящие от поставщика:
- WE8ISO8859P15 ( база данных Oracle ) [14]
См. Также [ править ]
- Наборы символов западной латыни (вычисления)
Ссылки [ править ]
- ^ "ISO-8859-15" . IANA . Проверено 8 марта +2016 .
- ^ "Кодовая страница 923 информационного документа" . Архивировано из оригинала на 2013-02-28.
- ^ "Информационный документ CCSID 923" . Архивировано из оригинала на 2014-12-01.
- ^ «Исторические тенденции использования кодировок символов, ноябрь 2018» . w3techs.com .
- ^ «Часто задаваемые вопросы» . w3techs.com .
- ^ "Саамский дополнительный латинский набор № 2" (PDF) . www.itscj.ipsj.or.jp . Проверено 5 января 2019 .
- ^ Эверсон, Майкл. «Предлагаемый ISO 8859-15» . Проверено 26 февраля 2017 года .
- ^ Эверсон, Майкл. «Предлагаемый ISO 8859-14 (позднее 15)» . Проверено 26 февраля 2017 года .
- ^ а б Эверсон, Майкл. «Предлагаемый стандарт ISO 8859-0 (позднее 15)» . Проверено 26 февраля 2017 года .
- ↑ Штольц, Отто (11 июля 1997 г.). «Re: Новый проект ISO 8859-0» . Список рассылки Unicode (список рассылки).
- ^ Кодовая страница CPGID 00923 (pdf) (PDF) , IBM
- ^ Кодовая страница CPGID 00923 (txt) , IBM
- ^ Международные компоненты для Unicode (ICU), ibm-923_P100-1998.ucm , 2002-12-03
- ^ Бэрд, Кэти; Чиба, Дэн; Чу, Уинсон; Вентилятор, Джессика; Хо, Клэр; Закон, Саймон; Ли, Джефф; Линсли, Питер; Мацуда, Кени; Осрофт, Тамзин; Такеда, Шиге; Танака, Линус; Тозава, Макото; Трюте, Барри; Цудзимото, Маюми; Ву, Инь; Яу, Майкл; Ю, Тим; Ван, Чао; Вонг, Саймон; Чжан, Вейран; Чжэн, Лэй; Чжу, Ян; Мур, Валари (2002) [1996]. «Приложение A: Данные о локали». Руководство по поддержке глобализации баз данных Oracle9i (PDF) (выпуск 2 (9.2), ред.). Корпорация Oracle . Оракул A96529-01. Архивировано (PDF) из оригинала на 2017-02-14 . Проверено 14 февраля 2017 .
Внешние ссылки [ править ]
- ИСО / МЭК 8859-15: 1999
- ISO / IEC 8859-15: 1998 - 8-битные однобайтовые графические наборы символов, Часть 15: Латинский алфавит № 9 (черновик от 1 августа 1997 г .; заменен ISO / IEC 8859-15: 1999, опубликован 15 марта). , 1999)
- ISO Latin 9 по сравнению с ISO Latin 1
- ISO-IR 203, дополнительный европейский латинский набор (16 сентября 1998 г.)