Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В вычислениях , A кодовая страница является кодировкой символов и как таковое оно является специфическим объединением набора печатных символов и управляющих символами с уникальными номерами. Обычно каждое число представляет двоичное значение в одном байте. (В некоторых контекстах эти термины используются более точно; см. Кодировка символов § Наборы символов, карты символов и кодовые страницы .)

Термин «кодовая страница» происходит от IBM «s EBCDIC систем мэйнфреймов основанных, [1] , но Microsoft , SAP , [2] и Oracle Corporation [3] является один из немногих производителей , которые используют этот термин. Большинство производителей идентифицируют свои собственные наборы символов по имени. В случае, когда существует множество наборов символов (как в IBM), идентификация наборов символов с помощью числа - удобный способ их различать. Первоначально номера кодовых страниц относились к номерам страниц в руководстве IBM по стандартному набору символов [4] [5] [6]состояние, которое не соблюдалось в течение долгого времени. Поставщики, использующие систему кодовых страниц, присваивают свой собственный номер кодовой страницы кодировке символов, даже если она более известна под другим именем; например, UTF-8 присвоены номера страниц 1208 в IBM, 65001 в Microsoft и 4110 в SAP.

Hewlett-Packard использует аналогичную концепцию в своей операционной системе HP-UX и протоколе языка команд принтера [7] (PCL) для принтеров (как для принтеров HP, так и для других). Однако терминология отличается: то, что другие называют набором символов , HP называет набором символов , а то, что IBM или Microsoft называют кодовой страницей , HP называет кодом набора символов . HP разработала серию наборов символов [8] [9], каждый из которых связан с кодом набора символов, для кодирования как собственных наборов символов, так и наборов символов других поставщиков.

Множество наборов символов заставляет многих поставщиков рекомендовать Unicode .

Система нумерации кодовых страниц [ править ]

IBM представила концепцию систематического присвоения небольшого, но глобально уникального 16-битного числа каждой кодировке символов, с которой может столкнуться компьютерная система или совокупность компьютерных систем. Происхождение схемы нумерации IBM отражается в том факте, что наименьшие (первые) номера присваиваются вариациям кодировки IBM EBCDIC, а несколько большие числа относятся к вариациям расширенной кодировки IBM ASCII, используемой в аппаратном обеспечении ПК.

С выпуском PC DOS версии 3.3 (и почти идентичной MS-DOS 3.3) IBM представила систему нумерации кодовых страниц обычным пользователям ПК, поскольку номера кодовых страниц (и фраза «кодовая страница») использовались в новых командах для позволяют систематически устанавливать кодировку символов, используемую всеми частями ОС. [10]

После того, как IBM и Microsoft прекратили сотрудничество в 1990-х годах, две компании поддерживали список присвоенных номеров кодовых страниц независимо друг от друга, что привело к некоторым противоречивым назначениям. По крайней мере, один сторонний поставщик ( Oracle ) также имеет свой собственный другой список числовых назначений. [3] Текущие назначения IBM перечислены в их репозитории CCSID , а назначения Microsoft задокументированы в MSDN . [11] Кроме того, список имен и примерный IANA ( Internet Assigned Numbers Authority) аббревиатуры для установленных кодовых страниц на любом компьютере с Windows можно найти в реестре на этом компьютере (эта информация используется программами Microsoft, такими как Internet Explorer ).

Большинство известных кодовых страниц, за исключением кодовых страниц для языков CJK и вьетнамского , умещают все свои кодовые точки в восемь бит и не требуют ничего, кроме отображения каждой кодовой точки на один символ; кроме того, не используются такие методы, как комбинирование символов, сложные сценарии и т. д.

Текстовый режим стандартного ( VGA-совместимого ) графического оборудования ПК основан на использовании 8-битной кодовой страницы, хотя можно использовать сразу две с некоторой жертвой глубины цвета, и до восьми могут храниться в адаптере дисплея. для легкого переключения. [12]Был набор сторонних шрифтов кодовой страницы, которые можно было загрузить в такое оборудование. Однако в настоящее время для поставщиков операционных систем стало обычным делом предоставлять свои собственные системы кодирования символов и визуализации, которые работают в графическом режиме и полностью обходят это аппаратное ограничение. Однако система ссылки на кодировки символов по номеру кодовой страницы остается применимой как эффективная альтернатива строковым идентификаторам, например, указанным IETF и IANA для использования в различных протоколах, таких как электронная почта и веб-страницы.

Отношение к ASCII [ править ]

Большинство кодовых страниц, используемых в настоящее время, являются расширенными наборами ASCII , 7-битного кода, представляющего 128 управляющих кодов и печатаемых символов. В далеком прошлом 8-битные реализации кода ASCII устанавливали верхний бит в ноль или использовали его как бит четности при передаче данных по сети. Когда верхний бит был доступен для представления символьных данных, можно было представить в общей сложности 256 символов и управляющих кодов. Большинство поставщиков (включая IBM) использовали этот расширенный диапазон для кодирования символов, используемых различными языками, и графических элементов, которые позволяли имитировать примитивную графику на устройствах вывода только текста. Для этих «расширенных наборов символов ASCII» не существовало формального стандарта, и поставщики называли эти варианты кодовыми страницами, как IBM всегда делала для вариантов кодировок EBCDIC.

Отношение к Unicode [ править ]

Unicode - это попытка включить все символы из всех в настоящее время и исторически используемых человеческих языков в односимвольное перечисление (фактически одна большая отдельная кодовая страница), устраняя необходимость различать разные кодовые страницы при обработке текста, хранящегося в цифровом виде. Unicode пытается сохранить обратную совместимость со многими устаревшими кодовыми страницами, копируя некоторые кодовые страницы 1: 1 в процессе проектирования. Явная цель дизайна Unicode состояла в том, чтобы разрешить двустороннее преобразование между всеми распространенными устаревшими кодовыми страницами, хотя эта цель не всегда достигалась. Некоторые поставщики, а именно IBM и Microsoft, анахронично присвоили номера кодовых страниц кодировкам Unicode. Это соглашение позволяет использовать номера кодовых страниц в качестве метаданных для определения правильного алгоритма декодирования при обнаружении двоичных сохраненных данных.

Кодовые страницы IBM [ править ]

Кодовые страницы на основе EBCDIC [ править ]

Эти кодовые страницы используются IBM в наборах символов EBCDIC для мэйнфреймов .

  • 1 - США WP, оригинал
  • 2 - США
  • 3 - Бухгалтерский учет в США, версия A
  • 4 - США
  • 5 - США
  • 6 - Латинская Америка
  • 7 - Германия FR / Австрия
  • 8 - Германия FR
  • 9 - Франция, Бельгия
  • 10 - Канада (английский)
  • 11 - Канада (французский)
  • 12 - Италия
  • 13 - Нидерланды
  • 14 -
  • 15 - Швейцария (французский)
  • 16 - Швейцария (французский / немецкий)
  • 17 - Швейцария (немецкий)
  • 18 - Швеция / Финляндия
  • 19 - Швеция / Финляндия WP, версия 2
  • 20 - Дания / Норвегия
  • 21 - Бразилия
  • 22 - Португалия
  • 23 - Соединенное Королевство
  • 24 - Великобритания
  • 25 - Япония (латиница)
  • 26 - Япония (латиница)
  • 27 - Греция (латиница)
  • 28 -
  • 29 - Исландия
  • 30 - Турция
  • 31 - Южная Африка
  • 32 - Чехословакия (чешский / словацкий)
  • 33 - Чехословакия
  • 34 - Чехословакия
  • 35 - Румыния
  • 36 - Румыния
  • 37 - США / Канада - CECP (то же самое с евро: 1140 | 1140)
  • 37-2 - Реальная кодовая страница 3279 APL, используемая C / 370. Это очень близко к 1047, за исключением перевернутых символов вставки и отсутствия знака. IBM официально не признает его, хотя SHARE указала на его существование. [13]
  • 38 - США ASCII
  • 39 - Великобритания / Израиль
  • 40 - Великобритания
  • 251 - Китай
  • 252 - Польша
  • 254 - Венгрия
  • 256 - Международный # 1 (заменен 500 | 500)
  • 257 - Международный # 2
  • 258 - Международный # 3
  • 259 - Символы, набор 7
  • 260 - канадский французский - 116
  • 264 - Распечатка поездов и обработка текста расширены
  • 273 - Германия FR / Австрия - CECP (то же самое с евро: 1141 | 1141)
  • 274 - Старая кодовая страница Бельгии
  • 275 - Бразилия - CECP
  • 276 - Канада (французский) - 94
  • 277 - Дания, Норвегия - CECP (то же самое с евро: 1142 | 1142)
  • 278 - Финляндия, Швеция - CECP (то же с евро: 1143 | 1143)
  • 279 - французский - 94 [13]
  • 280 - Италия - CECP (то же самое с евро: 1144 | 1144)
  • 281 - Япония (латиница) - CECP
  • 282 - Португалия - CECP
  • 283 - Испания - 190 [13]
  • 284 - Испания / Латинская Америка - CECP (то же самое с евро: 1145 | 1145)
  • 285 - Соединенное Королевство - CECP (то же самое с евро: 1146 | 1146)
  • 286 - Австрия / Германия FR Альтернативный
  • 287 - Дания / Норвегия Заместитель
  • 288 - Финляндия / Швеция Заместитель
  • 289 - Испания Альтернативный
  • 290 - японский (катакана) расширенный
  • 293 - APL
  • 297 - Франция (то же самое с евро: 1147) [13]
  • 298 - Япония (Катакана)
  • 300 - Япония (кандзи) DBCS (для JIS X 0213)
  • 310 - Графический побег APL / TN
  • 320 - Венгрия
  • 321 - Югославия
  • 322 - Турция
  • 330 - Международный # 4
  • 351 - GDDM по умолчанию
  • 352 - Возможность печати и публикации
  • 353 - BCDIC-A
  • 355 - Стандартный вариант PTTC / BCD
  • 357 - опция PTTC / BCD H
  • 358 - Вариант соответствия PTTC / BCD
  • 359 - вариант монокейса PTTC / BCD
  • 360 - опция PTTC / BCD Duocase
  • 361 - EBCDIC Publishing International
  • 363 - Символы, набор 8
  • 382 - EBCDIC Publishing Austria, Germany FR Alternate
  • 383 - EBCDIC Publishing Belgium
  • 384 - EBCDIC Publishing Brazil
  • 385 - EBCDIC Publishing Canada (французский)
  • 386 - EBCDIC Publishing Дания, Норвегия
  • 387 - EBCDIC Publishing Финляндия, Швеция
  • 388 - Издательство EBCDIC, Франция
  • 389 - EBCDIC Publishing Италия
  • 390 - EBCDIC Publishing Japan (Latin)
  • 391 - EBCDIC Publishing Portugal
  • 392 - EBCDIC Publishing Испания, Филиппины
  • 393 - EBCDIC Publishing Latin America (испанский язык)
  • 394 - EBCDIC Publishing China (Гонконг), Великобритания, Ирландия
  • 395 - EBCDIC Publishing Australia, New Zealand, USA, Canada (английский)
  • 410 - кириллица (ревизии: 880, 1025, 1154)
  • 420 - арабский
  • 421 - Магриб / французский
  • 423 - греческий (заменен 875)
  • 424 - Иврит (Код бюллетеня)
  • 425 - арабский / латинский для OS / 390 Open Edition
  • 435 - Изоморфный телетекст
  • 500 - Международный # 5 (ECECP; заменяет 256) (то же самое с евро: 1148)
  • 803 - Набор символов иврита A (Старый код)
  • 829 - Математические символы хоста - Публикация
  • 833 - Корейский расширенный (SBCS)
  • 834 - корейский хангыль (KSC5601; DBCS с UDC)
  • 835 - Традиционный китайский DBCS
  • 836 - упрощенный китайский расширенный
  • 837 - DBCS (упрощенный китайский)
  • 838 - Тайский язык с низкими отметками и знаками с ударением (то же самое с евро: 1160)
  • 839 - Тайский DBCS
  • 870 - Latin 2 (то же самое с евро: 1153) (редакция: 1110)
  • 871 - Исландия (то же самое с евро: 1149) [13]
  • 875 - греческий (заменяет 423)
  • 880 - Кириллица (ревизия 410) (ревизии: 1025, 1154)
  • 881 - США - 5080 Графическая система
  • 882 - Соединенное Королевство - 5080 Графическая система
  • 883 - Швеция - 5080 Графическая система
  • 884 - Германия - 5080 Графическая система
  • 885 - Франция - 5080 Графическая система
  • 886 - Италия - 5080 Графическая система
  • 887 - Япония - 5080 Графическая система
  • 888 - Франция, AZERTY - Графическая система 5080
  • 889 - Таиланд
  • 890 - Югославия
  • 892 - EBCDIC, OCR A
  • 893 - EBCDIC, OCR B
  • 905 - латиница 3
  • 918 - Двуязычный урду
  • 924 - латиница 9
  • 930 - Япония MIX (290 + 300) (то же самое с евро: 1390)
  • 931 - Япония MIX (37 + 300)
  • 933 - Корея MIX (833 + 834) (то же самое с евро: 1364)
  • 935 - Упрощенный китайский MIX (836 + 837) (то же самое с евро: 1388)
  • 937 - Традиционный китайский MIX (37 + 835) (то же самое с евро: 1371)
  • 939 - Япония MIX (1027 + 300) (то же самое с евро: 1399)
  • 1001 - МИКР
  • 1002 - Совместимость с EBCDIC DCF Release 2
  • 1003 - EBCDIC DCF, подмножество текста США
  • 1005 - Изоморфное текстовое сообщение EBCDIC
  • 1007 - EBCDIC арабский (XCOM2)
  • 1024 - EBCDIC T.61
  • 1025 - кириллица, многоязычный (то же самое с евро: 1154) (редакция 880)
  • 1026 - EBCDIC Турция (латиница 5) (то же самое с евро: 1155) (заменяет 905 в этой стране)
  • 1027 - расширенный японский (латиница) (JIS X 0201 Extended)
  • 1028 - EBCDIC Publishing Hebrew
  • 1030 - расширенный японский (катакана)
  • 1031 - расширенный японский (латиница)
  • 1032 - MICR, E13-B Комбинированный
  • 1033 - MICR, CMC-7 комбинированный
  • 1037 - Корея - Графическая система 5080/6090
  • 1039 - Совместимость с GML
  • 1047 - Latin 1 / Открытые системы [13]
  • 1068 - Совместимость с DCF
  • 1069 - Латиница 4
  • 1070 - США / Канада, версия 0 ([[Кодовая страница 37, версия 0)
  • 1071 - Германия FR / Австрия
  • 1073 - Бразилия
  • 1074 - Дания, Норвегия
  • 1075 - Финляндия, Швеция
  • 1076 - Италия
  • 1077 - Япония (латиница)
  • 1078 - Португалия
  • 1079 - Испания / Латинская Америка, версия 0 ([[Кодовая страница 284, версия 0)
  • 1080 - Соединенное Королевство
  • 1081 - Франция Версия 0 ([[Кодовая страница 297 Версия 0)
  • 1082 - Израиль (иврит)
  • 1083 - Израиль (иврит)
  • 1084 - Международный # 5 Версия 0 ([[Кодовая страница 500 Версия 0)
  • 1085 - Исландия
  • 1087 - Набор символов
  • 1091 - Модифицированные символы, набор 7
  • 1093 - Логотип IBM [14]
  • 1097 - двуязычный фарси
  • 1110 - Latin 2 (Редакция 870)
  • 1112 - Балтийский многоязычный (то же самое с евро: 1156)
  • 1113 - латиница 6
  • 1122 - Эстония (то же с евро: 1157)
  • 1123 - кириллица, Украина (то же с евро: 1158)
  • 1130 - Вьетнамский (то же самое с евро: 1164)
  • 1132 - Лаосский EBCDIC
  • 1136 - Хитачи Катакана
  • 1137 - Деванагари EBCDIC
  • 1140 - США, Канада и т. Д. ECECP (то же самое без евро: 37) (традиционная китайская версия: 1159)
  • 1141 - Австрия, Германия ECECP (то же без евро: 273)
  • 1142 - Дания, Норвегия ECECP (то же без евро: 277)
  • 1143 - Финляндия, Швеция ECECP (то же без евро: 278)
  • 1144 - Италия ECECP (то же без евро: 280)
  • 1145 - Испания, Латинская Америка (испанский) ECECP (то же без евро: 284)
  • 1146 - UK ECECP (то же без евро: 285)
  • 1147 - Франция ECECP с евро (то же самое без евро: 297)
  • 1148 - Международный ECECP с евро (то же без евро: 500)
  • 1149 - Исландский ECECP с евро (то же без евро: 871)
  • 1150 - Корейский расширенный с символами рамки
  • 1151 - упрощенный китайский расширенный с рамками
  • 1152 - традиционный китайский, расширенный, с прямоугольными символами
  • 1153 - Latin 2 Multilingual с евро (то же самое без евро: 870)
  • 1154 - Кириллица, многоязычный с евро (то же без евро: 1025; старая версия * 1166)
  • 1155 - Турция с евро (то же без евро: 1026)
  • 1156 - Baltic Multi с евро (то же без евро: 1112)
  • 1157 - Эстония с евро (то же без евро: 1122)
  • 1158 - кириллица, Украина с евро (то же без евро: 1123)
  • 1159 - T-Chinese EBCDIC (традиционный китайский евро, обновление * 1140)
  • 1160 - Тайский язык с низкими отметками и знаками с ударением с евро (то же самое без евро: 838)
  • 1164 - Вьетнамский с евро (то же без евро: 1130)
  • 1165 - Latin 2 / Открытые системы
  • 1166 - кириллица казахский
  • 1278 - стандартная кодировка EBCDIC Adobe (PostScript)
  • 1279 - Хитачи, японский узел катаканы [6]
  • 1303 - Штрих-код EBCDIC
  • 1364 - Корея MIX (833 + 834 + евро) (то же без евро: 933)
  • 1371 - Традиционный китайский MIX (1159 + 835) (то же без евро: 937)
  • 1376 - Традиционное китайское расширение хоста DBCS для HKSCS
  • 1377 - Выращивание HKSCS смешанного хозяина (37 + 1376)
  • 1388 - Упрощенный китайский MIX (то же самое без евро: 935) (836 + 837 + евро)
  • 1390 - Упрощенный китайский MIX Japan MIX (то же самое без евро: 930) (290 + 300 + евро)
  • 1399 - Япония MIX (1027 + 300 + евро) (то же без евро: 939)

Кодовые страницы DOS [ править ]

Эти кодовые страницы используются IBM в ее операционной системе PC DOS . Эти кодовые страницы изначально были встроены непосредственно в аппаратное обеспечение текстового режима графических адаптеров, используемых с IBM PC и его клонами, включая оригинальные адаптеры MDA и CGA, наборы символов которых можно было изменить только путем физической замены микросхемы ПЗУ, содержащей шрифт. Интерфейс этих адаптеров (эмулируемый всеми более поздними адаптерами, такими как VGA) обычно ограничивался однобайтовыми наборами символов, содержащими всего 256 символов в каждом шрифте / кодировке (хотя VGA добавила частичную поддержку для немного больших наборов символов).

  • 301 - IBM-PC Japan (кандзи) DBCS
  • 437 - Исходная кодовая страница оборудования IBM PC
  • 720 - арабский (прозрачный ASMO)
  • 737 - греческий
  • 775 - Latin-7
  • 808 - русский с евро (то же без евро: 866 )
  • 848 - украинский с евро (то же без евро: 1125 )
  • 849 - Белорусский с евро (то же без евро: 1131 )
  • 850 - Latin-1
  • 851 - греческий
  • 852 - Латиница-2
  • 853 - Латиница-3
  • 855 - Кириллица (то же самое с евро: 872 )
  • 856 - Иврит
  • 857 - Латиница-5
  • 858 - Latin-1 с символом евро
  • 859 - Латиница-9
  • 860 - португальский
  • 861 - исландский
  • 862 - Иврит
  • 863 - канадский французский
  • 864 - арабский
  • 865 - датский / норвежский
  • 866 - белорусский, русский, украинский (то же с евро: 808 )
  • 867 - Иврит + евро (на основе CP862) (конфликтующий идентификатор: NEC Czech (Kamenický) , который был создан до этой кодовой страницы)
  • 868 - урду
  • 869 - греческий
  • 872 - Кириллица с евро (то же без евро: 855 )
  • 874 - Тайский язык с низкими тонами и древними символами (конфликтующий идентификатор с Windows 874; версия с евро: 1161 Версия Windows: IBM 1162 )
  • 876 - OCR A
  • 877 - OCR B
  • 878 - КОИ8-Р
  • 891 - Корейский ПК SBCS
  • 898 - IBM-PC WP Многоязычный
  • 899 - Символ IBM-PC
  • 903 - ПК SBCS на упрощенном китайском языке
  • 904 - Традиционный китайский ПК SBCS
  • 906 - Международный сет # 5 3812/3820
  • 907 - APL ASCII (3812)
  • 909 - IBM-PC APL2 Extended
  • 910 - IBM-ПК APL2
  • 911 - IBM-PC Japan # 1
  • 926 - Корейский ПК DBCS
  • 927 - Традиционный китайский ПК DBCS
  • 928 - DBCS для ПК на упрощенном китайском
  • 929 - Тайский ПК DBCS
  • 932 - IBM-PC Japan MIX (DOS / V) (DBCS) ( 897 + 301 ) (конфликтующий идентификатор с Windows 932; версия Windows - IBM 943)
  • 934 - IBM-PC Korea MIX (DOS / V) (DBCS) ( 891 + 926 );
  • 936 - IBM-PC Simplified Chinese MIX (gb2312) (DOS / V) (DBCS) ( 903 + 928 ) (конфликтующий идентификатор с Windows 936; версия Windows - IBM 1386)
  • 938 - IBM-PC Традиционный китайский MIX (DOS / V, OS / 2) ( 904 + 927 )
  • 942 - IBM-PC Japan MIX (Японский SAA (OS / 2)) ( 1041 + 301 )
  • 943 - IBM-PC Japan OPEN ( 897 + 941 ) (Windows CP 932)
  • 944 - IBM-PC Korea MIX (Корейский SAA (OS / 2)) ( 1040 + 926 )
  • 946 - IBM-PC Simplified Chinese (Упрощенный китайский SAA (OS / 2)) ( 1042 + 928 )
  • 948 - IBM-PC Traditional Chinese (Традиционный китайский SAA (OS / 2)) ( 1043 + 927 )
  • 949 - корейский (Extended Wansung (ks_c_5601-1987)) ( 1088 + 951 ) (конфликтующий идентификатор с Windows 949 (унифицированный код хангыль); версия Windows - IBM 1363)
  • 951 - Корейский DBCS (код IBM KS) (конфликтующий идентификатор с Windows 951, взлом Windows 950 с сопоставлениями Unicode для некоторых символов PUA Unicode, найденных в HKSCS, на основе имени файла)
  • 1034 - Приложение для принтера - Транспортная этикетка, набор № 2
  • 1040 - Корейский расширенный
  • 1041 - расширенный японский (JIS X 0201 Extended)
  • 1042 - упрощенный китайский расширенный
  • 1043 - Традиционный китайский расширенный
  • 1044 - Приложение для принтера - Транспортная этикетка, набор № 1
  • 1046 - расширенный арабский (евро)
  • 1086 - IBM-PC Japan # 1
  • 1088 - Пересмотренный корейский язык (SBCS)
  • 1092 - Модифицированные символы IBM-PC
  • 1098 - Фарси
  • 1108 - Совместимость с базой DITROFF
  • 1109 - Совместимость с DITROFF Specials
  • 1115 - IBM-PC Китайская Народная Республика
  • 1116 - эстонский
  • 1117 - латышский
  • 1118 - литовский (реализация IBM кодовой страницы Лики 774 )
  • 1119 - литовский и русский (реализация IBM кодовой страницы Лики 772 )
  • 1125 - кириллица, украинский (то же самое с евро: 848 ) (IBM-версия RUSCII )
  • 1127 - IBM-PC арабский / французский
  • 1131 - IBM-PC Data, кириллица, белорусский (то же с евро: 849 )
  • 1139 - Японская буквенно-цифровая катакана
  • 1161 - Тайский язык с низкими тоновыми знаками и древними символами с евро (то же самое без евро: 874 )
  • 1167 - КОИ8-РУ
  • 1168 - КОИ8-У
  • 1300 - ANSI [PTS-DOS 6.70, а не 6.51]
  • 1370 - Традиционный китайский MIX ( кодировка Big5 ) ( 1114 + 947 + евро) (то же самое без евро: 950 )
  • 1380 - IBM-PC Упрощенный китайский GB PC-DATA (DBCS PC IBM GB 2312-80)
  • 1381 - IBM-PC упрощенный китайский ( 1115 + 1380 )
  • 1393 - Японский JIS X 0213 DBCS
  • 1394 - IBM-PC Japan (JIS X 0213) ( 897 + 1393 )

При работе со старым оборудованием, протоколами и форматами файлов часто бывает необходимо поддерживать эти кодовые страницы, но новые системы кодирования, в частности Unicode, приветствуются для новых проектов.

Кодовые страницы DOS обычно хранятся в файлах .CPI. [15] [16] [17] [18] [19]

Кодовые страницы IBM AIX [ править ]

Эти кодовые страницы используются IBM в своей операционной системе AIX . Они эмулируют несколько наборов символов, а именно те, которые предназначены для использования в соответствии с ISO, например, в UNIX-подобных операционных системах.

  • 367 - 7-битный US-ASCII
  • 371 - 7-битный US-ASCII APL
  • 806 - ISCII
  • 813 - ISO 8859-7
  • 819 - ISO 8859-1
  • 895 - 7-битная японская латынь
  • 896 - 7-битная японская расширенная катакана
  • 901 - Расширение ISO 8859-13 с евро (то же без евро: 921 )
  • 902 - ISO Эстонский с евро (то же без евро: 922 )
  • 912 - Расширение ISO 8859-2
  • 913 - ISO 8859-3
  • 914 - ISO 8859-4
  • 915 - Расширение ISO 8859-5
  • 916 - ISO 8859-8
  • 919 - ISO 8859-10
  • 920 - ISO 8859-9
  • 921 - Расширение ISO 8859-13 (то же самое с евро: 901 )
  • 922 - ISO эстонский (то же самое с евро: 902 )
  • 923 - ISO 8859-15
  • 952 - EUC японский для JIS X 0208
  • 953 - EUC японский для JIS X 0212
  • 954 - EUC японский ( 895 + 952 + 896 + 953 )
  • 955 - TCP японский, JIS X 0208-1978
  • 956 - TCP японский ( 895 + 952 + 896 + 953 )
  • 957 - TCP японский ( 895 + 955 + 896 + 953 )
  • 958 - TCP японский ( 367 + 952 + 896 + 953 )
  • 959 - TCP японский ( 367 + 955 + 896 + 953 )
  • 960 - Традиционный китайский DBCS-EUC SICGCC Primary Set (1-й уровень)
  • 961 - Традиционный китайский DBCS-EUC Полный набор SICGCC + IBM Select + UDC
  • 963 - Традиционный китайский TCP, только CNS 11643, плоскость 2
  • 964 - EUC (традиционный китайский) ( 367 + 960 + 961 )
  • 965 - TCP (традиционный китайский) ( 367 + 960 + 963 )
  • 970 - EUC корейский ( 367 + 971 )
  • 971 - EUC Korean DBCS (G1, KSC 5601 1989 (включая 188 UDC))
  • 1006 - ISO 8-битный урду
  • 1008 - ISO 8-битный арабский
  • 1009 - 7-битный ISO IRV
  • 1010 - 7-битная Франция
  • 1011 - 7-битная Германия FR
  • 1012 - 7-битная Италия
  • 1013 - 7-битное Соединенное Королевство
  • 1014 - 7-битная Испания
  • 1015 - 7-битная Португалия
  • 1016 - 7-битная Норвегия
  • 1017 - 7-битная Дания
  • 1018 - 7-битная Финляндия / Швеция
  • 1019 - 7-битные Нидерланды
  • 1029 - расширенный арабский
  • 1036 - CCITT T.61
  • 1089 - ISO 8859-6
  • 1111 - ISO 8859-2
  • 1124 - ISO украинский, аналог ISO 8859-5
  • 1129 - Вьетнамский ISO (то же самое с евро: 1163 )
  • 1133 - ISO Лаосский
  • 1163 - Вьетнамский ISO с евро (то же без евро: 1129 )
  • 1350 - EUC японский (JISeucJP) ( 367 + 952 + 896 + 953 )
  • 1382 - EUC (упрощенный китайский) (DBCS PC GB 2312-80)
  • 1383 - EUC (упрощенный китайский) ( 367 + 1382 )

Кодовая страница 819 идентична Latin-1, ISO / IEC 8859-1 , и с немного измененными командами позволяет машинам MS-DOS использовать эту кодировку. Он использовался с миникомпьютерами IBM AS / 400.

Кодовые страницы IBM OS / 2 [ править ]

Эти кодовые страницы используются IBM в своей операционной системе OS / 2 .

  • 1004 - Latin-1 Extended, Desk Top Publishing / Windows [20]

Кодовые страницы эмуляции Windows [ править ]

Эти кодовые страницы используются IBM при эмуляции наборов символов Microsoft Windows . Большинство этих кодовых страниц имеют тот же номер, что и кодовые страницы Microsoft, хотя они не совсем идентичны. Однако некоторые кодовые страницы являются новыми от IBM, а не Microsoft.

  • 897 - IBM-PC SBCS японский (JIS X 0201-1976)
  • 941 - IBM-PC Japanese DBCS для открытой среды
  • 947 - IBM-PC DBCS для ( кодировка Big5 )
  • 950 - Традиционный китайский MIX ( кодировка Big5 ) ( 1114 + 947 ) (то же самое с евро: 1370 )
  • 1114 - IBM-PC SBCS (упрощенный китайский; GBK ; традиционный китайский; кодировка Big5 )
  • 1126 - Корейский SBCS IBM-PC
  • 1162 - Windows Thai (Расширение 874 , но все еще называется в Windows)
  • 1169 - Windows кириллица азиатская
  • 1174 - Windows казахский [21]
  • 1250 - Windows Центральная Европа
  • 1251 - Windows кириллица
  • 1252 - Windows Western
  • 1253 - Windows греческий
  • 1254 - Windows Турецкая
  • 1255 - Windows Иврит
  • 1256 - Windows арабский
  • 1257 - Windows Baltic
  • 1258 - Windows вьетнамский
  • 1361 - корейский ( JOHAB )
  • 1362 - Корейский хангыль DBCS
  • 1363 - Windows Korean ( 1126 + 1362 ) (Windows CP 949)
  • 1372 - Кодировка китайского Big5 IBM-PC MS T (специально для DB2)
  • 1373 - Windows Традиционный китайский (расширение 950 )
  • 1374 - Расширение кодировки IBM-PC DB Big5 для HKSCS
  • 1375 - Расширение смешанного кодирования Big5 для HKSCS (предназначено для соответствия 950 )
  • 1385 - IBM-PC Simplified Chinese DBCS (Growing CS для GB18030, также используется для GBK PC-DATA.)
  • 1386 - IBM-PC Упрощенный китайский GBK ( 1114 + 1385 ) (Windows CP 936)
  • 1391 - упрощенный китайский 4 байта (растущий CS для GB18030, также используется для GBK PC-DATA.)
  • 1392 - IBM-PC Simplified Chinese MIX ( 1252 + 1385 + 1391 );

Кодовые страницы эмуляции Macintosh [ править ]

Эти кодовые страницы используются IBM при эмуляции наборов символов Apple Macintosh .

  • 1275 - Яблочный Роман
  • 1280 - Яблочный греческий
  • 1281 - Яблочный турецкий
  • 1282 - Яблоко Центральноевропейское
  • 1283 - Яблочная кириллица
  • 1284 - Яблочный хорватский
  • 1285 - Яблочный румынский
  • 1286 - Яблоко исландское

Кодовые страницы эмуляции Adobe [ править ]

Эти кодовые страницы используются IBM при эмуляции наборов символов Adobe .

  • 1038 - Кодировка Adobe Symbol
  • 1276 - стандартная кодировка Adobe (PostScript)
  • 1277 - Adobe (PostScript) Latin 1

Кодовые страницы эмуляции HP [ править ]

Эти кодовые страницы используются IBM при эмуляции наборов символов HP .

  • 1050 - расширение HP Roman
  • 1051 - HP Роман-8
  • 1052 - HP Gothic Legal
  • 1053 - HP Gothic-1 (почти то же, что и ISO 8859-1 )
  • 1054 - HP ASCII
  • 1055 - HP PC-Line
  • 1056 - Рисование линии HP
  • 1057 - HP PC-8 (почти то же, что и кодовая страница 437 )
  • 1058 - HP PC-8DN ( не совпадает с кодовой страницей 865 )
  • 1351 - Японский набор символов DBCS HP
  • 5039 - Японский MIX ( 1041 + 1351 )

Кодовые страницы эмуляции DEC [ править ]

Эти кодовые страницы используются IBM при эмуляции наборов символов DEC .

  • 1020 - 7-битный канадский (французский) набор NRC
  • 1021 - 7-битный набор швейцарского NRC
  • 1023 - 7-битный испанский набор NRC
  • 1090 - Специальные символы и набор рисования линий
  • 1100 - DEC Многонациональный
  • 1101 - 7-битный британский набор NRC
  • 1102 - 7-битный голландский набор NRC
  • 1103 - 7-битный финский набор NRC
  • 1104 - 7-битный французский набор NRC
  • 1105 - 7-битный норвежско-датский набор NRC
  • 1106 - 7-битный шведский набор NRC
  • 1107 - 7-битный норвежский / датский альтернативный NRC
  • 1287 - DEC греческий
  • 1288 - DEC Турецкий

Кодовые страницы IBM Unicode [ править ]

  • 1200 - Юникод UTF-16BE ( прямой порядок байтов ) с IBM Private Use Area (PUA) [22]
  • 1201 - Юникод UTF-16BE ( прямой порядок байтов ) [22]
  • 1202 - Юникод UTF-16LE ( с прямым порядком байтов ) с IBM PUA [22]
  • 1203 - Юникод UTF-16LE (с прямым порядком байтов ) [22]
  • 1208 - Юникод UTF-8 с IBM PUA [22]
  • 1209 - Юникод UTF-8 [22]
  • 1400 - ISO 10646 UCS-BMP (на основе Unicode 6.0) [22]
  • 1401 - ISO 10646 UCS-SMP (на основе Unicode 6.0) [22]
  • 1402 - ISO 10646 UCS-SIP (на основе Unicode 6.0) [22]
  • 1414 - ISO 10646 UCS-SSP (на основе Unicode 4.0) [22]
  • 1445 - IBM AFP PUA No. 1
  • 1446 - ISO 10646 UCS-PUP15 (на основе Unicode 4.0) [22]
  • 1447 - ISO 10646 UCS-PUP16 (на основе Unicode 4.0) [22]
  • 1448 - UCS-BMP (Общий УДК)
  • 1449 - PUA по умолчанию IBM

Кодовые страницы Microsoft [ править ]

Кодовые страницы Windows [ править ]

Эти кодовые страницы используются Microsoft в своей собственной операционной системе Windows. Microsoft определила ряд кодовых страниц, известных как кодовые страницы ANSI (первая, 1252 была основана на апокрифическом проекте ANSI того, что стало ISO 8859-1 ). Кодовая страница 1252 построена на ISO 8859-1, но использует диапазон 0x80-0x9F для дополнительных печатаемых символов, а не управляющие коды C1 из ISO 6429, упомянутые в ISO 8859-1. [23] Некоторые из других частично основаны на других частях ISO 8859, но часто изменяются, чтобы приблизить их к 1252.

  • 874 - Windows тайский
  • 1250 - Windows Центральная Европа
  • 1251 - Windows кириллица
  • 1252 - Windows Western
  • 1253 - Windows греческий
  • 1254 - Windows Турецкая
  • 1255 - Windows Иврит
  • 1256 - Windows арабский
  • 1257 - Windows Baltic
  • 1258 - Windows вьетнамский

Microsoft рекомендует новым приложениям использовать UTF-8 или UCS-2 / UTF-16 вместо этих кодовых страниц. [24]

Кодовые страницы DBCS [ править ]

Эти кодовые страницы представляют собой кодировки символов DBCS для различных языков CJK. В операционных системах Microsoft они используются как кодовые страницы «OEM» и «Windows» для соответствующей локали.

  • 932 - Поддерживает японский Shift-JIS
  • 936 - поддерживает GBK на упрощенном китайском
  • 949 - Поддерживает корейский унифицированный код хангыль
  • 950 - поддерживает традиционный китайский Big5

Кодовые страницы MS-DOS [ править ]

Эти кодовые страницы используются Microsoft в своей операционной системе MS-DOS. Microsoft называет их кодовыми страницами OEM, потому что они были определены производителями оригинального оборудования, которые лицензировали MS-DOS для распространения со своим оборудованием, а не Microsoft или организацией по стандартизации. Большинство этих кодовых страниц имеют тот же номер, что и эквивалентные кодовые страницы IBM, хотя они не совсем идентичны. Есть минимальные отличия [25] в некоторых кодовых страницах от IBM и Microsoft.

  • 708 - арабский (ASMO 708)
  • 709 - арабский ( ASMO 449+ / BCON V4)
  • 710 - арабский (прозрачный арабский)
  • 720 - арабский (прозрачный ASMO)
  • 737 - греческий
  • 850 - Latin-1
  • 851 - греческий
  • 852 - Латиница-2
  • 855 - кириллица
  • 857 - Латиница-5
  • 858 - Latin-1 с символом евро
  • 859 - Латиница-9
  • 860 - португальский
  • 861 - исландский
  • 862 - Иврит
  • 863 - канадский французский
  • 864 - арабский
  • 865 - датский / норвежский
  • 866 - белорусский, русский, украинский
  • 869 - греческий

Кодовые страницы эмуляции Macintosh [ править ]

Эти кодовые страницы используются Microsoft при эмуляции наборов символов Apple Macintosh .

  • 10000 - Apple Macintosh Роман
  • 10001 - Яблоко японское
  • 10002 - Apple, традиционный китайский (Big5)
  • 10003 - Яблочный корейский
  • 10004 - Яблочный арабский
  • 10005 - Яблочный иврит
  • 10006 - Яблочный греческий
  • 10007 - кириллица Apple Macintosh
  • 10008 - Apple, упрощенный китайский (GB 2312)
  • 10010 - Яблочный румынский
  • 10017 - Яблоко украинское
  • 10021 - Яблочный тайский
  • 10029 - Apple Macintosh Центральная Европа
  • 10079 - Яблоко исландское
  • 10081 - Яблочный турецкий
  • 10082 - Яблочный хорватский

Различные другие кодовые страницы Microsoft [ править ]

Следующие номера кодовых страниц относятся к Microsoft Windows. IBM может использовать другие номера для этих кодовых страниц. Они имитируют несколько наборов символов, а именно те, которые предназначены для использования в соответствии с ISO, [ требуется пояснение ], например, в UNIX-подобных операционных системах.

  • 20000 - Традиционный китайский CNS
  • 20001 - Традиционный китайский TCA
  • 20002 - Традиционный китайский ETEN
  • 20003 - Традиционный китайский IBM5500
  • 20004 - Традиционный китайский телетекст
  • 20005 - Традиционный китайский Ван
  • 20105 - 7-битный IA5 IRV [26] [27] [28]
  • 20106 - 7-битный IA5 немецкий (DIN 66003) [26] [27] [29]
  • 20107 - 7-битный IA5 шведский (SEN 850200 C) [26] [27] [30]
  • 20108 - 7-битный норвежский IA5 (NS 4551-2) [26] [27] [31]
  • 20127 - 7-битный US-ASCII [26] [27] [32]
  • 20261 - CCITT T.61
  • 20269 - ISO 6937
  • 20273
  • 20277
  • 20278
  • 20284
  • 20285
  • 20290
  • 20297
  • 20420
  • 20423
  • 20424
  • 20833
  • 20838
  • 20866 - КОИ8 -Р
  • 20871
  • 20880 - EBCDIC кириллица (880)
  • 20905
  • 20924
  • 20932
  • 20936
  • 20949
  • 21025 - EBCDIC кириллица (1025)
  • 21027
  • 21866 - КОИ8 -У
  • 28591 - ISO-8859-1
  • 28592 - ISO-8859-2
  • 28593 - ISO-8859-3
  • 28594 - ISO-8859-4
  • 28595 - ISO-8859-5
  • 28596 - ISO-8859-6
  • 28597 - ISO-8859-7
  • 28598 - ISO-8859-8
  • 28599 - ISO-8859-9
  • 28600 - ISO-8859-10
  • 28601 - ISO-8859-11
  • 28602 - не используется (зарезервировано для ISO-8859-12 )
  • 28603 - ISO-8859-13
  • 28604 - ISO-8859-14
  • 28605 - ISO-8859-15
  • 28606 - ISO-8859-16
  • 38596 - ISO-8859-6
  • 38598 - ISO-8859-8

Кодовые страницы Microsoft Unicode [ править ]

  • 1200 - Юникод UTF-16LE (с прямым порядком байтов )
  • 1201 - Юникод UTF-16BE (с прямым порядком байтов )
  • 12000 - Юникод UTF-32LE (с прямым порядком байтов )
  • 12001 - Юникод UTF-32BE (с прямым порядком байтов )
  • 65000 - Юникод UTF-7
  • 65001 - Юникод UTF-8
  • 65520 - Пустая плоскость Unicode

Наборы символов HP [ править ]

Компания HP разработала серию наборов символов (каждый со связанным кодом набора символов) для кодирования либо собственных наборов символов, либо наборов символов других поставщиков. Обычно это 7-битные наборы символов, которые при перемещении в верхнюю часть и связанные с набором символов ASCII составляют 8-битные наборы символов.

Собственные наборы символов HP [ править ]

  • Набор символов 0E - HP Roman Extension - 7-битный набор символов с акцентированными буквами (кодируется IBM как кодовая страница 1050 )
  • Набор символов 0G - HP 7-битный немецкий
  • Набор символов 0L - HP Line Draw (закодировано IBM как кодовая страница 1056 )
  • Набор символов 0M - HP Math-7
  • Набор символов 0T - HP Thai-8
  • Набор символов 1S - HP 7-бит, испанский
  • Набор символов 1U - 7-битный HP Gothic Legal (кодируется IBM как кодовая страница 1052 )
  • Набор символов 4Q - 7-битная линия ПК (закодирована IBM как кодовая страница 1055 )
  • Набор символов 4U - HP Roman-9 - Roman-8 + €
  • Набор символов 7J - настольный компьютер HP
  • Набор символов 7S - HP 7-битный европейский испанский
  • Набор символов 8E - HP East-8
  • Набор символов 8G - HP Greek-8 (на основе IR 088; не на ELOT 927)
  • Набор символов 8H - HP Hebrew-8
  • Набор символов 8I - MS LineDraw (ASCII + HP PC Line)
  • Набор символов 8K - HP Kana-8 (ASCII + японская катакана)
  • Набор символов 8L - HP LineDraw (ASCII + HP Line Draw)
  • Набор символов 8M - HP Math-8 (ASCII + HP Math-8)
  • Набор символов 8R - HP Cyrillic-8
  • Набор символов 8S - HP 7-битный латиноамериканский испанский
  • Набор символов 8T - HP Turkish-8
  • Набор символов 8U - HP Roman-8 (ASCII + HP Roman Extension; кодируется IBM как кодовая страница 1051 )
  • Набор символов 8V - HP Arabic-8
  • Набор символов 9K - HP Korean-8
  • Набор символов 9T - PC 8T (также известный как кодовая страница 437-T; это не кодовая страница 857 )
  • Набор символов 9V - латинский / арабский для Windows (это не кодовая страница 1256 )
  • Набор символов 11U - PC 8D / N (также известный как кодовая страница 437-N; кодируется IBM как кодовая страница 1058 ; это не кодовая страница 865 )
  • Набор символов 14G - альтернативный греческий язык PC-8 (также известный как кодовая страница 437-G; почти то же самое, что и кодовая страница 737 )
  • Набор символов 18K -
  • Набор символов 18T -
  • Набор символов 19C -
  • Набор символов 19K -

Наборы символов от других поставщиков [ править ]

  • Набор символов 0D - ISO 60: 7-битный норвежский язык
  • Набор символов 0F - ISO 25: 7-битный французский
  • Набор символов 0H - 7-битный иврит HP - практически такой же, как израильский стандарт SI 960
  • Набор символов 0I - ISO 15: 7-битный итальянский
  • Набор символов 0K - ISO 14: 7-битная японская катакана
  • Набор символов 0N - ISO 8859-1 Latin 1 (Первоначально назывался "Gothic-1"; кодируется IBM как кодовая страница 1052)
  • Набор символов 0R - ISO 8859-5 Latin / Cyrillic (версия 1986 года - IR 111)
  • Набор символов 0S - ISO 11: 7-битный шведский
  • Набор символов 0U - ISO 6: 7-битный США
  • Набор символов 0V - арабский
  • Набор символов 1D - ISO 61: 7-битный норвежский язык
  • Набор символов 1E - ISO 4: 7-битный UK
  • Набор символов 1F - ISO 69: 7-битный французский язык
  • Набор символов 1G - ISO 21: 7-битный немецкий язык
  • Набор символов 1K - ISO 13: 7-битная японская латиница
  • Набор символов 1T - Windows Thai (Практически то же, что и 874 )
  • Набор символов 2K - ISO 57: 7-битная упрощенная китайская латынь
  • Набор символов 2N - ISO 8859-2 Latin 2
  • Набор символов 2S - ISO 17: 7-битный испанский
  • Набор символов 2U - ISO 2: 7-битная версия International Reverence
  • Набор символов 3N - ISO 8859-3 Latin 3
  • Набор символов 3R - PC-866 Russia (Практически то же, что и кодовая страница 866 )
  • Набор символов 3S - ISO 10: 7-битный шведский
  • Набор символов 4N - ISO 8859-4 Latin 4
  • Набор символов 4S - ISO 16: 7-битный португальский
  • Набор символов 5M - математический символ PS (практически то же, что и символы Adobe )
  • Набор символов 5N - ISO 8859-9 Latin 5
  • Набор символов 5S - ISO 84: 7-битный португальский
  • Набор символов 5T - Windows 3.1 Latin-5 (Практически то же, что и кодовая страница 1254 )
  • Набор символов 6J - Microsoft Publishing
  • Набор символов 6M - Ventura Math
  • Набор символов 6N - ISO 8859-10 Latin 6
  • Набор символов 6S - ISO 85: 7-битный испанский
  • Набор символов 7H - ISO 8859-8 Латинский / Иврит
  • Набор символов 9E - Windows 3.1 Latin 2 (Практически то же, что и кодовая страница 1250 )
  • Набор символов 9G - Windows 98 Греческий (Практически то же, что и кодовая страница 1253 )
  • Набор символов 9J - PC 1004
  • Набор символов 9L - Ventura ITC Zapf Dingbats
  • Набор символов 9N - ISO 8859-15 Latin 9
  • Набор символов 9R - кириллица Windows 98 (практически такая же, как кодовая страница 1251 )
  • Набор символов 9U - Windows 3.0
  • Набор символов 10G - PC-851 Latin / Greek (Практически то же, что и кодовая страница 851 )
  • Набор символов 10J - PS Text (практически такой же, как Adobe Standard )
  • Набор символов 10L - PS ITC Zapf Dingbats (Практически такие же, как Adobe Dingbats )
  • Набор символов 10N - ISO 8859-5 Latin / Cyrillic (версия 1988 - IR 144)
  • Набор символов 10R - кириллица PC-855 (практически такая же, как кодовая страница 855 )
  • Набор символов 10T - Teletex
  • Набор символов 10U - PC-8 (Практически то же, что и кодовая страница 437 ; кодируется IBM как кодовая страница 1057 )
  • Набор символов 10V - CP-864 (Практически то же, что и кодовая страница 864 )
  • Набор символов 11G - CP-869 (Практически то же, что и кодовая страница 869 )
  • Набор символов 11J - PS ISO Latin-1 (практически то же, что и Adobe Latin-1 )
  • Набор символов 11N - ISO 8859-6 Latin / Arabic
  • Набор символов 12G - PC Latin / Greek (Практически то же, что и кодовая страница 737 )
  • Набор символов 12J - MC Text (практически такой же, как Macintosh Roman )
  • Набор символов 12N - ISO 8859-7 Латинский / греческий
  • Набор символов 12Р - ПК ГОСТ (Практически то же, что и ПК ГОСТ Главный )
  • Набор символов 12U - PC-850 Latin 1 (Практически то же, что и кодовая страница 850 )
  • Набор символов 13J - Ventura International
  • Symbol Set 13R - PC Болгарка (Практически то же, что и МИК )
  • Набор символов 13U - PC-858 Latin 1 + € (Практически то же, что и кодовая страница 858 )
  • Набор символов 14J - Ventura US
  • Набор символов 14L - Дингбаты Windows
  • Набор символов 14P - ABICOMP International (Практически то же, что и ABICOMP )
  • Набор символов 14R - ПК украинский (Практически то же, что и RUSCII )
  • Набор символов 15H - PC-862 Израиль (Практически то же, что и кодовая страница 862 )
  • Набор символов 16U - PC-857 Latin 5 (Практически то же, что и кодовая страница 857 )
  • Набор символов 17U - PC-852 Latin 2 (Практически то же, что и кодовая страница 852 )
  • Набор символов 18N - UTF-8
  • Набор символов 18U - PC-853 Latin 3 (Практически то же, что и кодовая страница 853 )
  • Набор символов 19L - Windows 98 Baltic (Практически то же, что и кодовая страница 1257 )
  • Набор символов 19M - символ Windows
  • Набор символов 19U - Windows 3.1 Latin 1 (Практически то же, что и кодовая страница 1252 )
  • Набор символов 20U - PC-860 Portugal (Практически то же, что и кодовая страница 860 )
  • Набор символов 21U - PC-861 Исландия (практически то же, что и кодовая страница 861 )
  • Набор символов 23U - PC-863 Канада - французский (Практически то же, что и кодовая страница 863 )
  • Набор символов 24Q - PC-Polish Mazowia (Практически то же, что и кодировка Mazovia )
  • Набор символов 25U - PC-865 Дания / Норвегия (практически то же, что и кодовая страница 865 )
  • Набор символов 26U - PC-775 Latin 7 (Практически то же, что и кодовая страница 775 )
  • Symbol Set 27Q - PC-8 PC Nova (Практически то же, что и PC Nova )
  • Набор символов 27U - ПК латышский русский (также известный как 866-латышский)
  • Набор символов 28U - ПК Литовский / Русский (Практически то же, что и кодовая страница 774 )
  • Набор символов 29U - PC-772 Литовский / Русский (Практически то же, что и кодовая страница 772 )

Кодовые страницы от других поставщиков [ править ]

Эти кодовые страницы являются независимыми назначениями сторонних поставщиков. Поскольку исходная кодовая страница IBM PC ( номер 437 ) на самом деле не была предназначена для международного использования, появилось несколько частично совместимых вариантов, специфичных для страны или региона.

Эти присвоения номеров кодовых страниц не являются официальными ни IBM, ни Microsoft, и почти ни один из них не упоминается IANA как пригодный для использования набор символов. Номера, присвоенные этим кодовым страницам, произвольны и могут противоречить зарегистрированным номерам, используемым IBM или Microsoft. Некоторые из них могут предшествовать добавлению переключения кодовых страниц в DOS 3.3.

  • 100 - Аппаратная страница шрифтов на иврите DOS (не от IBM; HDOS ) [33]
  • 111 - Греческий DOS (не от IBM; AST Premium Exec DOS 5.0 [34] [35] [36] )
  • 112 - DOS Turkish (не от IBM; AST Premium Exec DOS 5.0 [34] [35] [36] )
  • 113 - DOS югославский (не от IBM; AST Premium Exec DOS 5.0 [34] [35] [36] )
  • 151 - DOS Nafitha Arabic (не от IBM; ADOS )
  • 152 - DOS Nafitha Arabic (не от IBM; ADOS )
  • 161 - DOS арабский (не от IBM; ADOS ) [33]
  • 162 - DOS арабский (не от IBM; ADOS)
  • 163 - DOS арабский (не от IBM; ADOS) [33]
  • 164 - DOS арабский (не от IBM; ADOS)
  • 165 - DOS арабский (не от IBM; ADOS) [33]
  • 166 - IBM Arabic PC (ADOS) [33]
  • 210 - DEC DOS Greek (принтеры NEC Jetmate)
  • 220 - DEC DOS испанский (не от IBM)
  • 489 - Чехословацкий [программное обеспечение OCR 1993]
  • 620 - DOS Польский (Мазовецкое воеводство) (не от IBM)
  • 667 - DOS Polish (Мазовецкое воеводство) (не от IBM)
  • 668 - Польский DOS (не от IBM)
  • 707 - MS-DOS Arabic Sakhr (Не от IBM; Программное обеспечение Sakhr от MSX Computers)
  • 711 - MS-DOS Arabic Nafitha Enhanced (не от IBM)
  • 714 - MS-DOS Arabic Sakr (не от IBM)
  • 715 - MS-DOS арабский APTEC (не от IBM)
  • 721 - MS-DOS Arabic Nafitha International (не от IBM)
  • 768 - арабский Аль-Араби (не от IBM)
  • 770 - DOS эстонский, латышский, литовский [37] (из литовского Lika Software; [38] литовский национальный стандарт RST 1095-89)
  • 771 - DOS литовский / кириллица - KBL [39] (из литовского Lika Software [38] )
  • 772 - DOS литовский / кириллица [40] (из литовского Lika Software; [38] литовский LST 1284: национальный стандарт 1993; принят IBM в качестве кодовой страницы 1119 )
  • 773 - DOS Latin-7 - KBL (от литовского программного обеспечения Lika)
  • 774 - DOS литовский [41] (из литовского Lika Software; [38] литовский LST 1283: национальный стандарт 1993; принят IBM как кодовая страница 1118 )
  • 775 - DOS Latin-7 Baltic Rim (от литовского Lika Software; [38] литовский национальный стандарт LST 1590-1; принят IBM и Microsoft в качестве кодовой страницы 775 )
  • 776 - DOS литовский (расширенный CP770) [42] (из литовского Lika Software [38] )
  • 777 - Литовский с акцентом в DOS (старый) (расширенный CP773) - KBL [42] (от литовского Lika Software [38] )
  • 778 - Литовский с акцентом в DOS (расширенный CP775) [42] (из литовского Lika Software [38] )
  • 790 - DOS Польский (Мазовецкое воеводство)
  • 854 - испанский [43] [6]
  • 881 - Latin 1 (не от IBM; AST Premium Exec DOS 5.0 [34] [35] [36] ) (конфликтующий идентификатор с IBM EBCDIC 881 )
  • 882 - Latin 2 (ISO 8859-2) (не от IBM; то же, что и кодовая страница 912; AST Premium Exec DOS 5.0 [34] [35] [36] ) (конфликтующий идентификатор с IBM EBCDIC 882 )
  • 883 - Latin 3 (не от IBM; AST Premium Exec DOS 5.0 [34] [35] [36] ) (конфликтующий идентификатор с IBM EBCDIC 883 )
  • 884 - Latin 4 (не от IBM; AST Premium Exec DOS 5.0 [34] [35] [36] ) (конфликтующий идентификатор с IBM EBCDIC 884 )
  • 885 - Latin 5 (не от IBM; AST Premium Exec DOS 5.0 [34] [35] [36] ) (конфликтующий идентификатор с IBM EBCDIC 885 )
  • 895 - Чешский (Каменицкий) , (не от IBM; конфликтующий идентификатор с IBM CP895 - 7-битный EUC японский римский)
  • 896 - DOS Polish (Mazovia) (не от IBM; конфликтующий идентификатор с IBM CP896 - 7-битная EUC японская катакана)
  • 900 - DOS Russian (Русский MS-DOS 5.0 LCD.CPI)
  • 928 - греческий (на принтерах Star [44] ); То же, что и национальный стандарт Греции ELOT 928 (не от IBM; конфликтующий идентификатор с IBM CP928 - упрощенный китайский ПК DBCS)
  • 966 - саудовец (не из IBM)
  • 991 - DOS Польский (Мазовецкое воеводство) (не от IBM)
  • 999 - DOS сербо-хорватский I (не от IBM); также известный как PC Nova и CroSCII; нижняя часть - JUSI.B1.002, верхняя - кодовая страница 437; поддерживает словенский и сербохорватский (латиница)
  • 1001 - арабский (на принтерах Star [44] ) (не от IBM; конфликтующий идентификатор с IBM CP1001 - MICR)
  • 1261 - Windows Korean IBM-1261 LMBCS-17, аналог 1363
  • 1270 - Windows саамы
  • 2001 г. - литовский KBL (на принтерах Star [44] ); то же, что и кодовая страница 771
  • 3001 - эстонский 1 (на принтерах Star [44] ); то же, что и кодовая страница 1116
  • 3002 - эстонский 2 (на принтерах Star [44] ); то же, что и кодовая страница 922
  • 3011 - латышский 1 (на принтерах Star [44] ); то же, что и кодовая страница 437-латышский
  • 3012 - Латвийский-2 (на принтерах Star [44] ); то же, что и кодовая страница 866-латышский (латвийский национальный стандарт RST 1040-90)
  • 3021 - Болгарский (на принтерах Star [44] ); такой же как МИК
  • 3031 - Иврит (на принтерах Star [44] ); то же, что и кодовая страница 862
  • 3041 - Мальтийский (на принтерах Star [44] ); то же, что и ISO 646 на мальтийском языке
  • 3840 - IBM-Russian (на принтерах Star [44] ); почти как CP 866
  • 3841 - Гост-Россия (на принтерах Star [44] ); ГОСТ 13052 плюс иероглифы для языков Центральной Азии
  • 3843 - Польский (на принтерах Star [44] ); такой же как Мазовия
  • 3844 - CS2 (на принтерах Star [44] ); такой же, как Каменицкий
  • 3845 - Венгерский (на принтерах Star [44] ); то же, что и CWI
  • 3846 - турецкий (на принтерах Star [44] ); То же, что PC-8 Турецкая + старый знак турецкой лиры (T at) в кодовой точке A8
  • 3847 - Brazil-ABNT (на принтерах Star [44] ); соответствует бразильскому национальному стандарту NBR-9614: 1986
  • 3848 - Brazil-ABICOMP (на принтерах Star [44] ); то же, что и ABICOMP
  • 3850 - Стандартное КУ (на принтерах Star [44] ); вариант кодировки Университета Касетсарт для тайского языка
  • 3860 - Райвитее КУ (на принтерах Star [44] ); вариант кодировки Университета Касетсарт для тайского языка
  • 3861 - Микровиз КУ (на принтерах Star [44] ); вариант кодировки Университета Касетсарт для тайского языка
  • 3863 - STD988 TIS (на принтерах Star [44] ); вариант кодировки TIS 620 для тайского языка
  • 3864 - Популярные TIS (на принтерах Star [44] ); вариант кодировки TIS 620 для тайского языка
  • 3865 - Newsic TIS (на принтерах Star [44] ); вариант кодировки TIS 620 для тайского языка
  • (номер отсутствует) - CWI-2 (для DOS) поддерживает венгерский
  • (номер отсутствует) - MIK (для DOS) поддерживает болгарский
  • (номер отсутствует) - DOS Serbo-Croatian II; поддерживает словенский и сербохорватский (латиница)
  • (номер отсутствует) - Альтернативная русская кодовая страница (для DOS); это источник для IBM CP 866

Список присвоений кодовых страниц [ править ]

Список известных присвоений кодовых страниц (неполный):

Критика [ править ]

Многие старые кодировки символов (в отличие от Unicode) имеют несколько проблем. Некоторые поставщики кодовых страниц недостаточно документируют значение всех значений кодовых точек, что последовательно снижает надежность обработки текстовых данных через различные компьютерные системы. Некоторые поставщики добавляют собственные расширения к некоторым кодовым страницам для добавления или изменения определенных значений кодовых точек; например, байт 0x5C в Shift JIS может представлять либо обратную косую черту, либо символ валюты иены в зависимости от платформы. Наконец, для поддержки нескольких языков в программе, не использующей Unicode, необходимо сохранить кодовую страницу, используемую для каждой строки / документа.

Из-за обширной документации Unicode, обширного репертуара символов и политики стабильности символов, перечисленные выше проблемы редко вызывают беспокойство для Unicode. Приложения также могут неправильно маркировать текст в Windows-1252 как ISO-8859-1 . К счастью, единственное различие между этими кодовыми страницами состоит в том, что значения кодовых точек, используемые ISO-8859-1 для управляющих символов, вместо этого используются в качестве дополнительных печатаемых символов в Windows-1252. Поскольку управляющие символы не работают в HTML, веб-браузеры, как правило, используют Windows-1252, а не ISO-8859-1. В HTML5 обработка ISO-8859-1 как Windows-1252 даже кодифицирована как стандарт. Позже UTF-8 сменила обе кодировки с точки зрения популярности в Интернете. [46] [47]

Частные кодовые страницы [ править ]

Когда в начале истории персональных компьютеров пользователи не находили, что их требования к кодировке символов удовлетворяются, частные или локальные кодовые страницы создавались с помощью утилит Terminate и Stay Resident или путем перепрограммирования EPROM BIOS . В некоторых случаях были изобретены неофициальные номера кодовых страниц (например, CP895).

При более разнообразный набор символов поддержка стала доступна большая часть этих кодовых страниц упал в неиспользованием, с некоторыми исключениями , такими как Каменицки кодирования или KEYBCS2 для чешских и словацких алфавитов. Другой набор символов - это стандарт кодировки Iran System , созданный корпорацией Iran System для поддержки персидского языка . Этот стандарт использовался в Иране в программах на основе DOS, и после введения кодовой страницы Microsoft 1256 этот стандарт устарел. Однако некоторые программы Windows и DOS, использующие эту кодировку, все еще используются, и некоторые шрифты Windows с этой кодировкой существуют.

Чтобы преодолеть такие проблемы, уровень 2 Архитектуры представления символьных данных IBM специально резервирует диапазоны идентификаторов кодовых страниц для определяемых пользователем назначений и назначений для частного использования. Когда бы ни использовались такие идентификаторы кодовой страницы, пользователь не должен предполагать, что те же функции и внешний вид могут быть воспроизведены в другой конфигурации системы или на другом устройстве или системе, если только пользователь не позаботится об этом специально. Диапазон кодовых страниц 57344-61439 ( E000h - EFFFh ) официально зарезервирован для определяемых пользователем кодовых страниц (или фактически CCSID в контексте IBM CDRA ), тогда как диапазон 65280-65533 ( FF00h - FFFDh)) зарезервировано для любых определяемых пользователем назначений "частного использования". Например, незарегистрированный пользовательский вариант кодовой страницы 437 ( 1B5h ) или 28591 ( 6FAF ) может стать 57781 ( E1B5h ) или 61359 ( EFAFh ), соответственно, чтобы избежать потенциальных конфликтов с другими назначениями и сохранить иногда существующие внутренние числовая логика в назначениях исходных кодовых страниц. Незарегистрированная частная кодовая страница, не основанная на существующей кодовой странице, кодовая страница конкретного устройства, такая как шрифт принтера, которому просто нужен логический дескриптор, чтобы стать адресуемым для системы, часто меняющийся шрифт загрузки или номер кодовой страницы с символическим это означает, что в локальной среде может быть присвоение в частном диапазоне, например 65280 (FF00h ).

Идентификаторы кодовых страниц 0, 65534 ( FFFEh ) и 65535 ( FFFFh ) зарезервированы для внутреннего использования операционными системами, такими как DOS, и не должны назначаться каким-либо конкретным кодовым страницам.

См. Также [ править ]

  • Кодовая страница Windows
  • Кодировка символов
  • CCSID Определения и назначения официальной "кодовой страницы" IBM
  • Обнюхивание кодовой страницы
  • Юникод

Ссылки [ править ]

  1. ^ Ссылка на кодовую страницу хоста IBM (по CCSID для EBCDIC)
  2. ^ "Кодовая страница" . sap.com .
  3. ^ a b «Глоссарий» . oracle.com .
  4. ^ "Информация для программиста видеотерминала VT510" . Корпорация цифрового оборудования (DEC). 7.1. Наборы символов - Обзор . Проверено 15 февраля 2017 . В дополнение к традиционным DEC и ISO наборов символов, которые соответствуют структуре и правилам ISO 2022 , то VT510 поддерживает несколько кодовых страниц IBM PC ( номера страниц в стандартном наборе символов руководства компании IBM) в PCTerm режиме эмуляции консольного терминала в стандартные ПК.
  5. ^ «7.1. Наборы символов - Обзор». Информация для программиста видеотерминала VT520 / VT525 (PDF) . Корпорация цифрового оборудования (DEC). Июль 1994. с. 7-1. EK-VT520-RM. A01. Архивировано (PDF) из оригинала на 2017-02-15 . Проверено 15 февраля 2017 . Помимо традиционных наборов символов DEC и ISO, VT520 поддерживает ряд кодовых страниц IBM PC (которые относятся к номерам страниц в руководстве IBM по стандартным наборам символов) в режиме PCTerm для имитации консольного терминала стандартных промышленных ПК.
  6. ^ a b c Пол, Маттиас Р. (10.06.2001) [1995]. «Обзор кодовых страниц DOS, OS / 2 и Windows» (файл CODEPAGE.LST) (предварительная редакция 1.59). Архивировано 20 апреля 2016 года . Проверено 20 августа 2016 .
  7. ^ Наборы символов языка команд принтера
  8. ^ Наборы символов HP
  9. ^ Руководство PCL5 Camparison
  10. ^ Збиковски, Марк ; Аллен, Пол ; Баллмер, Стив ; Борман, Рувим; Борман, Роб; Батлер, Джон; Кэрролл, Чак; Чемберлен, Марк; Челл, Дэвид; Коли, Майк; Кортни, Майк; Драйфус, Майк; Дункан, Рэйчел; Экхардт, Курт; Эванс, Эрик; Фермер, Рик; Гейтс, Билл ; Гири, Майкл; Гриффин, Боб; Хогарт, Дуг; Джонсон, Джеймс У .; Кермаани, Камель; Король, Адриан; Кох, Рид; Ландовски, Джеймс; Ларсон, Крис; Леннон, Томас; Липки, Дэн; Макдональд, Марк ; МакКинни, Брюс; Мартин, Паскаль; Мазерс, Эстель; Мэтьюз, Боб; Мелин, Дэвид; Mergentime, Чарльз; Невин, Рэнди; Ньюэлл, Дэн; Ньюэлл, Тани; Норрис, Дэвид; О'Лири, Майк; О'Рир, Боб ; Олссон, Майк; Остерман, Ларри; Остлинг, Ридж; Пай, Сунил;Патерсон, Тим ; Перес, Гэри; Питерс, Крис; Петцольд, Чарльз ; Поллок, Джон; Рейнольдс, Аарон ; Рубин, Дэррил; Райан, Ральф; Шульмейстер, Карл; Шах, Раджен; Шоу, Барри; Коротко, Энтони; Сливка, Бен; Смирл, Джон; Стиллмейкер, Бетти; Стоддард, Джон; Тиллман, Деннис; Уиттен, Грег; Юнт, Натали; Зек, Стив (1988). «Технические советники». Энциклопедия MS-DOS: версии с 1.0 по 3.2 . Дункан, Рэй; Боствик, Стив; Бургойн, Кейт; Байерс, Роберт А.; Хоган, Том; Кайл, Джим; Летвин, Гордон ; Петцольд, Чарльз ; Рабинович, Чип; Томлин, Джим; Уилтон, Ричард; Волвертон, Ван; Вонг, Уильям; Вудкок, Джоанна (Полностью переработанная ред.). Редмонд, Вашингтон, США: Microsoft Press .ISBN 1-55615-049-0. LCCN  87-21452 . OCLC  16581341 . [1] (xix + 1570 страниц; 26 см) (NB. Это издание было опубликовано в 1988 году после обширной доработки изъятого первого издания 1986 года другим коллективом авторов.)
  11. ^ «Идентификаторы кодовой страницы» . microsoft.com . Microsoft .
  12. ^ «Программирование видео VGA / SVGA - Работа в текстовом режиме VGA» . osdever.net .
  13. ^ a b c d e f xlate - Транслитерация содержимого записей , IBM Corporation , 2010 [1986] , получено 18 октября 2016 г.
  14. ^ "Кодовая страница CPGID 01093 (pdf)" (PDF) . Архивировано из оригинального (PDF) 08.07.2015.
  15. ^ Пол, Маттиас Р. (2001-06-10) [1995]. «Описание формата файлов DOS, OS / 2 и Windows NT .CPI и Linux .CP» (файл CPI.LST) (изд. 1.30). Архивировано 20 апреля 2016 года . Проверено 20 августа 2016 .
  16. Перейти ↑ Elliott, John C. (2006-10-14). «Формат файла CPI» . Seasip.info . Архивировано 22 сентября 2016 года . Проверено 22 сентября 2016 .
  17. ^ Брауэр, Andries Эверт (2001-02-10). «Шрифты CPI» . 0.2. Архивировано 22 сентября 2016 года . Проверено 22 сентября 2016 .
  18. ^ Haralambous, Яннис (сентябрь 2007). Шрифты и кодировки . Перевод Хорна, П. Скотта (1-е изд.). Севастополь, Калифорния, США: O'Reilly Media, Inc., стр. 601–602, 611. ISBN 978-0-596-10242-5.
  19. ^ Справочник программиста MS-DOS . Microsoft Press . 1991. ISBN. 1-55615-329-5.
  20. ^ «Кодовая страница 1004 - Windows Extended» . IBM . 2001. Архивировано 13 мая 2018 года . Проверено 13 мая 2018 .
  21. ^ «Архитектура представления символьных данных» .
  22. ^ a b c d e f g h i j k l "Идентификатор кодированного набора символов IBM (CCSID)" . IBM . Архивировано из оригинала на 2009-11-26.
  23. ^ ISO / IEC 8859-1: 1998 (E) . ISO . 1998-04-15. п. 1. Кодированные символы в этом наборе могут использоваться вместе с кодированными функциями управления, выбранными из ISO / IEC 6429.
  24. ^ «Кодовые страницы» . microsoft.com . Microsoft .
  25. ^ [2]
  26. ^ a b c d e "Идентификаторы кодовой страницы" . Сеть разработчиков Microsoft . Microsoft. 2014. Архивировано 19 июня 2016 года . Проверено 19 июня 2016 .
  27. ^ a b c d e "Веб-кодировки - Internet Explorer - Кодировки" . WHATWG Wiki . 2012-10-23. Архивировано 20 июня 2016 года . Проверено 20 июня 2016 .
  28. ^ Фоллер, Антонин (2014) [2011]. «Западноевропейская (IA5) кодировка - кодировки Windows» . WUtils.com - онлайн-утилита и справка . Программное обеспечение Motobit. Архивировано 20 июня 2016 года . Проверено 20 июня 2016 .
  29. ^ Фоллер, Антонин (2014) [2011]. «Немецкая (IA5) кодировка - кодировки Windows» . WUtils.com - онлайн-утилита и справка . Программное обеспечение Motobit. Архивировано 20 июня 2016 года . Проверено 20 июня 2016 .
  30. ^ Фоллер, Антонин (2014) [2011]. «Шведская (IA5) кодировка - кодировки Windows» . WUtils.com - онлайн-утилита и справка . Программное обеспечение Motobit. Архивировано 20 июня 2016 года . Проверено 20 июня 2016 .
  31. ^ Фоллер, Антонин (2014) [2011]. «Норвежская (IA5) кодировка - кодировки Windows» . WUtils.com - онлайн-утилита и справка . Программное обеспечение Motobit. Архивировано 20 июня 2016 года . Проверено 20 июня 2016 .
  32. ^ Фоллер, Антонин (2014) [2011]. «Кодировка US-ASCII - кодировки Windows» . WUtils.com - онлайн-утилита и справка . Программное обеспечение Motobit. Архивировано 20 июня 2016 года . Проверено 20 июня 2016 .
  33. ^ a b c d e f g Пол, Маттиас Р. (05.09.2002), Техническая информация о недокументированной информации о стране DOS для записей LCASE, ARAMODE и CCTORC , список разработки FreeDOS fd-dev в Topica, заархивированный с оригинала на 27.05.2016 , дата обращения 26.05.2016
  34. ^ a b c d e f g h Браун, Ральф Д. (2002-12-29). Список прерываний x86 . 61.
  35. ^ a b c d e f g h Пол, Маттиас Р. (1997-07-30). NWDOS-TIPs - Советы и приемы для Novell DOS 7, с подробным описанием, ошибками и обходными путями . MPDOSTIP . Выпуск 157 (на немецком языке) (3-е изд.). Архивировано из оригинала на 2016-05-22 . Проверено 11 января 2012 .(NB. NWDOSTIP.TXT - это комплексная работа по Novell DOS 7 и OpenDOS 7.01 , включая описание многих недокументированных функций и внутренних компонентов. Она является частью еще более обширной коллекции автора MPDOSTIP.ZIP, поддерживаемой до 2001 г. и распространяемой на многих сайтах по адресу время. Приведенная ссылка указывает на старую версию файла NWDOSTIP.TXT, преобразованную в HTML.)
  36. ^ a b c d e f g h Пол, Маттиас Р. (2001-04-09). NWDOS-TIPs - Советы и приемы для Novell DOS 7, с подробным описанием, ошибками и обходными путями . MPDOSTIP . Выпуск 183 (на немецком языке) (3-е изд.).
  37. ^ "770" . От литовского Lika Software
  38. ^ a b c d e f g h Сменил название на «Ликит». Ушли из бизнеса?
  39. ^ "771" . От литовского Lika Software
  40. ^ "772" . От литовского Lika Software
  41. ^ "774" . От литовского Lika Software
  42. ^ a b c "lietuvybė.lt - Rašmenų koduotės" [lietuvybė.lt - Кодировки символов] (на литовском языке).
  43. ^ Хоган, Том (1992). Die PC-Referenz für Programmierer (на немецком языке) (2-е изд.). Systhema Verlag GmbH. ISBN 3-89390-272-4. (NB. Эта книга является немецким переводом "Справочника программиста для ПК" от Microsoft Press. В ней упоминается кодовая страница 854 для Испании.)
  44. ^ a b c d e f g h i j k l m n o p q r s t u v w x "Руководство пользователя Star LC 8021" (PDF) .
  45. ^ IBM. «Информационный документ кодовой страницы SBCS - CPGID 00437» . Проверено 4 июля 2014 .
  46. ^ «Статистика использования кодировок символов для веб-сайтов (обновляется ежедневно)» . w3techs.com . Проверено 6 августа 2015 .
  47. ^ «Статистика использования UTF-8» . Trends.builtwith.com . Проверено 28 марта 2011 .

Внешние ссылки [ править ]

  • Глоссарий IBM CDRA
  • Кодовые страницы IBM на Wayback Machine (архивировано 5 февраля 2016 г.)
  • Кодовые страницы IBM по схеме кодирования на Wayback Machine (архивировано 06.09.2009)
  • Информация о кодировке IBM / ICU
  • Идентификаторы кодовых страниц Microsoft (список Microsoft содержит только кодовые страницы, активно используемые обычными приложениями в Windows. Полный список поддерживаемых кодовых страниц см. Также в списке Торстена Мохрина )
  • Более короткий список Microsoft, содержащий только кодовые страницы ANSI и OEM, но со ссылками на более подробную информацию о каждой из них на Wayback Machine (архивировано 23 октября 2012 г.)
  • Наборы символов и кодовые страницы одним нажатием кнопки
  • Команда Microsoft Chcp: отображение и установка активной кодовой страницы консоли