Кодовая страница 37


Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

Кодовая страница 37 ( CCSID 37; этикетка IBM037), [1] известная как «США / Канада - CECP», представляет собой кодовую страницу EBCDIC, используемую на мэйнфреймах IBM. Он кодирует набор графических символов ISO / IEC 8859-1 .

Кодовая страница 37 - одна из наиболее часто используемых и поддерживаемых кодовых страниц EBCDIC. Он используется в качестве кодовой страницы z / OS по умолчанию в США и других англоязычных странах. [2] Она считается «обязательной» кодовой страницей EBCDIC для США, [3] и также используется в Австралии , Новой Зеландии , Нидерландах , Португалии и Бразилии , а также в системах ESA / 390 в Канаде , [4] но не в канадских системах AS / 400 , которые вместо этого используют кодовую страницу 500 . [5]Это один из четырех EBCDIC кодовых страниц (наряду с 500, 875 и 1026) с картографическими данными , поставляемых Microsoft к Консорциумом Unicode , [6] и один из семи (наряду с 273, 424, 500, 875, 1026 и 1140 ) , поддерживаемого Python в стандартной комплектации. [7]

Набор символов

  Письмо  Номер  пунктуация  Символ Другое  Неопределенный      

Перевод кодовой страницы

Поскольку CP 037 содержит все стандартные символы Latin-1, можно преобразовать коды символов из кодировки CP 037 в коды символов ISO 8859-1 , так что перевод обратно в кодировку CP 037 представляет собой раунд с сохранением точного значения. -поездка преобразование. Точно так же половина кодов управляющих символов может быть переведена в их точные эквиваленты ASCII . Если оставшиеся управляющие символы только для EBCDIC транслируются (произвольно) в оставшиеся неиспользуемые точки кода ASCII (шестнадцатеричные от 80 до 9F), результирующая трансляция охватывает все 256 кодовых точек. Такая таблица перевода представлена ​​ниже:

Варианты и отношение к другим кодовым страницам

Позиции каретки ( ^) и not sign ( ¬), хотя официально B0 шестнадцатеричный и 5F шестнадцатеричный соответственно, иногда переключаются, в том числе при использовании с APL в системе 3279. Этот вариант был признан АКЦИЮ , но не официально в качестве кодовой страницы по IBM, и иногда называют кодовой страницы 37-2 по перекодирования программного обеспечения. [10]

Существует несколько других кодовых страниц, которые составляют кодовую страницу 37 с заменой нескольких символов. В частности, кодовая страница 37 кодирует жесткие скобки ( []) в шестнадцатеричном формате BA и BB в шестнадцатеричном формате , в то время как в других вариантах используются другие кодировки для жестких скобок. Например, кодовая страница 1047 - это вариант, используемый компилятором открытых систем MVS . [11] Он отличается от кодовой страницы 37 в шести положениях: Ýи [меняются местами, как ¨и ], помещая жесткие скобки в шестнадцатеричный AD и BD шестнадцатеричный ; каретка и знак отсутствия также меняются местами, как на кодовой странице 37-2. [12] [13]Эта кодировка скобок была унаследована от системы отображения 3270. [10] Хотя IBM намеревается использовать кодовую страницу 1047 только для выполнения определенных требований, а не в качестве замены кодовых страниц 37 и 500, [3] подмножество кодовой страницы 1047, кодирующей репертуар ASCII, использовалось для однобайтовых графические коды в UTF-EBCDIC . [11]

Кодовая страница 500 , известная как «Международный EBCDIC», [5] «Международный Latin-1» или «Международный номер 5», [10], является другой основной кодировкой EBCDIC для репертуара ISO / IEC 8859-1. Он используется в Бельгии , Швейцарии и в системах AS / 400 в Канаде . [5] Он связан с кодовой страницей 37 и имеет тот же репертуар, но отличается семью позициями; в частности, он кодирует [и ]на 4A гекс и 5A гекс соответственно, которые используются для знака цента ( ¢) и восклицательный ( !) в кодовой странице 37. каретка (^) Также кодируется в 5F гекс , аналогично кодовой странице 37-2 и 1047. ¢кодируется в B0 гекс , то ¬при БА гекс , то !на 4F гекс и характер трубы ( |) на BB гекс . [14] [15] Кодовая страница 500, в свою очередь, связана с немецкой кодовой страницей 273 , которая меняет местами несколько пар символов в соответствии с различиями между DRV8 и ISO / IEC 8859-1, в результате чего жесткие скобки помещаются в 63 шестнадцатеричный и FC шестнадцатеричный . [16]

Вариант кодовой страницы 37 со знаком евро ( ), добавленным в шестнадцатеричную позицию 9F , заменяющий универсальный знак валюты ( ¤), представляет собой кодовую страницу 1140 . [17] [18] Точно так же кодовая страница 1148 вносит те же изменения в кодовую страницу 500, [19] [20], а кодовая страница 1141 делает то же самое для кодовой страницы 273. [21]

Кодовая страница EBCDIC с репертуаром ISO / IEC 8859-15 , включая знак евро, - это кодовая страница 924 ; это связано с кодовой страницей 1047, но символы ISO / IEC 8859-1 заменены их заменами ISO / IEC 8859-15, при этом ¢ и ¬ перемещены в их кодовые страницы 500 местоположений в шестнадцатеричном формате B0 и шестнадцатеричном формате BA соответственно, а также на Ý перемещен в гексагон 4А . [22]

Смотрите также

  • EBCDIC

использованная литература

  1. ^ a b Наборы символов IANA
  2. ^ Стивенс, Дэвид (2011), «Трудности перевода 1 - кодовые страницы EBCDIC» , LongEx Mainframe Quarterly , Longpela Expertise
  3. ^ a b «Идентификаторы кодовой страницы - CPGID 1047» . IBM . Архивировано из оригинала на 2015-06-07. Эта кодовая страница предназначена для ограниченного использования в соответствии с конкретными требованиями. Он не предназначен для замены кодовой страницы 00037, которая является обязательной кодовой страницей для США и некоторых других стран или кодовой страницы 00500.
  4. ^ «Идентификаторы кодированного набора символов - CCSID 37» . IBM . Архивировано из оригинала на 2014-11-29.
  5. ^ a b c «Идентификаторы кодированных наборов символов - CCSID 500» . IBM . Архивировано из оригинала на 2014-12-01.
  6. ^ «Сопоставления | Поставщики | Microsoft | EBCDIC» . Консорциум Unicode .
  7. ^ «кодеки - Реестр кодеков и базовые классы § Стандартные кодировки» . Документация по Python . Фонд программного обеспечения Python .
  8. ^ Кодовая страница CPGID 00037 (pdf) (PDF) , IBM
  9. ^ Кодовая страница CPGID 00037 (txt) , IBM
  10. ^ Б с xlate - транслитерации Содержание записей , IBM Corporation , 2010 [1986], в архиве с оригинала на 2019-06-16 , извлекаться 2016-10-18
  11. ^ а б Умамахесваран, ВС (16 апреля 2002 г.). «UTF-EBCDIC» . Консорциум Unicode . Технический отчет по Unicode №16. Карта сохраняет неизменность для набора из 82 графических символов (включая ПРОБЕЛ) (известного как набор синтаксических графических символов IBM) и поддерживает согласованность с кодовой страницей открытых систем IBM MVS (CPGID 1047) для вариантов символов из ASCII. репертуар.
  12. ^ "ibm-1047" . Международные компоненты для Unicode . Конвертер Explorer . Консорциум Unicode .
  13. ^ "Кодовая страница 1047" (PDF) . IBM . Архивировано (PDF) из оригинала 08.07.2015 . Проверено 9 июня 2021 .
  14. ^ "ИБМ-500" . Международные компоненты для Unicode . Конвертер Explorer . Консорциум Unicode .
  15. ^ "Кодовая страница 500" (PDF) . IBM . Архивировано (PDF) из оригинала 08.07.2015 . Проверено 9 июня 2021 .
  16. ^ "ibm-273" . Международные компоненты для Unicode . Конвертер Explorer . Консорциум Unicode .
  17. ^ "ibm-1140" . Международные компоненты для Unicode . Конвертер Explorer . Консорциум Unicode .
  18. ^ "Кодовая страница 1140" (PDF) . IBM . Архивировано (PDF) из оригинала 08.07.2015 . Проверено 9 июня 2021 .
  19. ^ "ibm-1140" . Международные компоненты для Unicode . Конвертер Explorer . Консорциум Unicode .
  20. ^ "Кодовая страница 1148" (PDF) . IBM . Архивировано (PDF) из оригинала 08.07.2015 . Проверено 9 июня 2021 .
  21. ^ "ibm-1141" . Международные компоненты для Unicode . Конвертер Explorer . Консорциум Unicode .
  22. ^ "Кодовая страница 924" (PDF) . IBM . Архивировано (PDF) из оригинала 08.07.2015 . Проверено 9 июня 2021 .

внешние ссылки

  • Конвертер кодов Longpela ASCII - EBCDIC 37
Источник « https://en.wikipedia.org/w/index.php?title=Code_page_37&oldid=1034405486 »