MIME / IANA | IBM037 |
---|---|
Псевдоним (а) | cp037, ebcdic-cp-us, ebcdic-cp-ca, ebcdic-cp-wt, ebcdic-cp-nl, csIBM037 [1] |
Классификация | EBCDIC |
Преобразует / кодирует | ИСО / МЭК 8859-1 |
Другая связанная кодировка (и) | EBCDIC 37-2 , 500 , 924 , 1047 , 1140 |
Кодовая страница 37 ( CCSID 37; этикетка IBM037
), [1] известная как «США / Канада - CECP», представляет собой кодовую страницу EBCDIC, используемую на мэйнфреймах IBM. Он кодирует набор графических символов ISO / IEC 8859-1 .
Кодовая страница 37 - одна из наиболее часто используемых и поддерживаемых кодовых страниц EBCDIC. Он используется в качестве кодовой страницы z / OS по умолчанию в США и других англоязычных странах. [2] Она считается «обязательной» кодовой страницей EBCDIC для США, [3] и также используется в Австралии , Новой Зеландии , Нидерландах , Португалии и Бразилии , а также в системах ESA / 390 в Канаде , [4] но не в канадских системах AS / 400 , которые вместо этого используют кодовую страницу 500 . [5]Это один из четырех EBCDIC кодовых страниц (наряду с 500, 875 и 1026) с картографическими данными , поставляемых Microsoft к Консорциумом Unicode , [6] и один из семи (наряду с 273, 424, 500, 875, 1026 и 1140 ) , поддерживаемого Python в стандартной комплектации. [7]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | NUL 0000 | SOH 0001 | STX 0002 | ETX 0003 | SEL | HT 0009 | RNL | DEL 007F | GE | СПС | RPT | ВТ 000Б | FF 000C | CR 000D | SO 000E | SI 000F |
1_ | DLE 0010 | DC1 0011 | DC2 0012 | DC3 0013 | res / enp | NL 0085 | BS 0008 | POC | CAN 0018 | EM 0019 | UBS | CU1 | IFS 001C | IGS 001D | IRS 001E | ius / itb 001F |
2_ | DS | SOS | FS | WUS | байп / вход | LF 000A | ETB 0017 | ESC 001B | SA | Лесхоз | см / sw | CSP | МИД | ENQ 0005 | ACK 0006 | BEL 0007 |
3_ | SYN 0016 | ИК | ПП | РНН | NBS | EOT 0004 | SBS | ЭТО | RFF | CU3 | DC4 0014 | NAK 0015 | SUB 001A | |||
4_ | SP 0020 | NBSP 00A0 | â 00E | ä 00E4 | à 00E0 | á 00E1 | ã 00E3 | å 00E5 | ç 00E7 | ñ 00F1 | ¢ 00A | . 002E | < 003C | ( 0028 | + 002B | | 007C |
5_ | & 0026 | é 00E9 | ê 00EA | ë 00EB | è 00E8 | í 00ED | î 00EE | • 00EF | ì 00EC | ß 00DF | ! 0021 | 0024 долл. США | * 002A | ) 0029 | ; 003B | ¬ 00AC |
6_ | - 002D | / 002F | Â 00C | Ä 00C4 | À 00C0 | Á 00C1 | Ã 00C3 | Å 00C5 | Ç 00C7 | Ñ 00D1 | ¦ 00A6 | , 002C | % 0025 | _ 005F | > 003E | ? 003F |
7_ | ø 00F8 | É 00C9 | Ê 00CA | Ë 00CB | È 00C8 | Í 00CD | Î 00CE | Ï 00CF | Ì 00CC | ` 0060 | : 003A | # 0023 | @ 0040 | ' 0027 | = 003D | « 002 |
8_ | Ø 00D8 | 0061 | b 006 | c 0063 | d 0064 | e 0065 | f 0066 | г 0067 | h 0068 | я 0069 | « 00AB | » 00BB | ð 00F0 | ý 00FD | þ 00FE | ± 00B1 |
9_ | ° 00B0 | j 006A | k 006B | l 006C | м 006D | № 006E | o 006F | p 0070 | q 0071 | r 007 | ª 00AA | º 00BA | æ 00E6 | ¸ 00B8 | Æ 00C6 | ¤ 00A4 |
A_ | µ 00B5 | ~ 007E | с 0073 | t 0074 | u 0075 | v 0076 | w 0077 | х 0078 | y 0079 | z 007A | ¡ 00A1 | ¿ 00BF | Ð 00D0 | Ý 00DD | Þ 00DE | ® 00AE |
B_ | ^ 005E | £ 00A3 | ¥ 00A5 | · 00B7 | © 00A9 | § 00A7 | ¶ 00B6 | ¼ 00BC | ½ 00BD | ¾ 00BE | [ 005B | ] 005D | ¯ 00AF | ¨ 00A8 | ´ 00B4 | × 00D7 |
C_ | { 007B | A 0041 | B 004 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | I 0049 | SHY 00AD | ô 00F4 | ö 00F6 | ò 00F | ó 00F3 | х 00F5 |
D_ | } 007D | J 004A | K 004B | L 004C | M 004D | № 004E | O 004F | P 0050 | Q 0051 | R 0052 | ¹ 00B9 | û 00FB | ü 00FC | ù 00F9 | ú 00FA | ÿ 00FF |
E_ | \ 005C | ÷ 00F7 | S 0053 | Т 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | ² 00B | Ô 00D4 | Ö 00D6 | Ò 00D | Ó 00D3 | Õ 00D5 |
F_ | 0 0030 | 1 0031 | 2 003 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | ³ 00B3 | Û 00 дБ | Ü 00DC | Ù 00D9 | Ú 00DA | EO |
Письмо Номер пунктуация Символ Другое Неопределенный
Поскольку CP 037 содержит все стандартные символы Latin-1, можно преобразовать коды символов из кодировки CP 037 в коды символов ISO 8859-1 , так что перевод обратно в кодировку CP 037 представляет собой раунд с сохранением точного значения. -поездка преобразование. Точно так же половина кодов управляющих символов может быть переведена в их точные эквиваленты ASCII . Если оставшиеся управляющие символы только для EBCDIC транслируются (произвольно) в оставшиеся неиспользуемые точки кода ASCII (шестнадцатеричные от 80 до 9F), результирующая трансляция охватывает все 256 кодовых точек. Такая таблица перевода представлена ниже:
CP 037 → ISO 8859-1 | ||||||||||||||||
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
0_ | 00 | 01 | 02 | 03 | 9C | 09 | 86 | 7F | 97 | 8D | 8E | 0B | 0C | 0D | 0E | 0F |
1_ | 10 | 11 | 12 | 13 | 9D | 85 | 08 | 87 | 18 | 19 | 92 | 8F | 1С | 1D | 1E | 1F |
2_ | 80 | 81 год | 82 | 83 | 84 | 0A | 17 | 1B | 88 | 89 | 8A | 8B | 8C | 05 | 06 | 07 |
3_ | 90 | 91 | 16 | 93 | 94 | 95 | 96 | 04 | 98 | 99 | 9А | 9B | 14 | 15 | 9E | 1А |
4_ | 20 | A0 | E2 | E4 | E0 | E1 | E3 | E5 | E7 | F1 | A2 | 2E | 3C | 28 год | 2B | 7C |
5_ | 26 год | E9 | EA | EB | E8 | ED | EE | EF | EC | DF | 21 год | 24 | 2А | 29 | 3B | AC |
6_ | 2D | 2F | C2 | C4 | C0 | C1 | C3 | C5 | C7 | D1 | A6 | 2C | 25 | 5F | 3E | 3F |
7_ | F8 | C9 | CA | CB | C8 | компакт диск | CE | CF | CC | 60 | 3А | 23 | 40 | 27 | 3D | 22 |
8_ | D8 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | AB | BB | F0 | FD | FE | B1 |
9_ | B0 | 6А | 6B | 6C | 6D | 6E | 6F | 70 | 71 | 72 | AA | BA | E6 | B8 | C6 | A4 |
A_ | B5 | 7E | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 7А | A1 | BF | D0 | DD | DE | AE |
B_ | 5E | A3 | A5 | B7 | A9 | A7 | B6 | До нашей эры | BD | БЫТЬ | 5B | 5D | AF | A8 | B4 | D7 |
C_ | 7B | 41 год | 42 | 43 год | 44 год | 45 | 46 | 47 | 48 | 49 | ОБЪЯВЛЕНИЕ | F4 | F6 | F2 | F3 | F5 |
D_ | 7D | 4А | 4B | 4C | 4D | 4E | 4F | 50 | 51 | 52 | B9 | FB | FC | F9 | FA | FF |
E_ | 5C | F7 | 53 | 54 | 55 | 56 | 57 год | 58 | 59 | 5А | Би 2 | D4 | D6 | D2 | D3 | D5 |
F_ | 30 | 31 год | 32 | 33 | 34 | 35 год | 36 | 37 | 38 | 39 | B3 | БД | ОКРУГ КОЛУМБИЯ | D9 | DA | 9F |
Позиции каретки ( ^
) и not sign ( ¬
), хотя официально B0 шестнадцатеричный и 5F шестнадцатеричный соответственно, иногда переключаются, в том числе при использовании с APL в системе 3279. Этот вариант был признан АКЦИЮ , но не официально в качестве кодовой страницы по IBM, и иногда называют кодовой страницы 37-2 по перекодирования программного обеспечения. [10]
Существует несколько других кодовых страниц, которые составляют кодовую страницу 37 с заменой нескольких символов. В частности, кодовая страница 37 кодирует жесткие скобки ( []
) в шестнадцатеричном формате BA и BB в шестнадцатеричном формате , в то время как в других вариантах используются другие кодировки для жестких скобок. Например, кодовая страница 1047 - это вариант, используемый компилятором открытых систем MVS . [11] Он отличается от кодовой страницы 37 в шести положениях: Ý
и [
меняются местами, как ¨
и ]
, помещая жесткие скобки в шестнадцатеричный AD и BD шестнадцатеричный ; каретка и знак отсутствия также меняются местами, как на кодовой странице 37-2. [12] [13]Эта кодировка скобок была унаследована от системы отображения 3270. [10] Хотя IBM намеревается использовать кодовую страницу 1047 только для выполнения определенных требований, а не в качестве замены кодовых страниц 37 и 500, [3] подмножество кодовой страницы 1047, кодирующей репертуар ASCII, использовалось для однобайтовых графические коды в UTF-EBCDIC . [11]
Кодовая страница 500 , известная как «Международный EBCDIC», [5] «Международный Latin-1» или «Международный номер 5», [10], является другой основной кодировкой EBCDIC для репертуара ISO / IEC 8859-1. Он используется в Бельгии , Швейцарии и в системах AS / 400 в Канаде . [5] Он связан с кодовой страницей 37 и имеет тот же репертуар, но отличается семью позициями; в частности, он кодирует [
и ]
на 4A гекс и 5A гекс соответственно, которые используются для знака цента ( ¢
) и восклицательный ( !
) в кодовой странице 37. каретка (^
) Также кодируется в 5F гекс , аналогично кодовой странице 37-2 и 1047. ¢
кодируется в B0 гекс , то ¬
при БА гекс , то !
на 4F гекс и характер трубы ( |
) на BB гекс . [14] [15] Кодовая страница 500, в свою очередь, связана с немецкой кодовой страницей 273 , которая меняет местами несколько пар символов в соответствии с различиями между DRV8 и ISO / IEC 8859-1, в результате чего жесткие скобки помещаются в 63 шестнадцатеричный и FC шестнадцатеричный . [16]
Вариант кодовой страницы 37 со знаком евро ( €
), добавленным в шестнадцатеричную позицию 9F , заменяющий универсальный знак валюты ( ¤
), представляет собой кодовую страницу 1140 . [17] [18] Точно так же кодовая страница 1148 вносит те же изменения в кодовую страницу 500, [19] [20], а кодовая страница 1141 делает то же самое для кодовой страницы 273. [21]
Кодовая страница EBCDIC с репертуаром ISO / IEC 8859-15 , включая знак евро, - это кодовая страница 924 ; это связано с кодовой страницей 1047, но символы ISO / IEC 8859-1 заменены их заменами ISO / IEC 8859-15, при этом ¢ и ¬ перемещены в их кодовые страницы 500 местоположений в шестнадцатеричном формате B0 и шестнадцатеричном формате BA соответственно, а также на Ý перемещен в гексагон 4А . [22]
Эта кодовая страница предназначена для ограниченного использования в соответствии с конкретными требованиями.
Он не предназначен для замены кодовой страницы 00037, которая является обязательной кодовой страницей для США и некоторых других стран или кодовой страницы 00500.
Карта сохраняет неизменность для набора из 82 графических символов (включая ПРОБЕЛ) (известного как набор синтаксических графических символов IBM) и поддерживает согласованность с кодовой страницей открытых систем IBM MVS (CPGID 1047) для вариантов символов из ASCII. репертуар.