Шесть-разрядный код символа является кодировка символов предназначена для использования на компьютерах с словом длины кратно 6. Шесть битов могут кодировать только 64 различных символов, так что эти коды обычно включают в себя только прописные буквы, числительные, некоторые знаки пунктуации , а иногда и управляющие символы. Такие коды с дополнительным битом четности были естественным способом хранения данных на 7-дорожечной магнитной ленте .
Типы шестибитных кодов
Ранний шестибитный двоичный код использовался для Брайля , системы чтения для слепых, разработанной в 1820-х годах.
Самые ранние компьютеры имели дело только с числовыми данными и не предусматривали символьных данных. Шестибитный BCD использовался IBM на ранних компьютерах, таких как IBM 704 в 1954 году. [1] : стр.35 Эта кодировка была заменена 8-битным кодом EBCDIC, когда System / 360 стандартизировала 8-битные байты . Есть несколько вариантов этого типа кода (см. Ниже ).
Шестибитные коды символов обычно следовали за пятибитным кодом Бодо и предшествовали семибитному ASCII . Одним из популярных вариантов был DEC SIXBIT. Это просто коды символов ASCII от 32 до 95, закодированные как от 0 до 63, путем вычитания 32 (т. Е. Столбцов 2, 3, 4 и 5 таблицы ASCII (16 символов в столбце), сдвинутых в столбцы с 0 по 3, путем вычитания 2 из старших битов); он включает пробелы, знаки препинания, цифры и заглавные буквы, но не управляющие символы. Поскольку в нем не было управляющих символов, даже конца строки, он не использовался для общей обработки текста. Тем не менее, имена шести символов , таких как имена файлов и ассемблерные символы могут храниться в одном 36-битным словом PDP-10 , и три символа вписываться в каждом слове из PDP-1 и два символа вписываться в каждом слове PDP - 8 .
Шестибитные коды могут кодировать более 64 символов с помощью символов Shift Out и Shift In , по сути, включая два различных набора из 62 символов и переключаясь между ними. Например, популярный коммуникационный терминал IBM 2741 поддерживал различные наборы символов, содержащие до 88 печатных символов плюс управляющие символы.
UTF-6 кодирование было предложено для Unicode [2] , но было заменено Punycode .
Шестибитный код BCD
Шесть-разрядное BCD код был адаптацией перфорированного кода карты в двоичный код . IBM применила термины двоично-десятичная дробь и двоично -десятичный код к вариациям двоично-десятичных букв, используемых в большинстве ранних компьютеров IBM, включая IBM 1620 , серии IBM 1400 и элементы недесятичной архитектуры серии IBM 700/7000 .
Базы данных COBOL шестибитный код
Шестибитный код также использовался в базах данных COBOL, где информация о конце записи хранилась отдельно. [ необходима цитата ]
Карта с магнитной полосой, шестибитный код
Шестибитный код с добавленным битом нечетной четности используется на дорожке 1 карт с магнитной полосой , как указано в ISO / IEC 7811-2 .
Шестибитный код DEC
Код DEC SIXBIT, включающий несколько управляющих символов - наряду с SO / SI , разрешающий расширение кода - был определен как ECMA - 1 в 1963 году (см. Ниже ). Другой, менее распространенный вариант получается простым удалением старшего бита кода ASCII в диапазоне 32-95 (коды 32-63 остаются на своих позициях, из более высоких значений вычитается 64). Такой вариант иногда использовался на DEC PDP-8 (1965).
Шестибитный код FIELDATA
FIELDATA представлял собой семибитовый код (с необязательной проверкой четности), из которого формально были определены только 64 позиции кода (занимающие шесть битов). [3] Вариант использовался компьютерами UNIVAC серии 1100. [4] Рассматривая код как шестибитовый, эти системы использовали 36-битное слово (способное хранить шесть таких сокращенных символов FIELDATA). [5]
Шестибитный код Брайля
Символы Брайля представлены шестью точками, расположенными в прямоугольнике. Каждая позиция может содержать или не содержать выпуклую точку, поэтому шрифт Брайля можно рассматривать как шестибитный двоичный код. Некоторые более современные системы Брайля добавляют две дополнительные точки, превращая эти системы в восьмибитный код.
Шестибитные коды для двоичного кодирования текста
Передача двоичных данных по системам, предназначенным только для текста, иногда может вызывать проблемы. Например, электронная почта исторически поддерживала только 7-битные коды ASCII и удаляла 8-й бит, тем самым искажая двоичные данные, отправляемые напрямую через любой проблемный почтовый сервер. Другие системы могут вызывать проблемы из-за неправильной интерпретации управляющих символов во время хранения или передачи. Существует ряд схем для упаковки 8-битных данных в текстовые представления, которые могут проходить через системы текстовой почты для декодирования в месте назначения. Примеры подмножеств 6-битных символов, используемых для упаковки двоичных данных, включают Uuencode и Base64 . Эти наборы не содержат управляющих символов (только печатаемые числа, буквы, некоторые знаки препинания и, возможно, пробелы) и позволяют передавать данные через любой носитель, который также может передавать читаемый человеком текст.
Примеры шестибитных кодов BCD
Символы показаны с их эквивалентами в Юникоде .
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | 0 0030 | # 0023 | @ 0040 | ЛЕНТА МАРКА | |||
1_ | SP 0020 | / 002F | S 0053 | Т 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | ЗАПИСЬ МЕТКА | , 002C | % 0025 | |||
2_ | - 002D | J 004A | K 004B | L 004C | M 004D | № 004E | O 004F | P 0050 | Q 0051 | R 0052 | -0 002D 0030 | 0024 долл. США | * 002A | |||
3_ | & 0026 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | I 0049 | +0 002B 0030 | . 002E | ¤ 00A4 | ГРУППОВАЯ МАРКА |
Письмо Число Пунктуация Символ Другой Неопределенный
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | 0 0030 | = 003D | - 2212 | ||||
1_ | SP 0020 | / 002F | S 0053 | Т 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | , 002C | ( 0028 | ||||
2_ | - 2014 г. | J 004A | K 004B | L 004C | M 004D | № 004E | O 004F | P 0050 | Q 0051 | R 0052 | -0 002D 0030 | 0024 долл. США | * 002A | |||
3_ | + 002B | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | I 0049 | +0 002B 0030 | . 002E | ) 0029 |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | : 003A | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | 0 0030 | = 003D | ≠ 2260 | ≤ 2264 | ! 0021 | [ 005B |
1_ | SP 0020 | / 002F | S 0053 | Т 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | ] 005D | , 002C | ( 0028 | → 2192 | ≡ 2261 | ~ 007E |
2_ | - 2212 | J 004A | K 004B | L 004C | M 004D | № 004E | O 004F | P 0050 | Q 0051 | R 0052 | % 0025 | 0024 долл. США | * 002A | ↑ 2191 | ↓ 2193 | > 003E |
3_ | + 002B | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | I 0049 | < 003C | . 002E | ) 0029 | ≥ 2265 | ? 003F | ; 003B |
Примеры шестибитных вариантов ASCII
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | SP 0020 | ! 0021 | « 0022 | # 0023 | 0024 долл. США | % 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
1_ | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
2_ | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | I 0049 | J 004A | K 004B | L 004C | M 004D | № 004E | O 004F |
3_ | P 0050 | Q 0051 | R 0052 | S 0053 | Т 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
Письмо Число Пунктуация Символ Другой Неопределенный
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | SP 0020 | HT 0009 | LF 000A | ВТ 000Б | FF 000C | CR 000D | SO 000E | SI 000F | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
1_ | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
2_ | NUL 0000 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | I 0049 | J 004A | K 004B | L 004C | M 004D | № 004E | O 004F |
3_ | P 0050 | Q 0051 | R 0052 | S 0053 | Т 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ESC 001B | DEL 007F |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
1_ | SP 0020 | ! 0021 | « 0022 | # 0023 | £ 00A3 | % 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
2_ | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | I 0049 | J 004A | K 004B | L 004C | M 004D | № 004E | O 004F |
3_ | P 0050 | Q 0051 | R 0052 | S 0053 | Т 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | 0024 долл. США | ] 005D | ↑ 2191 | ← 2190 |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | I 0049 | J 004A | K 004B | L 004C | M 004D | № 004E | O 004F |
1_ | P 0050 | Q 0051 | R 0052 | S 0053 | Т 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
2_ | SP 0020 | ! 0021 | « 0022 | # 0023 | 0024 долл. США | % 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
ГОСТ 6-битный код
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | + 002B | - 002D | / 002F | , 002C | . 002E | SP 0020 |
1_ | ⏨ 23E8 | ↑ 2191 | ( 0028 | ) 0029 | × 00D7 | = 003D | ; 003B | [ 005B | ] 005D | * 002A | ' 2018 | ' 2019 | ≠ 2260 | < 003C | > 003E | : 003A |
2_ | А 0410 | Б 0411 | В 0412 | Г 0413 | Д 0414 | Е 0415 | Ж 0416 | З 0417 | И 0418 | № 0419 | К 041A | Л 041B | М 041C | Н 041D | О 041E | П 041F |
3_ | Р 0420 | С 0421 | Т 0422 | У 0423 | Ф 0424 | Х 0425 | Ц 0426 | Ч 0427 | Ш 0428 | Щ 0429 | Ы 042B | Ь 042C | Э 042D | Ю 042E | Я 042F | DEL 007F |
Письмо Число Пунктуация Символ Другой Неопределенный
Пример шестибитных кодов Брайля
В следующей таблице показано расположение символов, включая шестнадцатеричное значение, соответствующий символ ASCII, 6-битные коды Брайля (комбинации точек), глиф Брайля Unicode и общее значение (фактическое значение может меняться в зависимости от контекста). [7] [8]
|
|
Смотрите также
- Десятичное число с двоичным кодом
- BCD (кодировка символов)
- Код дисплея CDC
- ДЕКАБРЬ RADIX 50 / MOD40
- IBM SQUOZE
- IBM Transcode
- ASCII
- Код Бодо
- EBCDIC
- Юникод
- ANSI X3.64
- UTF-8
- UTF-16
Рекомендации
- ^ Корпорация IBM (1954). 704 электронная машина обработки данных: руководство по эксплуатации (PDF) .
- ^ Велтер, Марк; Сполярич, Брайан В. (2000-11-16). «UTF-6 - еще одна ASCII-совместимая кодировка для ID» . Инженерная группа Интернета . Архивировано 23 мая 2016 года . Проверено 9 апреля 2016 .
- ^ Маккензи, Чарльз Э. (1980). Наборы кодированных символов, история и развитие . Серия системного программирования (1-е изд.). Addison-Wesley Publishing Company, Inc. стр. 64. ISBN 0-201-14460-3. LCCN 77-90165 . ISBN 978-0-201-14460-4 . Проверено 22 мая 2016 .
- ^ Уокер, Джон (1996-08-06). «Код FIELDATA для UNIVAC серии 1100» . Воспоминания UNIVAC . Архивировано 22 мая 2016 года . Проверено 22 мая 2016 .
- ^ Дженнингс, Томас Дэниел (2016-04-20) [1999]. «Аннотированная история некоторых кодов символов или ASCII: американский стандартный код для проникновения информации» . Мировые энергетические системы (WPS) . Архивировано 22 мая 2016 года . Проверено 22 мая 2016 .
- ^ Раймонд, Эрик С. (2017-08-29). «Типы данных полезной нагрузки AIS» . catb.org . Проверено 16 ноября 2017 .
- ^ «Представление и отображение шрифта Брайля» . DotlessBraille.org . 2002-02-20 . Проверено 9 августа 2009 .
- ^ Халлек, Джон (2000-08-24). "braille-ascii.ads" . Braille.Ascii . Проверено 10 августа 2009 .
Внешние ссылки
- «Справочное руководство для компьютера Control Data 1604-C» (PDF) . (7,44 МБ)
- «Стандарт ECMA для 6-битного кода символов ввода / вывода» (PDF) . (1,53 МБ)
- Ссылка на код символов SIXBIT Digital Equipment Corporation Система кодирования символов SIXBIT