В C0 и C1 код управления или контроля символов наборы определяют управляющие коды для использования в тексте с помощью компьютерных систем, использующих ASCII и производные ASCII. Коды представляют дополнительную информацию о тексте, такую как положение курсора, инструкцию начать новую строку или сообщение о том, что текст был получен.
Коды C0 - это диапазон 00 HEX –1F HEX, а набор C0 по умолчанию был первоначально определен в ISO 646 ( ASCII ). Коды C1 - это диапазон 80 HEX –9F HEX, а набор C1 по умолчанию был первоначально определен в ECMA-48 (позже согласован с ISO 6429). ISO / IEC 2022 Система определения контроля и графических символов позволяет другим C0 и C1 наборы будут доступны для специализированных приложений, но они редко используются.
C0 контролирует
В ASCII определены 32 управляющих символа плюс необходимый дополнительный для символа DEL, состоящего из одного элемента (необходим для того, чтобы пробить все отверстия на бумажной ленте и стереть ее).
Такое большое количество кодов было желательно в то время, поскольку многобайтовые элементы управления потребовали бы реализации конечного автомата в терминале, что было очень сложно с современной электроникой и механическими терминалами. С тех пор только некоторые из исходных элементов управления сохранили свое использование: диапазон «пробелов» BS, TAB, LF, VT, FF и CR; код BEL; и ESC (но, за исключением ISO-2022-JP , почти всегда как часть ESC, '[' представление CSI , запускающее escape-последовательность ANSI ). Другие не используются или приобрели другое значение, например, NUL - терминатор строки C.
Некоторые протоколы последовательной передачи, такие как ANPA-1312 , Kermit и XMODEM, действительно широко используют управляющие символы SOH, STX, ETX, EOT, ACK, NAK и SYN для аппроксимации их исходных определений.
Основные управляющие коды ASCII
Это стандартные управляющие коды ASCII, изначально определенные в ANSI X3.4 . При использовании механизма расширения ISO / IEC 2022 они обозначаются как активные управляющие символы C0 с помощью последовательности октетов 0x1B 0x21 0x40
( ESC ! @
). [1]
Seq | Декабрь | Шестигранник | Сокращение | Символ | Имя | C | Описание | ||
---|---|---|---|---|---|---|---|---|---|
^@ | 00 | 00 | NUL | ␀ | Ноль | \0 | Первоначально использовался, чтобы оставлять зазоры на бумажной ленте для редактирования. Позже используется для заполнения после кода, обработка которого терминалу может занять некоторое время (например, возврат каретки или перевод строки на печатном терминале). Сейчас часто используется как терминатор строки, особенно в языке программирования C. | ||
^A | 01 | 01 | SOH | ␁ | Начало заголовка | При передаче сообщения ограничивает начало заголовка сообщения. Формат этого заголовка может быть определен применимым протоколом, например IPTC 7901 для передачи журналистского текста, и обычно он завершается STX. [2] В Hadoop он часто используется как разделитель полей. | |||
^B | 02 | 02 | STX | ␂ | Начало текста | Первый символ текста сообщения и может использоваться для завершения заголовка сообщения. | |||
^C | 03 | 03 | ETX | ␃ | Конец текста | При передаче сообщения ограничивает конец основного текста сообщения. Может сопровождаться «пост-текстовой информацией» (то есть структурированным нижним колонтитулом), определяемой применимым протоколом [2], или любыми дополнительными текстами [3], за которыми следует EOT. [2] [3] При вводе с клавиатуры часто используется как символ «прерывания» (Ctrl-C) для прерывания или завершения программы или процесса. | |||
^D | 04 | 04 | EOT | ␄ | Конец передачи | Разграничивает конец передаваемого сообщения, которое может включать в себя заголовок, текст сообщения и нижний колонтитул пост-текста, [2] или даже несколько текстов и связанных заголовков. [3] Может также использоваться для перевода терминалов в режим ожидания. [3] Часто используется в Unix для обозначения конца файла на терминале. | |||
^E | 05 | 05 | ENQ | ␅ | Расследование | Сигнал, предназначенный для инициирования ответа на принимающей стороне, чтобы увидеть, присутствует ли он еще. | |||
^F | 06 | 06 | ACK | ␆ | Сознавать | Ответ на ENQ или указание на успешное получение сообщения. | |||
^G | 07 | 07 | BEL [a] | ␇ | Белл , оповещение | \a | Изначально использовался для звонка на терминал. Позже использовался для звукового сигнала в системах, у которых не было физического звонка. Также может быстро включать и выключать обратное видео (визуальный звонок). | ||
^H | 08 | 08 | BS | ␈ | Backspace | \b | Переместите курсор на одну позицию влево. При вводе это может удалить символ слева от курсора. При выводе, когда в ранних компьютерных технологиях напечатанный символ нельзя было стереть, для генерации акцентированных символов в ASCII иногда использовалось обратное пространство. Например, à можно создать с использованием трехсимвольной последовательности a BS ` (или, используя шестнадцатеричные значения символов 0x61 0x08 0x60 ). Такое использование сейчас обычно не поддерживается (например, запрещено в ISO / IEC 8859 ). [9] Чтобы обеспечить устранение неоднозначности между двумя возможными вариантами использования backspace, управляющий код символа отмены был включен в стандартный набор элементов управления C1. | ||
^I | 09 | 09 | HT | ␉ | Табуляция символов, горизонтальная табуляция | \t | Перейти к позиции табуляции до следующего символа . | ||
^J | 10 | 0A | LF | ␊ | Перевод строки | \n | На пишущих машинках , принтерах и некоторых эмуляторах терминалов перемещает курсор на одну строку вниз, не влияя на положение его столбца. В Unix используется для обозначения конца строки . В DOS , Windows и различных сетевых стандартах LF используется после CR как часть знака конца строки. | ||
^K | 11 | 0B | VT | ␋ | Строчная таблица, вертикальная таблица | \v | Поместите форму в позицию табуляции следующей строки. | ||
^L | 12 | 0C | FF | ␌ | Подача формы | \f | На принтерах загрузите следующую страницу. Считается пробелом во многих языках программирования и может использоваться для разделения логических разделов в коде. В некоторых эмуляторах терминала очищает экран. Он по-прежнему отображается в некоторых обычных текстовых файлах как символ разрыва страницы , например в RFC, опубликованных IETF . | ||
^M | 13 | 0D | CR | ␍ | Возврат каретки | \r | Первоначально использовался для перемещения курсора в нулевой столбец, оставаясь на той же строке. В классической Mac OS (до Mac OS X ), а также в более ранних системах, таких как Apple II и Commodore 64 , использовался для обозначения конца строки . В DOS , Windows и различных сетевых стандартах он используется перед LF как часть знака конца строки. Клавиши Enter или Return на клавиатуре отправят этот символ, но он может быть преобразован в другую последовательность конца строки с помощью терминальной программы. | ||
^N | 14 | 0E | ТАК | ␎ | Сдвиг | Переключитесь на альтернативный набор символов. | |||
^O | 15 | 0F | SI | ␏ | Перейти в | Вернитесь к обычному набору символов после Shift Out. | |||
^P | 16 | 10 | DLE | ␐ | Выход из канала передачи данных | Заставляет ограниченное количество следующих друг за другом октетов интерпретироваться каким-либо иным образом, [10] например, как необработанные данные (в отличие от управляющих кодов или графических символов). Детали этого зависят от реализации. Такие стандарты, как (ныне отмененный) ECMA-37, существовали для конкретных приложений символа выхода из канала передачи данных для доступа к дополнительным функциям управления передачей. [11] Стандартная схема сжатия для Unicode предлагает заменить все байты диапазона C0 на DLE, за которым следует этот байт плюс 0x40, если данные SCSU должны быть переданы по системе, что может вызвать путаницу из-за перепрофилирования SCSU байтов C0. [12] | |||
^Q | 17 | 11 | DC1 | ␑ | Устройство Control One ( XON ) | Эти четыре управляющих кода зарезервированы для управления устройствами, интерпретация которых зависит от устройства, к которому они были подключены. DC1 и DC2 предназначались в первую очередь для обозначения активации устройства, в то время как DC3 и DC4 предназначались в первую очередь для обозначения приостановки или выключения устройства. DC1 и DC3 (известные также как XON и XOFF соответственно в этом использовании) возникли как функции «запуск и остановка удаленного чтения с бумажной ленты» в сетях ASCII Telex . Использование телетайпа стало фактическим стандартом для программного управления потоком данных . [13] | |||
^R | 18 | 12 | DC2 | ␒ | Управление устройством два | ||||
^S | 19 | 13 | DC3 | ␓ | Управление устройством 3 ( XOFF ) | ||||
^T | 20 | 14 | DC4 | ␔ | Четвертое управление устройством | ||||
^U | 21 год | 15 | НАК | ␕ | Отрицательное подтверждение | Отправлено станцией как отрицательный ответ станции, с которой установлено соединение. В протоколе двоичной синхронной связи NAK используется для указания того, что в ранее принятом блоке обнаружена ошибка и что приемник готов принять повторную передачу этого блока. В многоточечных системах NAK используется как ответ о неготовности на опрос. | |||
^V | 22 | 16 | SYN | ␖ | Синхронный холостой ход | Используется в системах синхронной передачи для обеспечения сигнала, по которому может быть достигнута синхронная коррекция между оконечным оборудованием данных, особенно когда не передается никакой другой символ. | |||
^W | 23 | 17 | ETB | ␗ | Конец блока передачи | Указывает конец блока передачи данных, когда данные разделены на такие блоки для целей передачи. Если он не используется для других целей, IPTC 7901 рекомендует интерпретировать ETB как символ конца абзаца. [2] | |||
^X | 24 | 18 | МОЖЕТ | ␘ | Отмена | Указывает, что предшествующие данные ошибочны или не должны приниматься во внимание. | |||
^Y | 25 | 19 | ЭМ | ␙ | Конец среды | Предназначен для обозначения на бумаге или магнитной ленте того, что конец используемой части ленты достигнут. Он также может означать конец использованной части носителя и не обязательно соответствует физическому концу носителя. [1] Если он не используется для других целей, IPTC 7901 рекомендует перепрофилировать EM как em-пространство для отступа первой строки абзаца [2] (см. Также ЕПРС ). | |||
^Z | 26 | 1А | SUB | ␚ | Заменять | Первоначально предназначался для использования в качестве символа управления передачей, чтобы указать, что были получены искаженные или недопустимые символы. Его часто использовали для других целей, когда внутриполосная сигнализация ошибок, которую он предоставляет, не нужна, особенно когда используются надежные методы обнаружения и исправления ошибок или где ошибки, как ожидается, будут достаточно редкими, чтобы использовать символ для желательны другие цели. В DOS , Windows , CP / M и других производных операционных систем Digital Equipment Corporation он используется для обозначения конца файла как при вводе текста на терминале, так и иногда в текстовых файлах, хранящихся на диске. | |||
^[ | 27 | 1B | ESC | ␛ | Побег | \e [b] | Клавиша Esc на клавиатуре будет вызывать этот символ , который будет отправлен на большинстве систем. Его можно использовать в программных пользовательских интерфейсах для выхода из экрана, меню или режима, или в протоколах управления устройствами (например, в принтерах и терминалах), чтобы сигнализировать, что то, что следует далее, является специальной последовательностью команд, а не обычным текстом. В системах, основанных на ISO / IEC 2022 , даже если используется другой набор управляющих кодов C0, этот октет требуется, чтобы всегда представлять escape-символ.
| ||
^\ | 28 год | 1С | FS | ␜ | Разделитель файлов | Может использоваться как разделитель для обозначения полей структур данных. Если используется для иерархических уровней, US - это самый низкий уровень (разделение элементов данных в виде обычного текста), а RS, GS и FS - возрастающие уровни для разделения групп, состоящих из элементов нижележащего уровня. В информационном формате Unix используется US, за которым следует необязательная подача формы и разрыв строки для обозначения начала узла. [14] MARC 21 использует US как разделитель подполей, RS как признак конца поля и GS как признак конца записи. [15] В текущей редакции IPTC 7901 , если они не используются для других целей, US рекомендуется для использования в качестве разделителя столбцов в таблицах, FS в качестве «центрального разделителя полей» в таблицах, а GS и RS соответственно для обозначения следующего пробела. или дефис-минус как неразрывная или soft соответственно (в наборах символов, не предоставляющих явных символов NBSP и SHY). [2] Python «s | |||
^] | 29 | 1D | GS | ␝ | Разделитель групп | ||||
^^ | 30 | 1E | RS | ␞ | Разделитель записей | ||||
^_ | 31 год | 1F | нас | ␟ | Разделитель единиц | ||||
Хотя технически они не являются частью диапазона управляющих символов C0, следующие два символа определены в ISO / IEC 2022 как всегда доступные независимо от того, какие наборы управляющих символов и графических символов были зарегистрированы. Их можно рассматривать как обладающие некоторыми характеристиками управляющих персонажей. | |||||||||
32 | 20 | SP | ␠ | Космос | Пробел - это графический персонаж. Он имеет визуальное представление, состоящее из отсутствия графического символа. Это приводит к тому, что активная позиция продвигается на одну позицию символа. В некоторых приложениях пробел можно рассматривать как «разделитель слов» нижнего уровня, который используется с соседними символами-разделителями. | ||||
^? | 127 | 7F | DEL | ␡ | Удалить | Технически не являясь частью диапазона управляющих символов C0, это первоначально использовалось для маркировки удаленных символов на бумажной ленте, поскольку любой символ мог быть заменен на все, пробивая везде дыры. На терминалах, совместимых с VT100 , это символ, генерируемый клавишей с меткой ⌫, обычно называемой backspace на современных машинах, и не соответствует клавише удаления ПК . |
Имена категорий
Некоторые из основных управляющих кодов ASCII подразделяются на несколько категорий, и иногда им даются альтернативные сокращенные имена, состоящие из этой категории и номера: [1]
- Органы управления коробкой передач: [1] TC 1 (SOH), TC 2 (STX), TC 3 (ETX), TC 4 (EOT), TC 5 (ENQ), TC 6 (ACK), TC 7 (DLE), TC 8 (NAK), TC 9 (SYN), TC 10 (ETB).
- Эффекты формата: [1] FE 0 (BS), FE 1 (HT), FE 2 (LF), FE 3 (VT), FE 4 (FF), FE 5 (CR).
- Управление устройством: [1] DC 1 , DC 2 , DC 3 , DC 4 .
- Разделители информации: [1] IS 1 (США), IS 2 (RS), IS 3 (GS), IS 4 (FS).
- Блокировка сдвигов: [17] LS 0 (SI), LS 1 (SO).
- Другие: NUL, BEL, CAN, EM, SUB, ESC.
ISO / IEC 2022 (ECMA-35) называет сдвиги блокировки C0 как LS0 и LS1 в 8-битных средах и как SI и SO в 7-битных средах. [17]
Первое издание ASCII 1963 г. DLE как элемент управления устройством, а не управление передачей, и дал ему сокращение DC0 («управление устройством, зарезервированное для выхода из канала передачи данных»). [18]
Коды эффектора формата (FE) определяют и активируют форматирование (например, разрывы строк ), которое влияет на расположение и отображение графических символов, в отличие от управления другими функциями аппаратных устройств или других побочных эффектов. Эффекторы формата C0 разрешены в ISO / IEC 6429. DCS , OSC , PM и Последовательности APC . Разделители информации и эффекторы формата C0 (минус BS ) являются единственными управляющими кодами C0 с семантикой, определенной стандартом Unicode, а интерпретация остальных элементов управления C0 оставлена протоколам более высокого уровня. [19]
ISO / IEC 2022 (ECMA-35) требует, чтобы, если наборы управляющих кодов C0 включают десять кодов управления передачей (TC) ASCII, они должны быть закодированы в их местах расположения ASCII. [20] Он также запрещает включение этих десяти элементов управления передачей в набор управляющих кодов C1, [21] и запрещает включение этих десяти элементов управления передачей в набор управляющих кодов C0. [20]
Модифицированные наборы контрольных кодов C0
Хотя наборы управляющих кодов C0 обычно сохраняют большую часть управляющих кодов ASCII без изменений, зарегистрировано число, которое заменяет определенные функции управления альтернативами. Некоторые из них, за исключением тех , которые относятся к Videotex , показаны ниже.
Seq | Декабрь | Шестигранник | Заменены | В кодовом наборе (ах) | Аббревиатура | Имя | Описание |
---|---|---|---|---|---|---|---|
^I | 09 | 09 | HT | NATS, [22] IPTC [23] | FO | Форматирование | Используется в табличных данных для перехода к следующей позиции табуляции (с сохранением семантики табуляции в этом отношении) и в стандартных форматах для обозначения следующей фазы. Текущая спецификация IPTC вместо этого рекомендует использовать обычные элементы управления ASCII C0 и использовать Управление США в виде разрыва столбца в таблицах. [2] |
^K | 11 | 0B | VT | NATS, [22] IPTC [23] | ECD | Конец инструкции | Разграничивает конец типографской инструкции, предназначенной для наборного устройства. |
^L | 12 | 0C | FF | NATS, [22] IPTC [23] | SCD | Начало инструкции | Разграничивает начало типографской инструкции, предназначенной для наборного устройства. |
^M | 13 | 0D | CR | NATS, [22] IPTC [23] | QL | Quad Left | Завершает строку, указывая, что она должна быть выровнена по левому краю. Текущая спецификация IPTC вместо этого рекомендует использовать обычные элементы управления ASCII C0 и представлять эту функцию с помощью < CR LF последовательности. [2] |
^N | 14 | 0E | ТАК | NATS [22] | UR | Верхний рельс | Начинает выделенную область текста. Используется в передаче скандинавских журналистских текстов с 1975 года; [22] В рекомендациях IPTC от 1976 года вместо них использовались FT2 и FT3 (см. Ниже). [23] Текущая спецификация IPTC вместо этого рекомендует использовать обычные элементы управления ASCII C0 и отмечать эту функцию ^ символом. [2] |
^O | 15 | 0F | SI | NATS [22] | LR | Нижний рельс | Заканчивает выделенную область текста. Используется в передаче скандинавских журналистских текстов с 1975 года; [22] В рекомендациях IPTC от 1976 года вместо него использовался FT1 (см. Ниже). [23] Текущая спецификация IPTC вместо этого рекомендует использовать обычные элементы управления ASCII C0 и отмечать эту функцию @ символом. [2] |
^Q | 17 | 11 | DC1 | IPTC [23] | FT1 | Шрифт один | Переключает на обычный шрифт, т. Е. Отключает полужирный или курсивный шрифт. |
^R | 18 | 12 | DC2 | IPTC [23] | FT2 | Шрифт два | Переключение на курсивный шрифт. |
^S | 19 | 13 | DC3 | IPTC [23] | FT3 | Шрифт три | Переход к полужирному шрифту. |
^X | 24 | 18 | МОЖЕТ | NATS, [22] IPTC [23] | КВт | Убить слово | Удаляет предыдущее слово (удаляет назад до последнего пробела включительно или обратно до предыдущего разрыва строки, исключая его, в зависимости от того, что встречается раньше). В этом отношении сохраняет семантику «Отмена», но имеет более конкретную функцию. |
^Y | 25 | 19 | ЭМ | T.61 / T.51 , [24] Автономный [25] | SS2 | Одна смена, два | Код переключения без блокировки для G2 ; представление C0, позволяющее представить его одним байтом в 7-битной среде. |
^\ | 28 год | 1С | FS | NATS, [22] IPTC, [23] Автономный [26] | СС, СС2 | Super Shift или Single Shift Two | Код переключения без блокировки . |
JIS C 6225 [27] | CEX | Расширение управления | Вводит контрольную последовательность, как определено ныне отмененным JIS C 6225, обозначенным JIS X 0207 в более поздних источниках [28] Сюда входят последовательности для управления поведением вертикального текста, надстрочных и подстрочных индексов, [29] и для передачи пользовательской символьной графики . [28] | ||||
^] | 29 | 1D | GS | NATS, [22] IPTC [23] | КК | Quad Center | Завершает линию, указывая на то, что она должна быть отцентрирована. |
T.61 / T.51 [24] | SS3 | Одна смена три | Код переключения без блокировки для G3 ; представление C0, позволяющее представить его одним байтом в 7-битной среде. | ||||
^^ | 30 | 1E | RS | NATS, [22] IPTC [23] | QR | Квадрат вправо | Завершает строку, указывая, что она должна быть выровнена по правому краю. |
^_ | 31 год | 1F | нас | NATS, [22] IPTC [23] | JY | Оправдывать | Завершает строку, которую необходимо выровнять. |
Другие наборы управляющих кодов C0
Телетекст определяет совершенно другой набор управляющих кодов . В форматах, где совместимость с управляющими кодами C0 ECMA-48 не требуется, эти управляющие коды иногда прозрачно отображаются на диапазон управляющих кодов Unicode C0 (от U + 0000 до U + 001F). [30]
C1 контролирует
Параллельно с разработкой ISO 646 издания 1972 года , в котором был пересмотрен стандарт для введения концепции национальных версий кода в дополнение к исходному ASCII в США, также велась работа с целью определения механизмов расширения для ASCII, применим как к 7-битной, так и к 8-битной среде, которые будут опубликованы как ECMA-35 и ISO 2022 . [31]
Эти механизмы были разработаны таким образом, чтобы любой соответствующий 8-битный код мог быть преобразован в соответствующий 7-битный код, и наоборот . [32] В 7-битной среде Shift Out ( SO ) контроль изменит значение 94 байт0x21
через0x7E
(т.е. графических кодов,исключением пространства) для вызова символов из альтернативного набора и сдвиг ( SI ) контроль вернет их обратно. [33] В 8-битной среде вместо использования кодов сдвига восьмой бит был установлен в байте, указывающем на дополнительный набор графических символов. Это означало, что0xA1
проходныебайты0xFE
использовались для дополнительных графических символов. Управляющие символы C0, на которые не влияет состояние сдвига 7-битного кода, всегда должны были быть представлены в 8-битном коде с неустановленным восьмым битом. [32] Следовательно, неиспользуемые иначе байты в диапазоне0x80
до0x9F
могут использоваться для дополнительных управляющих кодов, которые вместо этого будут представлены как0x1B 0x40
сквозные0x1B 0x5F
(ESC @
сквозныеESC _
) в 7-битном коде. [32] Эти дополнительные управляющие коды известны как управляющие коды C1 . Чтобы сохранить совместимость с 7-битным представлением, поведение байтов0xA0
и0xFF
изначально оставлено неопределенным. [34]
Первым набором управляющих кодов C1, который должен был быть зарегистрирован для использования с ISO 2022, был DIN 31626 , [35] специализированный набор для библиографического использования, который был зарегистрирован в 1979 году. [36] Набор общего использования ISO / IEC 6429 был зарегистрирован в 1983 году, [37] хотя спецификация ECMA-48, на которой она основана, была впервые опубликована в 1976 году. [38]
Дальнейшие редакции стандартов в некоторой степени изменили положения. Например, в новой редакции стандартов ECMA-35 и ISO 2022 в 1985 г. была введена концепция набора графических символов с 96 кодами. [39] В одном из 8-битного кода, это позволило весь диапазон от 0xA0
до , 0xFF
которые будут использоваться для графических символов. Использование 96-кодовых наборов также означало, что значение байтов 0x20
и 0x7F
в соответствующем 7-битном коде могло отличаться от «Пробел» и «Удалить», если только код не находился в состоянии Shift In. [40] Использование 96-кодовых наборов для набора G0 (Shift In) было невозможно. [39]
В соответствии с этой пересмотренной 8-битной структурой кода ISO 2022, ISO 8859 определяет наборы символов, которые должны быть закодированы по 0xA0 – FF, в сочетании с графическими символами ASCII выше 0x20–7E, и резервирует байты за пределами этих диапазонов для использования в качестве неграфические коды в соответствии с другими спецификациями, такими как ISO 6429. [41] Unicode наследует свои первые 256 кодовых точек из ISO 8859-1, следовательно, также включает диапазон, зарезервированный для набора управляющих кодов C1, хотя в основном оставляет их функцию для определения протоколами более высокого уровня, по умолчанию предлагается ISO 6429. [19]
Коды управления C1 для общего использования
Это наиболее распространенные расширенные коды управления, которые определены в ISO / IEC 6429 , ECMA -48 и JIS X 0211 (ранее JIS C 6323). [42] При использовании механизма расширения ISO / IEC 2022 они обозначаются как активный управляющий символ C1 с помощью последовательности 0x1B 0x22 0x43
( ESC " C
). [37] Хотя Unicode не требует определенного набора управляющих кодов C1, оставляя их интерпретацию для определения протоколов более высокого уровня, и только определяет поведение для U + 0085, он предлагает интерпретировать управляющие коды C1, как указано в ISO / IEC 6429. при отсутствии использования по назначению. [19] В таблице ниже также перечислены три управляющих кода, перечисленных вместе с кодами ISO / IEC 6429 в RFC 1345 , но фактически не определенных в ISO / IEC 6429 ( ПОДКЛАДКА , HOP и SGC ). [5] [43]
Кроме SS2 и SS3 втексте EUC-JP и NEL в тексте, перекодированном из EBCDIC , 8-битные формы этих кодов почти никогда не используются. CSI , DCS и OSC используются для управления текстовыми терминалами и эмуляторами терминалов , но почти всегда с использованием их 7-битных представлений кода перехода. Иходнобайтовые представления, соответствующие ISO / IEC 2022 , недействительны в UTF-8 , а кодировки UTF-8 их соответствующих кодовых точек имеют длину два байта, как их формы escape-кода (например, CSI в U + 009B кодируется как байты 0xC2, 0x9B в UTF-8), поэтому их использование не дает преимущества перед эквивалентной двухбайтовой управляющей последовательностью. Когда эти коды появляются в современных документах, веб-страницах, сообщениях электронной почты и т. Д., Они обычно предназначены для печати символов в этой позиции в проприетарной кодировке, такой как Windows-1252 или Mac OS Roman, которые используют коды C1 для обеспечения дополнительные графические символы.
Официальные названия некоторых кодов C1 на английском языке были пересмотрены в последней редакции стандарта для управляющих кодов в целом (ISO 6429: 1992 или ECMA-48: 1991), чтобы они были нейтральными по отношению к используемым с ними графическим символам, и не предполагать, что, как в латинском алфавите, строки пишутся на странице сверху вниз, а символы пишутся в строке слева направо. Используемые сокращения не были изменены, поскольку в стандарте уже было указано, что они останутся неизменными при переводе стандарта на другие языки. Если имя было изменено, исходное имя, от которого произошло сокращение, также приводится в скобках в таблицах ниже.
Esc + | Декабрь | Шестигранник | Акро | Имя | Описание [44] |
---|---|---|---|---|---|
@ | 128 | 80 | ПОДКЛАДКА [6] | Заполнение символа | Не является частью ISO / IEC 6429 (ECMA-48). В ранних версиях ISO 10646 использовался как часть предложенного механизма для кодирования не-ASCII символов. Это использование было удалено в более поздних проектах. [5] [43] Тем не менее, используется внутренней двухбайтовой формой расширенного кода Unix (EUC) на основе ISO-2022 для двухбайтовых символов фиксированной длины с заполнением слева однобайтовых символов в кодовых наборах 1 и 3, тогда как NUL выполняет ту же функцию для кодовых наборов 0 и 2. Это не выполняется в обычном «упакованном» формате EUC. [45] |
А | 129 | 81 год | HOP [6] | Предустановка высокого октета | Не является частью ISO / IEC 6429 (ECMA-48). В ранних версиях ISO 10646 это было предназначено как средство введения последовательности многобайтовых символов, совместимых с ISO 2022, с одним и тем же первым байтом без повторения указанного первого байта, таким образом уменьшая длину; это поведение никогда не входило в стандартную или опубликованную реализацию. Тем не менее его название было сохранено как Стандартное имя кодовой точки RFC 1345 . [5] [43] |
B | 130 | 82 | Аденома простаты | Здесь разрешен перерыв | Следует за графическим символом там, где разрешен разрыв строки. Примерно эквивалентен мягкому дефису, за исключением того, что символ разрыва строки не обязательно является дефисом. Не входит в первую редакцию ISO / IEC 6429. [37] См. Также пробел нулевой ширины . |
C | 131 | 83 | NBH | Здесь нет перерыва | Следует за графическим символом, который нельзя нарушать. Не входит в первую редакцию ISO / IEC 6429. [37] См. Также разделитель слов . |
D | 132 | 84 | IND | Индекс | Переместите активную позицию на одну строку вниз, чтобы исключить двусмысленность значения LF. Устарело в 1988 г. и исключено в 1992 г. из ISO / IEC 6429 (1986 и 1991 соответственно для ECMA-48). |
E | 133 | 85 | NEL | Следующая строка | Эквивалент CR + LF. Используется для обозначения конца строки на некоторых мэйнфреймах IBM. |
F | 134 | 86 | SSA | Начало выбранной области | Используется блочно-ориентированными терминалами . |
грамм | 135 | 87 | ЕКА | Конец выделенной области | |
ЧАС | 136 | 88 | HTS | Набор символов в таблицах Набор горизонтальных таблиц | Приводит к установке остановки табуляции символов в активной позиции. |
я | 137 | 89 | HTJ | Таблица знаков с обоснованием Горизонтальная таблица с обоснованием | Подобно табуляции символов, за исключением того, что вместо пробелов или строк, помещаемых после предшествующих символов до достижения следующей позиции табуляции, пробелы или строки размещаются перед активным полем, так что предыдущий графический символ помещается непосредственно перед следующей табуляцией. |
J | 138 | 8A | СУДС | Набор линейных таблиц Набор вертикальных таблиц | Приводит к установке остановки табуляции строк в активной позиции. |
K | 139 | 8B | PLD | Неполная линия вперед Неполная линия вниз | Используется для создания нижних и верхних индексов в ISO / IEC 6429 , например, в принтере. Подстрочные индексы используются, а надстрочные . PLD text PLU PLU text PLD |
L | 140 | 8C | PLU | Частичная линия назад Частичная линия вверх | |
M | 141 | 8D | RI | Обратная подача строки Обратный индекс | |
N | 142 | 8E | SS2 | Односменный 2 | Следующий символ вызывает графический символ из графических наборов G2 или G3 соответственно. В системах, которые соответствуют ISO / IEC 4873 (ECMA-43), даже если используется набор C1, отличный от значения по умолчанию, эти два октета могут использоваться только для этой цели. |
О | 143 | 8F | SS3 | Односменный 3 | |
п | 144 | 90 | DCS | Строка управления устройством | За ней следует строка печатаемых символов (от 0x20 до 0x7E) и эффекторов формата (от 0x08 до 0x0D), заканчивающаяся ST (0x9C). Это может использоваться управляющими последовательностями переменной длины для текстовых терминалов и эмуляторов терминалов, такими как запросы terminfo . [46] |
Q | 145 | 91 | PU1 | Частное использование 1 | Зарезервировано для функции, не имеющей стандартизованного значения, для частного использования по мере необходимости при условии предварительного согласия отправителя и получателя данных. |
р | 146 | 92 | PU2 | Частное использование 2 | |
S | 147 | 93 | СТС | Установить состояние передачи | |
Т | 148 | 94 | CCH | Отменить символ | Деструктивный backspace, предназначенный для устранения двусмысленности в значении BS . |
U | 149 | 95 | МВт | Ожидающее сообщение | |
V | 150 | 96 | СПА | Начало охраняемой территории | Используется блочно-ориентированными терминалами . |
W | 151 | 97 | EPA | Конец охраняемой территории | |
Икс | 152 | 98 | SOS | Начало строки | За которым следует контрольная строка, заканчивающаяся ST (0x9C), который, в отличие от инициированных DCS , OSC , PM или APC , может содержать любой символ, кроме SOS или ST. Не входит в первую редакцию ISO / IEC 6429. [37] MARC 21 использует SOS и ST в записях формата Unicode для разметки строки, которую следует игнорировать для целей сопоставления, в то время как записи формата MARC-8 используют NSB и NSE для той же цели. [15] [47] |
Y | 153 | 99 | SGC [6] | Представитель одного графического персонажа | Не является частью ISO / IEC 6429. В ранних версиях ISO 10646 использовался для кодирования одного многобайтового символа без переключения Режим HOP . В более поздних версиях это средство было удалено, тем не менее название было сохранено как Стандартное имя кодовой точки RFC 1345 . [5] [43] |
Z | 154 | 9А | SCI | Представитель одного персонажа | За ним следует один печатный символ (от 0x20 до 0x7E) или эффектор формата (от 0x08 до 0x0D). Намерение состояло в том, чтобы предоставить средства, с помощью которых можно было бы определить функцию управления или графический символ, которые будут доступны независимо от того, какие графические или контрольные наборы используются. Определение того, что будет вызывать следующий байт, никогда не было реализовано в международном стандарте. Не входит в первую редакцию ISO / IEC 6429. [37] |
[ | 155 | 9B | CSI | Введение в контрольную последовательность | Используется для представления управляющих последовательностей, принимающих параметры. |
\ | 156 | 9C | ST | Строковый терминатор | Завершает контрольную строку переменной длины, инициированную DCS , SOS , OSC , PM или APC . |
] | 157 | 9D | OSC | Команда операционной системы | За ней следует строка печатаемых символов (от 0x20 до 0x7E) и эффекторов формата (от 0x08 до 0x0D), заканчивающаяся ST (0x9C). Эти три управляющих кода были предназначены для использования внутриполосной сигнализации протокольной информации, но редко используются для этой цели. Некоторые эмуляторы терминала , включая xterm , поддерживают последовательности OSC для установки заголовка окна и перенастройки доступной цветовой палитры. Они также могут поддерживать завершение последовательности OSC с помощью BEL как нестандартная альтернатива стандартному ST. [48] APC иногда используется для передачи команд Kermit , хотя это может быть отключено или отфильтровано по соображениям безопасности. [49] |
^ | 158 | 9E | ВЕЧЕРА | Сообщение о конфиденциальности | |
_ | 159 | 9F | БТР | Команда прикладной программы |
Контрольные коды C1 для библиографического использования
Следующий альтернативный набор управляющих кодов C1 определен для библиографических приложений, таких как библиотечные системы . В основном это касается сопоставления строк и разметки библиографических полей. Немного разные варианты определяются немецким стандартом DIN 31626 [36] (опубликована в 1978 году и с тех пор отозваны) [50] и ISO стандарта ISO 6630 , [51] [52] последний из которых также был принят в Германии DIN ISO 6630 . [53] Если они отличаются, это указано в таблице ниже, где это применимо. MARC-8 использует кодировку NSB и NSE из этого набора и добавляет некоторые дополнительные эффекторы формата в места, не используемые версией ISO; однако MARC 21 использует этот набор элементов управления только в записях MARC-8, а не в записях формата Unicode. [15]
При использовании механизма расширения ISO / IEC 2022 набор DIN 31626 обозначается как активный набор управляющих символов C1 последовательностью 0x1B 0x22 0x45
( ESC " E
), [36], а набор ISO 6630 / DIN ISO 6630 обозначается последовательностью 0x1B 0x22 0x42
( ESC " B
). [51] Расширение набора ISO 6630 за 1985 год также можно явно указать с помощью функции sequence 0x1B 0x26 0x40 0x1B 0x22 0x42
( ESC & @ ESC " B
). [52]
Esc + | Декабрь | Шестигранник | Акро | Имя | Описание [36] [51] [52] |
---|---|---|---|---|---|
@… F | 128… 134 | 80… 86 | - | (зарезервированный) | |
грамм | 135 | 87 | CUS | Крупный план для сортировки | (DIN 31626, ISO 6630) Заявляет, что две последовательные последовательности символов, разделенные пробелом или разделителем, должны рассматриваться как одно слово для целей сопоставления. |
ЧАС | 136 | 88 | NSB | Начинаются символы без сортировки | (DIN 31626, ISO 6630, MARC 21) Обозначает начало последовательности символов, которые следует игнорировать при сопоставлении. MARC 21 использует этот символ в записях MARC-8 , но использует 0x98 ( SOS ) в записях Unicode с той же целью. [15] [47] |
я | 137 | 89 | NSE | Конец несортированных символов | (DIN 31626, ISO 6630, MARC 21) Обозначает конец последовательности символов, которые следует игнорировать при сопоставлении. MARC 21 использует этот символ в записях MARC-8, но использует 0x9C ( ST ) в записях Unicode с той же целью. [15] [47] |
J | 138 | 8A | FIL | Наполнитель | (DIN 31626) Заменяет обязательный буквенно-цифровой символ в поле. |
K | 139 | 8B | TCI | Тег в индикаторе контекста | (DIN 31626) Внутри библиографического поля, используется для ссылки на данные в другом библиографическом поле по его номеру тега. |
PLD | Неполная линия вниз | (ISO 6630) Отсутствует в исходной редакции ISO 6630. [51] В редакции ISO 6630 1985 г., [52] используется для частичного перехода на нижнюю строку (см. PLD выше). | |||
L | 140 | 8C | ICI | Идентификационный номер в контекстном индикаторе | (DIN 31626) В пределах библиографического поля, используется для ссылки на данные в другой библиографической записи по ее идентификационному номеру. |
PLU | Частичная очередь | (ISO 6630) Отсутствует в исходной редакции ISO 6630. [51] В редакции ISO 6630 1985 г., [52] используется для частичного преобразования (см. PLU выше). | |||
M | 141 | 8D | OSC [c] | Дополнительная слоговая форма [d] Control | (DIN 31626) Обозначает границу слога в длинном слове. Смотрите также мягкий дефис . |
ZWJ | Столяр | (MARC 21) В MARC-8 используется для объединения с нулевой шириной , а U + 200D используется в записях MARC в формате Unicode. [15] [47] | |||
N | 142 | 8E | SS2 | Односменный 2 | (DIN 31626) Код переключения без блокировки, см. SS2 выше. |
ZWNJ | Не присоединившийся | (MARC 21) В MARC-8 используется для несоединения нулевой ширины , а U + 200C используется в записях MARC в формате Unicode. [15] [47] | |||
О | 143 | 8F | SS3 | Односменный 3 | (DIN 31626) Код переключения без блокировки, см. SS3 выше. |
п | 144 | 90 | - | (зарезервированный) | |
Q | 145 | 91 | EAB | Встроенная аннотация Начало | (DIN 31626, ISO 6630) Отмечает начало аннотации переменной длины, которая встроена в библиографическое поле, а не разделяется с использованием обозначения содержимого. |
р | 146 | 92 | EAE | Конец встроенной аннотации | (DIN 31626, ISO 6630) Обозначает конец встроенной аннотации переменной длины. |
S | 147 | 93 | ЭТО Б | Спецификация товара Начало | (DIN 31626) Отмечает начало строки определенной информации некоторого описания, кроме ключевого слова или строки перестановки. |
Т | 148 | 94 | ISE | Конец спецификации товара | (DIN 31626) Обозначает конец строки с конкретной информацией. |
U | 149 | 95 | SIB | Сортировка начала интерполяции | (ISO 6630) Обозначает начало последовательности символов, используемых только для сопоставления. |
V | 150 | 96 | SIE | Сортировка конца интерполяции | (ISO 6630) Обозначает конец последовательности символов, используемых только для сопоставления. |
W | 151 | 97 | SSB | Начало значения вторичной сортировки | (ISO 6630) Отмечает начало строки подчиненным значением сопоставления. |
Икс | 152 | 98 | SSE | Конец значения вторичной сортировки | (ISO 6630) Помечает конец строки подчиненным значением сопоставления. |
Y | 153 | 99 | INC | Индикатор нестандартного характера | (DIN 31626) Обозначает следующий нестандартный символ. |
Z | 154 | 9А | - | (зарезервированный) | |
[ | 155 | 9B | - | (зарезервированный) | |
\ | 156 | 9C | KWB | Ключевое слово начало | (DIN 31626, ISO 6630) Отмечает начало ключевого слова в библиографическом поле. |
] | 157 | 9D | KWE | Конец ключевого слова | (DIN 31626, ISO 6630) Отмечает конец ключевого слова в библиографическом поле. |
^ | 158 | 9E | PSB | Начало строки перестановки | (DIN 31626, ISO 6630) Обозначает начало строки, которая должна быть переставлена в начало элемента при создании ссылок или индексов . Завершается PSE или концом элемента. |
_ | 159 | 9F | PSE | Конец строки перестановки | (DIN 31626, ISO 6630) Обозначает конец строки, которая должна быть переставлена на переднюю часть элемента. |
Другие наборы управляющих кодов C1
EBCDIC определяет 16 дополнительных управляющих кодов, помимо тех, которые присутствуют в ASCII. При отображении в Unicode или в ISO 8859 эти коды отображаются в управляющие символы C1 способом, указанным в Архитектуре представления символьных данных IBM (CDRA). [54] [55]
Хотя отображение по умолчанию элемента управления New Line (NL) действительно соответствует ISO / IEC 6429 NEL (0x85; хотя его отображение иногда заменяется LF, в соответствии с соглашением о завершении строки UNIX), [54] остальные управляющие коды не соответствуют ISO / IEC 6429. Например, элемент управления EBCDIC SPS (0x09, сопоставлен с 0x8D) и управление ECMA-48 Оба PLU (0x8C) используются для начала или окончания нижнего индекса, но не сопоставляются друг с другом. Таким образом, EBCDIC с расширенным отображением ASCII можно рассматривать как имеющий собственный набор C1, хотя он не зарегистрирован в реестре ISO-IR для использования с ISO / IEC 2022 . [35]
Различные специализированные наборы управляющих кодов C1 зарегистрированы для использования в различных форматах Videotex . [35]
Юникод
Unicode выделяет 65 кодовых точек в общей категории «Cc» (Control) для совместимости с ISO / IEC 2022 . Коды управления в этой категории охватывают U + 0000 — U + 001F (элементы управления C0), U + 007F (удаление) и U + 0080 — U + 009F (элементы управления C1). Unicode определяет семантику только для U + 0009 — U + 000D, U + 001C — U + 001F и U + 0085. Остальные управляющие коды прозрачны для Unicode, и их значения оставлены протоколам более высокого уровня. [19]
Unicode не имеет выделенных кодовых точек категории «Cc», кроме C0 и C1. Тем не менее, он включает дополнительные символы-эффекторы формата, помимо тех, что входят в контрольные наборы C0 и C1, такие как метки, вставки, изолирующие и всплывающие подсказки для явного двунаправленного форматирования, а также объединители нулевой ширины и не-объединители для управления использованием лигатуры. Им присваивается общая категория «Cf» (формат), а не «Cc».
Смотрите также
- Контрольные изображения
- Escape-код ANSI
Сноски
- ^ Имя BELL присвоено Unicode несвязанномусимволу эмодзи 🔔 (U + 1F514). Хотя в то время управляющие символы C0 и C1 официально не назывались стандартом Unicode, это противоречило существующему использованию BELL в качестве имени этого управляющего символа в программном обеспечении после предыдущих версий UTS # 18 (стандарт регулярных выражений Unicode) , [4] например, в Perl . [5] Unicode теперь принимает ALERT и BEL (но не BELL) в качестве формальных псевдонимов для управляющего символа [6], хотя кодовая таблица по-прежнему указывает BELL в качестве псевдонима ISO 6429 [7], ивызываетсясоответствующая кодовая точка контрольного изображения. СИМВОЛ ДЛЯ ЗВОНКА. Впоследствии Perl перешел на использование BELL для эмодзи в версии 5.18. [8]
- ^ Управляющая
\e
последовательность"" не является частью ISO C и многих других языковых спецификаций. Однако это понимают несколько компиляторов, включая GCC . - ^ Не то же самое, что и Команда операционной системы (OSC) в кодовом наборе ISO / IEC 6429 C1.
- ^ Написано "Syllabication [ sic ]" в документе ISO-IR-040, вместе с "syllabe", написанным "syllabe [ sic ]" в описании. Предположительно, это опечатки.
Рекомендации
- ^ Б с д е е г ISO / TC 97 / SC 2 (1975). Набор управляющих символов стандарта ISO 646 (PDF) . ITSCJ / IPSJ . ISO-IR-1.
- ^ Б с д е е г ч я J K IPTC (1995). Рекомендуемый формат сообщений IPTC (PDF) (5-е изд.). IPTC TEC 7901.
- ^ а б в г «символ конца передачи (EOT)» . Федеральный стандарт 1037С . 1996 г.
- ^ Уильямсон, Карл. «Re: PRI # 202: Расширения NameAliases.txt для Unicode 6.1.0» .
- ^ а б в г д Кен Уистлер (20 июля 2011 г.). «Псевдонимы формальных имен для управляющих символов, L2 / 11-281» . Консорциум Unicode .
- ^ а б в г «Псевдонимы» . База данных символов Юникода . Консорциум Unicode .
- ^ "C0 Controls и Basic Latin" (PDF) . Консорциум Unicode.
- ^ "charnames" . Документация по программированию на Perl .
- ^ ISO / IEC JTC 1 / SC 2 (12 февраля 1998 г.). Окончательный текст DIS 8859-10, Информационные технологии - 8-битные однобайтовые наборы графических символов - Часть 10: Латинский алфавит № 6 (PDF) . ISO / IEC FDIS 8859-10: 1998, JTC1 / SC2 N2992, WG3 N415.
- ^ "escape-символ канала данных (DLE)" . Федеральный стандарт 1037С . 1996 г.
- ^ «Дополнительные функции управления передачей (расширение основных процедур управления режимами для систем передачи данных)» . Европейская ассоциация производителей компьютеров . 1972. ECMA-37.
- ^ Волк, Миша; Уистлер, Кен; Викстид, Чарльз; Дэвис, Марк; Фрейтаг, Асмус; Шерер, Маркус (2005-05-06). «10.1 Избегание значений управляющих байтов» . Стандартная схема сжатия для Unicode . Консорциум Unicode . ЕТС №6.
- ^ "В чем смысл Ctrl-S?" . Обмен Unix и Linux Stack . Проверено 14 февраля 2019 .
- ^ Фокс, Брайан . «Добавление нового узла в Info» . Информация: интерактивная система документации GNU, управляемая с помощью меню . Проект GNU .
- ^ Б с д е е г «Коды функций управления» . Спецификации MARC 21 для структуры записи, наборов символов и средств обмена . Библиотека Конгресса . 2007-12-04.
- ^ "Встроенные типы § str.splitlines" . Стандартная библиотека Python . Фонд программного обеспечения Python .
- ^ а б ECMA (1994). «7.3: Вызов элементов кода набора символов». Структура кода символов и методы расширения (PDF) (Стандарт ECMA) (6-е изд.). п. 14. ECMA-35.
- ^ Американская ассоциация стандартов (1963). Американский стандартный код обмена информацией: 4. Легенда . п. 6. ASA X3.4-1963.
- ^ а б в г Консорциум Unicode (2019). 23.1: Коды управления (PDF) . Стандарт Юникода (изд. 12.0.0). С. 868–870. ISBN 978-1-936213-22-1.
- ^ а б ECMA (1994). «6.4.2: Основные наборы кодированных функций управления». Структура кода символов и методы расширения (PDF) (Стандарт ECMA) (6-е изд.). п. 11. ECMA-35.
- ^ ECMA (1994). «6.4.3: Дополнительные наборы кодированных функций управления». Структура кода символов и методы расширения (PDF) (Стандарт ECMA) (6-е изд.). п. 11. ECMA-35.
- ^ Б с д е е г ч я J к л м Sveriges Standardiseringskommission (1975). Комплект NATS Control для передачи газетного текста (PDF) . ITSCJ / IPSJ . ISO-IR-7.
- ^ Б с д е е г ч я J к л м н IPTC (1976). Комплект управления для передачи газетного текста (PDF) . ITSCJ / IPSJ . ISO-IR-26.
- ^ а б МСЭ (1985). Основной набор функций управления Teletex (PDF) . ITSCJ / IPSJ . ISO-IR-106.
- ^ Řad pro normalizaci a měřeni (1987). Набор управляющих символов ISO 646 с заменой EM на SS2 (PDF) . ITSCJ / IPSJ . ISO-IR-140.
- ^ ISO / TC 97 / SC 2 (1977). Набор управляющих символов ISO 646 с заменой IS4 на Single Shift для G2 (SS2) (PDF) . ITSCJ / IPSJ . ISO-IR-36.
- ^ ISO / TC 97 / SC 2 (1982). Набор управляющих символов C0 японского стандарта JIS C 6225-1979 (PDF) . ITSCJ / IPSJ . ISO-IR-74.
- ^ а б ISO / TC97 / SC2 / WG6 . «Заявление о взаимодействии с ISO / TC97 / SC2 / WG8 и ISO / TC97 / SC18 / WG8» (PDF) . ISO / TC97 / SC2 / WG6 N317.rev.
- ^ Принтроникс (2012). Справочное руководство программиста OKI® (PDF) . п. 26.
- ^ Юэлл, Дуг (2020-10-16). «Мозаичная графика, разделенная телетекстом» . Архив списков рассылки Unicode . Консорциум Unicode .
- ^ ECMA / TC 1 (1973). "Краткая история". 7-битный набор кодированных символов ввода / вывода (PDF) (4-е изд.). ECMA . ЭКМА-6: 1973.
- ^ а б в ECMA / TC 1 (1971). «8.2: Соответствие 7-битного кода и 8-битного кода». Расширение набора 7-битных кодированных символов (PDF) (1-е изд.). ECMA . С. 21–24. ECMA-35: 1971.
- ^ ECMA / TC 1 (1973). «4.2: Особые управляющие символы». 7-битный набор кодированных символов ввода / вывода (PDF) (4-е изд.). ECMA . п. 16. ECMA-6: 1973.
- ^ ECMA / TC 1 (1974). «5: Примечания к таблице 1». 8-битный кодированный набор символов (PDF) (1-е изд.). ECMA . С. 4–5. ECMA-43: 1974.
- ^ а б в Международный регистр кодированных наборов символов ISO / IEC для использования с escape-последовательностями (PDF) , ITSCJ / IPSJ , ISO-IR
- ^ а б в г DIN (1979-07-15). Дополнительные контрольные коды для библиографического использования в соответствии с немецким стандартом DIN 31626 (PDF) . ITSCJ / IPSJ . ISO-IR-40.
- ^ а б в г д е ISO / TC97 / SC2 (1983-10-01). C1 Control Set по ISO 6429: 1983 (PDF) . ITSCJ / IPSJ . ISO-IR-77.
- ^ ECMA / TC 1 (1979). "Краткая история". Дополнительные функции управления для устройств ввода-вывода с отображением символов (PDF) (2-е изд.). ECMA . ECMA-48: 1979.
- ^ а б ECMA / TC 1 (1985). «5.3.8: Наборы из 96 графических символов». Методы расширения кода (PDF) (4-е изд.). ECMA . С. 17–18. ECMA-35: 1985.
- ^ ECMA / TC 1 (1985). «5.2.1: Использование функций блокировки-сдвига». Методы расширения кода (PDF) (4-е изд.). ECMA . С. 9–10. ECMA-35: 1985.
- ^ ISO / IEC JTC 1 / SC 2 / WG 3 (12 февраля 1998 г.). Окончательный текст DIS 8859-1, 8-битные однобайтовые наборы графических символов - Часть 1: Латинский алфавит № 1 (PDF) . ISO / IEC FDIS 8859-1: 1998; JTC1 / SC2 / N2988; WG3 / N411.
Этот набор кодированных графических символов может рассматриваться как версия 8-битного кода согласно ISO / IEC 2022 или ISO / IEC 4873 на уровне 1. […] Затененные позиции в кодовой таблице соответствуют битовым комбинациям, которые не соответствуют представляют собой графические символы. Их использование выходит за рамки ISO / IEC 8859; это указано в других международных стандартах, например ISO / IEC 6429.
- ^ «JIS X 02xx 符号» (на японском языке).
- ^ а б в г Кен Уистлер (05.10.2015). «Почему ничего не уходит» . Список рассылки Unicode .
- ^ ECMA (1991). Функции управления для кодированных наборов символов . Стандарт ECMA-48.
- ^ Лунде, Кен (2008). Обработка информации CJKV: вычисления на китайском, японском, корейском и вьетнамском языках . О'Рейли. п. 244. ISBN 9780596800925.
- ^ Мой, Эдвард; Гильдея, Стивен; Дики, Томас. «Функции управления устройством» . Последовательности управления XTerm .
- ^ а б в г д «Кодовая таблица расширенной латиницы (ANSEL)» . Спецификации MARC 21 для структуры записи, наборов символов и средств обмена . Библиотека Конгресса . 2007-12-05.
- ^ Мой, Эдвард; Гильдея, Стивен; Дики, Томас. «Команды операционной системы» . Последовательности управления XTerm .
- ^ Франк да Круз; Кристин Джаноне (1997). Используя C-Kermit . Цифровая пресса. п. 278. ISBN 978-1-55558-164-0.
- ^ «Обработка информации; библиографические контрольные символы» . Beuth: издательство DIN. DIN 31626: 1978-12.
- ^ а б в г д ISO / TC 46 (1983-06-01). Дополнительные контрольные коды для библиографического использования в соответствии с международным стандартом ISO 6630 (PDF) . ITSCJ / IPSJ . ISO-IR-67.
- ^ а б в г д ISO / TC 46 (1986-02-01). Дополнительные контрольные коды для библиографического использования в соответствии с международным стандартом ISO 6630 (PDF) . ITSCJ / IPSJ . ISO-IR-124.
- ^ «DIN ISO 6630 декабрь 1997 г.» . Интернет-магазин AFNOR Editions .
- ^ а б Умамахесваран, ВС (1999-11-08). «3.3 Шаг 2: Преобразование байтов» . UTF-EBCDIC . Консорциум Unicode . Технический отчет по Unicode №16.
64 управляющих символа […], символ УДАЛЕНИЯ ASCII (U + 007F) […] отображаются в соответствии с соглашениями EBCDIC, как определено в Архитектуре представления символьных данных IBM, CDRA, с одним исключением - пара символов перевода строки EBCDIC и New Управляющие символы строки заменяются из их пар по умолчанию CDRA на управляющие символы перевода строки ISO / IEC 6429 (U + 000A) и следующей строки (U + 0085).
- ^ Стил, Шон (1996-04-24). cp037_IBMUSCanada в таблицу Unicode . Консорциум Microsoft / Unicode .
- Стандарт Юникода
- C0 Controls и базовая латынь
- Элементы управления C1 и приложение Latin-1
- Контрольные изображения
- Стандарт Unicode, версия 6.1.0, глава 16: Особые области и символы формата
- Глоссарий ATIS Telecom 2007
- De litteris regentibus C1 quaestiones septem или Допустимы ли символы C1 в XHTML 1.0?
- W3C I18N FAQ: HTML, XHTML, XML и управляющие коды
- Международный регистр наборов кодированных символов для использования с escape-последовательностями