Из Википедии, свободной энциклопедии
Перейти к навигацииПерейти к поиску

В C0 и C1 код управления или контроля символов наборы определяют управляющие коды для использования в тексте с помощью компьютерных систем, использующих ASCII и производные ASCII. Коды представляют дополнительную информацию о тексте, такую ​​как положение курсора, инструкцию начать новую строку или сообщение о том, что текст был получен.

Коды C0 - это диапазон 00 HEX –1F HEX, а набор C0 по умолчанию был первоначально определен в ISO 646 ( ASCII ). Коды C1 - это диапазон 80 HEX –9F HEX, а набор C1 по умолчанию был первоначально определен в ECMA-48 (позже согласован с ISO 6429). ISO / IEC 2022 Система определения контроля и графических символов позволяет другим C0 и C1 наборы будут доступны для специализированных приложений, но они редко используются.

C0 Controls

В ASCII определены 32 управляющих символа плюс необходимый дополнительный для символа DEL, состоящего из одного элемента (необходим для того, чтобы пробить все отверстия на бумажной ленте и стереть ее).

Такое большое количество кодов было желательно в то время, поскольку многобайтовые элементы управления потребовали бы реализации конечного автомата в терминале, что было очень сложно с современной электроникой и механическими терминалами. С тех пор только некоторые из исходных элементов управления сохранили свое использование: диапазон «пробелов» BS, TAB, LF, VT, FF и CR; код BEL; и ESC (но, за исключением ISO-2022-JP , почти всегда как часть ESC, '[' представление CSI , запускающее escape-последовательность ANSI ). Другие не используются или приобрели другое значение, например, NUL - терминатор строки C.

Некоторые протоколы последовательной передачи, такие как ANPA-1312 , Kermit и XMODEM, действительно широко используют управляющие символы SOH, STX, ETX, EOT, ACK, NAK и SYN для аппроксимации их исходных определений.

Основные управляющие коды ASCII

Это стандартные управляющие коды ASCII, изначально определенные в ANSI X3.4 . При использовании механизма расширения ISO / IEC 2022 они обозначаются как активные управляющие символы C0 с помощью последовательности октетов 0x1B 0x21 0x40( ESC ! @). [1]

Имена категорий

Некоторые из основных управляющих кодов ASCII подразделяются на несколько категорий, и иногда им даются альтернативные сокращенные имена, состоящие из этой категории и номера: [1]

  • Органы управления коробкой передач: [1] TC 1 (SOH), TC 2 (STX), TC 3 (ETX), TC 4 (EOT), TC 5 (ENQ), TC 6 (ACK), TC 7 (DLE), TC 8 (NAK), TC 9 (SYN), TC 10 (ETB).
  • Эффекты формата: [1] FE 0 (BS), FE 1 (HT), FE 2 (LF), FE 3 (VT), FE 4 (FF), FE 5 (CR).
  • Управление устройством: [1] DC 1 , DC 2 , DC 3 , DC 4 .
  • Разделители информации: [1] IS 1 (США), IS 2 (RS), IS 3 (GS), IS 4 (FS).
  • Блокировка сдвигов: [17] LS 0 (SI), LS 1 (SO).
  • Другие: NUL, BEL, CAN, EM, SUB, ESC.

ISO / IEC 2022 (ECMA-35) называет сдвиги блокировки C0 как LS0 и LS1 в 8-битных средах и как SI и SO в 7-битных средах. [17]

Первое издание ASCII 1963 года классифицировало DLE как управление устройством, а не как управление передачей, и дало ему аббревиатуру DC0 («управление устройством, зарезервированное для выхода из канала передачи данных»). [18]

Коды эффектора формата (FE) определяют и активируют форматирование (например, разрывы строк ), которое влияет на расположение и отображение графических символов, в отличие от управления другими функциями аппаратных устройств или других побочных эффектов. Эффекторы формата C0 разрешены в последовательностях DCS , OSC , PM и APC ISO / IEC 6429 . Разделители информации и эффекторы формата C0 (без BS ) являются единственными управляющими кодами C0 с семантикой, определенной стандартом Unicode, а интерпретация остальных элементов управления C0 оставлена ​​протоколам более высокого уровня. [19]

ISO / IEC 2022 (ECMA-35) требует, чтобы, если наборы управляющих кодов C0 включают десять кодов управления передачей (TC) ASCII, они должны быть закодированы в их местах расположения ASCII. [20] Он также запрещает включение этих десяти элементов управления передачей в набор управляющих кодов C1, [21] и запрещает включение этих десяти элементов управления передачей в набор управляющих кодов C0. [20]

Измененные наборы контрольных кодов C0

Хотя наборы управляющих кодов C0 обычно сохраняют большую часть управляющих кодов ASCII без изменений, зарегистрировано число, которое заменяет определенные функции управления альтернативами. Некоторые из них, за исключением тех , которые относятся к Videotex , показаны ниже.

Другие наборы контрольных кодов C0

Телетекст определяет совершенно другой набор управляющих кодов . В форматах, где совместимость с управляющими кодами C0 ECMA-48 не требуется, эти управляющие коды иногда прозрачно отображаются на диапазон управляющих кодов Unicode C0 (от U + 0000 до U + 001F). [30]

Элементы управления C1

Параллельно с разработкой ISO 646 издания 1972 года , в котором был пересмотрен стандарт для введения концепции национальных версий кода в дополнение к исходному ASCII в США, также велась работа с целью определения механизмов расширения для ASCII, применимо как к 7-битной, так и к 8-битной среде, которые будут опубликованы как ECMA-35 и ISO 2022 . [31]

Эти механизмы были разработаны таким образом, чтобы любой соответствующий 8-битный код мог быть преобразован в соответствующий 7-битный код, и наоборот . [32] В 7-битной среде, то Out (Shift SO ) контроль изменит значение 94 байт через (т.е. графических кодов, за исключением пространства) для вызова символов из альтернативного набора и сдвига ( SI ) control вернет их обратно. [33] В 8-битной среде вместо использования кодов сдвига восьмой бит был установлен в байте, указывающем на дополнительный набор графических символов. Это означало, что байты через0x210x7E0xA10xFEбыли использованы для дополнительных графических символов. Управляющие символы C0, на которые не влияет состояние сдвига 7-битного кода, всегда должны были быть представлены в 8-битном коде с неустановленным восьмым битом. [32] Следовательно, неиспользуемые иначе байты в диапазоне 0x80до 0x9Fмогут использоваться для дополнительных управляющих кодов, которые вместо этого будут представлены как 0x1B 0x40сквозные 0x1B 0x5F( ESC @сквозные ESC _) в 7-битном коде. [32] Эти дополнительные управляющие коды известны как управляющие коды C1 . Чтобы сохранить совместимость с 7-битным представлением, поведение байтов 0xA0и 0xFFизначально оставлено неопределенным. [34]

Первым набором управляющих кодов C1, который должен был быть зарегистрирован для использования с ISO 2022, был DIN 31626 , [35] специализированный набор для библиографического использования, который был зарегистрирован в 1979 году. [36] Набор общего использования ISO / IEC 6429 был зарегистрирован в 1983 году, [37] хотя спецификация ECMA-48, на которой она основана, была впервые опубликована в 1976 году. [38]

Дальнейшие редакции стандартов в некоторой степени изменили положения. Например, в новой редакции стандартов ECMA-35 и ISO 2022 в 1985 г. была введена концепция набора графических символов с 96 кодами. [39] В одном из 8-битного кода, это позволило весь диапазон от 0xA0до , 0xFFкоторые будут использоваться для графических символов. Использование 96-кодовых наборов также означало, что значение байтов 0x20и 0x7Fв соответствующем 7-битном коде могло отличаться от «Пробел» и «Удалить», если только код не находился в состоянии Shift In. [40] Использование 96-кодовых наборов для набора G0 (Shift In) было невозможно. [39]

В соответствии с этой пересмотренной 8-битной структурой кода ISO 2022, ISO 8859 определяет наборы символов, которые должны быть закодированы по 0xA0 – FF, в сочетании с графическими символами ASCII выше 0x20–7E, и резервирует байты за пределами этих диапазонов для использования в качестве неграфические коды в соответствии с другими спецификациями, такими как ISO 6429. [41] Unicode наследует свои первые 256 кодовых точек из ISO 8859-1, следовательно, также включает диапазон, зарезервированный для набора управляющих кодов C1, хотя в основном оставляет их функцию для определения протоколами более высокого уровня, по умолчанию предлагается ISO 6429. [19]

Контрольные коды C1 для общего пользования

Это наиболее распространенные расширенные коды управления, которые определены в ISO / IEC 6429 , ECMA -48 и JIS X 0211 (ранее JIS C 6323). [42] При использовании механизма расширения ISO / IEC 2022 они обозначаются как активный управляющий символ C1 с помощью последовательности 0x1B 0x22 0x43( ESC " C). [37] Хотя Unicode не требует определенного набора управляющих кодов C1, оставляя их интерпретацию для определения протоколов более высокого уровня, и только определяет поведение для U + 0085, он предлагает интерпретировать управляющие коды C1, как указано в ISO / IEC 6429. при отсутствии использования по назначению. [19]В таблице ниже также перечислены три управляющих кода, перечисленных вместе с кодами ISO / IEC 6429 в RFC  1345 , но фактически не определенных ISO / IEC 6429 ( PAD , HOP и SGC ). [5] [43]

За исключением SS2 и SS3 в тексте EUC-JP и NEL в тексте, перекодированном из EBCDIC , 8-битные формы этих кодов почти никогда не используются. CSI , DCS и OSC используются для управления текстовыми терминалами и эмуляторами терминалов , но почти всегда с использованием их 7-битных представлений escape-кода. Их однобайтовые представления, соответствующие ISO / IEC 2022 , недействительны в UTF-8., а кодировки UTF-8 их соответствующих кодовых точек имеют длину два байта, как и их формы escape-кода (например, CSI в U + 009B кодируется как байты 0xC2, 0x9B в UTF-8), поэтому нет никаких преимуществ в использовании их, а не эквивалентную двухбайтовую escape-последовательность. Когда эти коды появляются в современных документах, веб-страницах, сообщениях электронной почты и т. Д., Они обычно предназначены для печати символов в этой позиции в проприетарной кодировке, такой как Windows-1252 или Mac OS Roman, которые используют коды C1 для обеспечения дополнительные графические символы.

Официальные названия некоторых кодов C1 на английском языке были пересмотрены в последней редакции стандарта для управляющих кодов в целом (ISO 6429: 1992 или ECMA-48: 1991), чтобы они были нейтральными по отношению к графическим символам, используемым с ними, и не предполагать, что, как в латинском алфавите, строки пишутся на странице сверху вниз, а символы пишутся в строке слева направо. Используемые сокращения не были изменены, поскольку в стандарте уже было указано, что они останутся неизменными при переводе стандарта на другие языки. Если имя было изменено, исходное имя, от которого произошло сокращение, также приводится в скобках в таблицах ниже.

Контрольные коды C1 для библиографического использования

Следующий альтернативный набор управляющих кодов C1 определен для библиографических приложений, таких как библиотечные системы . В основном это касается сопоставления строк и разметки библиографических полей. Немного разные варианты определяются немецким стандартом DIN 31626 [36] (опубликована в 1978 году и с тех пор отозваны) [50] и ISO стандарта ISO 6630 , [51] [52] последний из которых также был принят в Германии DIN ISO 6630 . [53] Если они отличаются, это указано в таблице ниже, где это применимо. MARC-8 использует кодировку NSB иNSE из этого набора и добавляет некоторые дополнительные эффекторы формата в места, не используемые версией ISO; однако MARC 21 использует этот набор элементов управления только в записях MARC-8, а не в записях формата Unicode. [15]

При использовании механизма расширения ISO / IEC 2022 набор DIN 31626 обозначается как активный набор управляющих символов C1 последовательностью 0x1B 0x22 0x45( ESC " E), [36], а набор ISO 6630 / DIN ISO 6630 обозначается последовательностью 0x1B 0x22 0x42( ESC " B). [51] Расширение набора ISO 6630 за 1985 год также можно явно указать с помощью функции sequence 0x1B 0x26 0x40 0x1B 0x22 0x42( ESC & @ ESC " B). [52]

Другие наборы управляющих кодов C1

EBCDIC определяет 16 дополнительных управляющих кодов, помимо тех, которые присутствуют в ASCII. При отображении в Unicode или в ISO 8859 эти коды отображаются в управляющие символы C1 способом, указанным в Архитектуре представления символьных данных IBM (CDRA). [54] [55]

Хотя отображение по умолчанию элемента управления New Line (NL) действительно соответствует ISO / IEC 6429 NEL (0x85; хотя его отображение иногда заменяется LF, в соответствии с соглашением о завершении строки UNIX), [54] остальные коды управления соответствуют не соответствуют ISO / IEC 6429. Например, управляющий SPS EBCDIC (0x09, сопоставлен с 0x8D) и управляющий PLU ECMA-48 (0x8C) оба используются для начала надстрочного или конечного подстрочного индекса, но не сопоставляются с одним Другой. Таким образом, EBCDIC с расширенным отображением ASCII можно рассматривать как имеющий собственный набор C1, хотя он не зарегистрирован в реестре ISO-IR для использования с ISO / IEC 2022 . [35]

Различные специализированные наборы управляющих кодов C1 зарегистрированы для использования в различных форматах Videotex . [35]

Юникод

Unicode выделяет 65 кодовых точек в общей категории «Cc» (Control) для совместимости с ISO / IEC 2022 . Коды управления в этой категории охватывают U + 0000 — U + 001F (элементы управления C0), U + 007F (удаление) и U + 0080 — U + 009F (элементы управления C1). Unicode определяет семантику только для U + 0009 — U + 000D, U + 001C — U + 001F и U + 0085. Остальные управляющие коды прозрачны для Unicode, и их значения оставлены протоколам более высокого уровня. [19]

Unicode не имеет выделенных кодовых точек категории «Cc», кроме C0 и C1. Тем не менее, он включает в себя дополнительные символы-эффекторы формата, помимо тех, что входят в наборы элементов управления C0 и C1, такие как метки, вставки, изолирующие и всплывающие подсказки для явного двунаправленного форматирования, а также объединители с нулевой шириной и без объединения для управления использованием лигатуры. Им присваивается общая категория «Cf» (формат), а не «Cc».

См. Также

  • Контрольные изображения
  • Escape-код ANSI

Сноски

  1. ^ Имя BELL присвоено Unicode несвязанномусимволу эмодзи 🔔 (U + 1F514). Хотя в то время управляющие символы C0 и C1 официально не назывались стандартом Unicode, это противоречило существующему использованию BELL в качестве имени этого управляющего символа в программном обеспечении после предыдущих версий UTS # 18 (стандарт регулярных выражений Unicode) , [4] например, в Perl . [5] Unicode теперь принимает ALERT и BEL (но не BELL) в качестве формальных псевдонимов для управляющего символа, [6] хотя кодовая таблица по-прежнему указывает BELL как псевдоним ISO 6429 [7] и соответствующую кодовую точку контрольного изображения.называется СИМВОЛ ДЛЯ ЗВОНКА. Впоследствии Perl перешел на использование BELL для эмодзи в версии 5.18. [8]
  2. ^ Управляющая\eпоследовательность"" не является частью ISO C и многих других языковых спецификаций. Однако это понимают несколько компиляторов, включая GCC .
  3. ^ Не то же самое, что команда операционной системы (OSC) в кодовом наборе ISO / IEC 6429 C1.
  4. ^ Написано "Syllabication [ sic ]" в документе ISO-IR-040, вместе с "syllabe", написанным "syllabe [ sic ]" в описании. Предположительно, это опечатки.

Ссылки

  1. ^ Б с д е е г ISO / TC 97 / SC 2 (1975). Набор управляющих символов стандарта ISO 646 (PDF) . ITSCJ / IPSJ . ISO-IR-1.
  2. ^ Б с д е е г ч я J K IPTC (1995). Рекомендуемый формат сообщений IPTC (PDF) (5-е изд.). IPTC TEC 7901.
  3. ^ a b c d "символ конца передачи (EOT)" . Федеральный стандарт 1037С . 1996 г.
  4. ^ Уильямсон, Карл. «Re: PRI # 202: Расширения NameAliases.txt для Unicode 6.1.0» .
  5. ↑ a b c d e Кен Уистлер (20 июля 2011 г.). «Псевдонимы формальных имен для управляющих символов, L2 / 11-281» . Консорциум Unicode .
  6. ^ a b c d "Псевдонимы" . База данных символов Юникода . Консорциум Unicode .
  7. ^ "C0 Controls и Basic Latin" (PDF) . Консорциум Unicode.
  8. ^ "charnames" . Документация по программированию на Perl .
  9. ^ ISO / IEC JTC 1 / SC 2 (1998-02-12). Окончательный текст DIS 8859-10, Информационные технологии - 8-битные однобайтовые наборы графических символов - Часть 10: Латинский алфавит № 6 (PDF) . ISO / IEC FDIS 8859-10: 1998, JTC1 / SC2 N2992, WG3 N415.
  10. ^ "escape-символ канала данных (DLE)" . Федеральный стандарт 1037С . 1996 г.
  11. ^ «Дополнительные функции управления передачей (расширение основных процедур управления режимами для систем передачи данных)» . Европейская ассоциация производителей компьютеров . 1972. ECMA-37.
  12. Волк, Миша; Уистлер, Кен; Викстид, Чарльз; Дэвис, Марк; Фрейтаг, Асмус; Шерер, Маркус (2005-05-06). «10.1 Избегание значений управляющих байтов» . Стандартная схема сжатия для Unicode . Консорциум Unicode . ЕТС №6.
  13. ^ "В чем смысл Ctrl-S?" . Обмен Unix и Linux Stack . Проверено 14 февраля 2019 .
  14. ^ Фокс, Брайан . «Добавление нового узла в Info» . Информация: интерактивная система документации GNU, управляемая с помощью меню . Проект GNU .
  15. ^ a b c d e f g "Коды функций управления" . Спецификации MARC 21 для структуры записи, наборов символов и средств обмена . Библиотека Конгресса . 2007-12-04.
  16. ^ "Встроенные типы § str.splitlines" . Стандартная библиотека Python . Фонд программного обеспечения Python .
  17. ^ а б ECMA (1994). «7.3: Вызов элементов кода набора символов». Структура кода символов и методы расширения (PDF) (Стандарт ECMA) (6-е изд.). п. 14. ECMA-35.
  18. ^ Американская ассоциация стандартов (1963). Американский стандартный код обмена информацией: 4. Легенда . п. 6. ASA X3.4-1963.
  19. ^ a b c d Консорциум Unicode (2019). 23.1: Коды управления (PDF) . Стандарт Юникода (изд. 12.0.0). С. 868–870. ISBN  978-1-936213-22-1.
  20. ^ а б ECMA (1994). «6.4.2: Основные наборы кодированных функций управления». Структура кода символов и методы расширения (PDF) (Стандарт ECMA) (6-е изд.). п. 11. ECMA-35.
  21. ^ ECMA (1994). «6.4.3: Дополнительные наборы кодированных функций управления». Структура кода символов и методы расширения (PDF) (Стандарт ECMA) (6-е изд.). п. 11. ECMA-35.
  22. ^ a b c d e f g h i j k l m Sveriges Standardiseringskommission (1975). Комплект NATS Control для передачи газетного текста (PDF) . ITSCJ / IPSJ . ISO-IR-7.
  23. ^ Б с д е е г ч я J к л м н IPTC (1976). Комплект управления для передачи газетного текста (PDF) . ITSCJ / IPSJ . ISO-IR-26.
  24. ^ a b ITU (1985). Основной набор функций управления Teletex (PDF) . ITSCJ / IPSJ . ISO-IR-106.
  25. ^ Řad pro normalizaci a měřeni (1987). Набор управляющих символов ISO 646 с заменой EM на SS2 (PDF) . ITSCJ / IPSJ . ISO-IR-140.
  26. ISO / TC 97 / SC 2 (1977). Набор управляющих символов ISO 646 с заменой IS4 на Single Shift для G2 (SS2) (PDF) . ITSCJ / IPSJ . ISO-IR-36.
  27. ISO / TC 97 / SC 2 (1982). Набор управляющих символов C0 японского стандарта JIS C 6225-1979 (PDF) . ITSCJ / IPSJ . ISO-IR-74.
  28. ^ а б ISO / TC97 / SC2 / WG6 . «Заявление о взаимодействии с ISO / TC97 / SC2 / WG8 и ISO / TC97 / SC18 / WG8» (PDF) . ISO / TC97 / SC2 / WG6 N317.rev.
  29. ^ Printronix (2012). Справочное руководство программиста OKI® (PDF) . п. 26.
  30. ^ Юэлл, Дуг (2020-10-16). «Мозаичная графика, разделенная телетекстом» . Архив списков рассылки Unicode . Консорциум Unicode .
  31. ECMA / TC 1 (1973). "Краткая история". 7-битный набор кодированных символов ввода / вывода (PDF) (4-е изд.). ECMA . ЭКМА-6: 1973.
  32. ^ а б в ECMA / TC 1 (1971). «8.2: Соответствие 7-битного кода и 8-битного кода». Расширение набора 7-битных кодированных символов (PDF) (1-е изд.). ECMA . С. 21–24. ECMA-35: 1971.
  33. ECMA / TC 1 (1973). «4.2: Особые управляющие символы». 7-битный набор кодированных символов ввода / вывода (PDF) (4-е изд.). ECMA . п. 16. ECMA-6: 1973.
  34. ^ ECMA / TC 1 (1974). «5: Примечания к таблице 1». 8-битный кодированный набор символов (PDF) (1-е изд.). ECMA . С. 4–5. ECMA-43: 1974.
  35. ^ a b c Международный регистр кодированных наборов символов ISO / IEC для использования с escape-последовательностями (PDF) , ITSCJ / IPSJ , ISO-IR
  36. ^ a b c d DIN (15.07.1979). Дополнительные контрольные коды для библиографического использования в соответствии с немецким стандартом DIN 31626 (PDF) . ITSCJ / IPSJ . ISO-IR-40.
  37. ^ Б с д е е ISO / TC97 / SC2 (1983-10-01). C1 Control Set по ISO 6429: 1983 (PDF) . ITSCJ / IPSJ . ISO-IR-77.
  38. ECMA / TC 1 (1979). "Краткая история". Дополнительные функции управления для устройств ввода-вывода с отображением символов (PDF) (2-е изд.). ECMA . ECMA-48: 1979.
  39. ^ а б ECMA / TC 1 (1985). «5.3.8: Наборы из 96 графических символов». Методы расширения кода (PDF) (4-е изд.). ECMA . С. 17–18. ECMA-35: 1985.
  40. ^ ECMA / TC 1 (1985). «5.2.1: Использование функций блокировки-сдвига». Методы расширения кода (PDF) (4-е изд.). ECMA . С. 9–10. ECMA-35: 1985.
  41. ^ ISO / IEC JTC 1 / SC 2 / WG 3 (1998-02-12). Окончательный текст DIS 8859-1, 8-битные однобайтовые наборы графических символов - Часть 1: Латинский алфавит № 1 (PDF) . ISO / IEC FDIS 8859-1: 1998; JTC1 / SC2 / N2988; WG3 / N411. Этот набор кодированных графических символов может рассматриваться как версия 8-битного кода согласно ISO / IEC 2022 или ISO / IEC 4873 на уровне 1. […] Затененные позиции в кодовой таблице соответствуют битовым комбинациям, которые не соответствуют представляют собой графические символы. Их использование выходит за рамки ISO / IEC 8859; это указано в других международных стандартах, например ISO / IEC 6429.
  42. ^ «JIS X 02xx 符号» (на японском языке).
  43. ^ а б в г Кен Уистлер (2015-10-05). «Почему ничего не уходит» . Список рассылки Unicode .
  44. ^ ECMA (1991). Функции управления для кодированных наборов символов . Стандарт ECMA-48.
  45. ^ Лунде, Кен (2008). Обработка информации CJKV: вычисления на китайском, японском, корейском и вьетнамском языках . О'Рейли. п. 244. ISBN 9780596800925.
  46. ^ Мой, Эдвард; Гильдея, Стивен; Дики, Томас. «Функции управления устройством» . Последовательности управления XTerm .
  47. ^ a b c d e "Расширенная латинская кодовая таблица (ANSEL)" . Спецификации MARC 21 для структуры записи, наборов символов и средств обмена . Библиотека Конгресса . 2007-12-05.
  48. ^ Мой, Эдвард; Гильдея, Стивен; Дики, Томас. «Команды операционной системы» . Последовательности управления XTerm .
  49. Франк да Круз; Кристин Джаноне (1997). Используя C-Kermit . Цифровая пресса. п. 278. ISBN 978-1-55558-164-0.
  50. ^ «Обработка информации; библиографические контрольные символы» . Beuth: издательство DIN. DIN 31626: 1978-12.
  51. ^ a b c d e ISO / TC 46 (1983-06-01). Дополнительные контрольные коды для библиографического использования в соответствии с международным стандартом ISO 6630 (PDF) . ITSCJ / IPSJ . ISO-IR-67.
  52. ^ a b c d e ISO / TC 46 (1986-02-01). Дополнительные контрольные коды для библиографического использования в соответствии с международным стандартом ISO 6630 (PDF) . ITSCJ / IPSJ . ISO-IR-124.
  53. ^ "DIN ISO 6630 декабрь 1997" . Интернет-магазин AFNOR Editions .
  54. ^ а б Умамахесваран, ВС (1999-11-08). «3.3 Шаг 2: Преобразование байтов» . UTF-EBCDIC . Консорциум Unicode . Технический отчет по Unicode №16. 64 управляющих символа […], символ УДАЛЕНИЯ ASCII (U + 007F) […] отображаются в соответствии с соглашениями EBCDIC, как определено в Архитектуре представления символьных данных IBM, CDRA, с одним исключением - пара символов перевода строки EBCDIC и New Управляющие символы строки заменяются из их пар по умолчанию CDRA на управляющие символы перевода строки ISO / IEC 6429 (U + 000A) и следующей строки (U + 0085).
  55. ^ Стил, Шон (1996-04-24). cp037_IBMUSCanada в таблицу Unicode . Консорциум Microsoft / Unicode .
  • Стандарт Юникода
    • C0 Controls и базовая латынь
    • Элементы управления C1 и приложение Latin-1
    • Контрольные изображения
    • Стандарт Unicode, версия 6.1.0, глава 16: Особые области и символы формата
  • Глоссарий ATIS Telecom 2007
  • De litteris regentibus C1 quaestiones septem или Допустимы ли символы C1 в XHTML 1.0?
  • W3C I18N FAQ: HTML, XHTML, XML и управляющие коды
  • Международный регистр наборов кодированных символов для использования с escape-последовательностями