Из Википедии, бесплатной энциклопедии
  (Перенаправлено с ISO 6630 )
Перейти к навигации Перейти к поиску

В C0 и C1 код управления или контроля символов наборы определяют управляющие коды для использования в тексте с помощью компьютерных систем, использующих ASCII и производные ASCII. Коды представляют дополнительную информацию о тексте, такую ​​как положение курсора, инструкцию начать новую строку или сообщение о том, что текст был получен.

Коды C0 - это диапазон 00 HEX –1F HEX, а набор C0 по умолчанию был первоначально определен в ISO 646 ( ASCII ). Коды C1 - это диапазон 80 HEX –9F HEX, а набор C1 по умолчанию был первоначально определен в ECMA-48 (позже согласован с ISO 6429). ISO / IEC 2022 Система определения контроля и графических символов позволяет другим C0 и C1 наборы будут доступны для специализированных приложений, но они редко используются.

C0 control [ править ]

В ASCII определены 32 управляющих символа плюс необходимый дополнительный для символа DEL, состоящего из одного символа (необходим, чтобы пробить все отверстия на бумажной ленте и стереть их).

Такое большое количество кодов было желательным в то время, поскольку многобайтовые элементы управления потребовали бы реализации конечного автомата в терминале, что было очень сложно с современной электроникой и механическими терминалами. С тех пор только некоторые из исходных элементов управления сохранили свое использование: диапазон «пробелов» BS, TAB, LF, VT, FF и CR; код BEL; и ESC (но, за исключением ISO-2022-JP , почти всегда как часть ESC, '[' представление CSI , запускающее escape-последовательность ANSI ). Другие не используются или приобрели другое значение, например, NUL - терминатор строки C.

Некоторые протоколы последовательной передачи, такие как ANPA-1312 , Kermit и XMODEM, действительно широко используют управляющие символы SOH, STX, ETX, EOT, ACK, NAK и SYN для целей приближения их исходных определений.

Основные управляющие коды ASCII [ править ]

Это стандартные управляющие коды ASCII, изначально определенные в ANSI X3.4 . При использовании механизма расширения ISO / IEC 2022 они обозначаются как активные управляющие символы C0 с помощью последовательности октетов 0x1B 0x21 0x40( ESC ! @). [1]

Имена категорий [ править ]

Некоторые из основных управляющих кодов ASCII делятся на несколько категорий, и иногда им даются альтернативные сокращенные имена, состоящие из этой категории и числа: [1]

  • Органы управления коробкой передач: [1] TC 1 (SOH), TC 2 (STX), TC 3 (ETX), TC 4 (EOT), TC 5 (ENQ), TC 6 (ACK), TC 7 (DLE), TC 8 (NAK), TC 9 (SYN), TC 10 (ETB).
  • Эффекты формата: [1] FE 0 (BS), FE 1 (HT), FE 2 (LF), FE 3 (VT), FE 4 (FF), FE 5 (CR).
  • Управление устройством: [1] DC 1 , DC 2 , DC 3 , DC 4 .
  • Разделители информации: [1] IS 1 (США), IS 2 (RS), IS 3 (GS), IS 4 (FS).
  • Блокировка смены: [17] LS 0 (SI), LS 1 (SO).
  • Другие: NUL, BEL, CAN, EM, SUB, ESC.

В стандарте ISO / IEC 2022 (ECMA-35) сдвиги блокировки C0 называются LS0 и LS1 в 8-битных средах и SI и SO в 7-битных средах. [17]

Первое издание ASCII 1963 года классифицировало DLE как управление устройством, а не как управление передачей, и дало ему сокращение DC0 («управление устройством, зарезервированное для выхода из канала передачи данных»). [18]

Коды эффекторов формата влияют на расположение и отображение графических символов, в отличие от управления другими функциями аппаратных устройств или наличия других побочных эффектов. Эффекторы формата C0 разрешены в последовательностях DCS , OSC , PM и APC ISO / IEC 6429 .

Разделители информации и эффекторы формата C0 (минус BS ) являются единственными управляющими кодами C0 с семантикой, определенной стандартом Unicode, а интерпретация остальных элементов управления C0 оставлена ​​протоколам более высокого уровня. [19]

ISO / IEC 2022 (ECMA-35) требует, чтобы, если наборы управляющих кодов C0 включают десять кодов управления передачей ASCII, они должны быть закодированы в их местах расположения ASCII. [20] Он также запрещает включение этих десяти элементов управления передачей в набор управляющих кодов C1, [21] и запрещает включение этих десяти элементов управления передачей в набор управляющих кодов C0. [20]

Измененные наборы контрольных кодов C0 [ править ]

Хотя наборы управляющих кодов C0 обычно сохраняют большую часть управляющих кодов ASCII без изменений, зарегистрировано число, которое заменяет определенные функции управления альтернативами. Некоторые из них, за исключением тех , которые относятся к Videotex , показаны ниже.

Другие наборы контрольных кодов C0 [ править ]

Телетекст определяет совершенно другой набор управляющих кодов . В форматах, где совместимость с управляющими кодами C0 ECMA-48 не требуется, эти управляющие коды иногда прозрачно отображаются на диапазон управляющих кодов Unicode C0 (от U + 0000 до U + 001F). [30]

Элементы управления C1 [ править ]

Параллельно с разработкой ISO 646 издания 1972 года , в котором был пересмотрен стандарт для введения концепции национальных версий кода в дополнение к исходному ASCII в США, также велась работа с целью определения механизмов расширения для ASCII, применим как к 7-битной, так и к 8-битной среде, которые будут опубликованы как ECMA-35 и ISO 2022 . [31]

Эти механизмы были разработаны таким образом, чтобы любой соответствующий 8-битный код можно было преобразовать в соответствующий 7-битный код, и наоборот . [32] В 7-битной среде, то Out (Shift SO ) контроль изменит значение 94 байт через (т.е. графических кодов, за исключением пространства) для вызова символов из альтернативного набора и сдвига ( SI ) control вернет их обратно. [33] В 8-битной среде, вместо использования кодов сдвига, восьмой бит был установлен в байте, указывающем на дополнительный набор графических символов. Это означало, что байты через0x210x7E0xA10xFEбыли использованы для дополнительных графических символов. Управляющие символы C0, на которые не влияет состояние сдвига 7-битного кода, всегда должны были быть представлены в 8-битном коде с неустановленным восьмым битом. [32] Следовательно, неиспользованные в противном случае байты в диапазоне 0x80до 0x9Fможно использовать для дополнительных управляющих кодов, которые вместо этого будут представлены как 0x1B 0x40сквозные 0x1B 0x5F( ESC @сквозные ESC _) в 7-битном коде. [32] Эти дополнительные управляющие коды известны как управляющие коды C1 . Чтобы сохранить совместимость с 7-битным представлением, поведение байтов 0xA0и 0xFFизначально оставлено неопределенным. [34]

Первым набором управляющих кодов C1, который должен был быть зарегистрирован для использования с ISO 2022, был DIN 31626 , [35] специализированный набор для библиографического использования, который был зарегистрирован в 1979 году. [36] Набор общего использования ISO / IEC 6429 был зарегистрирован в 1983 году, [37] хотя спецификация ECMA-48, на которой она основана, была впервые опубликована в 1976 году. [38]

Последующие редакции стандартов в некоторой степени изменили положения. Например, в новой редакции стандартов ECMA-35 и ISO 2022 в 1985 году была введена концепция набора графических символов с 96 кодами. [39] В одном из 8-битного кода, это позволило весь диапазон от 0xA0до , 0xFFкоторые будут использоваться для графических символов. Использование 96-кодовых наборов также означало, что значение байтов 0x20и 0x7Fсоответствующего 7-битного кода могло отличаться от «Пробел» и «Удалить», если только код не находился в состоянии Shift In. [40] Использование 96-кодовых наборов для набора G0 (Shift In) было невозможно. [39]

Именно эта структура 8-битного кода с байтами с восьмым набором битов, разделенными между диапазоном управляющих кодов C1 и 96-кодовым набором графических символов, была использована в качестве основы для ISO 8859 .

Контрольные коды C1 для общего пользования [ править ]

Это наиболее распространенные расширенные коды управления, которые определены в ISO / IEC 6429 , ECMA -48 и JIS X 0211 (ранее JIS C 6323). [41] При использовании механизма расширения ISO / IEC 2022 они обозначаются как активный управляющий символ C1 с помощью последовательности 0x1B 0x22 0x43( ESC " C). [37] Хотя Unicode не требует определенного набора управляющих кодов C1, оставляя их интерпретацию на усмотрение протоколов более высокого уровня, и определяет только поведение для U + 0085, он предлагает интерпретировать управляющие коды C1, как указано в ISO / IEC 6429. при отсутствии использования по назначению. [19]В таблице ниже также перечислены три управляющих кода, перечисленных вместе с кодами ISO / IEC 6429 в RFC  1345 , но фактически не определенных ISO / IEC 6429 ( PAD , HOP и SGC ). [5] [42]

За исключением NELSS2 и SS3 в EUC-JP ), 8-битные формы этих кодов почти никогда не используются. CSI , DCS и OSC используются для управления текстовыми терминалами и эмуляторами терминалов , но почти всегда с использованием их 7-битных представлений кода перехода. Их однобайтовые представления, соответствующие ISO / IEC 2022 , недопустимы в UTF-8., а кодировки UTF-8 их соответствующих кодовых точек имеют длину два байта, как и их формы escape-кода (например, CSI в U + 009B кодируется как байты 0xC2, 0x9B в UTF-8), поэтому нет преимущества использования их, а не эквивалентную двухбайтовую escape-последовательность. Когда эти коды появляются в современных документах, веб-страницах, сообщениях электронной почты и т. Д., Они обычно предназначены для печати символов в этой позиции в проприетарной кодировке, такой как Windows-1252 или Mac OS Roman, которые используют коды C1 для обеспечения дополнительные графические символы.

Официальные названия некоторых кодов C1 на английском языке были пересмотрены в последней редакции стандарта для управляющих кодов в целом (ISO 6429: 1992 или ECMA-48: 1991), чтобы быть нейтральными по отношению к используемым с ними графическим символам, и не предполагать, что, как в латинском алфавите, строки пишутся на странице сверху вниз, а символы пишутся в строке слева направо. Используемые сокращения не были изменены, поскольку в стандарте уже было указано, что они останутся неизменными при переводе стандарта на другие языки. Если имя было изменено, исходное имя, от которого произошло сокращение, также приводится в скобках в таблицах ниже.

Контрольные коды C1 для библиографического использования [ править ]

Следующий альтернативный набор управляющих кодов C1 определен для библиографических приложений, таких как библиотечные системы . В основном это касается сопоставления строк и разметки библиографических полей. Немного разные варианты определяются немецким стандартом DIN 31626 [36] (опубликована в 1978 году и с тех пор отозваны) [48] и ISO стандарта ISO 6630 , [49] [50] последний из которых также был принят в Германии DIN ISO 6630 . [51] Если они отличаются, это указано в таблице ниже, где это применимо. MARC-8 использует кодировку NSB иNSE из этого набора и добавляет некоторые дополнительные эффекторы формата в местах, не используемых версией ISO; однако MARC 21 использует этот набор элементов управления только в записях MARC-8, а не в записях формата Unicode. [15]

При использовании механизма расширения ISO / IEC 2022 набор DIN 31626 обозначается как активный набор управляющих символов C1 последовательностью 0x1B 0x22 0x45( ESC " E), [36], а набор ISO 6630 / DIN ISO 6630 обозначается последовательностью 0x1B 0x22 0x42( ESC " B). [49] Расширение набора ISO 6630 за 1985 год также может быть явно указано с помощью функции sequence 0x1B 0x26 0x40 0x1B 0x22 0x42( ESC & @ ESC " B). [50]

Другие наборы управляющих кодов C1 [ править ]

EBCDIC определяет 16 дополнительных управляющих кодов, помимо тех, которые присутствуют в ASCII. При отображении в Unicode или в ISO 8859 эти коды отображаются в управляющие символы C1 способом, указанным в Архитектуре представления символьных данных IBM (CDRA). [52] [53] Несмотря на то, отображение по умолчанию (NL) управления New Line делает соответствовать ISO / IEC 6429 NEL (0x85, хотя его отображение иногда местами с LF, после UNIX окончание строки конвенции), [52] остальные коды управления не соответствуют ISO / IEC 6429. Даже если они имеют одинаковое поведение, например SPS и PLU, преобразованные в C1 представления элементов управления EBCDIC (например, 0x8D для SPS) не соответствуют кодам ISO / IEC 6429 (например, 0x8C для PLU). Таким образом, EBCDIC с расширенным отображением ASCII можно рассматривать как имеющий собственный набор C1, хотя он не зарегистрирован в реестре ISO-IR для использования с ISO / IEC 2022 . [35]

Различные специализированные наборы управляющих кодов C1 зарегистрированы для использования в различных форматах Videotex . [35]

Юникод [ править ]

Unicode выделяет 65 кодовых точек в общей категории «Cc» (Control) для совместимости с ISO / IEC 2022 . Управляющие символы Unicode охватывают U + 0000 — U + 001F (элементы управления C0), U + 007F (удаление) и U + 0080 — U + 009F (элементы управления C1). Юникод определяет семантику только для U + 0009 – U + 000D, U + 001C – U + 001F и U + 0085. Остальные управляющие символы прозрачны для Unicode, и их значения оставлены протоколам более высокого уровня. [19]

Unicode не имеет выделенных кодовых точек категории «Cc», кроме C0 и C1. Тем не менее, он включает в себя дополнительные символы-эффекторы формата, помимо тех, что входят в наборы элементов управления C0 и C1, такие как метки, вставки, изолирующие и всплывающие подсказки для явного двунаправленного форматирования, а также объединители нулевой ширины и не-объединители для управления использованием лигатуры. Им присваивается общая категория «Cf» (формат), а не «Cc».

См. Также [ править ]

  • Контрольные изображения
  • Код выхода ANSI

Сноски [ править ]

  1. ^ Имя BELL присваивается Unicode несвязанномусимволу эмодзи 🔔 (U + 1F514). Хотя в то время управляющие символы C0 и C1 не были официально названы самим стандартом Unicode, это противоречило существующему использованию BELL в качестве имени этого управляющего символа в программном обеспечении после предыдущих версий UTS # 18 (стандарт регулярных выражений Unicode) , [4] например, на Perl . [5] Unicode теперь принимает ALERT и BEL (но не BELL) в качестве формальных псевдонимов для управляющего символа [6], хотя кодовая таблица по-прежнему указывает BELL как псевдоним ISO 6429 [7] и соответствующую кодовую точку контрольного изображения.называется СИМВОЛ ДЛЯ ЗВОНКА. Впоследствии Perl перешел на использование BELL для эмодзи в версии 5.18. [8]
  2. ^ Управляющаяпоследовательность' \ e ' не является частью ISO C и многих других языковых спецификаций. Однако это понимают несколько компиляторов, включая GCC .
  3. ^ Не то же самое, что команда операционной системы (OSC) в кодовом наборе ISO / IEC 6429 C1.
  4. ^ Написано "Syllabication [ sic ]" в документе ISO-IR-040, наряду с "syllabe", написанным "syllabe [ sic ]" в описании. Предположительно, это опечатки.

Ссылки [ править ]

  1. ^ Б с д е е г ISO / TC 97 / SC 2 (1975). Набор управляющих символов стандарта ISO 646 (PDF) . ITSCJ / IPSJ . ISO-IR-1.
  2. ^ Б с д е е г ч я J K IPTC (1995). Рекомендуемый формат сообщений IPTC (PDF) (5-е изд.). IPTC TEC 7901.
  3. ^ a b c d "символ конца передачи (EOT)" . Федеральный стандарт 1037С . 1996 г.
  4. ^ Уильямсон, Карл. «Re: PRI # 202: Расширения NameAliases.txt для Unicode 6.1.0» .
  5. ^ Б с д е Кен Whistler (20 июля 2011). «Псевдонимы формальных имен для управляющих символов, L2 / 11-281» . Консорциум Unicode .
  6. ^ a b c d "Псевдонимы" . База данных символов Юникода . Консорциум Unicode .
  7. ^ "C0 Controls и Basic Latin" (PDF) . Консорциум Unicode.
  8. ^ "charnames" . Документация по программированию на Perl .
  9. ^ ISO / IEC JTC 1 / SC 2 (1998-02-12). Окончательный текст DIS 8859-10, Информационные технологии - 8-битные однобайтовые наборы графических символов - Часть 10: Латинский алфавит № 6 (PDF) . ISO / IEC FDIS 8859-10: 1998, JTC1 / SC2 N2992, WG3 N415.
  10. ^ "escape-символ канала данных (DLE)" . Федеральный стандарт 1037С . 1996 г.
  11. ^ «Дополнительные функции управления передачей (расширение основных процедур управления режимами для систем передачи данных)» . Европейская ассоциация производителей компьютеров . 1972. ECMA-37.
  12. Волк, Миша; Уистлер, Кен; Уикстид, Чарльз; Дэвис, Марк; Фрейтаг, Асмус; Шерер, Маркус (2005-05-06). «10.1 Избегание значений управляющих байтов» . Стандартная схема сжатия для Unicode . Консорциум Unicode . ЕТС №6.
  13. ^ "В чем смысл Ctrl-S?" . Обмен Unix и Linux Stack . Дата обращения 14 февраля 2019 .
  14. ^ Фокс, Брайан . «Добавление нового узла в Info» . Информация: интерактивная система документации GNU с меню . Проект GNU .
  15. ^ a b c d e f g "Коды функций управления" . Спецификации MARC 21 для структуры записи, наборов символов и средств обмена . Библиотека Конгресса . 2007-12-04.
  16. ^ "Встроенные типы § str.splitlines" . Стандартная библиотека Python . Фонд программного обеспечения Python .
  17. ^ а б ECMA (1994). «7.3: Вызов элементов кода набора символов». Структура кода символов и методы расширения (PDF) (Стандарт ECMA) (6-е изд.). п. 14. ECMA-35.
  18. ^ Американская ассоциация стандартов (1963). Американский стандартный код обмена информацией: 4. Легенда . п. 6. ASA X3.4-1963.
  19. ^ a b c Консорциум Unicode (2019). 23.1: Контрольные коды (PDF) . Стандарт Юникода (12.0.0 ред.). С. 868–870. ISBN  978-1-936213-22-1.
  20. ^ а б ECMA (1994). «6.4.2: Первичные наборы кодированных функций управления». Структура кода символов и методы расширения (PDF) (Стандарт ECMA) (6-е изд.). п. 11. ECMA-35.
  21. ^ ECMA (1994). «6.4.3: Дополнительные наборы кодированных функций управления». Структура кода символов и методы расширения (PDF) (Стандарт ECMA) (6-е изд.). п. 11. ECMA-35.
  22. ^ a b c d e f g h i j k l m Sveriges Standardiseringskommission (1975). Комплект NATS Control для передачи газетного текста (PDF) . ITSCJ / IPSJ . ISO-IR-7.
  23. ^ Б с д е е г ч я J к л м н IPTC (1976). Комплект управления для передачи газетного текста (PDF) . ITSCJ / IPSJ . ISO-IR-26.
  24. ^ a b ITU (1985). Первичный набор функций управления Teletex (PDF) . ITSCJ / IPSJ . ISO-IR-106.
  25. ^ Řad pro normalizaci a měřeni (1987). Набор управляющих символов ISO 646 с заменой EM на SS2 (PDF) . ITSCJ / IPSJ . ISO-IR-140.
  26. ISO / TC 97 / SC 2 (1977). Набор управляющих символов ISO 646 с заменой IS4 на Single Shift для G2 (SS2) (PDF) . ITSCJ / IPSJ . ISO-IR-36.
  27. ISO / TC 97 / SC 2 (1982). Набор управляющих символов C0 японского стандарта JIS C 6225-1979 (PDF) . ITSCJ / IPSJ . ISO-IR-74.
  28. ^ а б ISO / TC97 / SC2 / WG6 . «Заявление Лиасона по ISO / TC97 / SC2 / WG8 и ISO / TC97 / SC18 / WG8» (PDF) . ISO / TC97 / SC2 / WG6 N317.rev.
  29. ^ Printronix (2012). Справочное руководство программиста OKI® (PDF) . п. 26.
  30. ^ Юэлл, Дуги (2020-10-16). «Мозаичная графика, разделенная телетекстом» . Архив списков рассылки Unicode . Консорциум Unicode .
  31. Перейти ↑ ECMA / TC 1 (1973). "Краткая история". 7-битный набор кодированных символов ввода / вывода (PDF) (4-е изд.). ECMA . ЭКМА-6: 1973.
  32. ^ а б в ECMA / TC 1 (1971). «8.2: Соответствие 7-битного кода и 8-битного кода». Расширение набора 7-битных кодированных символов (PDF) (1-е изд.). ECMA . С. 21–24. ECMA-35: 1971.
  33. Перейти ↑ ECMA / TC 1 (1973). «4.2: Особые управляющие символы». 7-битный набор кодированных символов ввода / вывода (PDF) (4-е изд.). ECMA . п. 16. ECMA-6: 1973.
  34. ^ ECMA / TC 1 (1974). «5: Примечания к таблице 1». 8-битный кодированный набор символов (PDF) (1-е изд.). ECMA . С. 4–5. ECMA-43: 1974.
  35. ^ a b c Международный регистр наборов кодированных символов ISO / IEC для использования с escape-последовательностями (PDF) , ITSCJ / IPSJ , ISO-IR
  36. ^ a b c d DIN (1979-07-15). Дополнительные контрольные коды для библиографического использования в соответствии с немецким стандартом DIN 31626 (PDF) . ITSCJ / IPSJ . ISO-IR-40.
  37. ^ Б с д е е ISO / TC97 / SC2 (1983-10-01). C1 Control Set по ISO 6429: 1983 (PDF) . ITSCJ / IPSJ . ISO-IR-77.
  38. ECMA / TC 1 (1979). "Краткая история". Дополнительные функции управления для устройств ввода-вывода с отображением символов (PDF) (2-е изд.). ECMA . ECMA-48: 1979.
  39. ^ а б ECMA / TC 1 (1985). «5.3.8: Наборы из 96 графических символов». Методы расширения кода (PDF) (4-е изд.). ECMA . С. 17–18. ЭКМА-35: 1985.
  40. ^ ECMA / TC 1 (1985). «5.2.1: Использование функций блокировки-сдвига». Методы расширения кода (PDF) (4-е изд.). ECMA . С. 9–10. ЭКМА-35: 1985.
  41. ^ «JIS X 02xx 符号» (на японском языке).
  42. ^ а б в г Кен Уистлер (2015-10-05). "Почему ничего не уходит" . Список рассылки Unicode .
  43. ^ ECMA (1991). Функции управления для кодированных наборов символов . Стандарт ECMA-48.
  44. ^ Лунде, Кен (2008). Обработка информации CJKV: вычисления на китайском, японском, корейском и вьетнамском языках . О'Рейли. п. 244. ISBN 9780596800925.
  45. ^ Мой, Эдвард; Гильдея, Стивен; Дики, Томас. «Функции управления устройством» . Последовательности управления XTerm .
  46. ^ a b c d e "Расширенная латинская кодовая таблица (ANSEL)" . Спецификации MARC 21 для структуры записи, наборов символов и средств обмена . Библиотека Конгресса . 2007-12-05.
  47. ^ Мой, Эдвард; Гильдея, Стивен; Дики, Томас. «Команды операционной системы» . Последовательности управления XTerm .
  48. ^ «Обработка информации; библиографические контрольные символы» . Beuth: издательство DIN. DIN 31626: 1978-12.
  49. ^ а б в г д ISO / TC 46 (1983-06-01). Дополнительные контрольные коды для библиографического использования в соответствии с международным стандартом ISO 6630 (PDF) . ITSCJ / IPSJ . ISO-IR-67.
  50. ^ a b c d e ISO / TC 46 (1986-02-01). Дополнительные контрольные коды для библиографического использования в соответствии с международным стандартом ISO 6630 (PDF) . ITSCJ / IPSJ . ISO-IR-124.
  51. ^ "DIN ISO 6630 декабрь 1997" . Интернет-магазин AFNOR Editions .
  52. ^ а б Умамахесваран, ВС (1999-11-08). «3.3 Шаг 2: Преобразование байтов» . UTF-EBCDIC . Консорциум Unicode . Технический отчет Unicode №16. 64 управляющих символа […], символ УДАЛЕНИЯ ASCII (U + 007F) […] отображаются в соответствии с соглашениями EBCDIC, как определено в Архитектуре представления символьных данных IBM, CDRA, с одним исключением - пара символов перевода строки EBCDIC и New Управляющие символы строки заменяются из их пар по умолчанию CDRA на управляющие символы перевода строки ISO / IEC 6429 (U + 000A) и следующей строки (U + 0085).
  53. ^ Стил, Шон (1996-04-24). cp037_IBMUSCanada в таблицу Unicode . Консорциум Microsoft / Unicode .
  • Стандарт Юникода
    • C0 Controls и базовая латынь
    • Элементы управления C1 и приложение Latin-1
    • Контрольные изображения
    • Стандарт Unicode, версия 6.1.0, глава 16: Особые области и символы формата
  • Глоссарий ATIS Telecom 2007
  • De litteris regentibus C1 quaestiones septem или Допустимы ли символы C1 в XHTML 1.0?
  • W3C I18N FAQ: HTML, XHTML, XML и управляющие коды
  • Международный регистр кодированных наборов символов для использования с escape-последовательностями