Расширенный ASCII

Вывод программы ascii в Cygwin

Расширенная ASCII ( EASCII или высокой ASCII ) кодировки символов являются восемь-битные или больше кодировок , которые включают в себя стандартные семи- бит ASCII символов, плюс дополнительные символы. Само по себе использование термина «расширенный ASCII» иногда подвергается критике ^[1]^[2]^[3], потому что его можно ошибочно интерпретировать как означающее, что стандарт ASCII был обновлен, чтобы включить более 128 символов или что термин однозначно идентифицирует единственная кодировка, ни то, ни другое.

Существует множество расширенных кодировок ASCII (более 220 кодовых страниц DOS и Windows). EBCDIC («другой» основной 8-битный символьный код) за десятилетия также разработал множество расширенных вариантов (более 186 кодовых страниц EBCDIC).

История [ править ]

Этот раздел требует дополнительных ссылок для проверки . Пожалуйста, помогите улучшить эту статью , добавив цитаты из надежных источников . Материал, не полученный от источника, может быть оспорен и удален.
Поиск источников: «Extended ASCII» - новости · газеты · книги · ученый · JSTOR ( март 2016 г. ) ( Узнайте, как и когда удалить это сообщение-шаблон )

ASCII был разработан в 1960-х годах для телетайпов и телеграфии , а также некоторых вычислительных машин. Ранние телепринтеры были электромеханическими, не имели микропроцессора и имели достаточно электромеханической памяти для работы. Они полностью обрабатывали один символ за раз, сразу после этого возвращаясь в состояние ожидания; это означало, что любые управляющие последовательности должны состоять только из одного символа, и поэтому для таких элементов управления необходимо зарезервировать большое количество кодов. Это были ударные принтеры , созданные на пишущей машинке , и они могли печатать только фиксированный набор глифов, которые были отлиты в металлический элемент или элементы; это также поощряло минимальный набор глифов.

Семибитный ASCII улучшен по сравнению с предыдущими пяти- и шестибитными кодами. Из 2 ⁷ = 128 кодов 33 использовались для элементов управления и 95 тщательно отобранных печатных символов (94 глифа и один пробел), которые включают английский алфавит (прописные и строчные буквы), цифры и 31 знак препинания и символ: все из символы на стандартной пишущей машинке США плюс несколько выбранных для задач программирования. Некоторые популярные периферийные устройства реализовали только подмножество из 64 печатных символов: Teletype Model 33 не мог передавать символы от «a» до «z» или пять менее распространенных символов («« »,« {»,« | »,«} »и "~"). и когда они получали такие символы, они вместо этого печатали от "A" до "Z" (принудительно все) и пять других почти похожих символов («@», «[», «\», «]» и «^»).

Набор символов ASCII едва достаточен для использования в английском языке (США) и не имеет многих глифов, распространенных при наборе текста , и слишком мал для универсального использования. Желательно, полезно или требуется гораздо больше букв и символов для прямого представления букв алфавитов, отличных от английского, больше видов пунктуации и пробелов, больше математических операторов и символов (× ÷ ⋅ ≠ ≥ ≈ π и т. Д.), Используются некоторые уникальные символы некоторыми языками программирования, идеограммами , логограммами , символами рисования прямоугольников и т. д. В течение многих лет приложения разрабатывались на основе 64-символьного и / или 95-символьного набора, поэтому некоторые символы получили новое применение. Например, в ASCII отсутствует «÷», поэтому в большинстве языков программирования «/» используется для обозначения деления.

Самой большой проблемой для пользователей компьютеров во всем мире были другие алфавиты. Английский алфавит ASCII почти соответствует европейским языкам, если буквы с диакритическими знаками заменены буквами без диакритических знаков или приближенными к ним двумя символами. Модифицированные варианты 7-битного ASCII появились незамедлительно, заменив некоторые редко используемые символы на очень желанные символы или буквы, такие как замена "#" на "£" в британских телетайпах, "\" на "¥" в Японии или "₩" в Корее и т.д. Приведено как минимум 29 вариантов набора. 12 кодовых точек были изменены по крайней мере одним модифицированным набором, оставив только 82 «неизменных» кода . Языки программирования, однако, присвоили значение многим замененным символам, были разработаны обходные пути, такие как трехсимвольные последовательности C "?? ("и "??)" для обозначения "{" и "}". ^[4]Языки с разными базовыми алфавитами могут использовать транслитерацию, например замену всех латинских букв наиболее близкими кириллическими буквами (что приводит к нечетному, но несколько читаемому тексту, когда английский напечатан на кириллице или наоборот). Также были разработаны схемы, позволяющие накладывать на две буквы (часто с контролем обратного пробела между ними) для получения букв с акцентом. Пользователям не нравились любые из этих компромиссов, и они часто плохо поддерживались. ^{[ необходима цитата ]}

Когда компьютеры и периферийные устройства стандартизированы на восьмибитных байтахВ 1970-х годах стало очевидно, что компьютеры и программное обеспечение могут обрабатывать текст, который использует наборы из 256 символов, практически без дополнительных затрат на программирование и без дополнительных затрат на хранение. (Предполагая, что неиспользованный 8-й бит каждого байта каким-либо образом не использовался повторно, например, при проверке ошибок, логических полях или упаковке 8 символов в 7 байтов.) Это позволит использовать ASCII без изменений и предоставить еще 128 символов. Многие производители разработали 8-битные наборы символов, состоящие из ASCII плюс до 128 неиспользуемых кодов. Поскольку в то время Восточная Европа была политически разделена, часто можно было сделать 8-битные кодировки, которые охватывали все более используемые европейские (и латиноамериканские) языки, такие как датский, голландский, французский, немецкий, португальский, испанский, шведский и другие. называется «латинским» или «римским».

128 дополнительных символов по-прежнему недостаточно, чтобы охватить все цели, все языки или даже все европейские языки, поэтому появление множества собственных и национальных 8-битных наборов символов, полученных из ASCII, было неизбежным. Перевод между этими наборами ( перекодирование ) сложен (особенно, если символ не входит в оба набора); и часто не выполнялся, создавая моджибаке ( получитаемый конечный текст, часто пользователи учились его декодировать вручную). В конце 1990-х годов были предприняты попытки сотрудничества или координации между национальными и международными органами по стандартизации, но производимые проприетарные наборы оставались наиболее популярными, прежде всего потому, что стандарты исключали многих популярных персонажей.

Собственные расширения [ править ]

Этот раздел требует дополнительных ссылок для проверки . Пожалуйста, помогите улучшить эту статью , добавив цитаты из надежных источников . Материал, не полученный от источника, может быть оспорен и удален. ( Июнь 2020 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения )

Различные частные модификации и расширения ASCII появились на мэйнфреймах и миникомпьютерах без EBCDIC , особенно в университетах.

Компания Hewlett-Packard начала добавлять европейские символы в свой расширенный 7-битный / 8-битный набор символов ASCII HP Roman Extension примерно в 1978/1979 годах для использования на своих рабочих станциях, терминалах и принтерах. Позже это превратилось в широко используемые обычные 8-битные наборы символов HP Roman-8 и HP Roman-9 (а также ряд вариантов).

Домашние компьютеры Atari и Commodore добавили множество графических символов к своим нестандартным ASCII (соответственно, ATASCII и PETSCII , основанные на исходном стандарте ASCII 1963 года).

Набор символов ТРС-80 для TRS-80 домашний компьютер добавлено 64 semigraphics символов (0x80 через 0xbf) , которые реализованы блочные графики с низким разрешением. (Каждый блочный графический символ отображается как сетка 2x3 пикселей, причем каждый пиксель блока эффективно контролируется одним из младших 6 битов.) ^[5]

IBM представила 8-битные расширенные коды ASCII на оригинальном IBM PC, а затем выпустила варианты для разных языков и культур. IBM называла такие наборы символов кодовыми страницами и присваивала номера как тем, которые они сами изобрели, так и многим из них, изобретенным и используемым другими производителями. Соответственно, наборы символов очень часто обозначаются номером кодовой страницы IBM. В кодовых страницах, совместимых с ASCII, нижние 128 символов сохраняли свои стандартные значения US-ASCII, а различные страницы (или наборы символов) могли быть доступны в верхних 128 символах. Например, компьютеры DOS, созданные для североамериканского рынка, использовали кодовую страницу 437., который включал акцентированные символы, необходимые для французского, немецкого и некоторых других европейских языков, а также некоторые графические символы рисования линий. Большой набор символов позволил создавать документы на комбинации таких языков, как английский и французский (хотя французские компьютеры обычно используют кодовую страницу 850 ), но не, например, на английском и греческом языках (для которых требовалась кодовая страница 737 ).

Apple Computer представила свои собственные восьмибитные расширенные коды ASCII в Mac OS , такие как Mac OS Roman . Apple LaserWriter также представил набор символов Postscript .

Digital Equipment Corporation (DEC) разработала многонациональный набор символов , в котором было меньше символов, но больше буквенных и диакритических комбинаций. Он поддерживался компьютерными терминалами VT220 и более поздними версиями DEC . Позже это стало основой для других наборов символов, таких как Lotus International Character Set (LICS), ECMA-94 и ISO 8859-1 .

ISO 8859 и его собственные адаптации [ править ]

В конце концов, ISO выпустила этот стандарт как ISO 8859, описывающий свой собственный набор восьмибитных расширений ASCII. Самым популярным является ISO 8859-1 , также называемый ISO Latin 1 , который содержит символы, достаточные для большинства распространенных западноевропейских языков. Варианты были стандартизированы и для других языков: например, ISO 8859-2 для восточноевропейских языков и ISO 8859-5 для кириллических языков.

Одним из примечательных отличий наборов символов ISO от кодовых страниц является то, что позиции символов со 128 по 159, соответствующие управляющим символам ASCII с набором старших битов, специально не используются и не определены в стандартах ISO, хотя они часто использовались. для печатаемых символов в проприетарных кодовых страницах, нарушение почти универсальных стандартов ISO.

Позднее Microsoft создала кодовую страницу 1252 , совместимую надмножество ISO 8859-1 с дополнительными символами в неиспользуемом диапазоне ISO. Кодовая страница 1252 - это стандартная кодировка символов западноевропейских языковых версий Microsoft Windows , включая английские версии. ISO 8859-1 - это обычная 8-битная кодировка символов, используемая системой X Window , и большинство стандартов Интернета использовали ее до Unicode .

Путаница в наборе символов [ править ]

Значение каждой расширенной кодовой точки может быть разным в каждой кодировке. Чтобы правильно интерпретировать и отображать текстовые данные (последовательности символов), которые включают расширенные коды, аппаратное и программное обеспечение, которое читает или принимает текст, должно использовать конкретную расширенную кодировку ASCII, которая применяется к нему. Применение неправильной кодировки вызывает нерациональную замену многих или всех расширенных символов в тексте.

Программное обеспечение может использовать фиксированный выбор кодировки или может выбирать из палитры кодировок по умолчанию, проверяя настройки страны и языка компьютера, читая объявление в тексте, анализируя текст , спрашивая пользователя, позволяя пользователю выбирать или отменять, и / или по умолчанию используется последний выбор. Когда текст передается между компьютерами, которые используют разные операционные системы, программное обеспечение и кодировки, применение неправильной кодировки может быть обычным явлением.

Поскольку полный английский алфавит и наиболее часто используемые символы английского языка включены в семибитные кодовые точки ASCII, которые являются общими для всех кодировок (даже большинства проприетарных кодировок), англоязычный текст менее поврежден при его интерпретации с помощью неправильная кодировка, но текст на других языках может отображаться как моджибаке (полная чушь). Поскольку многие стандарты Интернета используют ISO 8859-1, а также поскольку Microsoft Windows (с использованием кодовой страницы 1252 надмножества ISO 8859-1) является доминирующей операционной системой для персональных компьютеров сегодня, необъявленное использование ISO 8859-1 является довольно обычным явлением и может обычно следует предполагать, если нет других указаний.

Многие протоколы связи , в первую очередь SMTP и HTTP , требуют, чтобы кодировка символов содержимого была помечена идентификаторами набора символов, присвоенными IANA .

Кодировки многобайтовых символов [ править ]

Некоторые многобайтовые кодировки символов (кодировки символов, которые могут обрабатывать более 256 различных символов) также являются истинным расширенным ASCII. Это означает, что все символы ASCII кодируются одним байтом с тем же значением, что и ASCII, и эти значения больше нигде не используются. Их можно использовать в форматах файлов, в которых для ключевых слов и синтаксиса формата файла используются только байты ASCII, а байты 0x80-0xFF могут использоваться для произвольного текста, включая большинство языков программирования, где ключевые слова языка, имена переменных и имена функций должны быть в ASCII, но строковые константы и комментарии могут использовать символы, отличные от ASCII. Это значительно упрощает введение многобайтового набора символов в существующие системы, использующие расширенный ASCII.

UTF-8 - это действительно расширенный ASCII, как и некоторые кодировки расширенного кода Unix .

ISO / IEC 6937 не является расширенным ASCII, потому что его кодовая точка 0x24 соответствует общему знаку валюты (¤), а не знаку доллара ($), но в противном случае, если вы считаете, что пары акцент + буква являются расширенным символом, за которым следует ASCII.

Shift JIS не является истинным расширенным ASCII. Кроме замены обратной косой черты с йены характером, многобайтовые символы могут также включать в себя ASCII байт. Он избегает использования разделителей и элементов управления ASCII, поэтому во многих случаях, таких как HTML, он может работать. UTF-16 является еще менее расширенным ASCII, потому что символы ASCII хранятся как два байта, один из которых равен 0x00. Перенос существующей системы для поддержки наборов символов как Shift JIS или UTF-16 сложен и подвержен ошибкам.

Использование на машиночитаемых языках [ править ]

Для языков программирования и языков документов, таких как C и HTML , важен принцип расширенного ASCII, поскольку он позволяет поддерживать множество различных кодировок и, следовательно, многие человеческие языки с небольшими дополнительными усилиями программирования в программном обеспечении, которое интерпретирует файлы машиночитаемых языков. .

Принцип расширенного ASCII означает, что:

все байты ASCII (от 0x00 до 0x7F) имеют одинаковое значение во всех вариантах расширенного ASCII,
байты, которые не являются байтами ASCII, используются только для свободного текста, а не для тегов, ключевых слов или других функций, которые имеют особое значение для интерпретирующего программного обеспечения.

См. Также [ править ]

ASCII
ASCII искусство
Диграфы и триграфы
Метод ввода
Список символов Юникода
UTF-8
КОИ-8

Ссылки [ править ]

↑ Бенджамин Рифеншталь (26 февраля 2001 г.). «Re: информация Cygwin Termcap, включающая расширенные символы ascii» . cygwin (список рассылки). Архивировано 11 июля 2013 года . Проверено 2 декабря 2012 года .
^ С. Wolicki (23 марта 2012). «Тема: печатать расширенные коды ASCII в sql * plus» . Архивировано 15 марта 2013 года . Проверено 2 декабря 2012 года .
↑ Марк Дж. Рид (28 марта 2004 г.). "vim: как набрать расширенный ascii?" . Группа новостей : сост . Редакторы . Архивировано 2 августа 2013 года . Проверено 2 декабря 2012 года .
^ «2.2.1.1 Последовательности триграфа» . Обоснование Американского национального стандарта для информационных систем - язык программирования - C . Архивировано 29 сентября 2018 года . Проверено 8 февраля 2019 .
^ Goldklang, Ira (2015). «Графические советы и хитрости» . Архивировано 29 июля 2017 года . Проверено 29 июля 2017 .

Внешние ссылки [ править ]

Юникод Романа Чиборры и информационные страницы расширенного ASCII
Короткая страница по ASCII с 8-битной диаграммой OEM и 8-битной диаграммой ANSI

[1] Бенджамин Рифеншталь (26 февраля 2001 г.). «Re: информация Cygwin Termcap, включающая расширенные символы ascii» . cygwin (список рассылки). Архивировано 11 июля 2013 года . Проверено 2 декабря 2012 года .

[2] С. Wolicki (23 марта 2012). «Тема: печатать расширенные коды ASCII в sql * plus» . Архивировано 15 марта 2013 года . Проверено 2 декабря 2012 года .

[3] Марк Дж. Рид (28 марта 2004 г.). "vim: как набрать расширенный ascii?" . Группа новостей : сост . Редакторы . Архивировано 2 августа 2013 года . Проверено 2 декабря 2012 года .

[4] «2.2.1.1 Последовательности триграфа» . Обоснование Американского национального стандарта для информационных систем - язык программирования - C . Архивировано 29 сентября 2018 года . Проверено 8 февраля 2019 .

[5] Goldklang, Ira (2015). «Графические советы и хитрости» . Архивировано 29 июля 2017 года . Проверено 29 июля 2017 .

[1]

vтеКодировки символов
Ранние телекоммуникации	Телеграфный код Иголка Морс Нелатинский Вабун / Кана Китайский Кириллица Корейский Бодо и Мюррей FIELDATA ASCII ISO / IEC 646 BCDIC 353 355 357 358 359 360 EBCDIC Телетекс и Видеотекс / Телетекст ISO / IEC 6937 / ITU T.51 ITU T.61 ITU T.101 Телетекст мировой системы фон наборы
ISO / IEC 8859	Одобренный -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -13 -14 -15 -16 Заброшенный -12 Адаптации ISO-IR-182 ISO-IR-200 ISO-IR-201 Предложено, но не утверждено ISO-IR-111 ISO-IR-197 Французский / голландский / турецкий проект
Библиографическое использование	MARC-8 ANSEL CCCII / EACC ISO 5426 / 5426-2 / 5427 / 5428 / 6438 /6861/ 6862 / 10585 /10586/10754/11822
Национальные стандарты	ArmSCII BraSCII CNS 11643 ELOT 927 ГОСТ 10859 ГБ 2312 ГБ 12052 ГБ 18030 HKSCS IS 434 ISCII JIS X 0201 JIS X 0208 JIS X 0212 JIS X 0213 КОИ-7 КПС 9566 KS X 1001 KS X 1002 LST 1284 LST 1564 LST 1590-1 LST 1590-2 LST 1590-3 LST 1590-4 PASCII RUSCII SI 960 ТИС-620 TSCII VISCII VSCII ЮСКИИ
ISO / IEC 2022	7-битный CN CN-EXT JP JP-EXT JP-1 JP-2 JP-3 KR ISO / IEC 4873 ISO / IEC 8859 ISO / IEC 10367 Расширенный код Unix / EUC CN KR JP TW
Кодовые страницы Mac OS («скрипты»)	Армянский арабский Баренц кириллица кельтская CentEuro КитайскийSimp / EUC-CN Китайский Трад / Big5 хорватский Кириллица Деванагари / ISCII Дингбаты Фарси (персидский) Гэльский Грузинский Греческий Гуджарати / ISCII Гурмукхи / ISCII иврит Исландия Инуиты Японский / Shift JIS Клавиатура Корейский / EUC-KR Латынь (Кермит) Мальтийский / эсперанто Огам / IS 434 Римский румынский Саами Символ Тайский / TIS-620 турецкий Тюркская кириллица украинец VT100
Кодовые страницы DOS	100 111 112 113 151 152 161 162 163 164 165 166 210 220 301 437 449 489 620 667 668 707 708 709 710 711 714 715 720 721 737 768 770 771 772 773 774 775 776 777 778 790 850 851 852 853 854 855 / 872 856 857 858 859 860 861 862 863 864 865 866 / 808 867 868 869 874 / один тысяча сто шестьдесят-один / 1162 файл 876 877 878 881 882 883 884 885 891 895 896 897 898 899 900 903 904 906 907 909 910 911 926 927 928 929 932 934 936 938 941 942 943 944 946 947 948 949 950/1370 951 966 991 1034 1039 1040 1041 1042 1043 1044 1046 1086 1088 1092 1093 1098 1108 1109 1114 1115 1116 1117 1118 1119 1125 / 848 1126 1127 1131 / 849 1139 1167 1168 1300 1351 1361 1362 1363 1372 1373 1374 1375 1380 1381 1385 1386 1391 1392 1393 1394 3012 3021 3843 3844 3845 3846 3847 3848 30000 30001 30002 30003 30004 30005 30006 30007 30008 30009 30010 30011 30012 30013 30014 30015 30016 30017 30018 30019 30020 30021 30022 30023 30024 30025 30026 30027 30028 30029 30030 30031 30032 30033 30034 30039 30040 58152 58210 58335 59234 59829 60258 60853 61282 62306 CS Индийский CSX Индийский CSX + Индийский CWI-2 Иранская система Каменицкий KOI8 Мазовецкое воеводство МИК
Кодовые страницы IBM AIX	367 371 806 813 819 895 896 912 913 914 915 916 919 920 921 / 901 922 / 902 923 952 953 954 955 956 957 958 959 960 961 963 964 965 970 971 1004 1006 1008 1009 1010 1011 1012 1013 1014 1015 1016 1017 1018 1019 1029 1036 1089 1111 1124 1129 / 1163 1133 1350 1382 1383
Кодовые страницы IBM для кодировок других поставщиков	Apple Macintosh 1275 1280 1281 1282 1283 1284 1285 1286 Adobe 1038 1276 1277 DEC 1020 1021 1023 1090 1100 1101 1102 1103 1104 1105 1106 1107 1287 1288 HP 1050 1051 1052 1053 1054 1055 1056 1057 1058
Кодовые страницы Windows	CER-GS 874 / 1162 файла ( TIS-620 ) 932 / 943 ( Сдвиг JIS ) 936 / одна тысячи триста восемьдесят-шести ( GBK ) 950 / 1370 ( Big5 ) 949 / 1363 ( EUC-KR ) 1169 1174 Расширенная латиница-8 1200 ( UTF-16LE ) 1201 ( UTF-16BE ) 1250 1251 1252 1253 1254 1255 1256 1257 1258 1261 1270 54936 (GB18030) Армянский Кириллица + финский Кириллица + французский Кириллица + немецкий Политонический греческий 65001 ( UTF-8 )
Кодовые страницы Microsoft для кодировок других поставщиков	Apple Macintosh 10000 10001 10002 10003 10004 10005 10006 10007 10008 10010 10017 10021 10029 10079 10081 10082
Кодовые страницы EBCDIC	37 390 391 392 393 394 395 435 829 834 835 837 839 881 882 883 884 885 886 887 888 889 890 931 933 / 1364 935 / 1388 937 / 1371 939 / 1399 1001 1003 1005 1007 1024 1027 1028 1030 1031 1032 1033 1037 1068 1071 1073 1074 1075 1076 1077 1078 1080 1082 1083 1085 1087 1091 1136 1150 1151 1152 1278 1279 1303 1364 1376 1377
Терминалы DEC ( VTx )	Многонациональная (MCS) Национальная замена (NRCS) французский канадец Швейцарский испанский объединенное Королевство нидерландский язык Финский Французский Норвежский и датский Шведский Норвежский и датский (альтернативный) 8-битный греческий 8-битный турецкий 7-битный иврит 8-битный иврит Специальная графика Технические (TCS)
Для конкретной платформы	Желудь Adobe Standard Adobe Latin 1 Амстрад КТК Яблоко I Яблоко II Яблоко III ATASCII Atari ST BICS Калькуляторы Casio CDC Compucolor II CP / M + ДЕКАБРЬ RADIX 50 DEC MCS / NRCS DG International ЭЛВРО-Юниор FIELDATA GEM GEOS GSM 03.38 Расширение HP Roman HP Роман-8 HP Роман-9 HP FOCAL ХП РПЛ IBM SQUOZE LICS LMBCS Маттел Водолей Минитель MSX NEC APC Следующий OricSCII PCW PETSCII Sega SC-3000 Калькуляторы Sharp Sharp MZ Sinclair QL Телетекст Калькуляторы TI TRS-80 Ventura International Символ Вентуры WISCII XCCS ZX80 ZX81 ZX Spectrum
Юникод / ISO / IEC 10646	UTF-1 UTF-7 UTF-8 UTF-16 ( UTF-16LE / UTF-16BE ) / UCS-2 UTF-32 ( UTF-32LE / UTF-32BE ) / UCS-4 UTF-EBCDIC ГБ 18030 BOCU-1 ЦЭСУ-8 ГКГУ
Система набора TeX	Пробка IL1 IL2 IL3 L7X LGR LY1 OML OMS OMX OT1 OT2 OT3 OT4 PL0 QX T2A T2B T2C T2D Т3 Т4 Т5 TS1 TS3 U X2
Разные кодовые страницы	ABICOMP APL 293 310 (графический побег) 351 (GDDM) 907 (OEM) ISO-IR-68 ARIB STD-B24 Гц IEC-P27-1 ИНИС 7-битный 8 бит Кириллица ISO-IR-169 ISO 2033 Йохаб Модзикё SEASCII Стэнфорд / ИТС TACE16 TRON UTF-5 UTF-6 WTF-8
Контрольные и непечатаемые наборы символов	Азбука Морзе Коды управления C0 и C1 ISO / IEC 6429 / ANSI X3.64 / ECMA-48 / JIS X 0211 ISO 6630 DIN 31626 JIS X 0207 ITU T.101 C0 C1 Коды управления EBCDIC Управление Unicode, формат и символы-разделители Пробельные символы
похожие темы	Кодовая страница Кодовая страница Windows CCSID Кодировки символов в HTML Обнаружение кодировки Ханьское объединение Аппаратное обеспечение Моджибаке
Наборы символов