Расширенный ASCII


Расширенный ASCII означает восьмибитную кодировку символов , которая включает (большую часть) семибитных символов ASCII , а также дополнительные символы. Использование термина «расширенный ASCII» иногда подвергается критике [1] [2] [3] , потому что его можно ошибочно интерпретировать как означающее, что стандарт ASCII был обновлен, чтобы включить больше символов, или что этот термин однозначно идентифицирует одну кодировку. ни то, ни другое.

Существует множество расширенных кодировок ASCII (более 220 кодовых страниц DOS и Windows). EBCDIC («другой» основной 8-битный символьный код) за десятилетия также разработал множество расширенных вариантов (более 186 кодовых страниц EBCDIC).

Некоторые люди называют любой не-ASCII-символ в Unicode «расширенным ASCII». В других контекстах учитывается только кодировка UTF-8 , а в других контекстах никакая кодировка Unicode не считается расширенным ASCII.

ASCII был разработан в 1960-х годах для телетайпов и телеграфии , а также для некоторых вычислений. Ранние телетайпы были электромеханическими, не имели микропроцессора и имели достаточно электромеханической памяти для работы. Они полностью обрабатывали один символ за раз, сразу после этого возвращаясь в состояние ожидания; это означало, что любые управляющие последовательности должны были состоять только из одного символа, и, следовательно, для таких элементов управления необходимо было зарезервировать большое количество кодов. Это были ударные принтеры , производные от пишущих машинок, и они могли печатать только фиксированный набор глифов, которые были отлиты в элемент или элементы металлического шрифта; это также поощряло минимальный набор глифов.

Семибитный ASCII улучшен по сравнению с предыдущими пяти- и шестибитными кодами. Из 2 7 =128 кодов 33 использовались для управления и 95 тщательно отобранных печатных символов (94 глифа и один пробел), которые включают английский алфавит (прописные и строчные), цифры и 31 знак препинания и символ: все символы на стандартной пишущей машинке США плюс несколько, выбранных для задач программирования. Некоторые популярные периферийные устройства реализовали только подмножество из 64 печатных символов: модель телетайпа 33 не могла передавать от «a» до «z» или пять менее распространенных символов («`», «{», «|», «}», и "~"). и когда они получали такие символы, они вместо этого печатали от «A» до «Z» (принудительно вводили все заглавные буквы ).) и пять других в основном похожих символов ("@", "[", "\", "]" и "^").

Набор символов ASCII едва ли достаточно велик для использования на английском языке в США, в нем отсутствуют многие глифы, распространенные при наборе текста , и он слишком мал для универсального использования. Намного больше букв и символов желательны, полезны или необходимы для непосредственного представления букв алфавитов, отличных от английского, больше видов пунктуации и интервалов, больше математических операторов и символов (× ÷ ⋅ ≠ ≥ ≈ π и т. д.), некоторые уникальные используемые символы некоторыми языками программирования, идеограммами , логограммами , символами рисования прямоугольников и т. д. В течение многих лет приложения разрабатывались на основе набора из 64 символов и / или набора из 95 символов, поэтому некоторые символы получили новое использование. Например, в ASCII отсутствует «÷», поэтому в большинстве языков программирования для обозначения деления используется «/».


Вывод программы ascii в Cygwin