В CJK (китайский, японский и корейский) вычислительных, графических символов традиционно классифицируются в Полноширинный (в Тайване и Гонконге :全形, в CJK:全角) и полуширина (в Тайване и Гонконге :半形, в CJK:半角) символы. В шрифтах фиксированной ширины символ половинной ширины занимает половину ширины символа полной ширины, отсюда и название.
Формы половинной и полной ширины - это также имя блока Unicode U + FF00 – FFEF, при условии, что старые кодировки, содержащие символы как половинной, так и полной ширины, могут иметь перевод без потерь в / из Unicode.
Обоснование [ править ]
В этом разделе не процитировать любые источники . ( Ноябрь 2018 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения ) |
Во времена использования текстового режима символы западного алфавита обычно располагались на экране в виде сетки, часто 80 столбцов на 24 или 25 строк. Каждый символ отображался в виде небольшой точечной матрицы , часто шириной около 8 пикселей , а для кодирования символов западных языков обычно использовался SBCS (однобайтовый набор символов).
По ряду практических и эстетических причин символы Han должны быть квадратными, примерно в два раза шире, чем эти символы SBCS фиксированной ширины. Поскольку они обычно кодировались в формате DBCS (двухбайтовый набор символов), это также означало, что их ширина на экране с использованием дуоширинного шрифта была пропорциональна их длине байта. Некоторые терминалы и программы редактирования не могли обрабатывать двухбайтовые символы, начинающиеся с нечетных столбцов, только четные (некоторые не могли даже помещать двухбайтовые и однобайтовые символы в одну строку). Таким образом, наборы DBCS обычно включают латинские символы и цифры для использования вместе с символами CJK в одной строке.
С другой стороны, ранние японские вычисления использовали однобайтовую кодовую страницу под названием JIS X 0201 для катаканы . Они будут отображаться с той же шириной, что и другие однобайтовые символы, что сделает их символами кана половинной ширины, а не кана с нормальными пропорциями. Хотя сам стандарт JIS X 0201 не определяет отображение половинной ширины для катаканы, это стало визуально отличительной особенностью Shift JIS между однобайтовой катаканой JIS X 0201 и двухбайтовой катаканой JIS X 0208 . Некоторые кодовые страницы IBM использовали подобную обработку для корейского Jamo , [1] , основанной на N-байтах хангылите коду и его EBCDIC перевода.
В Юникоде [ править ]
Для совместимости с существующими наборами символов, которые содержали версии одного и того же символа как с половинной, так и с полной шириной, Unicode выделял один блок в U + FF00 – FFEF, содержащий необходимые символы «альтернативной ширины». Это включает в себя Полноширинную версию всех ASCII символов , а некоторые не-ASCII знаков препинания , такие как знак йены, полуширина версия катакана и хангылите и полуширину версия некоторых других символов , такие как окружность. Были выделены только символы, необходимые для обхода без потерь к существующим наборам символов, а не (например) создание полноразмерной версии каждого символа с латинским акцентом.
Юникод присваивает каждой кодовой точке свойство «восточноазиатская ширина» . Это может быть: [2]
Сокращение | Имя | Описание |
---|---|---|
W | Широкий | Естественно широкий характер, например Хирагана . |
Na | Узкий | Естественно узкий символ, например, базовый латинский алфавит ISO . |
F | Полная ширина | Широкий вариант с нормализацией совместимости до естественно узких символов, например, полноразмерный латинский шрифт. |
ЧАС | Половина ширины | Узкий вариант с нормализацией совместимости до естественно широкого символа, например кана половинной ширины . Включает U + 20A9 ( ₩ ) в качестве исключения. |
А | Двусмысленный | Символы включены в коды DBCS для Восточной Азии, а также в коды SBCS для Европы, например, греческий алфавит . Следовательно, двойное поведение может меняться. |
N | Нейтральный | Символы, которых нет в восточноазиатских кодах DBCS, например Деванагари . |
Эмуляторы терминала могут использовать это свойство, чтобы решить, должен ли персонаж занимать один или два «столбца» при определении вкладок и положения курсора.
В OpenType [ править ]
OpenType имеет теги функций "fwid", "halt", "hwid" и "vhal", которые используются для обеспечения полной или половинной ширины символа. [ необходима цитата ]
См. Также [ править ]
- Ханьское объединение
- Восточноазиатская пунктуация
- Em size - формы полной ширины
- Хангыль Джамо (блок Unicode)
- Катакана (блок Unicode)
- Латинский шрифт в Юникоде
- Вложенные буквенно-цифровые символы - последовательности маркеров, некоторые отображаются в полную ширину (например, ⒈, ⓵, ⑴, ⒜, ⓐ)
Ссылки [ править ]
- ^ «Демонстрация ICU - Converter Explorer» . demo.icu-project.org . Проверено 7 мая 2018 .
- ^ Лунде, Кен (2019-01-25). «Стандартное приложение № 11 Unicode®: ширина Восточной Азии» . Консорциум Unicode .
Внешние ссылки [ править ]
- Стандартное приложение № 11 к восточноазиатской ширине Unicode