Языки описания китайских иероглифов


Языки описания китайских иероглифов — это несколько предлагаемых языков для наиболее точного и полного описания китайских (или CJK ) иероглифов и информации, такой как их список компонентов, список штрихов (основных и сложных), их порядок и расположение каждого из них на фон пустой квадрат. Они предназначены для преодоления присущей растровому описанию нехватки информации. Эта расширенная информация может использоваться для идентификации вариантов символов, объединенных в одну кодовую точку Unicode и ISO/IEC 10646 , а также для предоставления альтернативной формы представления для редких символов, которые еще не имеют стандартизированной кодировки в Unicode или ISO/IEC 10646. Многие стремятся работать в стиле Kaishu.и Стиль песни , а также для предоставления внутренней структуры персонажа, которую можно использовать для более легкого поиска персонажа путем индексации внутреннего облика персонажа и перекрестных ссылок среди похожих персонажей.

Язык описания символов — это технология шрифтов , основанная на XML , совместно созданная Томом Бишопом и Ричардом Куком для Wenlin Institute, Inc , разработанная для описания любого символа CJK , но подходящая для описания любого глифа .

Этот основанный на XML декларативный язык определяет порядок штрихов каждого компонента (подъединица глифа, похожая на радикал , но не обязательно имеющую семантическое значение истинного радикала), а также сборку ранее определенных компонентов для создания еще большего количества элементов. сложные персонажи. Многие из этих компонентов являются самостоятельными персонажами, помимо того, что они служат компонентами строительных блоков.

Соответственно, набор менее чем из 50 штрихов [1] позволяет построить набор из примерно 1000 компонентов [2] , которые, в свою очередь, могут быть встроены в описания десятков тысяч символов. [2] Изменение формы одного из 50 основных штрихов неявно применяется к каждому символу, в который встроен этот штрих. Точно так же изменение компонента неявно применяется ко всем персонажам, сборка которых использует этот компонент. [2]

Количество штрихов одного символа обычно связано с количеством штрихов других символов. Большинство символов построено из компонентов, и пока количество штрихов для этих компонентов определено, редко возникают трудности с их сложением для получения общего количества штрихов. Следовательно, если стандарт определяет штрихи нескольких тысяч символов, он неявно определяет штрихи многих тысяч дополнительных символов. [3]

Язык описания символов, предназначенный для заполнения отсутствующих редких символов в документах (обращение к китайскому эквиваленту проблемы гайдзи ). [5] Документы могут содержать разметку для отсутствующих символов, что автоматически запускает создание мелких шрифтов для предоставления символов. Сам язык представляет собой простую постфиксную нотацию, описывающую штрихи и способы их комбинирования. Программное обеспечение-прототип использует Metapost для визуализации символов и встраивания их в документы LaTeX . Язык был представлен Вай Вонгом в 1997 г. [6] , а статьи о его реализации в Metapost и LaTeX появились на конференциях групп пользователей TeX в 2003 г. [7] [8]


CDL каскадного подхода компонентов.