Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Код TRON - это многобайтовая кодировка символов, используемая в проекте TRON . Он похож на Unicode, но не использует процесс унификации Han Unicode : каждый символ из каждого набора символов CJK кодируется отдельно, включая архаические и исторические эквиваленты современных символов. Это означает, что тексты на китайском, японском и корейском языках можно смешивать без какой-либо двусмысленности в отношении точной формы символов; однако это также означает, что многие [ какие? ] символы с эквивалентной семантикой будут кодироваться более одного раза, что усложняет некоторые операции.

TRON имеет место для 150 миллионов кодовых точек. Отдельные кодовые точки для китайского, корейского и японского вариантов более 70000 символов хань в Unicode 4.1 (если это будет сочтено необходимым) потребуют более 200000 кодовых точек в TRON. TRON включает не-ханьские символы из Unicode 2.0, но он не соответствует последним выпускам Unicode, поскольку Unicode выходит за пределы базовой многоязычной плоскости и добавляет символы в существующие скрипты. Кодировка TRON была обновлена, чтобы включить другие недавние обновления кодовой страницы, такие как JIS X 0213 . [1]

Шрифты для кодировки TRON доступны, но имеют ограничения для коммерческого использования. [2]

Структура [ править ]

Каждый символ в коде TRON состоит из двух байтов. Подобно ISO / IEC 2022 , кодировка символов TRON обрабатывает символы в нескольких наборах символов в рамках одной кодировки символов с помощью управляющих последовательностей, называемых кодами спецификатора языка, для переключения между плоскостями из 48 400 кодовых точек. Наборы символов, включенные в код TRON, включают существующие наборы символов, такие как JIS X 0208 и GB 2312 , а также другие источники символов, такие как Dai Kan-Wa Jiten , и некоторые скрипты, не включенные в другие кодировки, такие как символы Dongba .

Благодаря включению полных наборов символов в код TRON многие символы с эквивалентной семантикой кодируются несколько раз; например, все символы кандзи в GT Typeface получают свои собственные кодовые точки, несмотря на то, что многие из них перекрываются с другими наборами символов кандзи, которые уже включены, такими как JIS X 0208. Одним из таких примеров является символ 亜 (расположенный в Unicode в U + 4E9C), который появляется в области JIS X 0208 по адресу 1-3021, области GT Typeface по адресу 2-2464 и области Dai Kan-Wa Jiten по адресу 8-2373.

Коды управления [ править ]

Байты в диапазоне от 0x00 до 0x20 и 0x7F зарезервированы для использования в управляющих кодах.

Коды символов [ править ]

Персонажи в каждой плоскости разделены на четыре зоны. Каждая зона выделяется отдельно; например, в плоскости 1 символы JIS X 0208 находятся в зоне A, начиная с 0x2121, символы JIS X 0213 находятся как в зоне A, так и в зоне B, а символы GB 2312 находятся в зоне C, начиная с 0x2180.

Кодовые точки обозначаются как X-YYYY, где X - это номер плоскости в десятичном формате, а YYYY - это кодовая точка в шестнадцатеричном формате. В качестве альтернативы можно использовать нотацию 0xNNYYYY, где NN - второй байт кода спецификатора языка. Текстовый формат "& TNNYYYY;" может использоваться для обозначения кодовой точки TRON в тексте ASCII аналогично ссылкам на числовые символы в HTML .

Коды спецификатора языка [ править ]

Коды спецификатора языка имеют префикс 0xFE. Допустимые суффиксы: от 0x21 до 0x7E и от 0x80 до 0xFE, многие из которых нераспределены.

Специальные и escape-коды [ править ]

Специальные коды имеют префикс 0xFF.

Самолеты [ править ]

Ниже приведены плоскости, выделенные для использования в коде TRON, вместе с соответствующими кодами спецификаторов языка и описанием наборов символов, включенных в каждую плоскость.

Самолеты с 11 по 15 изначально предназначались для хранения набора символов Модзикё , но из-за разногласий эти самолеты были исключены. Все остальные самолеты до 31 в настоящее время зарезервированы для использования в будущем.

См. Также [ править ]

  • Проект TRON
    • BTRON
    • ITRON

Внешние ссылки [ править ]

  • TRON コ ー ド 体系Система кодов Tron в документе спецификации BTRON
  • TRON 文字 収録 セ ン タ ーЦентр сбора персонажей Трон
  • 超 漢字Операционная система со стандартом BTRON
  • Шрифт GT 明朝Tron GT-Mincho
  • Архив проекта ITRON
  • Страница активного персонажа TRON
  • Обработка китайских иероглифов и кода TRON

Ссылки [ править ]

  1. ^ «Название T-Engine Forum было изменено на TRON Forum» . T-engine.org. 2015-04-01 . Проверено 16 сентября 2018 .
  2. ^ "T フ ォ ン ト プ ロ ジ ェ ク ト 利用 規定" . Charcenter.t-engine.org . Проверено 16 сентября 2018 .