Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Тайский промышленный стандарт 620-2533 , обычно упоминается как TIS-620 , является наиболее распространенным набором символов и кодировка символов для языка тайского . Стандарт опубликован Тайским институтом промышленных стандартов (TISI), органом Министерства промышленности при Королевском правительстве Таиланда, и является единственным официальным стандартом кодирования тайского языка в Таиланде . Описательное название стандарта - «Стандарт тайских кодов символов для компьютеров» (тайский: รหัส สำหรับ อักขระ ไทย ที่ ใช้ กับ คอมพิวเตอร์). «2533» относится к 2533 году буддийской эры.(1990) - год публикации настоящей версии стандарта; предыдущая редакция, TIS 620-2529 (1986), теперь устарела.

TIS-620 является предпочтительным именем кодировки IANA для TIS-620, и это имя набора символов используется также для ISO / IEC 8859-11 (который добавляет непрерывный пробел в 0xA0, который не назначен в TIS-620). Когда используется имя IANA, коды дополняются управляющими кодами C0 и C1 из ISO / IEC 6429 .

Структура [ править ]

TIS-620 - это стандартный набор национальных символов расширенного ASCII, который сохраняет полную совместимость с 7-битным ASCII и использует 8-битный шестнадцатеричный диапазон от A1 до FB для кодирования тайского алфавита . Из-за сложного сочетания тайских гласных и диакритических знаков TIS-620 предназначен только для обмена информацией, и для правильного составления символов требуется дополнительный механизм отображения.

Варианты [ править ]

Почти идентичная версия TIS-620 была принята как ISO / IEC 8859-11 в 2001 году, единственное отличие состоит в том, что ISO / IEC 8859-11 определяет шестнадцатеричный A0 как неразрывный пробел , а TIS-620 оставляет его неопределенным, но зарезервированный. (На практике это небольшое различие обычно игнорируется.)

ИСО / МЭК множество 8859-11 также было зарегистрировано как ISO-IR-166 с помощью Ecma International , но этот вариант добавляет явные коды эвакуации для сигнализации о начале и в конце последовательности символов тайских.

Порядок набора символов TIS-620 использовался по существу, как и в Unicode ( ISO / IEC 10646 ). Тайский блок Unicode - это от U + 0E01 до U + 0E7F, а тайские символы TIS-620 можно преобразовать в UTF-16, просто добавив к каждому байту префикс 0E и вычтя шестнадцатеричный A0 из значения.

Набор символов [ править ]

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный

В приведенной выше таблице 20 - это обычный ПРОБЕЛ. Кодовые значения 00-1F, 7F, 80-9F, A0, DB-DE и FC-FF не присваиваются символам в TIS-620.

Кодовые значения D1, D4-DA, E7-EE являются комбинированными символами .

Дальнейшее чтение [ править ]

  • Флор, Гвидо (2016) [2006]. «Locale :: RecodeData :: TIS_620 - Процедуры преобразования для TIS-620» . CPAN libintl-perl . 1.0. Архивировано 14 января 2017 года . Проверено 14 января 2017 .

Ссылки [ править ]

  1. ^ Лейшер, Марк (1998-03-06), TCCII 2533 1009 / TIS 620 Thai , TIS620.TXT

Внешние ссылки [ править ]

  • Официальная справка (на тайском языке)
  • Объявление в Королевской газете ТИС 620-2533 и ТИС 620-2529
  • Сопоставление TIS-620 с ISO 10646 на Wayback Machine (архивировано 5 июня 2013 г.)