Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Тибетский - это блок Unicode, содержащий символы тибетского, дзонгкха и других языков Китая, Бутана, Непала, Монголии, северной Индии, восточного Пакистана и России.

Заблокировать [ редактировать ]

Бывший тибетский блок [ править ]

Блок тибетской Unicode , является уникальным для того , был выделены в версии 1.0.0 с вирамом основанного кодирования , который был неспособен различить видимый srog мед и конъюнкт согласных правильно. [примечание 1] Эта кодировка была удалена из стандарта Unicode в версии 1.0.1 в процессе унификации с ISO 10646 для версии 1.1, [3]затем повторно введена в виде явной корневой / присоединенной кодировки с большим размером блока в версии 2.0. Перемещение или удаление существующих символов запрещено Политикой стабильности Unicode для всех версий, следующих за Unicode 2.0, поэтому тибетские символы, закодированные в Unicode 2.0 и всех последующих версиях, неизменяемы.

  1. ^ В большинстве индийских кодировок Unicode, хотя можно заставить систему отображать видимую халанту с помощью символа ZWS, не существует метода принудительного отображения конъюнктивного согласного, что очень важно при написании тибетского языка.

Диапазон бывшего тибетского блока Unicode 1.0.0 был занят блоком Myanmar начиная с Unicode 3.0. В Microsoft Windows , сортировки данные , относящиеся к старому тибетскому блоку были сохранены как в конце Windows XP , и удалить в Windows 2003 . [4]

История [ править ]

Следующие документы, связанные с Unicode, фиксируют цель и процесс определения определенных символов в тибетском блоке:

Ссылки [ править ]

  1. ^ "База данных символов Юникода" . Стандарт Юникода . Проверено 9 июля 2016 .
  2. ^ «Нумерованные версии стандарта Unicode» . Стандарт Юникода . Проверено 9 июля 2016 .
  3. ^ a b c «Дополнение к Unicode 1.0.1» (PDF) . Стандарт Юникода . 1992-11-03 . Проверено 9 июля 2016 .
  4. ^ Каплан, Майкл (2007-08-28). «У каждого персонажа есть история № 29: U + 1000 ^ H ^ H ^ H ^ H0f40, (ТИБЕТСКОЕ или МЬЯНМАРСКОЕ ПИСЬМО KA, в зависимости от того, когда вы спросите)» . Разбираемся со всем .
  • Китайская проблема, представленная Консорциуму Unicode со ссылкой на конъюнктивный символ «སྐྤྵ ྴ ྍ ྐ» (EWTS s + k + p + Sh + sh + x + ka; IAST skpṣśxka ), демонстрирует сложность кодирования. (Кодировка деванагари никогда не позволяла соединять « ᳵ », т. Е. «स्क्प्ष्श्ᳵ्क» не существует.)