тибетский | |
---|---|
Классифицировать | U + 0F00..U + 0FFF (256 кодовых точек) |
Самолет | BMP |
Скрипты | Тибетский (207 символов) Обычный (4 символа) |
Основные алфавиты | Тибетский дзонгка |
Назначенный | 211 кодовых точек |
Неиспользованный | 45 зарезервированных кодовых точек 2 устарели |
История версий Unicode | |
2.0 (1996) | 168 (+168) |
3,0 (1999) | 193 (+25) |
4,1 (2005) | 195 (+2) |
5.1 (2008) | 201 (+6) |
5.2 (2009) | 205 (+4) |
6.0 (2010) | 211 (+6) |
Примечание : [1] [2] При объединении с ISO 10646 , то оригинальный Тибетский блок был удален в Unicode 1.0.1. [3] Текущий блок (с новой моделью кодирования и другим диапазоном) был представлен в версии 2.0. |
Тибетский - это блок Unicode, содержащий символы тибетского, дзонгкха и других языков Китая, Бутана, Непала, Монголии, северной Индии, восточного Пакистана и России.
Заблокировать [ редактировать ]
Тибетский [1] [2] [3] Официальная таблица кодов Консорциума Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | B | C | D | E | F | |
U + 0F0x | ༀ | ༁ | ༂ | ༃ | ༄ | ༅ | ༆ | ༇ | ༈ | ༉ | ༊ | ་ | ༌ NB | ། | ༎ | ༏ |
U + 0F1x | ༐ | ༑ | ༒ | ༓ | ༔ | ༕ | ༖ | ༗ | ༘ | ༙ | ༚ | ༛ | ༜ | ༝ | ༞ | ༟ |
U + 0F2x | ༠ | ༡ | ༢ | ༣ | ༤ | ༥ | ༦ | ༧ | ༨ | ༩ | ༪ | ༫ | ༬ | ༭ | ༮ | ༯ |
U + 0F3x | ༰ | ༱ | ༲ | ༳ | ༴ | ༵ | ༶ | ༷ | ༸ | ༹ | ༺ | ༻ | ༼ | ༽ | ༾ | ༿ |
U + 0F4x | ཀ | ཁ | ག | གྷ | ང | ཅ | ཆ | ཇ | ཉ | ཊ | ཋ | ཌ | ཌྷ | ཎ | ཏ | |
U + 0F5x | ཐ | ད | དྷ | ན | པ | ཕ | བ | བྷ | མ | ཙ | ཚ | ཛ | ཛྷ | ཝ | ཞ | ཟ |
U + 0F6x | འ | ཡ | ར | ལ | ཤ | ཥ | ས | ཧ | ཨ | ཀྵ | ཪ | ཫ | ཬ | |||
U + 0F7x | ཱ | ི | ཱ ི | ུ | ཱ ུ | ྲྀ | ཷ | ླྀ | ཹ | ེ | ཻ | ོ | ཽ | ཾ | ཿ | |
U + 0F8x | ྀ | ཱ ྀ | ྂ | ྃ | ྄ | ྅ | ྆ | ྇ | ྈ | ྉ | ྊ | ྋ | ྌ | ྍ | ྎ | ྏ |
U + 0F9x | ྐ | ྑ | ྒ | ྒྷ | ྔ | ྕ | ྖ | ྗ | ྙ | ྚ | ྛ | ྜ | ྜྷ | ྞ | ྟ | |
U + 0FAx | ྠ | ྡ | ྡྷ | ྣ | ྤ | ྥ | ྦ | ྦྷ | ྨ | ྩ | ྪ | ྫ | ྫྷ | ྭ | ྮ | ྯ |
U + 0FBx | ྰ | ྱ | ྲ | ླ | ྴ | ྵ | ྶ | ྷ | ྸ | ྐྵ | ྺ | ྻ | ྼ | ྾ | ྿ | |
U + 0FCx | ࿀ | ࿁ | ࿂ | ࿃ | ࿄ | ࿅ | ࿆ | ࿇ | ࿈ | ࿉ | ࿊ | ࿋ | ࿌ | ࿎ | ࿏ | |
U + 0FDx | ࿐ | ࿑ | ࿒ | ࿓ | ࿔ | ࿕ | ࿖ | ࿗ | ࿘ | ࿙ | ࿚ | |||||
U + 0FEx | ||||||||||||||||
U + 0FFx | ||||||||||||||||
Примечания |
Бывший тибетский блок [ править ]
Тибетский (Unicode 1.0.0) | |
---|---|
Классифицировать | U + 1000..U + 104F (80 кодовых точек) |
Самолет | BMP |
Скрипты | тибетский |
Основные алфавиты | Тибетский дзонгка |
Положение дел | Удалено до выпуска Unicode 2.0. |
Сейчас занят | Мьянма |
История версий Unicode | |
1.0.0 (1991) | 71 (+71) |
1.0.1 (1992) | 0 (-71) |
Примечание . При объединении с ISO 10646 исходный тибетский блок был удален в Unicode 1.0.1. [3] Позднее тибетский язык был повторно представлен с новой моделью кодирования для Unicode 2.0. |
Блок тибетской Unicode , является уникальным для того , был выделены в версии 1.0.0 с вирамом основанного кодирования , который был неспособен различить видимый srog мед и конъюнкт согласных правильно. [примечание 1] Эта кодировка была удалена из стандарта Unicode в версии 1.0.1 в процессе унификации с ISO 10646 для версии 1.1, [3]затем повторно введена в виде явной корневой / присоединенной кодировки с большим размером блока в версии 2.0. Перемещение или удаление существующих символов запрещено Политикой стабильности Unicode для всех версий, следующих за Unicode 2.0, поэтому тибетские символы, закодированные в Unicode 2.0 и всех последующих версиях, неизменяемы.
- ^ В большинстве индийских кодировок Unicode, хотя можно заставить систему отображать видимую халанту с помощью символа ZWS, не существует метода принудительного отображения конъюнктивного согласного, что очень важно при написании тибетского языка.
Диапазон бывшего тибетского блока Unicode 1.0.0 был занят блоком Myanmar начиная с Unicode 3.0. В Microsoft Windows , сортировки данные , относящиеся к старому тибетскому блоку были сохранены как в конце Windows XP , и удалить в Windows 2003 . [4]
Тибетский (Unicode 1.0.0) [1] [2] Официальная таблица кодов Консорциума Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | B | C | D | E | F | |
U + 100x | ཀ | ཁ | ག | ང | ཅ | ཆ | ཇ | ཉ | ཊ | ཋ | ཌ | ཎ | ཏ | ཐ | ད | ན |
U + 101x | པ | ཕ | བ | མ | ཙ | ཚ | ཛ | ཝ | ཞ | ཟ | འ | ཡ | ར | ལ | ཤ | ཥ |
U + 102x | ས | ཧ | ཨ | ི | ྀ | ུ | ེ | ོ | ྅ | ཿ | ཾ | ༽ | ||||
U + 103x | ༷ | ྾ | ༄ | ། | ་ | ྃ | ྂ | ༔ | ༑ | ༈ | ༵ | ༼ | ཻ | ཽ | ||
U + 104x | ༠ | ༡ | ༢ | ༣ | ༤ | ༥ | ༦ | ༧ | ༨ | ༩ | ༎ | ྄ | ༹ | |||
Примечания
|
История [ править ]
Следующие документы, связанные с Unicode, фиксируют цель и процесс определения определенных символов в тибетском блоке:
Версия | Окончательные коды [a] | Считать | Идентификатор UTC | L2 ID | ID WG2 | Документ |
---|---|---|---|---|---|---|
2.0 | U + 0F00..0F47, 0F49..0F69, 0F71..0F8B, 0F90..0F95, 0F97, 0F99..0FAD, 0FB1..0FB7, 0FB9 | 168 | X3L2 / 92-144 | N808 | Лофтинг, Питер; Росс, Хью МакГрегор (13 мая 1992 г.), Комментарии к тибетскому письму | |
N1095 | Zhaxi, Nima, Предложение по кодированию тибетского сценария на BMP | |||||
N1185 | Предложение по кодированию тибетского письма на BMP по ISO / IEC 10646 | |||||
N1159 | Новое сводное тибетское предложение , 1995-03-10 | |||||
N1192 | Резюме заявки, тибетский , 1995-03-28 | |||||
N1203 | Умамахесваран, ВС; Ксар, Майк (1995-05-03), "РЕЗОЛЮЦИЯ M27.22", неподтвержденный протокол 27-го заседания SC2 / WG2, Женева | |||||
UTC / 1995-029 | Эверсон, Майкл , Набор тибетских символов для обмена информацией (кодовая таблица) | |||||
UTC / 1995-024B | Лофтинг, Питер (1995-05-31), Обновленная таблица тибетских кодов (U + xx00 - U + xxFF) | |||||
UTC / 1995-xxx | «Тибетское предложение и отчет Специального комитета», заседание Технического комитета Unicode № 65, протокол , 1995-06-02 | |||||
N1227 | Андерсон, Ллойд (1995-06-21), тибетец, 10646 г. | |||||
N1238 | Предложение по кодированию тибетского письма в BMP , 1995-06-24 | |||||
X3L2 / 95-090 | N1253 (doc , txt ) | Умамахесваран, ВС; Ксар, Майк (1995-09-09), «6.4.5», неподтвержденный протокол заседания № 28 РГ 2 в Хельсинки, Финляндия; 1995-06-26-27 | ||||
N1263 | Эверсон, Майкл (1995-09-18), О сложности имен тибетских персонажей | |||||
N1538 | Таблица ответов и отзывов о поправке 6 - тибетский , 1997-01-29 | |||||
L2 / 97-126 | N1562 | Патерсон, Брюс (1997-05-27), Проект отчета по бюллетеням JTC1 по бюллетеням DAM № 6 по ISO / IEC 10646-1 (тибетский) | ||||
N1571 | Патерсон, Брюс (1997-06-23), почти окончательный текст - DAM 6 - тибетский | |||||
L2 / 97-288 | N1603 | Умамахесваран, ВС (1997-10-24), "5.3.2", неподтвержденный протокол заседания, РГ 2, заседание № 33, Ираклион, Крит, Греция, 20 июня - 4 июля 1997 г. | ||||
N1739 | Патерсон, Брюс (1998-05-06), Отчет о дефектах AMD 6 - тибетский | |||||
L2 / 99-010 | N1903 (pdf , html , doc ) | Умамахесваран, ВС (1998-12-30), "11.2", Протокол заседания РГ 2 № 35, Лондон, Великобритания; 1998-09-21-25 | ||||
L2 / 01-301 | Уистлер, Кен (2001-08-01), "Трехчастные тибетские гласные знаки с а-чунг", Анализ устаревания символов в стандарте Unicode | |||||
L2 / 03-267 | Дафф, Тони ( 18 августа 2003 г.), комментарии к выпуску № 12 публичного обзора (конечная пунктуация) | |||||
L2 / 03-268 | Финн, Кристофер (18 августа 2003 г.), Unicode Tibetan [объяснение Unicode на тибетском языке] | |||||
L2 / 05-073 | Фрейтаг, Асмус; Финн, Кристофер (2005-02-09), Основные правила нарушения линии для тибетцев, дзонгкха и ладакхи | |||||
L2 / 08-287 | Дэвис, Марк (4 августа 2008 г.), Выпуск № 122 для общественного обсуждения: Предложение по дополнительным устаревшим символам | |||||
L2 / 08-304 | Финн, Кристофер (2008-08-09), Tibetan Chars in PR 122 | |||||
L2 / 08-253R2 | Мур, Лиза ( 19 августа 2008 г.), «Consensus 116-C13», UTC # 116 минут , измените устаревшее свойство, удалив 0340, 0341, 17D3 и добавив 0149, 0F77, 0F79, 17A4, 2329, 232A. | |||||
L2 / 08-328 (HTML , XLS ) | Уистлер, Кен (2008-10-14), Таблица устаревания и разочарования | |||||
L2 / 11-261R2 | Мур, Лиза (2011-08-16), "Consensus 128-C6", UTC # 128 / L2 # 225 минут , измените общую категорию с "So" на "Po" ... [U + 0F14] | |||||
3.0 | U + 0F6A, 0F96, 0FAE..0FB0, 0FB8, 0FBA..0FBC, 0FBE..0FCC, 0FCF | 25 | L2 / 98-024 | N1660 | Эверсон, Майкл (1997-12-08), Предложение о кодировании тибетских расширений в ISO / IEC 10646 | |
L2 / 98-070 | Алипранд, Жанна; Винклер, Арнольд, «3.A.2. Пункт c. Tibetan Extensions», Протокол совместной встречи UTC и L2 встречи в Купертино, 25-27 февраля 1998 г. | |||||
L2 / 98-218 | N1756 | Андерсон, Ллойд; Чилтон, Роберт; Дафф, Тони; Эверсон, Майкл; Финн, Кристофер; Макгоуэн, Рик; Сирлин, Сэм; Уистлер, Кен; Умаков, Валерий (1998-05-27), Предложение по тибетскому расширению UCS | ||||
L2 / 98-286 | N1703 | Умамахесваран, ВС; Ксар, Майк (1998-07-02), «8.8», неподтвержденный протокол собрания, РГ 2, собрание № 34, Редмонд, Вашингтон, США; 1998-03-16-20 | ||||
L2 / 98-281R (pdf , html ) | Алипранд, Джоан (1998-07-31), «Расширенный тибетский язык (IV.D.1.a)», неподтвержденные протоколы - UTC № 77 и NCITS подгруппа L2 № 174 СОВМЕСТНОЕ ВСТРЕЧА, Редмонд, Вашингтон - 29-31 июля, 1998 г. | |||||
N1864 | Комментарии к программе N1756 - Tibetan Extensions , 1998-09-17 | |||||
L2 / 98-330 | N1921 | Предложение о разделении на JTC 1.02.18.01 для Поправки 31: Тибетское расширение ISO / IEC 10646-1 , 1998-10-28 | ||||
L2 / 98-331 | N1922 | Комбинированный бюллетень регистрации и рассмотрения PDAM на WD для ISO / IEC 10646-1 / Amd. 31, ПОПРАВКА 31: Тибетское расширение , 1998-10-28 | ||||
L2 / 99-010 | N1903 (pdf , html , doc ) | Умамахесваран, ВС (1998-12-30), «8.1.4 и 11.2», Протокол заседания РГ 2 № 35, Лондон, Великобритания; 1998-09-21-25 | ||||
L2 / 99-079.2 | N1977R | ПРОЕКТ ирландских комментариев к SC 2 N 3212 , 1999-01-19 | ||||
L2 / 99-079.1 | N1979R | Комментарии Китая к SC 2 N 3212 , 1999-01-27 | ||||
N1977 | Комментарии Китая к ISO / IEC 10646-1 / PDAM 31: Tibetan Extension , 1999-01-27 | |||||
L2 / 99-079 | Резюме голосования по SC 2 N 3212, бюллетень PDAM по WD для ISO / IEC 10646-1 / Amd. 31: Tibetan Extension , 12 февраля 1999 г. | |||||
N2022 | Патерсон, Брюс (1999-04-05), FPDAM 31 Text - Tibetan Extensions | |||||
L2 / 99-111 | Текст для бюллетеня FPDAM ISO / IEC 10646, Amd. 31 - Тибетские расширения , 1999-04-06 | |||||
L2 / 99-232 | N2003 | Умамахесваран, VS (1999-08-03), "6.1.5 PDAM31 - Tibetan Extensions", Протокол заседания 36 РГ 2, Фукуока, Япония, 1999-03-09-15 | ||||
L2 / 99-256 | N2070 | Резюме голосования по SC 2 N 3310, ISO 10646-1 / FPDAM 31 - Тибетское расширение , 1999-08-19 | ||||
L2 / 99-307 | N2129 | Патерсон, Брюс (1999-09-20), Отчет о рассмотрении комментариев к SC 2 N 3310, ISO / IEC 10646-1 / FPDAM 31, AMD. 31: Тибетское расширение | ||||
L2 / 99-308 | N2130 | Патерсон, Брюс (1999-10-01), пересмотренный текст для голосования FDAM ISO / IEC 10646-1 / FDAM 31, - AMD. 31: Тибетское расширение | ||||
L2 / 99-352 | N2130R | ISO 10646-1, Amd. # 31 - Тибетский с правильными таблицами кодов , 1999-11-01 | ||||
L2 / 99-361 | Эверсон, Майкл (1999-11-09), Исправленный текст для ISO / IEC 10646-1 / FDAM 31 - Тибетское расширение | |||||
L2 / 00-010 | N2103 | Умамахесваран, ВС (2000-01-05), "6.4.6", Протокол 37-го заседания РГ 2, Копенгаген, Дания: 1999-09-13-16 | ||||
L2 / 00-071 | Таблица ответов на ISO / IEC 10646-1: 1993 / FDAM 31: Tibetan Extensions , 2000-03-02 | |||||
4.1 | U + 0FD0..0FD1 | 2 | L2 / 04-007 | N2694 | Эверсон, Майкл; Финн, Кристофер (30 декабря 2003 г.), Предложение о кодировании двух бутанских знаков для Дзонгкхи в UCS | |
5.1 | U + 0F6B..0F6C | 2 | L2 / 05-338 | N3010 | Уэст, Эндрю (2005-10-25), Комментарии к N2985 - Бэлцьские тибетские дополнения | |
L2 / 05-279 | Мур, Лиза (2005-11-10), "Tibetan (C.7)", UTC # 105 минут | |||||
N2953 (pdf , doc ) | Умамахесваран, ВС (2006-02-16), «7.4.13», неподтвержденный протокол собрания 47 РГ 2, София Антиполис, Франция; 2005-09-12 / 15 | |||||
L2 / 06-231 | Мур, Лиза (17 августа 2006 г.), "Сценарии - тибетские символы для Бэлць", UTC # 108 минут | |||||
N3153 (pdf , doc ) | Умамахесваран, ВС (2007-02-16), «M49.4», неподтвержденный протокол собрания WG 2 49 AIST, Акихабара, Токио, Япония; 2006-09-25 / 29 | |||||
L2 / 06-324R2 | Мур, Лиза (29 ноября 2006 г.), "Consensus 109-C2", UTC # 109 минут | |||||
L2 / 05-244 | N2985 | Эверсон, Майкл (2009-09-04), Предложение добавить четыре тибетских символа для Балти в BMP UCS | ||||
U + 0FCE | 1 | L2 / 05-345R | N3011 | Уэст, Эндрю (2005-10-24), Предложение о кодировании одного тибетского астрологического символа | ||
L2 / 05-279 | Мур, Лиза (2005-11-10), "Tibetan (C.7)", UTC # 105 минут | |||||
N3103 (pdf , doc ) | Умамахесваран, ВС (25 августа 2006 г.), «M48.20a», неподтвержденный протокол собрания 48 РГ 2, Маунтин-Вью, Калифорния, США; 2006-04-24 / 27 | |||||
U + 0FD2..0FD4 | 3 | L2 / 05-346 | N3012 | Уэст, Эндрю (2005-10-24), Предложение о кодировании трех архаичных тибетских символов | ||
L2 / 05-347 | Финн, Кристофер (2005-10-27), Комментарии к: N3012 - Предложение о кодировании трех архаичных тибетских символов | |||||
L2 / 05-364 | Финн, Кристофер (2005-11-03), Re: Новые тибетские предложения | |||||
L2 / 05-279 | Мур, Лиза (2005-11-10), "Tibetan (C.7)", UTC # 105 минут | |||||
L2 / 06-043 | N3032 | Уэст, Эндрю (30 января 2006 г.), Предложение закодировать один тибетский знак препинания | ||||
L2 / 06-044 | N3033 | Уэст, Эндрю (30 января 2006 г.), Предложение о кодировании двух архаичных тибетских знаков препинания | ||||
L2 / 06-008R2 | Мур, Лиза (13 февраля 2006 г.), "C.13", UTC # 106 Минуты | |||||
N3103 (pdf , doc ) | Умамахесваран, ВС (25 августа 2006 г.), «M48.20b, M48.20c», неподтвержденный протокол собрания 48 РГ 2, Маунтин-Вью, Калифорния, США; 2006-04-24 / 27 | |||||
N3153 (pdf , doc ) | Umamaheswaran, VS (2007-02-16), "M49.1e", неподтвержденный протокол собрания WG 2 49 AIST, Акихабара, Токио, Япония; 2006-09-25 / 29 | |||||
L2 / 08-317 | Мюллер, Эрик (2008-08-11), "1.8", Отчет Подкомитета Южной Азии | |||||
L2 / 08-253R2 | Мур, Лиза (2008-08-19), "Vedic (B.15.2, E.1)", UTC # 116 минут | |||||
5.2 | U + 0FD5..0FD8 | 4 | N3353 (pdf , doc ) | Умамахесваран, ВС (2007-10-10), «M51.19», неподтвержденный протокол встречи WG 2 51, Ханчжоу, Китай; 2007-04-24 / 27 | ||
L2 / 07-148 | N3268 | Эверсон, Майкл; Финн, Кристофер; Шарф, Питер; Уэст, Эндрю (2007-05-09), Предложение закодировать четырех религиозных персонажей в тибетском блоке | ||||
L2 / 07-118R2 | Мур, Лиза (2007-05-23), "Consensus 111-C19", UTC # 111 Минуты | |||||
L2 / 09-060 | N3537 | Лата, Сваран (2008-10-14), Предложение добавить специальную аннотацию для Индии в правую сторону Свасти. | ||||
L2 / 08-379 | Suignard, Michel (2008-10-21), "Ireland T5", Размещение комментариев к SC2 N 3989 (текст PDAM для поправки 6 к ISO / IEC 10646: 2003) | |||||
6.0 | U + 0F8C..0F8F | 4 | L2 / 09-032 | N3568 | Уэст, Эндрю; Финн, Кристофер (24 января 2009 г.), Предложение о кодировании четырех тибетско-санскритских букв, используемых в текстах Калачакры | |
L2 / 09-003R | Мур, Лиза (2009-02-12), "B.15.11", UTC # 118 / L2 # 215 Минуты | |||||
L2 / 09-234 | N3603 (pdf , doc ) | Умамахесваран, VS (2009-07-08), "M54.13d", неподтвержденный протокол собрания РГ 2 54 | ||||
U + 0FD9..0FDA | 2 | L2 / 09-033 | N3569 | Уэст, Эндрю (24 января 2009 г.), Предложение о кодировании двух тибетских аннотационных знаков | ||
L2 / 09-003R | Мур, Лиза (2009-02-12), "B.15.11", UTC # 118 / L2 # 215 Минуты | |||||
L2 / 09-234 | N3603 (pdf , doc ) | Умамахесваран, VS (2009-07-08), "M54.13e", неподтвержденный протокол собрания WG 2 54 | ||||
|
Ссылки [ править ]
- ^ "База данных символов Юникода" . Стандарт Юникода . Проверено 9 июля 2016 .
- ^ «Нумерованные версии стандарта Unicode» . Стандарт Юникода . Проверено 9 июля 2016 .
- ^ a b c «Дополнение к Unicode 1.0.1» (PDF) . Стандарт Юникода . 1992-11-03 . Проверено 9 июля 2016 .
- ^ Каплан, Майкл (2007-08-28). «У каждого персонажа есть история № 29: U + 1000 ^ H ^ H ^ H ^ H0f40, (ТИБЕТСКОЕ или МЬЯНМАРСКОЕ ПИСЬМО KA, в зависимости от того, когда вы спросите)» . Разбираемся со всем .
- Китайская проблема, представленная Консорциуму Unicode со ссылкой на конъюнктивный символ «སྐྤྵ ྴ ྍ ྐ» (EWTS s + k + p + Sh + sh + x + ka; IAST skpṣśxka ), демонстрирует сложность кодирования. (Кодировка деванагари никогда не позволяла соединять « ᳵ », т. Е. «स्क्प्ष्श्ᳵ्क» не существует.)