Тибетский (блок Unicode)

тибетский
Классифицировать	U + 0F00..U + 0FFF (256 кодовых точек)
Самолет	BMP
Скрипты	Тибетский (207 символов) Обычный (4 символа)
Основные алфавиты	Тибетский дзонгка
Назначенный	211 кодовых точек
Неиспользованный	45 зарезервированных кодовых точек 2 устарели
История версий Unicode

2.0 (1996)	168 (+168)
3,0 (1999)	193 (+25)
4,1 (2005)	195 (+2)
5.1 (2008)	201 (+6)
5.2 (2009)	205 (+4)
6.0 (2010)	211 (+6)

Примечание : ^[1]^[2] При объединении с ISO 10646 , то оригинальный Тибетский блок был удален в Unicode 1.0.1. ^[3] Текущий блок (с новой моделью кодирования и другим диапазоном) был представлен в версии 2.0.

Тибетский - это блок Unicode, содержащий символы тибетского, дзонгкха и других языков Китая, Бутана, Непала, Монголии, северной Индии, восточного Пакистана и России.

Заблокировать [ редактировать ]

Тибетский ^[1]^[2]^[3]
Официальная таблица кодов Консорциума Unicode (PDF)

0

1

2

3

4

5

6

7

8

9

А

B

C

D

E

F

U + 0F0x

ༀ

༁

༂

༃

༄

༅

༆

༇

༈

༉

༊

་

༌
NB

།

༎

༏

U + 0F1x

༐

༑

༒

༓

༔

༕

༖

༗

༘

༙

༚

༛

༜

༝

༞

༟

U + 0F2x

༠

༡

༢

༣

༤

༥

༦

༧

༨

༩

༪

༫

༬

༭

༮

༯

U + 0F3x

༰

༱

༲

༳

༴

༵

༶

༷

༸

༹

༺

༻

༼

༽

༾

༿

U + 0F4x

ཀ

ཁ

ག

གྷ

ང

ཅ

ཆ

ཇ

ཉ

ཊ

ཋ

ཌ

ཌྷ

ཎ

ཏ

U + 0F5x

ཐ

ད

དྷ

ན

པ

ཕ

བ

བྷ

མ

ཙ

ཚ

ཛ

ཛྷ

ཝ

ཞ

ཟ

U + 0F6x

འ

ཡ

ར

ལ

ཤ

ཥ

ས

ཧ

ཨ

ཀྵ

ཪ

ཫ

ཬ

U + 0F7x

ཱ

ི

ཱ ི

ུ

ཱ ུ

ྲྀ

ཷ

ླྀ

ཹ

ེ

ཻ

ོ

ཽ

ཾ

ཿ

U + 0F8x

ྀ

ཱ ྀ

ྂ

ྃ

྄

྅

྆

྇

ྈ

ྉ

ྊ

ྋ

ྌ

ྍ

ྎ

ྏ

U + 0F9x

ྐ

ྑ

ྒ

ྒྷ

ྔ

ྕ

ྖ

ྗ

ྙ

ྚ

ྛ

ྜ

ྜྷ

ྞ

ྟ

U + 0FAx

ྠ

ྡ

ྡྷ

ྣ

ྤ

ྥ

ྦ

ྦྷ

ྨ

ྩ

ྪ

ྫ

ྫྷ

ྭ

ྮ

ྯ

U + 0FBx

ྰ

ྱ

ྲ

ླ

ྴ

ྵ

ྶ

ྷ

ྸ

ྐྵ

ྺ

ྻ

ྼ

྾

྿

U + 0FCx

࿀

࿁

࿂

࿃

࿄

࿅

࿆

࿇

࿈

࿉

࿊

࿋

࿌

࿎

࿏

U + 0FDx

࿐

࿑

࿒

࿓

࿔

࿕

࿖

࿗

࿘

࿙

࿚

U + 0FEx

U + 0FFx

Примечания

1. ^ Начиная с версии Unicode 13.0

2. ^ Серые области обозначают неназначенные кодовые точки.

3. ^ Кодовые точки Unicode U + 0F77 и U + 0F79 устарели в Unicode 5.2 и более поздних версиях.

Бывший тибетский блок [ править ]

Тибетский (Unicode 1.0.0)
Классифицировать	U + 1000..U + 104F (80 кодовых точек)
Самолет	BMP
Скрипты	тибетский
Основные алфавиты	Тибетский дзонгка
Положение дел	Удалено до выпуска Unicode 2.0.
Сейчас занят	Мьянма
История версий Unicode

1.0.0 (1991)	71 (+71)
1.0.1 (1992)	0 (-71)

Примечание . При объединении с ISO 10646 исходный тибетский блок был удален в Unicode 1.0.1. ^[3] Позднее тибетский язык был повторно представлен с новой моделью кодирования для Unicode 2.0.

Блок тибетской Unicode , является уникальным для того , был выделены в версии 1.0.0 с вирамом основанного кодирования , который был неспособен различить видимый srog мед и конъюнкт согласных правильно. ^{[примечание 1]} Эта кодировка была удалена из стандарта Unicode в версии 1.0.1 в процессе унификации с ISO 10646 для версии 1.1, ^[3]затем повторно введена в виде явной корневой / присоединенной кодировки с большим размером блока в версии 2.0. Перемещение или удаление существующих символов запрещено Политикой стабильности Unicode для всех версий, следующих за Unicode 2.0, поэтому тибетские символы, закодированные в Unicode 2.0 и всех последующих версиях, неизменяемы.

^ В большинстве индийских кодировок Unicode, хотя можно заставить систему отображать видимую халанту с помощью символа ZWS, не существует метода принудительного отображения конъюнктивного согласного, что очень важно при написании тибетского языка.

Диапазон бывшего тибетского блока Unicode 1.0.0 был занят блоком Myanmar начиная с Unicode 3.0. В Microsoft Windows , сортировки данные , относящиеся к старому тибетскому блоку были сохранены как в конце Windows XP , и удалить в Windows 2003 . ^[4]

Тибетский (Unicode 1.0.0) ^[1]^[2]
Официальная таблица кодов Консорциума Unicode (PDF)

0

1

2

3

4

5

6

7

8

9

А

B

C

D

E

F

U + 100x

ཀ

ཁ

ག

ང

ཅ

ཆ

ཇ

ཉ

ཊ

ཋ

ཌ

ཎ

ཏ

ཐ

ད

ན

U + 101x

པ

ཕ

བ

མ

ཙ

ཚ

ཛ

ཝ

ཞ

ཟ

འ

ཡ

ར

ལ

ཤ

ཥ

U + 102x

ས

ཧ

ཨ

ི

ྀ

ུ

ེ

ོ

྅

ཿ

ཾ

༽

U + 103x

༷

྾

༄

།

་

ྃ

ྂ

༔

༑

༈

༵

༼

ཻ

ཽ

U + 104x

༠

༡

༢

༣

༤

༥

༦

༧

༨

༩

༎

྄

༹

Примечания

1. ^ Начиная с версии Unicode 1.0.0. Символы отображаются с помощью соответствующих кодовых точек в Unicode 2.0 и всех последующих версиях.

2. ^ Серые области обозначают неназначенные кодовые точки.

История [ править ]

Следующие документы, связанные с Unicode, фиксируют цель и процесс определения определенных символов в тибетском блоке:

Версия	Окончательные коды ^[a]	Считать	Идентификатор UTC	L2 ID	ID WG2	Документ
2.0	U + 0F00..0F47, 0F49..0F69, 0F71..0F8B, 0F90..0F95, 0F97, 0F99..0FAD, 0FB1..0FB7, 0FB9	168		X3L2 / 92-144	N808	Лофтинг, Питер; Росс, Хью МакГрегор (13 мая 1992 г.), Комментарии к тибетскому письму
					N1095	Zhaxi, Nima, Предложение по кодированию тибетского сценария на BMP
					N1185	Предложение по кодированию тибетского письма на BMP по ISO / IEC 10646
					N1159	Новое сводное тибетское предложение , 1995-03-10
					N1192	Резюме заявки, тибетский , 1995-03-28
					N1203	Умамахесваран, ВС; Ксар, Майк (1995-05-03), "РЕЗОЛЮЦИЯ M27.22", неподтвержденный протокол 27-го заседания SC2 / WG2, Женева
			UTC / 1995-029			Эверсон, Майкл , Набор тибетских символов для обмена информацией (кодовая таблица)
			UTC / 1995-024B			Лофтинг, Питер (1995-05-31), Обновленная таблица тибетских кодов (U + xx00 - U + xxFF)
			UTC / 1995-xxx			«Тибетское предложение и отчет Специального комитета», заседание Технического комитета Unicode № 65, протокол , 1995-06-02
					N1227	Андерсон, Ллойд (1995-06-21), тибетец, 10646 г.
					N1238	Предложение по кодированию тибетского письма в BMP , 1995-06-24
				X3L2 / 95-090	N1253 (doc , txt )	Умамахесваран, ВС; Ксар, Майк (1995-09-09), «6.4.5», неподтвержденный протокол заседания № 28 РГ 2 в Хельсинки, Финляндия; 1995-06-26-27
					N1263	Эверсон, Майкл (1995-09-18), О сложности имен тибетских персонажей
					N1538	Таблица ответов и отзывов о поправке 6 - тибетский , 1997-01-29
				L2 / 97-126	N1562	Патерсон, Брюс (1997-05-27), Проект отчета по бюллетеням JTC1 по бюллетеням DAM № 6 по ISO / IEC 10646-1 (тибетский)
					N1571	Патерсон, Брюс (1997-06-23), почти окончательный текст - DAM 6 - тибетский
				L2 / 97-288	N1603	Умамахесваран, ВС (1997-10-24), "5.3.2", неподтвержденный протокол заседания, РГ 2, заседание № 33, Ираклион, Крит, Греция, 20 июня - 4 июля 1997 г.
					N1739	Патерсон, Брюс (1998-05-06), Отчет о дефектах AMD 6 - тибетский
				L2 / 99-010	N1903 (pdf , html , doc )	Умамахесваран, ВС (1998-12-30), "11.2", Протокол заседания РГ 2 № 35, Лондон, Великобритания; 1998-09-21-25
				L2 / 01-301		Уистлер, Кен (2001-08-01), "Трехчастные тибетские гласные знаки с а-чунг", Анализ устаревания символов в стандарте Unicode
				L2 / 03-267		Дафф, Тони ( 18 августа 2003 г.), комментарии к выпуску № 12 публичного обзора (конечная пунктуация)
				L2 / 03-268		Финн, Кристофер (18 августа 2003 г.), Unicode Tibetan [объяснение Unicode на тибетском языке]
				L2 / 05-073		Фрейтаг, Асмус; Финн, Кристофер (2005-02-09), Основные правила нарушения линии для тибетцев, дзонгкха и ладакхи
				L2 / 08-287		Дэвис, Марк (4 августа 2008 г.), Выпуск № 122 для общественного обсуждения: Предложение по дополнительным устаревшим символам
				L2 / 08-304		Финн, Кристофер (2008-08-09), Tibetan Chars in PR 122
				L2 / 08-253R2		Мур, Лиза ( 19 августа 2008 г. ), «Consensus 116-C13», UTC # 116 минут , измените устаревшее свойство, удалив 0340, 0341, 17D3 и добавив 0149, 0F77, 0F79, 17A4, 2329, 232A.
				L2 / 08-328 (HTML , XLS )		Уистлер, Кен (2008-10-14), Таблица устаревания и разочарования
				L2 / 11-261R2		Мур, Лиза (2011-08-16), "Consensus 128-C6", UTC # 128 / L2 # 225 минут , измените общую категорию с "So" на "Po" ... [U + 0F14]
3.0	U + 0F6A, 0F96, 0FAE..0FB0, 0FB8, 0FBA..0FBC, 0FBE..0FCC, 0FCF	25		L2 / 98-024	N1660	Эверсон, Майкл (1997-12-08), Предложение о кодировании тибетских расширений в ISO / IEC 10646
				L2 / 98-070		Алипранд, Жанна; Винклер, Арнольд, «3.A.2. Пункт c. Tibetan Extensions», Протокол совместной встречи UTC и L2 встречи в Купертино, 25-27 февраля 1998 г.
				L2 / 98-218	N1756	Андерсон, Ллойд; Чилтон, Роберт; Дафф, Тони; Эверсон, Майкл; Финн, Кристофер; Макгоуэн, Рик; Сирлин, Сэм; Уистлер, Кен; Умаков, Валерий (1998-05-27), Предложение по тибетскому расширению UCS
				L2 / 98-286	N1703	Умамахесваран, ВС; Ксар, Майк (1998-07-02), «8.8», неподтвержденный протокол собрания, РГ 2, собрание № 34, Редмонд, Вашингтон, США; 1998-03-16-20
				L2 / 98-281R (pdf , html )		Алипранд, Джоан (1998-07-31), «Расширенный тибетский язык (IV.D.1.a)», неподтвержденные протоколы - UTC № 77 и NCITS подгруппа L2 № 174 СОВМЕСТНОЕ ВСТРЕЧА, Редмонд, Вашингтон - 29-31 июля, 1998 г.
					N1864	Комментарии к программе N1756 - Tibetan Extensions , 1998-09-17
				L2 / 98-330	N1921	Предложение о разделении на JTC 1.02.18.01 для Поправки 31: Тибетское расширение ISO / IEC 10646-1 , 1998-10-28
				L2 / 98-331	N1922	Комбинированный бюллетень регистрации и рассмотрения PDAM на WD для ISO / IEC 10646-1 / Amd. 31, ПОПРАВКА 31: Тибетское расширение , 1998-10-28
				L2 / 99-010	N1903 (pdf , html , doc )	Умамахесваран, ВС (1998-12-30), «8.1.4 и 11.2», Протокол заседания РГ 2 № 35, Лондон, Великобритания; 1998-09-21-25
				L2 / 99-079.2	N1977R	ПРОЕКТ ирландских комментариев к SC 2 N 3212 , 1999-01-19
				L2 / 99-079.1	N1979R	Комментарии Китая к SC 2 N 3212 , 1999-01-27
					N1977	Комментарии Китая к ISO / IEC 10646-1 / PDAM 31: Tibetan Extension , 1999-01-27
				L2 / 99-079		Резюме голосования по SC 2 N 3212, бюллетень PDAM по WD для ISO / IEC 10646-1 / Amd. 31: Tibetan Extension , 12 февраля 1999 г.
					N2022	Патерсон, Брюс (1999-04-05), FPDAM 31 Text - Tibetan Extensions
				L2 / 99-111		Текст для бюллетеня FPDAM ISO / IEC 10646, Amd. 31 - Тибетские расширения , 1999-04-06
				L2 / 99-232	N2003	Умамахесваран, VS (1999-08-03), "6.1.5 PDAM31 - Tibetan Extensions", Протокол заседания 36 РГ 2, Фукуока, Япония, 1999-03-09-15
				L2 / 99-256	N2070	Резюме голосования по SC 2 N 3310, ISO 10646-1 / FPDAM 31 - Тибетское расширение , 1999-08-19
				L2 / 99-307	N2129	Патерсон, Брюс (1999-09-20), Отчет о рассмотрении комментариев к SC 2 N 3310, ISO / IEC 10646-1 / FPDAM 31, AMD. 31: Тибетское расширение
				L2 / 99-308	N2130	Патерсон, Брюс (1999-10-01), пересмотренный текст для голосования FDAM ISO / IEC 10646-1 / FDAM 31, - AMD. 31: Тибетское расширение
				L2 / 99-352	N2130R	ISO 10646-1, Amd. # 31 - Тибетский с правильными таблицами кодов , 1999-11-01
				L2 / 99-361		Эверсон, Майкл (1999-11-09), Исправленный текст для ISO / IEC 10646-1 / FDAM 31 - Тибетское расширение
				L2 / 00-010	N2103	Умамахесваран, ВС (2000-01-05), "6.4.6", Протокол 37-го заседания РГ 2, Копенгаген, Дания: 1999-09-13-16
				L2 / 00-071		Таблица ответов на ISO / IEC 10646-1: 1993 / FDAM 31: Tibetan Extensions , 2000-03-02
4.1	U + 0FD0..0FD1	2		L2 / 04-007	N2694	Эверсон, Майкл; Финн, Кристофер (30 декабря 2003 г.), Предложение о кодировании двух бутанских знаков для Дзонгкхи в UCS
5.1	U + 0F6B..0F6C	2		L2 / 05-338	N3010	Уэст, Эндрю (2005-10-25), Комментарии к N2985 - Бэлцьские тибетские дополнения
				L2 / 05-279		Мур, Лиза (2005-11-10), "Tibetan (C.7)", UTC # 105 минут
					N2953 (pdf , doc )	Умамахесваран, ВС (2006-02-16), «7.4.13», неподтвержденный протокол собрания 47 РГ 2, София Антиполис, Франция; 2005-09-12 / 15
				L2 / 06-231		Мур, Лиза (17 августа 2006 г.), "Сценарии - тибетские символы для Бэлць", UTC # 108 минут
					N3153 (pdf , doc )	Умамахесваран, ВС (2007-02-16), «M49.4», неподтвержденный протокол собрания WG 2 49 AIST, Акихабара, Токио, Япония; 2006-09-25 / 29
				L2 / 06-324R2		Мур, Лиза (29 ноября 2006 г.), "Consensus 109-C2", UTC # 109 минут
				L2 / 05-244	N2985	Эверсон, Майкл (2009-09-04), Предложение добавить четыре тибетских символа для Балти в BMP UCS
	U + 0FCE	1		L2 / 05-345R	N3011	Уэст, Эндрю (2005-10-24), Предложение о кодировании одного тибетского астрологического символа
				L2 / 05-279		Мур, Лиза (2005-11-10), "Tibetan (C.7)", UTC # 105 минут
					N3103 (pdf , doc )	Умамахесваран, ВС (25 августа 2006 г.), «M48.20a», неподтвержденный протокол собрания 48 РГ 2, Маунтин-Вью, Калифорния, США; 2006-04-24 / 27
	U + 0FD2..0FD4	3		L2 / 05-346	N3012	Уэст, Эндрю (2005-10-24), Предложение о кодировании трех архаичных тибетских символов
				L2 / 05-347		Финн, Кристофер (2005-10-27), Комментарии к: N3012 - Предложение о кодировании трех архаичных тибетских символов
				L2 / 05-364		Финн, Кристофер (2005-11-03), Re: Новые тибетские предложения
				L2 / 05-279		Мур, Лиза (2005-11-10), "Tibetan (C.7)", UTC # 105 минут
				L2 / 06-043	N3032	Уэст, Эндрю (30 января 2006 г.), Предложение закодировать один тибетский знак препинания
				L2 / 06-044	N3033	Уэст, Эндрю (30 января 2006 г.), Предложение о кодировании двух архаичных тибетских знаков препинания
				L2 / 06-008R2		Мур, Лиза (13 февраля 2006 г.), "C.13", UTC # 106 Минуты
					N3103 (pdf , doc )	Умамахесваран, ВС (25 августа 2006 г.), «M48.20b, M48.20c», неподтвержденный протокол собрания 48 РГ 2, Маунтин-Вью, Калифорния, США; 2006-04-24 / 27
					N3153 (pdf , doc )	Umamaheswaran, VS (2007-02-16), "M49.1e", неподтвержденный протокол собрания WG 2 49 AIST, Акихабара, Токио, Япония; 2006-09-25 / 29
				L2 / 08-317		Мюллер, Эрик (2008-08-11), "1.8", Отчет Подкомитета Южной Азии
				L2 / 08-253R2		Мур, Лиза (2008-08-19), "Vedic (B.15.2, E.1)", UTC # 116 минут
5.2	U + 0FD5..0FD8	4			N3353 (pdf , doc )	Умамахесваран, ВС (2007-10-10), «M51.19», неподтвержденный протокол встречи WG 2 51, Ханчжоу, Китай; 2007-04-24 / 27
				L2 / 07-148	N3268	Эверсон, Майкл; Финн, Кристофер; Шарф, Питер; Уэст, Эндрю (2007-05-09), Предложение закодировать четырех религиозных персонажей в тибетском блоке
				L2 / 07-118R2		Мур, Лиза (2007-05-23), "Consensus 111-C19", UTC # 111 Минуты
				L2 / 09-060	N3537	Лата, Сваран (2008-10-14), Предложение добавить специальную аннотацию для Индии в правую сторону Свасти.
				L2 / 08-379		Suignard, Michel (2008-10-21), "Ireland T5", Размещение комментариев к SC2 N 3989 (текст PDAM для поправки 6 к ISO / IEC 10646: 2003)
6.0	U + 0F8C..0F8F	4		L2 / 09-032	N3568	Уэст, Эндрю; Финн, Кристофер (24 января 2009 г.), Предложение о кодировании четырех тибетско-санскритских букв, используемых в текстах Калачакры
				L2 / 09-003R		Мур, Лиза (2009-02-12), "B.15.11", UTC # 118 / L2 # 215 Минуты
				L2 / 09-234	N3603 (pdf , doc )	Умамахесваран, VS (2009-07-08), "M54.13d", неподтвержденный протокол собрания РГ 2 54
	U + 0FD9..0FDA	2		L2 / 09-033	N3569	Уэст, Эндрю (24 января 2009 г.), Предложение о кодировании двух тибетских аннотационных знаков
				L2 / 09-003R		Мур, Лиза (2009-02-12), "B.15.11", UTC # 118 / L2 # 215 Минуты
				L2 / 09-234	N3603 (pdf , doc )	Умамахесваран, VS (2009-07-08), "M54.13e", неподтвержденный протокол собрания WG 2 54
^ Предлагаемые кодовые точки и имена символов могут отличаться от окончательных кодовых точек и имен.

Ссылки [ править ]

^ "База данных символов Юникода" . Стандарт Юникода . Проверено 9 июля 2016 .
^ «Нумерованные версии стандарта Unicode» . Стандарт Юникода . Проверено 9 июля 2016 .
^ a b c «Дополнение к Unicode 1.0.1» (PDF) . Стандарт Юникода . 1992-11-03 . Проверено 9 июля 2016 .
^ Каплан, Майкл (2007-08-28). «У каждого персонажа есть история № 29: U + 1000 ^ H ^ H ^ H ^ H0f40, (ТИБЕТСКОЕ или МЬЯНМАРСКОЕ ПИСЬМО KA, в зависимости от того, когда вы спросите)» . Разбираемся со всем .

Китайская проблема, представленная Консорциуму Unicode со ссылкой на конъюнктивный символ «སྐྤྵ ྴ ྍ ྐ» (EWTS s + k + p + Sh + sh + x + ka; IAST skpṣśxka ), демонстрирует сложность кодирования. (Кодировка деванагари никогда не позволяла соединять « ᳵ », т. Е. «स्क्प्ष्श्ᳵ्क» не существует.)

[4] В большинстве индийских кодировок Unicode, хотя можно заставить систему отображать видимую халанту с помощью символа ZWS, не существует метода принудительного отображения конъюнктивного согласного, что очень важно при написании тибетского языка.

[final-6] Предлагаемые кодовые точки и имена символов могут отличаться от окончательных кодовых точек и имен.

[1] "База данных символов Юникода" . Стандарт Юникода . Проверено 9 июля 2016 .

[2] «Нумерованные версии стандарта Unicode» . Стандарт Юникода . Проверено 9 июля 2016 .

[1.0.1notice-3] «Дополнение к Unicode 1.0.1» (PDF) . Стандарт Юникода . 1992-11-03 . Проверено 9 июля 2016 .

[5] Каплан, Майкл (2007-08-28). «У каждого персонажа есть история № 29: U + 1000 ^ H ^ H ^ H ^ H0f40, (ТИБЕТСКОЕ или МЬЯНМАРСКОЕ ПИСЬМО KA, в зависимости от того, когда вы спросите)» . Разбираемся со всем .

[1]