Блок Unicode - это один из нескольких непрерывных диапазонов числовых кодов символов ( кодовых точек ) набора символов Unicode , которые определены Консорциумом Unicode для административных целей и документации. Обычно такие предложения, как добавление новых глифов, обсуждаются и оцениваются путем рассмотрения соответствующего блока или блоков в целом.
Каждый блок обычно, но не всегда, предназначен для предоставления глифов, используемых в одном или нескольких конкретных языках или в какой-либо общей области приложения, такой как математика , геодезия , декоративный набор текста , социальные форумы и т. Д.
Дизайн и реализация [ править ]
Блоки Unicode идентифицируются уникальными именами, которые используют только символы ASCII и обычно описывают характер символов на английском языке ; такие как «Тибетский» или «Дополнительные стрелки-А». (При сравнении имен блоков предполагается, что прописные буквы приравниваются к строчным буквам и игнорируются любые пробелы, дефисы и символы подчеркивания; таким образом, последнее имя эквивалентно «additional_arrows__a» и «SUPPLEMENTALARROWSA». [1]
Блоки попарно не пересекаются , то есть не перекрываются. Начальная кодовая точка и размер (количество кодовых точек) каждого блока всегда кратны 16; следовательно, в шестнадцатеричной системе счисления начальная (наименьшая) точка - это U + xxx 0, а конечная (наибольшая) точка - это U + yyy F, где xxx и yyy - три или более шестнадцатеричных цифр. (Эти ограничения предназначены для упрощения отображения глифов в документах Unicode Consortium в виде таблиц с 16 столбцами, помеченных последней шестнадцатеричной цифрой кодовой точки. [1] ) Размер блока может варьироваться от минимум 16 до максимум 65 536 кодовых точек.
Каждая назначенная кодовая точка имеет свойство глифа, называемое «Блок», значение которого представляет собой строку символов, обозначающую уникальный блок, которому принадлежит эта точка. [2] Однако блок может также содержать неназначенные кодовые точки, обычно зарезервированные для будущих добавлений символов, которые «логически» должны принадлежать этому блоку. Кодовые точки, не принадлежащие ни одному из названных блоков, например, в неназначенных плоскостях 3–13, имеют значение block = "No_block". [1]
Другие классификации [ править ]
Каждая точка Unicode также имеет свойство, называемое « Общая категория », которое пытается описать роль соответствующего символа в языках или приложениях, ради которых он был включен в систему. Примерами общих категорий являются «Lu» (означающая заглавные буквы), «Nd» (десятичная цифра), «Pi» (знаки препинания с открытыми кавычками) и «Mn» (знак без пробелов, т. Е. Диакритический знак для предшествующего глиф). Это разделение полностью не зависит от кодовых блоков: кодовые точки с данной общей категорией обычно охватывают множество блоков и не обязательно должны быть последовательными, даже в пределах каждого блока. [3]
Каждая кодовая точка также имеет свойство скрипта , определяющее, для какой системы письма она предназначена или предназначена ли она для нескольких систем письма. Это также не зависит от блока.
В описаниях системы Unicode блок может быть разделен на более конкретные подгруппы, такие как « Шахматные символы » в блоке « Разные символы ». Эти подгруппы не являются «блоками» в техническом смысле, используемом консорциумом Unicode, и названы только для удобства пользователей.
Список блоков [ править ]
Unicode 13.0 определяет 308 блоков: [1]
- 163 в плоскости 0, базовой многоязычной плоскости (в таблице ниже: § BMP )
- 134 в плоскости 1, дополнительная многоязычная плоскость ( § SMP )
- 6 в плоскости 2, дополнительная идеографическая плоскость ( § SIP )
- 1 в плоскости 3, третичной идеографической плоскости ( § TIP )
- 2 в плоскости 14 (E в шестнадцатеричной системе ), дополнительный самолет специального назначения ( § SSP )
- По одному в самолетах 15 (F гекс ) и 16 ( гекс 10 ), называемых Зоной дополнительного частного использования-A и -B ( § PUA-A )
Самолет | Блокировать диапазон | Имя блока | Кодовые точки [a] | Назначенные символы | Скрипты [b] [c] [d] [e] [f] |
---|---|---|---|---|---|
0 BMP | U + 0000..U + 007F | Базовая латынь [g] | 128 | 128 | Латинский (52 символа), Обычный (76 символов) |
0 BMP | U + 0080..U + 00FF | Дополнение Latin-1 [h] | 128 | 128 | Латинский (64 символа), Обычный (64 символа) |
0 BMP | U + 0100..U + 017F | Расширенная латиница-A | 128 | 128 | латинский |
0 BMP | U + 0180..U + 024F | Расширенная латиница-B | 208 | 208 | латинский |
0 BMP | U + 0250..U + 02AF | Расширения IPA | 96 | 96 | латинский |
0 BMP | U + 02B0..U + 02FF | Буквы модификатора интервала | 80 | 80 | Bopomofo (2 символа), Latin (14 символов), Common (64 символа) |
0 BMP | U + 0300..U + 036F | Объединение диакритических знаков | 112 | 112 | Унаследовано |
0 BMP | U + 0370..U + 03FF | Греческий и коптский | 144 | 135 | Коптский (14 символов), греческий (117 символов), общий (4 символа) |
0 BMP | U + 0400..U + 04FF | Кириллица | 256 | 256 | Кириллица (254 символа), Унаследованное (2 символа) |
0 BMP | U + 0500..U + 052F | Дополнение к кириллице | 48 | 48 | Кириллица |
0 BMP | U + 0530..U + 058F | Армянский | 96 | 91 | Армянский |
0 BMP | U + 0590..U + 05FF | иврит | 112 | 88 | иврит |
0 BMP | U + 0600..U + 06FF | арабский | 256 | 255 | Арабский (237 символов), Общий (6 символов), Унаследованный (12 символов) |
0 BMP | U + 0700..U + 074F | Сирийский | 80 | 77 | Сирийский |
0 BMP | U + 0750..U + 077F | Дополнение на арабском языке | 48 | 48 | арабский |
0 BMP | U + 0780..U + 07BF | Thaana | 64 | 50 | Thaana |
0 BMP | U + 07C0..U + 07FF | НКо | 64 | 62 | Nko |
0 BMP | U + 0800..U + 083F | Самаритянин | 64 | 61 | Самаритянин |
0 BMP | U + 0840..U + 085F | Мандаикский | 32 | 29 | Мандаикский |
0 BMP | U + 0860..U + 086F | Сирийское дополнение | 16 | 11 | Сирийский |
0 BMP | U + 08A0..U + 08FF | Арабский расширенный-A | 96 | 84 | Арабский (83 символа), Общий (1 символ) |
0 BMP | U + 0900..U + 097F | Деванагари | 128 | 128 | Деванагари (122 символа), Обычный (2 символа), Унаследованный (4 символа) |
0 BMP | U + 0980..U + 09FF | Бенгальский | 128 | 96 | Бенгальский |
0 BMP | U + 0A00..U + 0A7F | Гурмукхи | 128 | 80 | Гурмукхи |
0 BMP | U + 0A80..U + 0AFF | Гуджарати | 128 | 91 | Гуджарати |
0 BMP | U + 0B00..U + 0B7F | Ория | 128 | 91 | Ория |
0 BMP | U + 0B80..U + 0BFF | Тамильский | 128 | 72 | Тамильский |
0 BMP | U + 0C00..U + 0C7F | телугу | 128 | 98 | телугу |
0 BMP | U + 0C80..U + 0CFF | Каннада | 128 | 89 | Каннада |
0 BMP | U + 0D00..U + 0D7F | Малаялам | 128 | 118 | Малаялам |
0 BMP | U + 0D80..U + 0DFF | Сингальский | 128 | 91 | Сингальский |
0 BMP | U + 0E00..U + 0E7F | Тайский | 128 | 87 | Тайский (86 символов), Общий (1 символ) |
0 BMP | U + 0E80..U + 0EFF | Лаосский | 128 | 82 | Лаосский |
0 BMP | U + 0F00..U + 0FFF | тибетский | 256 | 211 | Тибетский (207 символов), Общий (4 символа) |
0 BMP | U + 1000..U + 109F | Мьянма | 160 | 160 | Мьянма |
0 BMP | U + 10A0..U + 10FF | Грузинский | 96 | 88 | Грузинский (87 символов), Общий (1 символ) |
0 BMP | U + 1100..U + 11FF | Хангыль джамо | 256 | 256 | Хангыль |
0 BMP | U + 1200..U + 137F | Эфиопский | 384 | 358 | Эфиопский |
0 BMP | U + 1380..U + 139F | Эфиопское дополнение | 32 | 26 год | Эфиопский |
0 BMP | U + 13A0..U + 13FF | Чероки | 96 | 92 | Чероки |
0 BMP | U + 1400..U + 167F | Единая слоговая речь канадских аборигенов | 640 | 640 | Канадские аборигены |
0 BMP | U + 1680..U + 169F | Огам | 32 | 29 | Огам |
0 BMP | U + 16A0..U + 16FF | Рунический | 96 | 89 | Рунический (86 символов), Обычный (3 символа) |
0 BMP | U + 1700..U + 171F | Тагальский | 32 | 20 | Тагальский |
0 BMP | U + 1720..U + 173F | Хануноо | 32 | 23 | Хануну (21 символ), Обычный (2 символа) |
0 BMP | U + 1740..U + 175F | Бухид | 32 | 20 | Бухид |
0 BMP | U + 1760..U + 177F | Tagbanwa | 32 | 18 | Tagbanwa |
0 BMP | U + 1780..U + 17FF | Кхмерский | 128 | 114 | Кхмерский |
0 BMP | U + 1800..U + 18AF | Монгольский | 176 | 157 | Монгольский (154 символа), Общий (3 символа) |
0 BMP | U + 18B0..U + 18FF | Унифицированная слоговая речь канадских аборигенов расширенная | 80 | 70 | Канадские аборигены |
0 BMP | U + 1900..U + 194F | Лимбу | 80 | 68 | Лимбу |
0 BMP | U + 1950..U + 197F | Тай Ле | 48 | 35 год | Тай Ле |
0 BMP | U + 1980..U + 19DF | Новый Тай Лю | 96 | 83 | Новый Тай Лю |
0 BMP | U + 19E0..U + 19FF | Кхмерские символы | 32 | 32 | Кхмерский |
0 BMP | U + 1A00..U + 1A1F | Бугийский | 32 | 30 | Бугийский |
0 BMP | U + 1A20..U + 1AAF | Тай Тхам | 144 | 127 | Тай Тхам |
0 BMP | U + 1AB0..U + 1AFF | Расширенное объединение диакритических знаков | 80 | 17 | Унаследовано |
0 BMP | U + 1B00..U + 1B7F | Балийский | 128 | 121 | Балийский |
0 BMP | U + 1B80..U + 1BBF | Суданский | 64 | 64 | Суданский |
0 BMP | U + 1BC0..U + 1BFF | Батак | 64 | 56 | Батак |
0 BMP | У + 1C00..U + 1C4F | Лепча | 80 | 74 | Лепча |
0 BMP | U + 1C50..U + 1C7F | Ол Чики | 48 | 48 | Ол Чики |
0 BMP | У + 1C80..U + 1C8F | Кириллица расширенная-C | 16 | 9 | Кириллица |
0 BMP | U + 1C90..U + 1CBF | Грузинский расширенный | 48 | 46 | Грузинский |
0 BMP | U + 1CC0..U + 1CCF | Сунданская добавка | 16 | 8 | Суданский |
0 BMP | U + 1CD0..U + 1CFF | Ведические расширения | 48 | 43 год | Обычный (16 символов), Унаследованный (27 символов) |
0 BMP | U + 1D00..U + 1D7F | Фонетические расширения | 128 | 128 | Кириллица (2 символа), греческий (15 символов), латинский (111 символов) |
0 BMP | U + 1D80..U + 1DBF | Дополнение к фонетическим расширениям | 64 | 64 | Греческий (1 символ), латинский (63 символа) |
0 BMP | У + 1DC0..U + 1DFF | Дополнение для комбинирования диакритических знаков | 64 | 63 | Унаследовано |
0 BMP | U + 1E00..U + 1EFF | Латинская расширенная дополнительная | 256 | 256 | латинский |
0 BMP | U + 1F00..U + 1FFF | Греческий расширенный | 256 | 233 | Греческий |
0 BMP | U + 2000..U + 206F | Общая пунктуация | 112 | 111 | Обычный (109 символов), Унаследованный (2 символа) |
0 BMP | U + 2070..U + 209F | Верхние и нижние индексы | 48 | 42 | Латинский (15 символов), Обычный (27 символов) |
0 BMP | U + 20A0..U + 20CF | Символы валюты | 48 | 32 | Общий |
0 BMP | U + 20D0..U + 20FF | Комбинирование диакритических знаков для символов | 48 | 33 | Унаследовано |
0 BMP | U + 2100..U + 214F | Буквоподобные символы | 80 | 80 | Греческий (1 символ), Латинский (4 символа), Обычный (75 символов) |
0 BMP | U + 2150..U + 218F | Числовые формы | 64 | 60 | Латинский (41 символ), Обычный (19 символов) |
0 BMP | U + 2190..U + 21FF | Стрелы | 112 | 112 | Общий |
0 BMP | U + 2200..U + 22FF | Математические операторы | 256 | 256 | Общий |
0 BMP | U + 2300..U + 23FF | Разное Техническое | 256 | 256 | Общий |
0 BMP | U + 2400..U + 243F | Контрольные изображения | 64 | 39 | Общий |
0 BMP | U + 2440..U + 245F | Оптическое распознавание символов | 32 | 11 | Общий |
0 BMP | U + 2460..U + 24FF | Вложенные буквенно-цифровые символы | 160 | 160 | Общий |
0 BMP | U + 2500..U + 257F | Рисунок Коробки | 128 | 128 | Общий |
0 BMP | U + 2580..U + 259F | Блочные элементы | 32 | 32 | Общий |
0 BMP | U + 25A0..U + 25FF | Геометрические фигуры | 96 | 96 | Общий |
0 BMP | U + 2600..U + 26FF | Разные символы | 256 | 256 | Общий |
0 BMP | U + 2700..U + 27BF | Дингбаты | 192 | 192 | Общий |
0 BMP | U + 27C0..U + 27EF | Разные математические символы-A | 48 | 48 | Общий |
0 BMP | U + 27F0..U + 27FF | Дополнительные стрелки-A | 16 | 16 | Общий |
0 BMP | U + 2800..U + 28FF | Шаблоны Брайля | 256 | 256 | Шрифт Брайля |
0 BMP | U + 2900..U + 297F | Дополнительные стрелки-B | 128 | 128 | Общий |
0 BMP | U + 2980..U + 29FF | Разные математические символы-B | 128 | 128 | Общий |
0 BMP | U + 2A00..U + 2AFF | Дополнительные математические операторы | 256 | 256 | Общий |
0 BMP | U + 2B00..U + 2BFF | Разные символы и стрелки | 256 | 253 | Общий |
0 BMP | U + 2C00..U + 2C5F | Глаголица | 96 | 94 | Глаголица |
0 BMP | У + 2C60..U + 2C7F | Расширенная латиница-C | 32 | 32 | латинский |
0 BMP | U + 2C80..U + 2CFF | Коптский | 128 | 123 | Коптский |
0 BMP | У + 2D00..U + 2D2F | Грузинская добавка | 48 | 40 | Грузинский |
0 BMP | У + 2Д30..У + 2Д7Ф | Тифинаг | 80 | 59 | Тифинаг |
0 BMP | У + 2Д80..У + 2ДДФ | Эфиопский расширенный | 96 | 79 | Эфиопский |
0 BMP | U + 2DE0..U + 2DFF | Кириллица расширенная-A | 32 | 32 | Кириллица |
0 BMP | U + 2E00..U + 2E7F | Дополнительная пунктуация | 128 | 83 | Общий |
0 BMP | U + 2E80..U + 2EFF | Дополнение CJK Radicals | 128 | 115 | Хан |
0 BMP | U + 2F00..U + 2FDF | Kangxi Radicals | 224 | 214 | Хан |
0 BMP | U + 2FF0..U + 2FFF | Символы идеографического описания | 16 | 12 | Общий |
0 BMP | U + 3000..U + 303F | Символы и знаки препинания CJK | 64 | 64 | Хан (15 символов), Хангыль (2 символа), Обычный (43 символа), Унаследованный (4 символа) |
0 BMP | U + 3040..U + 309F | Хирагана | 96 | 93 | Хирагана (89 символов), Обычный (2 символа), Унаследованный (2 символа) |
0 BMP | U + 30A0..U + 30FF | Катакана | 96 | 96 | Катакана (93 символа), Обычный (3 символа) |
0 BMP | U + 3100..U + 312F | Бопомофо | 48 | 43 год | Бопомофо |
0 BMP | U + 3130..U + 318F | Совместимость с хангыль Джамо | 96 | 94 | Хангыль |
0 BMP | U + 3190..U + 319F | Канбун | 16 | 16 | Общий |
0 BMP | U + 31A0..U + 31BF | Бопомофо расширенный | 32 | 32 | Бопомофо |
0 BMP | U + 31C0..U + 31EF | CJK инсульты | 48 | 36 | Общий |
0 BMP | U + 31F0..U + 31FF | Фонетические расширения катаканы | 16 | 16 | Катакана |
0 BMP | U + 3200..U + 32FF | Прилагаемые письма и месяцы CJK | 256 | 255 | Хангыль (62 символа), Катакана (47 символов), Общий (146 символов) |
0 BMP | U + 3300..U + 33FF | Совместимость с CJK | 256 | 256 | Катакана (88 символов), Обычный (168 символов) |
0 BMP | U + 3400..U + 4DBF | Расширение унифицированных иероглифов CJK A | 6 592 | 6 592 | Хан |
0 BMP | У + 4DC0..U + 4DFF | Символы гексаграммы Ицзин | 64 | 64 | Общий |
0 BMP | U + 4E00..U + 9FFF | Единые иероглифы CJK | 20 992 | 20 989 | Хан |
0 BMP | U + A000..U + A48F | Yi слоги | 1,168 | 1,165 | Йи |
0 BMP | U + A490..U + A4CF | Yi Radicals | 64 | 55 | Йи |
0 BMP | U + A4D0..U + A4FF | Лису | 48 | 48 | Лису |
0 BMP | U + A500..U + A63F | Вай | 320 | 300 | Вай |
0 BMP | U + A640..U + A69F | Кириллица расширенная-B | 96 | 96 | Кириллица |
0 BMP | U + A6A0..U + A6FF | Бамум | 96 | 88 | Бамум |
0 BMP | U + A700..U + A71F | Буквы тона модификатора | 32 | 32 | Общий |
0 BMP | U + A720..U + A7FF | Расширенная латиница-D | 224 | 180 | Латинский (175 символов), Обычный (5 символов) |
0 BMP | U + A800..U + A82F | Силоти Нагри | 48 | 45 | Силоти Нагри |
0 BMP | U + A830..U + A83F | Общие индийские числовые формы | 16 | 10 | Общий |
0 BMP | U + A840..U + A87F | Phags-pa | 64 | 56 | Phags Pa |
0 BMP | U + A880..U + A8DF | Саураштра | 96 | 82 | Саураштра |
0 BMP | U + A8E0..U + A8FF | Деванагари расширенный | 32 | 32 | Деванагари |
0 BMP | U + A900..U + A92F | Кая Ли | 48 | 48 | Кая Ли (47 символов), Обычный (1 символ) |
0 BMP | U + A930..U + A95F | Rejang | 48 | 37 | Rejang |
0 BMP | U + A960..U + A97F | Хангыль Джамо расширенный-А | 32 | 29 | Хангыль |
0 BMP | U + A980..U + A9DF | Яванский | 96 | 91 | Яванский (90 символов), общий (1 символ) |
0 BMP | U + A9E0..U + A9FF | Мьянма расширенный-B | 32 | 31 год | Мьянма |
0 BMP | U + AA00..U + AA5F | Чам | 96 | 83 | Чам |
0 BMP | U + AA60..U + AA7F | Мьянма Extended-A | 32 | 32 | Мьянма |
0 BMP | U + AA80..U + AADF | Тай Вьет | 96 | 72 | Тай Вьет |
0 BMP | U + AAE0..U + AAFF | Расширения Meetei Mayek | 32 | 23 | Митей Майек |
0 BMP | U + AB00..U + AB2F | Эфиопский язык Extended-A | 48 | 32 | Эфиопский |
0 BMP | U + AB30..U + AB6F | Расширенная латиница-E | 64 | 60 | Латинский (56 символов), греческий (1 символ), общий (3 символа) |
0 BMP | U + AB70..U + ABBF | Дополнение Cherokee | 80 | 80 | Чероки |
0 BMP | U + ABC0..U + ABFF | Митей Майек | 64 | 56 | Митей Майек |
0 BMP | U + AC00..U + D7AF | Слоги хангыль | 11 184 | 11 172 | Хангыль |
0 BMP | U + D7B0..U + D7FF | Хангыль Джамо расширенный-B | 80 | 72 | Хангыль |
0 BMP | U + D800..U + DB7F | Высокие суррогаты | 896 | 0 | Неизвестный |
0 BMP | U + DB80..U + DBFF | Суррогаты с высоким уровнем частного использования | 128 | 0 | Неизвестный |
0 BMP | U + DC00..U + DFFF | Низкие суррогаты | 1,024 | 0 | Неизвестный |
0 BMP | U + E000..U + F8FF | Зона частного использования | 6 400 | 6 400 | Неизвестный |
0 BMP | U + F900..U + FAFF | Идеографы совместимости CJK | 512 | 472 | Хан |
0 BMP | U + FB00..U + FB4F | Алфавитные формы представления | 80 | 58 | Армянский (5 символов), иврит (46 символов), латинский (7 символов) |
0 BMP | U + FB50..U + FDFF | Формы представления на арабском языке-A | 688 | 611 | Арабский (609 символов), Общий (2 символа) |
0 BMP | U + FE00..U + FE0F | Селекторы вариаций | 16 | 16 | Унаследовано |
0 BMP | U + FE10..U + FE1F | Вертикальные формы | 16 | 10 | Общий |
0 BMP | U + FE20..U + FE2F | Комбинирование половинных отметок | 16 | 16 | Кириллица (2 символа), Наследуется (14 символов) |
0 BMP | U + FE30..U + FE4F | Формы совместимости CJK | 32 | 32 | Общий |
0 BMP | U + FE50..U + FE6F | Варианты малой формы | 32 | 26 год | Общий |
0 BMP | U + FE70..U + FEFF | Формы представления на арабском языке-B | 144 | 141 | Арабский (140 символов), общий (1 символ) |
0 BMP | U + FF00..U + FFEF | Формы половинной и полной ширины | 240 | 225 | Хангыль (52 символа), катакана (55 символов), латиница (52 символа), общий (66 символов) |
0 BMP | U + FFF0..U + FFFF | Специальные | 16 | 5 | Общий |
1 SMP | U + 10000..U + 1007F | Слоговое письмо линейного письма B | 128 | 88 | Линейное письмо B |
1 SMP | U + 10080..U + 100FF | Идеограммы линейного письма B | 128 | 123 | Линейное письмо B |
1 SMP | U + 10100..U + 1013F | Эгейские числа | 64 | 57 | Общий |
1 SMP | U + 10140..U + 1018F | Древнегреческие числа | 80 | 79 | Греческий |
1 SMP | U + 10190..U + 101CF | Древние символы | 64 | 14 | Греческий (1 символ), Общий (13 символов) |
1 SMP | U + 101D0..U + 101FF | Фестский диск | 48 | 46 | Обычный (45 символов), Унаследованный (1 символ) |
1 SMP | U + 10280..U + 1029F | Ликийский | 32 | 29 | Ликийский |
1 SMP | U + 102A0..U + 102DF | Карийский | 64 | 49 | Карийский |
1 SMP | U + 102E0..U + 102FF | Коптские номера эпактов | 32 | 28 год | Обычный (27 символов), Унаследованный (1 символ) |
1 SMP | U + 10300..U + 1032F | Старый курсив | 48 | 39 | Старый курсив |
1 SMP | U + 10330..U + 1034F | Готика | 32 | 27 | Готика |
1 SMP | U + 10350..U + 1037F | Старая Пермь | 48 | 43 год | Старая Пермь |
1 SMP | U + 10380..U + 1039F | Угаритский | 32 | 31 год | Угаритский |
1 SMP | U + 103A0..U + 103DF | Древнеперсидский | 64 | 50 | Древнеперсидский |
1 SMP | U + 10400..U + 1044F | Deseret | 80 | 80 | Deseret |
1 SMP | U + 10450..U + 1047F | Шавиан | 48 | 48 | Шавиан |
1 SMP | U + 10480..U + 104AF | Османья | 48 | 40 | Османья |
1 SMP | U + 104B0..U + 104FF | Осейдж | 80 | 72 | Осейдж |
1 SMP | U + 10500..U + 1052F | Эльбасан | 48 | 40 | Эльбасан |
1 SMP | U + 10530..U + 1056F | Кавказский албанский | 64 | 53 | Кавказский албанский |
1 SMP | U + 10600..U + 1077F | Линейное письмо А | 384 | 341 | Линейное письмо А |
1 SMP | U + 10800..U + 1083F | Кипрская слоговая азбука | 64 | 55 | Киприот |
1 SMP | U + 10840..U + 1085F | Императорский арамейский | 32 | 31 год | Императорский арамейский |
1 SMP | U + 10860..U + 1087F | Пальмирена | 32 | 32 | Пальмирена |
1 SMP | U + 10880..U + 108AF | Набатейский | 48 | 40 | Набатейский |
1 SMP | U + 108E0..U + 108FF | Хатран | 32 | 26 год | Хатран |
1 SMP | U + 10900..U + 1091F | Финикийский | 32 | 29 | Финикийский |
1 SMP | U + 10920..U + 1093F | Лидийский | 32 | 27 | Лидийский |
1 SMP | U + 10980..U + 1099F | Мероитские иероглифы | 32 | 32 | Мероитские иероглифы |
1 SMP | U + 109A0..U + 109FF | Меройский курсив | 96 | 90 | Меройский курсив |
1 SMP | U + 10A00..U + 10A5F | Харошти | 96 | 68 | Харошти |
1 SMP | U + 10A60..U + 10A7F | Старый южноаравийский | 32 | 32 | Старый южноаравийский |
1 SMP | U + 10A80..U + 10A9F | Старый северноаравийский | 32 | 32 | Старый северноаравийский |
1 SMP | U + 10AC0..U + 10AFF | Манихейский | 64 | 51 | Манихейский |
1 SMP | U + 10B00..U + 10B3F | Авестийский | 64 | 61 | Авестийский |
1 SMP | U + 10B40..U + 10B5F | Письменный парфянский | 32 | 30 | Письменный парфянский |
1 SMP | U + 10B60..U + 10B7F | Пехлеви с надписью | 32 | 27 | Пехлеви с надписью |
1 SMP | U + 10B80..U + 10BAF | Псалтырь Пехлеви | 48 | 29 | Псалтырь Пехлеви |
1 SMP | U + 10C00..U + 10C4F | Древнетюркский | 80 | 73 | Древнетюркский |
1 SMP | U + 10C80..U + 10CFF | Старовенгерский | 128 | 108 | Старовенгерский |
1 SMP | U + 10D00..U + 10D3F | Ханифи Рохинджа | 64 | 50 | Ханифи Рохинджа |
1 SMP | U + 10E60..U + 10E7F | Цифровые символы Руми | 32 | 31 год | арабский |
1 SMP | U + 10E80..U + 10EBF | Езиды | 64 | 47 | Езиды |
1 SMP | U + 10F00..U + 10F2F | Старый согдийский | 48 | 40 | Старый согдийский |
1 SMP | U + 10F30..U + 10F6F | Согдийский | 64 | 42 | Согдийский |
1 SMP | U + 10FB0..U + 10FDF | Хорезмист | 48 | 28 год | Хорезмист |
1 SMP | U + 10FE0..U + 10FFF | Elymaic | 32 | 23 | Elymaic |
1 SMP | U + 11000..U + 1107F | Брахми | 128 | 109 | Брахми |
1 SMP | U + 11080..U + 110CF | Kaithi | 80 | 67 | Kaithi |
1 SMP | U + 110D0..U + 110FF | Сора Сомпенг | 48 | 35 год | Сора Сомпенг |
1 SMP | U + 11100..U + 1114F | Чакма | 80 | 71 | Чакма |
1 SMP | U + 11150..U + 1117F | Махаджани | 48 | 39 | Махаджани |
1 SMP | U + 11180..U + 111DF | Шарада | 96 | 96 | Шарада |
1 SMP | U + 111E0..U + 111FF | Сингальские архаические числа | 32 | 20 | Сингальский |
1 SMP | U + 11200..U + 1124F | Хойки | 80 | 62 | Хойки |
1 SMP | U + 11280..U + 112AF | Мултани | 48 | 38 | Мултани |
1 SMP | U + 112B0..U + 112FF | Худавади | 80 | 69 | Худавади |
1 SMP | U + 11300..U + 1137F | Гранта | 128 | 86 | Гранта (85 символов), Унаследовано (1 символ) |
1 SMP | U + 11400..U + 1147F | Newa | 128 | 97 | Newa |
1 SMP | U + 11480..U + 114DF | Тирхута | 96 | 82 | Тирхута |
1 SMP | U + 11580..U + 115FF | Сиддхам | 128 | 92 | Сиддхам |
1 SMP | U + 11600..U + 1165F | Моди | 96 | 79 | Моди |
1 SMP | U + 11660..U + 1167F | Монгольская добавка | 32 | 13 | Монгольский |
1 SMP | U + 11680..U + 116CF | Такри | 80 | 67 | Такри |
1 SMP | U + 11700..U + 1173F | Ахом | 64 | 58 | Ахом |
1 SMP | U + 11800..U + 1184F | Догра | 80 | 60 | Догра |
1 SMP | U + 118A0..U + 118FF | Варанг Сити | 96 | 84 | Варанг Сити |
1 SMP | U + 11900..U + 1195F | Дайвс Акуру | 96 | 72 | Дайвс Акуру |
1 SMP | U + 119A0..U + 119FF | Нандинагари | 96 | 65 | Нандинагари |
1 SMP | U + 11A00..U + 11A4F | Площадь Занабазар | 80 | 72 | Площадь Занабазар |
1 SMP | U + 11A50..U + 11AAF | Соёмбо | 96 | 83 | Соёмбо |
1 SMP | U + 11AC0..U + 11AFF | Пау Чин Хау | 64 | 57 | Пау Чин Хау |
1 SMP | U + 11C00..U + 11C6F | Bhaiksuki | 112 | 97 | Bhaiksuki |
1 SMP | U + 11C70..U + 11CBF | Марчен | 80 | 68 | Марчен |
1 SMP | U + 11D00..U + 11D5F | Масарам Гонди | 96 | 75 | Масарам Гонди |
1 SMP | U + 11D60..U + 11DAF | Гунджала Гонди | 80 | 63 | Гунджала Гонди |
1 SMP | U + 11EE0..U + 11EFF | Макасар | 32 | 25 | Макасар |
1 SMP | U + 11FB0..U + 11FBF | Дополнение Лису | 16 | 1 | Лису |
1 SMP | U + 11FC0..U + 11FFF | Дополнение на тамильском языке | 64 | 51 | Тамильский |
1 SMP | U + 12000..U + 123FF | Клинопись | 1,024 | 922 | Клинопись |
1 SMP | U + 12400..U + 1247F | Клинописные числа и знаки препинания | 128 | 116 | Клинопись |
1 SMP | U + 12480..U + 1254F | Раннединастическая клинопись | 208 | 196 | Клинопись |
1 SMP | U + 13000..U + 1342F | Египетские иероглифы | 1072 | 1,071 | Египетские иероглифы |
1 SMP | U + 13430..U + 1343F | Элементы управления форматом египетских иероглифов | 16 | 9 | Египетские иероглифы |
1 SMP | U + 14400..U + 1467F | Анатолийские иероглифы | 640 | 583 | Анатолийские иероглифы |
1 SMP | U + 16800..U + 16A3F | Бамум Дополнение | 576 | 569 | Бамум |
1 SMP | U + 16A40..U + 16A6F | Mro | 48 | 43 год | Mro |
1 SMP | U + 16AD0..U + 16AFF | Басса Вах | 48 | 36 | Басса Вах |
1 SMP | U + 16B00..U + 16B8F | Пахау Хмонг | 144 | 127 | Пахау Хмонг |
1 SMP | U + 16E40..U + 16E9F | Медефайдрин | 96 | 91 | Медефайдрин |
1 SMP | U + 16F00..U + 16F9F | Мяо | 160 | 149 | Мяо |
1 SMP | U + 16FE0..U + 16FFF | Идеографические символы и знаки препинания | 32 | 7 | Хан (2 символа), Киданьский маленький шрифт (1 символ), Нушу (1 символ), Тангут (1 символ), Общий (2 символа) |
1 SMP | U + 17000..U + 187FF | Тангутский | 6 144 | 6136 | Тангутский |
1 SMP | U + 18800..U + 18AFF | Тангутские компоненты | 768 | 768 | Тангутский |
1 SMP | U + 18B00..U + 18CFF | Киданьский маленький шрифт | 512 | 470 | Киданьский маленький шрифт |
1 SMP | U + 18D00..U + 18D8F | Тангутская добавка | 144 | 9 | Тангутский |
1 SMP | U + 1B000..U + 1B0FF | Дополнение кана | 256 | 256 | Хирагана (255 символов), Катакана (1 символ) |
1 SMP | U + 1B100..U + 1B12F | Кана Расширенная-А | 48 | 31 год | Хирагана |
1 SMP | U + 1B130..U + 1B16F | Маленькое расширение Кана | 64 | 7 | Хирагана (3 символа), Катакана (4 символа) |
1 SMP | U + 1B170..U + 1B2FF | Нушу | 400 | 396 | Нюшу |
1 SMP | U + 1BC00..U + 1BC9F | Дуплоян | 160 | 143 | Дуплоян |
1 SMP | U + 1BCA0..U + 1BCAF | Элементы управления сокращенным форматом | 16 | 4 | Общий |
1 SMP | U + 1D000..U + 1D0FF | Византийские музыкальные символы | 256 | 246 | Общий |
1 SMP | U + 1D100..U + 1D1FF | Музыкальные символы | 256 | 231 | Обычный (209 символов), Унаследованный (22 символа) |
1 SMP | U + 1D200..U + 1D24F | Древнегреческая музыкальная нотация | 80 | 70 | Греческий |
1 SMP | U + 1D2E0..U + 1D2FF | Цифры майя | 32 | 20 | Общий |
1 SMP | У + 1Д300..У + 1Д35Ф | Символы Тай Сюань Цзин | 96 | 87 | Общий |
1 SMP | U + 1D360..U + 1D37F | Счетные числа на стержнях | 32 | 25 | Общий |
1 SMP | У + 1D400..U + 1D7FF | Математические буквенно-цифровые символы | 1,024 | 996 | Общий |
1 SMP | U + 1D800..U + 1DAAF | Знак Саттона | 688 | 672 | Знак |
1 SMP | U + 1E000..U + 1E02F | Дополнение к глаголице | 48 | 38 | Глаголица |
1 SMP | U + 1E100..U + 1E14F | Nyiakeng Puachue Hmong | 80 | 71 | Nyiakeng Puachue Hmong |
1 SMP | U + 1E2C0..U + 1E2FF | Wancho | 64 | 59 | Wancho |
1 SMP | U + 1E800..U + 1E8DF | Менде Кикакуи | 224 | 213 | Менде Кикакуи |
1 SMP | U + 1E900..U + 1E95F | Адлам | 96 | 88 | Адлам |
1 SMP | U + 1EC70..U + 1ECBF | Индийские числа сияк | 80 | 68 | Общий |
1 SMP | U + 1ED00..U + 1ED4F | Османские числа Siyaq | 80 | 61 | Общий |
1 SMP | U + 1EE00..U + 1EEFF | Арабские математические алфавитные символы | 256 | 143 | арабский |
1 SMP | U + 1F000..U + 1F02F | Плитки для маджонга | 48 | 44 год | Общий |
1 SMP | U + 1F030..U + 1F09F | Домино Плитка | 112 | 100 | Общий |
1 SMP | U + 1F0A0..U + 1F0FF | Играя в карты | 96 | 82 | Общий |
1 SMP | U + 1F100..U + 1F1FF | Прилагаемое буквенно-цифровое приложение | 256 | 200 | Общий |
1 SMP | U + 1F200..U + 1F2FF | Прилагаемое идеографическое приложение | 256 | 64 | Хирагана (1 символ), Обычный (63 символа) |
1 SMP | U + 1F300..U + 1F5FF | Разные символы и пиктограммы | 768 | 768 | Общий |
1 SMP | U + 1F600..U + 1F64F | Смайлики | 80 | 80 | Общий |
1 SMP | U + 1F650..U + 1F67F | Декоративные дингбаты | 48 | 48 | Общий |
1 SMP | U + 1F680..U + 1F6FF | Транспортные и картографические символы | 128 | 114 | Общий |
1 SMP | U + 1F700..U + 1F77F | Алхимические символы | 128 | 116 | Общий |
1 SMP | U + 1F780..U + 1F7FF | Расширенные геометрические фигуры | 128 | 101 | Общий |
1 SMP | U + 1F800..U + 1F8FF | Дополнительные стрелки-C | 256 | 150 | Общий |
1 SMP | U + 1F900..U + 1F9FF | Дополнительные символы и пиктограммы | 256 | 254 | Общий |
1 SMP | U + 1FA00..U + 1FA6F | Шахматные символы | 112 | 98 | Общий |
1 SMP | U + 1FA70..U + 1FAFF | Расширенные символы и пиктограммы-A | 144 | 57 | Общий |
1 SMP | U + 1FB00..U + 1FBFF | Символы для устаревших вычислений | 256 | 212 | Общий |
2 глотка | U + 20000..U + 2A6DF | Расширение B унифицированных иероглифов CJK | 42 720 | 42 718 | Хан |
2 глотка | U + 2A700..U + 2B73F | Расширение унифицированных иероглифов CJK C | 4 160 | 4 149 | Хан |
2 глотка | U + 2B740..U + 2B81F | Расширение унифицированных иероглифов CJK D | 224 | 222 | Хан |
2 глотка | U + 2B820..U + 2CEAF | Расширение унифицированных иероглифов CJK E | 5776 | 5762 | Хан |
2 глотка | U + 2CEB0..U + 2EBEF | Расширение унифицированных иероглифов CJK F | 7 488 | 7 473 | Хан |
2 глотка | U + 2F800..U + 2FA1F | Приложение к идеографам совместимости CJK | 544 | 542 | Хан |
3 СОВЕТ | U + 30000..U + 3134F | Расширение унифицированных иероглифов CJK G | 4944 | 4939 | Хан |
14 SSP | U + E0000..U + E007F | Теги | 128 | 97 | Общий |
14 SSP | U + E0100..U + E01EF | Дополнение к селекторам вариаций | 240 | 240 | Унаследовано |
15 PUA-A | U + F0000..U + FFFFF | Зона дополнительного частного использования-A | 65 536 | 65 534 | Неизвестный |
16 PUA-B | U + 100000..U + 10FFFF | Дополнительная зона частного использования-B | 65 536 | 65 534 | Неизвестный |
|
Удаленные блоки [ править ]
Политика стабильности Unicode требует, чтобы символ, однажды назначенный, нельзя было перемещать или удалять, хотя это может быть устаревшим. Это относится к Unicode 2.0 и всем последующим версиям.
До этого были удалены следующие бывшие блоки:
Блокировать диапазон | Имя блока | Дальность теперь занята | Заменено блоком | Кодовые точки | Назначенные символы | Скрипты |
---|---|---|---|---|---|---|
U + 1000..U + 105F | Тибетский [4] | Мьянма | тибетский | 96 | 71 | тибетский |
U + 3400..U + 3D2D | Хангыль [5] | Расширение унифицированных иероглифов CJK A | Слоги хангыль | 2350 | 2350 | Хангыль |
U + 3D2E..U + 44B7 | Дополнительный хангыль-А [5] | Расширение унифицированных иероглифов CJK A | 1930 г. | 1930 г. | Хангыль | |
U + 44B8..U + 4DFF | Дополнительный хангыль-B [5] | Расширение унифицированных иероглифов CJK A | 2376 | 2376 | Хангыль | |
Символы гексаграммы Ицзин |
Ссылки [ править ]
- ^ a b c d "Файл данных блоков Unicode, версия Unicode 13.0" . Консорциум Unicode . Проверено 29 апреля 2019 .
- ^ Глоссарий Unicode
- ^ «Основные спецификации Unicode, Глава 4: Свойства символов» (PDF) . Проверено 14 марта 2020 .
- ^ «3.8: Блок-за-блок-схемы» (PDF) . Стандарт Юникода . Версия 1.0. Консорциум Unicode .
- ^ a b c «Приложение E: Имена блоков» (PDF) . Стандарт Юникода . Версия 1.1. Консорциум Unicode .
Внешние ссылки [ править ]
- Официальный веб-сайт Консорциума Unicode (английский)
Базовый | Дополнительный | ||||||||
---|---|---|---|---|---|---|---|---|---|
Самолет 0 | Самолет 1 | Самолет 2 | Самолет 3 | Самолеты 4–13 | Самолет 14 | Самолеты 15–16 | |||
0000– FFFF | 10000– 1FFFF | 20000– 2FFFF | 30000– 3FFFF | 40000– DFFFF | E0000– EFFFF | F0000– 10FFFF | |||
Базовая многоязычная плоскость | Дополнительная многоязычная плоскость | Дополнительная идеографическая плоскость | Третичная идеографическая плоскость | неназначенный | Дополнительный самолет специального назначения | Дополнительные самолеты для частного использования | |||
BMP | SMP | ГЛОТОК | СОВЕТ | - | SSP | СПУА-А / Б | |||
0000– 0FFF | 8000– 8FFF | 10000– 10FFF | 18000– 18FFF | 20000– 20FFF | 28000– 28FFF | 30000– 30FFF | E0000– E0FFF | 15: SPUA-A |