В вычислении , символ Unicode является Unicode символ , который не является частью сценария , используемого для написания естественного языка, но тем не менее , для использования в качестве части текста.
Многие символы взяты из существующих наборов символов или стандартов ISO или других национальных и международных стандартов. Стандарт Unicode гласит, что «вселенная символов богата и неограниченна». [1] Это делает вопрос о том, какие символы кодировать и как символы должны кодироваться, более сложен, чем проблемы, связанные с системами письма. Unicode фокусируется на символах, которые имеют смысл в одномерном текстовом контексте. Например, типичное двумерное расположение символов электронных диаграмм оправдывает их исключение. [2] ( Символы в виде прямоугольников являются частичным исключением для устаревших целей, и некоторые символы электронных схем действительно закодированы в Unicode's Miscellaneous Technicalблок.) Для адекватной обработки в виде обычного текста символы также должны отображаться в монохромной обстановке. Даже с этими ограничениями - монохроматическими, одномерными и основанными на стандартах - область потенциальных символов Unicode обширна. (Однако смайлики - идеограммы , графические символы - которые были допущены в Unicode, допускают цвета, хотя цвета не стандартизированы.)
Список блоков символов [ править ]
В Unicode 13.0, [3] [4] 143 859 символов, включая следующие блоки символов:
- Буквенно-цифровые варианты (на основе латинских символов в Unicode )
- Символы валюты (U + 20A0 – U + 20CF)
- Общая пунктуация (U + 2000 – U + 206F)
- Буквоподобные символы (U + 2100 – U + 214F)
- Числовые формы (U + 2150 – U + 218F)
- Фонетические символы (в том числе IPA) (различные блоки)
- Верхние и нижние индексы (U + 2070 – U + 209F)
- Закрытые варианты
- Прилагаемое буквенно-цифровое приложение (1F100–1F1FF)
- Закрытые буквенно-цифровые символы (U + 2460 – U + 24FF)
- Прилагаемое идеографическое приложение (1F200–1F2FF)
- Стрелки
- Стрелки (U + 2190 – U + 21FF)
- Дингбатские стрелки (U + 2794 – U + 27BF)
- Разные символы и стрелки (U + 2B00 – U + 2BFF)
- Дополнительные стрелки-A (U + 27F0 – U + 27FF)
- Дополнительные стрелки-B (U + 2900 – U + 297F)
- Дополнительные стрелки-C (U + 1F800-U + 1F8FF)
- Математический
- Математические буквенно-цифровые символы (U + 1D400 – U + 1D7FF)
- Математические операторы (U + 2200 – U + 22FF)
- Разные математические символы-A (U + 27C0 – U + 27EF)
- Разные математические символы-B (U + 2980 – U + 29FF)
- Расширенные символы и пиктограммы-A (U + 1FA70–1FAFF)
- Дополнительные математические операторы (U + 2A00 – U + 2AFF)
- Технический
- Контрольные изображения (U + 2400 – U + 243F)
- Разное техническое (U + 2300 – U + 23FF)
- Оптическое распознавание символов (U + 2440 – U + 245F)
- Музыкальный
- Древнегреческая музыкальная нотация (U + 1D200 – U + 1D24F)
- Византийские музыкальные символы (U + 1D000 – U + 1D0FF)
- Музыкальные символы (U + 1D100 – U + 1D1FF)
- Игры
- Шахматные символы (U + 1FA00–1FA6F)
- Плитки домино (U + 1F030 – U + 1F09F)
- Плитки для маджонга (U + 1F000 – U + 1F02F)
- Игральные карты (U + 1F0A0 – U + 1F0FF)
- Эмодзи и смайлики
- Дингбаты (U + 2700 – U + 27BF)
- Смайлики (U + 1F600 – U + 1F64F)
- Разные символы (U + 2600 – U + 26FF)
- Разные символы и пиктограммы (U + 1F300 – U + 1F5FF)
- Дополнительные символы и пиктограммы (U + 1F900–1F9FF)
- Расширенные символы и пиктограммы-A
- Транспортные и картографические символы (U + 1F680..U + 1F6FF)
- Дополнительные смайлики можно найти в следующих блоках Unicode: Стрелки , Basic латинского , КИЕ символы и знаки , Ограждённые Буквенно - Доплата , Вложенные буквы и цифры , закрываемая КАЯ буквы и месяцы , закрываемый Идеографическое Дополнение , Общая ПУНКТУАЦИЯ , геометрические фигуры , геометрические фигуры Extended , Latin- 1 Приложение , буквенные символы , плитки для маджонга , разные символы и стрелки , разная техника , игральные карты, и дополнительные стрелки-B .
- Разнообразный
- Алхимические символы (1F700–1F77F)
- Арабские математические алфавитные символы (1EE00–1EEFF)
- Блочные элементы (U + 2580 – U + 259F)
- Чертеж коробки (U + 2500 – U + 257F)
- Совместимость с CJK (U + 3300–33FF)
- Комбинирование диакритических знаков для символов (U + 20D0 – U + 20FF)
- Общие индийские числовые формы (U + A830 – A83F)
- Числа на счетных стержнях (U + 1D360–1D37F)
- Прилагаемые буквы и месяцы CJK (U + 3200–32FF)
- Геометрические формы (U + 25A0 – U + 25FF)
- Расширенные геометрические формы (U + 1F780-U + 1F7FF)
- Индийские числа сиак (U + 1EC70–1ECBF)
- Цифры майя (U + 1D2E0–1D2FF)
- Разные символы и стрелки (U + 2B00 – U + 2BFF)
- Декоративные дингбаты (U + 1F650-U + 1F67F)
- Османские числа сиак (U + 1ED00–1ED4F)
- Религиозные и политические символы (различные блоки)
- Цифровые символы Руми (U + 10E60–10E7F)
- Дополнительная пунктуация (U + 2E00–2E7F)
- Символы для устаревших вычислений (U + 1FB00–1FBFF)
- Символы Тай Сюань Цзин (U + 1D300–1D35F)
- Символы гексаграммы Ицзин (U + 4DC0–4DFF)
См. Также [ править ]
- Специальные символы
- Персонажи универсального набора символов
Ссылки [ править ]
- ^ «Раздел 22: Символы» (PDF) . Стандарт Юникода . Консорциум Unicode. Март 2020.
- ^ «Раздел 22: Разное техническое» (PDF) . Стандарт Юникода . Консорциум Unicode. Март 2020.
- ^ "База данных символов Юникода" . Стандарт Юникода . Проверено 15 марта 2020 .
- ^ «Нумерованные версии стандарта Unicode» . Стандарт Юникода . Проверено 15 марта 2020 .
Внешние ссылки [ править ]
- Таблицы кодов символов Unicode
- Проект технического отчета по Unicode № 25: Поддержка Unicode в математике
- shapecatcher.com - поиск персонажей путем их наброска.