Из Википедии, бесплатной энциклопедии
  (Перенаправлено со специальных символов )
Перейти к навигации Перейти к поиску
Юникод логотип

Это список Unicode символов ; имеется 143 859 символов, с Unicode 13.0, охватывающих 154 современных и исторических сценария , а также несколько наборов символов. Поскольку технически невозможно перечислить все эти символы на одной странице Википедии, этот список ограничен подмножеством наиболее важных символов для англоязычных читателей со ссылками на другие страницы, на которых перечислены дополнительные символы. Эта статья включает 1062 символа в подмножестве многоязычного европейского набора символов 2 ( MES-2 ), а также некоторые дополнительные связанные символы.

Обзор ссылок на персонажей [ править ]

HTML или XML ссылка числового символа относится к символу , по его универсальному характеру Set / Unicode код точка , и использует формат

&#нннн;

или же

&#xхххх;

где nnnn - это кодовая точка в десятичной форме, а hhhh - это кодовая точка в шестнадцатеричной форме. В XML-документах x должен быть в нижнем регистре. Нннн или хххх может быть любое количество цифр и может включать в себя ведущие нули. В hhhh могут смешиваться прописные и строчные буквы, хотя прописные буквы являются обычным стилем.

Напротив, ссылка на символьный объект ссылается на символ по имени объекта, который имеет желаемый символ в качестве замещающего текста . Сущность должна быть либо предопределена (встроена в язык разметки), либо явно объявлена ​​в определении типа документа (DTD). Формат такой же, как и для любой ссылки на сущность:

&название;

где name - это имя объекта с учетом регистра. Точка с запятой обязательна.

Коды управления [ править ]

65 символов, включая DEL . Все принадлежат общему сценарию.

Сноски:

1 Control-C обычно используется как клавиша «прерывания» или «прерывания».
2 Control-D использовался для обозначения «конца файла» для текста, набранного на терминале в системах Unix / Linux. Windows, DOS и старые мини-компьютеры использовали для этой цели Control-Z.
3 Control-G - это артефакт тех времен, когда использовались телетайпы . О важных сообщениях можно было сообщить, ударив в колокол на телетайпе. Это было перенесено на ПК путем создания гудящего звука.
4 Перевод строки используется для «конца строки» в текстовых файлах в системах Unix / Linux.
5 Возврат каретки (сопровождаемый переводом строки) используется как символ конца строки в Windows, DOS и большинстве мини-компьютеров, кроме систем на базе Unix / Linux.
6 Control-O был клавишей «сбросить вывод» на миникомпьютерах. Вывод не отправляется на терминал, а отбрасывается, пока не будет набран еще один Control-o.
7 Control-Q использовался, чтобы указать главному компьютеру возобновить отправку вывода после того, как он был остановлен Control-S.
8 Control-S используется для указания главному компьютеру отложить отправку вывода на терминал. Вывод приостанавливается до тех пор, пока не будет перезапущен клавишей Control-Q.
9 Control-U изначально использовался компьютерами Digital Equipment Corporation для отмены строки набранного текста. Другие производители использовали для этого Control-X.
10 Control-X обычно использовался для отмены строки ввода, введенной на терминале.
11 Control-Z обычно используется на миникомпьютерах, системах Windows и DOS для обозначения «конца файла» на терминале или в текстовом файле. Системы Unix / Linux используют Control-D для обозначения конца файла на терминале.

Латинский шрифт [ править ]

Стандарт Unicode (версия 13.0) классифицирует 1374 символа как принадлежащие к латинскому сценарию.

Базовая латынь [ править ]

95 символов; 52 символа алфавита относятся к латинскому письму. Остальные 43 относятся к общему сценарию.
33 символа, классифицируемые как знаки препинания и символы ASCII , также иногда называют специальными символами ASCII . Дополнительные "специальные символы" см. В § Дополнение к Latin-1 и § Символы Юникода . В паролях можно использовать определенные специальные символы; некоторые организации требуют их использования. См. Список специальных символов для паролей .

Приложение Latin-1 [ править ]

96 символов; 62 буквы и два порядковых указателя принадлежат латинице. Остальные 32 относятся к общему сценарию.

Расширенная латиница-A [ править ]

128 символов; все принадлежат латинице.

Расширенная латиница-B [ править ]

208 символов; все принадлежат латинице; 33 в подмножестве MES-2.

Расширенный латинский дополнительный [ править ]

256 символов; все принадлежат латинице; 23 в подмножестве MES-2. Об остальном см. Дополнительная латинская расширенная (блок Unicode) .

Дополнительная расширенная латиница [ править ]

  • Расширенная латиница-C (блок Unicode)
  • Расширенная латиница-D (блок Unicode)
  • Расширенная латиница-E (блок Unicode)

Фонетические сценарии [ править ]

Расширения IPA [ править ]

96 символов; все принадлежат латинице; три в подмножестве MES-2. Об остальном см. Расширения IPA (блок Unicode) .

Буквы-модификаторы интервала [ править ]

80 символов; 15 в подмножестве MES-2.

Фонетические расширения [ править ]

  • Фонетические расширения (блок Unicode)
  • Дополнение о фонетических расширениях (блок Unicode)

Объединение знаков [ править ]

  • Объединение диакритических знаков (блок Unicode)
  • Расширенное объединение диакритических знаков (блок Unicode)
  • Объединение половинных знаков (блок Unicode)
  • Дополнение для комбинирования диакритических знаков (блок Unicode)
  • Объединение диакритических знаков для символов (блок Unicode)

Греческий и коптский [ править ]

144 кодовых точки; 135 присвоенных символов; 85 в подмножестве MES-2.

Греческий расширенный [ править ]

Для политонной орфографии . 256 кодовых точек; 233 назначенных символа, все в подмножестве MES-2 (# 670 - 902).

Кириллица [ править ]

256 символов; 191 в подмножестве MES-2.

Кириллица [ править ]

  • Дополнение кириллицы (блок Unicode)
  • Cyrillic Extended-A (блок Unicode)
  • Кириллица расширенная-B (блок Unicode)
  • Кириллица расширенная-C (блок Unicode)

Армянский [ править ]

  • Армянский (блок Unicode)

Семитские языки [ править ]

  • Арабское письмо в Юникоде , включая персидский алфавит , алфавит Джави и др.
  • Юникод и HTML для еврейского алфавита
  • Mandaic (блок Unicode)
  • Самаритянин (блок Unicode)
  • Сирийский (блок Unicode)
  • Дополнение к сирийскому языку (блок Unicode)

Тхана [ править ]

  • Тана (блок Unicode)

Брахмические (индийские) скрипты [ править ]

В диапазоне от U + 0900 до U + 0DFF включает деванагари , бенгальский сценарий , Гурмухи , гуджаратский сценарий , Одиа алфавит , тамильский сценарий , телугу~d сценарий , каннаду сценарий , малаялам сценарий и сингальском сценарий .

  • Деванагари в Юникоде
  • Бенгальский (блок Unicode)
  • Гурмукхи (блок Unicode)
  • Гуджарати (блок Unicode)
  • Ория (блок Unicode)
  • Тамильский (блок Unicode)
  • Тамильское приложение (блок Unicode)
  • Телугу (блок Unicode)
  • Каннада (блок Unicode)
  • Малаялам (блок Unicode)
  • Сингальский (блок Unicode)
  • Сингальские архаические числа (блок Unicode)

Другие брахмические и индийские скрипты в Юникоде включают:

  • Ахом (блок Unicode)
  • Балийский (блок Unicode)
  • Батак (блок Unicode)
  • Бхайкуки (блок Unicode)
  • Брахми (блок Unicode)
  • Бухид (блок Unicode)
  • Бугийский (блок Unicode)
  • Чакма (блок Unicode)
  • Чам (блок Unicode)
  • Общие индийские числовые формы (блок Unicode)
  • Dives Akuru (блок Unicode)
  • Догра (блок Unicode)
  • Grantha (блок Unicode)
  • Gunjala Gondi (блок Unicode)
  • Хануноо (блок Unicode)
  • Яванский (блок Unicode)
  • Kaithi (блок Unicode)
  • Кхмерский (блок Unicode)
  • Кхмерские символы (блок Unicode)
  • Хойки (блок Unicode)
  • Худавади (блок Unicode)
  • Лаосский (блок Unicode)
  • Лепча (блок Unicode)
  • Лимбу (блок Unicode)
  • Махаджани (блок Unicode)
  • Макасар (блок Unicode)
  • Марчен (блок Unicode)
  • Митей Майек (блок Unicode)
  • Расширения Meetei Mayek (блок Unicode)
  • Моди (блок Unicode)
  • Мултани (блок Unicode)
  • Мьянма (блок Unicode)
  • New Tai Lue (блок Unicode)
  • Newa (блок Unicode)
  • Ol Chiki (блок Unicode)
  • Phags-pa (блок Unicode)
  • Rejang (блок Unicode)
  • Саураштра (блок Unicode)
  • Шарада (блок Unicode)
  • Сиддхам (блок Unicode)
  • Сунданский (блок Unicode)
  • Дополнение сунданского языка (блок Unicode)
  • Силоти Нагри (блок Unicode)
  • Тагальский (блок Unicode)
  • Тагбанва (блок Unicode)
  • Тай Ле (блок Unicode)
  • Тай Тхам (блок Unicode)
  • Тай Вьет (блок Unicode)
  • Такри (блок Unicode)
  • Тайский (блок Unicode)
  • Тибетский (блок Unicode)
  • Тирхута (блок Unicode)

Другие системы письма Южной и Центральной Азии [ править ]

  • Масарам Гонди (блок Unicode)
  • Mro (блок Unicode)
  • Сора Сомпенг (блок Unicode)
  • Warang Citi (блок Unicode)

Грузинский [ править ]

  • Грузинский (блок Unicode)
  • Грузинский расширенный (блок Unicode)
  • Приложение на грузинском языке (блок Unicode)

Африканские шрифты [ править ]

  • Адлам (блок Unicode)
  • Бамум (блок Unicode)
  • Дополнение Bamum (блок Unicode)
  • Басса Вах (блок Unicode)
  • Геэз / эфиопское письмо
  • Медефайдрин (блок Unicode)
  • Mende Kikakui (блок Unicode)
  • NKo (блок Unicode)
  • Османья (блок Unicode)
  • Османские числа сиак (блок Unicode)
  • Тифинаг (блок Unicode)
  • Вай (блок Unicode)

Американские сценарии [ править ]

  • Чероки (блок Unicode)
  • Дополнение Cherokee (блок Unicode)
  • Дезерет (блок Unicode)
  • Осейдж (блок Unicode)
  • Единая слоговая система канадских аборигенов (блок Unicode)
  • Единая расширенная слоговая речь канадских аборигенов (блок Unicode)

Монгольский [ править ]

  • Монгольский (блок Unicode)
  • Монгольское приложение (блок Unicode)

Символы Юникода [ править ]

Общая пунктуация [ править ]

112 кодовых точек; 111 присвоенных символов; 24 в подмножестве MES-2.

Верхние и нижние индексы [ править ]

Символы валюты [ править ]

Буквоподобные символы [ править ]

Числовые формы [ править ]

Стрелки [ править ]

  • Разные символы и стрелки (блок Unicode)
  • Дополнительные стрелки-A (блок Unicode)
  • Дополнительные стрелки-B (блок Unicode)
  • Дополнительные стрелки-C (блок Unicode)

Математические символы [ править ]

  • Дополнительные математические операторы (блок Unicode)
  • Разные математические символы-A (блок Unicode)
  • Разные математические символы-B (блок Unicode)
  • Математические буквенно-цифровые символы: математические буквенно-цифровые символы (блок Unicode)

Разное техническое [ править ]

Оптическое распознавание символов [ править ]

  • Оптическое распознавание символов (блок Unicode)

Заключенные буквенно-цифровые символы [ править ]

Рисунок коробки [ править ]

Блокировать элементы [ править ]

Геометрические фигуры [ править ]

Разные символы [ править ]

Символы для устаревших вычислений [ править ]

Дингбаты [ править ]

  • Дингбат

Восточноазиатские системы письма [ править ]

  • Bopomofo (блок Unicode)
  • Bopomofo Extended (блок Unicode)
  • Единые иероглифы CJK
  • Дополнение CJK Radicals (блок Unicode)
  • CJK Strokes (блок Unicode)
  • Символы и знаки препинания CJK (блок Unicode)
  • Подсчет цифр на стержнях (блок Unicode)
  • Закрытое буквенно-цифровое дополнение (блок Unicode)
  • Закрытые буквы и месяцы CJK (блок Unicode)
  • Закрытое идеографическое дополнение (блок Unicode)
  • Формы половинной и полной ширины (блок Unicode)
  • Хангыль в Юникоде
  • Хирагана (блок Unicode)
  • Символы идеографического описания (блок Unicode)
  • Идеографические символы и знаки препинания (блок Unicode)
  • Канбун (блок Unicode)
  • Kangxi Radicals (блок Unicode)
  • Катакана (блок Unicode)
  • Kana Extended-A (блок Unicode)
  • Дополнение кана (блок Unicode)
  • Фонетические расширения катаканы (блок Unicode)
  • Киданьский маленький шрифт (блок Unicode)
  • Лису (блок Unicode)
  • Приложение Lisu (блок Unicode)
  • Мяо (блок Unicode)
  • Тональные буквы модификатора (блок Unicode)
  • Нушу (блок Unicode)
  • Nyiakeng Puachue Hmong (блок Unicode)
  • Варианты малой формы (блок Unicode)
  • Маленькое расширение кана (блок Unicode)
  • Символы Тай Сюань Цзин (блок Unicode)
  • Тангутский (блок Unicode)
  • Компоненты Tangut (блок Unicode)
  • Дополнение Tangut (блок Unicode)
  • Вертикальные формы (блок Unicode)
  • Ванчо (блок Unicode)
  • Yi Syllables (блок Unicode)
  • Yi Radicals (блок Unicode)
  • Символы гексаграммы Ицзин (блок Unicode)

Системы письма Юго-Восточной Азии [ править ]

  • Ханифи Рохинджа (блок Unicode)
  • Кая Ли (блок Unicode)
  • Pahawh Hmong (блок Unicode)
  • Пау Цин Хау (блок Unicode)
  • Митей Майек (блок Unicode)

Алфавитные формы представления [ править ]

Древние и исторические сценарии [ править ]

  • Эгейские числа (блок Unicode)
  • Анатолийские иероглифы (блок Unicode)
  • Древнегреческие числа (блок Unicode)
  • Древние символы (блок Unicode)
  • Авестийский (блок Unicode)
  • Кариан (блок Unicode)
  • Кавказский албанский (блок Unicode)
  • Хорезмиан (блок Unicode)
  • Клинопись (блок Unicode)
  • Клинописные числа и знаки препинания (блок Unicode)
  • Кипрское слоговое письмо (блок Unicode)
  • Раннединастическая клинопись (блок Unicode)
  • Элементы управления форматом египетских иероглифов (блок Unicode)
  • Египетские иероглифы (блок Unicode)
  • Эльбасан (блок Unicode)
  • Elymaic (блок Unicode)
  • Глаголица (блок Unicode)
  • Глаголица (блок Unicode)
  • Готический (блок Unicode)
  • Хатран (блок Unicode)
  • Императорский арамейский (блок Unicode)
  • Индийские числа сиак (блок Unicode)
  • Пехлеви с надписью (блок Unicode)
  • Начертательный парфянский (блок Unicode)
  • Kharoshthi (блок Unicode)
  • Линейное письмо A (блок Unicode)
  • Идеограммы линейного письма B (блок Unicode)
  • Линейное письмо B (блок Unicode)
  • Ликийский (блок Unicode)
  • Lydian (блок Unicode)
  • Манихейский (блок Unicode)
  • Цифры майя (блок Unicode)
  • Мероитский курсив (блок Unicode)
  • Мероитские иероглифы (блок Unicode)
  • Набатейский (блок Unicode)
  • Нандинагари (блок Unicode)
  • Огам (блок Unicode)
  • Старый венгерский (блок Unicode)
  • Старый курсив (блок Unicode)
  • Старый северноаравийский (блок Unicode)
  • Старый пермик (блок Unicode)
  • Староперсидский (блок Unicode)
  • Старосогдийский (блок Unicode)
  • Старый южноаравийский (блок Unicode)
  • Старотюркский (блок Unicode)
  • Пальмирена (блок Unicode)
  • Фестский диск (блок Unicode)
  • Финикийский (блок Unicode)
  • Псалтырь Пехлевий (блок Unicode)
  • Рунический (блок Unicode)
  • Согдийский (блок Unicode)
  • Соёмбо (блок Unicode)
  • Угаритский (блок Unicode)
  • Езиды (блок Unicode)
  • Площадь Занабазар (блок Unicode)

Шавиан [ править ]

  • Шавиан (блок Unicode)

Системы обозначения [ править ]

Шрифт Брайля [ править ]

  • Шаблоны Брайля (блок Unicode)

Музыка [ править ]

  • Западные музыкальные символы (блок Unicode)
  • Византийские музыкальные символы (блок Unicode)
  • Древнегреческая музыкальная нотация (блок Unicode)

Сокращение [ править ]

  • Дуплоян (блок Unicode)
  • Элементы управления сокращенным форматом (блок Unicode)

Sutton SignWriting [ править ]

  • Sutton SignWriting: Sutton SignWriting (блок Unicode)

Emoji [ править ]

  • Эмодзи в Юникоде

Алхимические символы [ править ]

  • Алхимические символы (блок Unicode)

Игровые символы [ править ]

  • Шахматные символы (блок Unicode)
  • Плитки домино (блок Unicode)
  • Плитки маджонга (блок Unicode)
  • Играя в карты

Особые области и символы формата [ править ]

  • Контрольные изображения (блок Unicode)
  • Зоны частного использования
    • Область частного использования (блок Unicode)
    • Дополнительное частное использование Area-A (блок Unicode)
    • Дополнительное частное использование Area-B (блок Unicode)
  • Специальные (блок Unicode)
  • Суррогаты
    • Низкие суррогаты (блок Unicode)
    • Высокие суррогаты (блок Unicode)
    • Суррогаты с высоким уровнем частного использования (блок Unicode)
  • Теги (блок Unicode)
  • Селекторы вариаций
    • Селекторы вариаций (блок Unicode)
    • Дополнение к селекторам вариаций (блок Unicode)

См. Также [ править ]

  • Сравнение кодировок Unicode
  • Бесплатное программное обеспечение шрифтов Unicode
  • GNU Unifont
  • Список радикалов Unicode
  • Список шрифтов Unicode
  • Список гарнитур
  • Типографская единица
  • Консорциум Unicode
  • Резервный шрифт Unicode
  • Шрифт Unicode
  • Персонажи универсального набора символов

Ссылки [ править ]

  1. ^ Не рекомендуется,начиная сверсии Unicode 5.2.0 [1] "U + 0149 Строчная латинская буква n, перед которой стоит апостроф, была закодирована для использования в африкаансе. Этот символ устарел, и его использование настоятельно не рекомендуется. Почти во всех случаях он лучше представлен последовательностью апострофа, за которым следует «n» ». [2] стр. 208
  • Таблицы кодов символов Unicode 7.0 , Unicode, Inc.
  • CWA 13873: 2000 - Многоязычные европейские подмножества в ISO / IEC 10646-1 Соглашение о семинаре CEN 13873
  • Обоснование многоязычного европейского набора символов 2 (MES-2) , Маркус Кун , 1998 г.

Внешние ссылки [ править ]

  • Официальный веб-сайт Консорциума Unicode (английский)
  • decodeunicode.org Unicode-Wiki с изображениями всех 98 884 графических символов Юникода (немецкий / английский, полнотекстовый поиск )
  • Буквы с диакритическими знаками, сгруппированные по алфавиту , Pinyin.info
  • Таблица кодировки UTF-8 и символы Unicode
  • Удалить Special | Конкретные символы из текстовой строки.
  • Таблица символов Unicode®