Общая пунктуация | |
---|---|
Классифицировать | U + 2000..U + 206F (112 кодовых точек) |
Самолет | BMP |
Скрипты | Обычный (109 знаков) Унаследовано (2 знака) |
Наборы символов | Знаки пунктуации Пробелы управления формата |
Назначенный | 111 кодовых точек |
Неиспользованный | 1 зарезервированный код 6 устарел |
История версий Unicode | |
1.0.0 (1991) | 67 (+67) |
1.1 (1993) | 76 (+9) |
3,0 (1999) | 83 (+7) |
3,2 (2002) | 95 (+12) |
4.0 (2003) | 97 (+2) |
4,1 (2005) | 106 (+9) |
5.1 (2008) | 107 (+1) |
6.3 (2013) | 111 (+4) |
Примечание : [1] [2] |
Общие знаки пунктуации - это блок Unicode, содержащий знаки пунктуации, пробелы и форматирования для использования со всеми скриптами и системами письма. Включены пробелы определенной ширины , форматы соединения, направленные форматы, умные кавычки , устаревшие и новые знаки препинания, такие как межблочный переход , и невидимые математические операторы.
Дополнительные символы пунктуации находятся в блоке Supplemental Punctuation и добавлены в десятки других блоков Unicode.
Заблокировать [ редактировать ]
Знаки пунктуации [1] [2] [3] Официальная таблица кодов Консорциума Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | B | C | D | E | F | |
U + 200x | NQ SP | MQ SP | EN SP | EM SP | 3 / М СП | 4 / М СП | 6 / М СП | F SP | P SP | TH SP | H SP | ZW SP | ZW NJ | ZW J | LRM | RLM |
U + 201x | - | NB - | - | - | - | - | ‖ | ‗ | ' | ' | ‚ | ‛ | « | ” | „ | ‟ |
U + 202x | † | ‡ | • | ‣ | ․ | ‥ | … | ‧ | L СЕН | P СЕН | ЖРД | RLE | МРО | RLO | ННБ СП | |
U + 203x | ‰ | ‱ | ′ | ″ | ‴ | ‵ | ‶ | ‷ | ‸ | ‹ | › | ※ | ‼ | ‽ | ‾ | ‿ |
U + 204x | ⁀ | ⁁ | ⁂ | ⁃ | ⁄ | ⁅ | ⁆ | ⁇ | ⁈ | ⁉ | ⁊ | ⁋ | ⁌ | ⁍ | ⁎ | ⁏ |
U + 205x | ⁐ | ⁑ | ⁒ | ⁓ | ⁔ | ⁕ | ⁖ | ⁗ | ⁘ | ⁙ | ⁚ | ⁛ | ⁜ | ⁝ | ⁞ | ММ SP |
U + 206x | WJ | ƒ () | × | , | + | LRI | RLI | FSI | PDI | Я СС | С.С. | Я AFS | AFS | NA DS | НЕТ DS | |
Ноты
|
Некоторые символы в этом блоке обычно не отображаются с помощью непосредственно видимого глифа. Десять символов пробельных U + 2002 через U + 200B (фиксированные ен или 1 / 2 ет, ет, 1 / 3 ют, 1 / 4 ет, 1 / 6 ет, рис и знаки пунктуация пространства , переменное тонкие или 1 / 5 ет и волосы пространство , фиксированное нулевой ширина пространства ) и U + 205F ( математика средний или 2 /9 em) различаются шириной по горизонтали, в то время как U + 2000 и U + 2001 (enиem quad) фактически являются псевдонимами U + 2002 и U + 2003 соответственно; еще два, U + 202F и U + 2060 (некорректное объединениеслов) являются вариантами U + 2009 или U + 2004 и U + 200B, которые запрещают перенос строки. Три нулевой ширины символов U + 200B через U + 200D (пространство, не-столярныеистолярные) отличаются темкак они влияютлигированиеи формирование соседних буквтаких какконтекстные формына арабском. Одиннадцать невидимых символов U + 200E, U + 200F (знакислева направоисправа налево), U + 202A - U + 202E (вставки, всплывающиеи переопределяет ) и от U + 2066 до U + 2069 ( изолирует ) управляет направленностью текста, если разметка более высокого уровня не переопределяет их. В U + 2028 и U + 2029 есть явные разделители строк и абзацев .
Emoji [ править ]
Этот раздел содержит смайлики или смайлы Unicode . Без надлежащей поддержки рендеринга вы можете увидеть вопросительные знаки, квадраты или другие символы вместо предполагаемых символов. |
Блок общей пунктуации содержит два эмодзи : U + 203C и U + 2049. [3] [4]
Блок имеет четыре стандартизированных варианта, определенных для указания стиля эмодзи (U + FE0F VS16) или текстового представления (U + FE0E VS15) для двух эмодзи, оба из которых по умолчанию представляют собой текстовое представление. [5]
U + | 203C | 2049 г. |
базовая кодовая точка | ‼ | ⁉ |
база + VS15 (текст) | ‼ ︎ | ⁉︎ |
база + VS16 (смайлики) | ‼ ️ | ⁉️ |
История [ править ]
Следующие документы, относящиеся к Unicode, фиксируют цель и процесс определения определенных символов в блоке General Punctuation:
Версия | Окончательные коды [a] | Считать | Идентификатор UTC | L2 ID | ID WG2 | Документ |
---|---|---|---|---|---|---|
1.0.0 | U + 2000..202E, 2030..203E, 2040..2044 | 67 | (быть определенным) | |||
L2 / 11-438 [b] [c] | N4182 | Эдберг, Питер (2011-12-22), Последовательности вариаций эмодзи (редакция L2 / 11-429) | ||||
L2 / 17-086 | Бердж, Джереми ; и другие. (2017-03-27), Добавить ZWJ, VS-16, колпачки клавиш и теги в Emoji_Component | |||||
L2 / 17-103 | Мур, Лиза (2017-05-18), "E.1.7 Добавить ZWJ, VS-16, колпачки клавиш и теги в Emoji_Component", UTC # 151 Минуты | |||||
1.1 | U + 203F, 2045..2046 | 3 | (быть определенным) | |||
U + 206A..206F | 6 | (быть определенным) | ||||
UTC / 1992-xxx | Фрейтаг, Асмус (1992-05-12), "К. Биди", неподтвержденный протокол собрания UTC № 52, 8 мая 1992 г., в Xerox | |||||
L2 / 01-275 | Дэвис, Марк (16 июля 2001 г.), New Properties (ReservedForCf, Deprecated, Discouraged) | |||||
L2 / 01-301 | Уистлер, Кен (2001-08-01), «Элементы управления альтернативным форматом, унаследованные от 10646», Анализ устаревания символов в стандарте Unicode | |||||
L2 / 01-326 | Дэвис, Марк (15 августа 2001 г.), Новые свойства: Reserved_Cf_Code_Point & Deprecated | |||||
L2 / 01-295R | Мур, Лиза (2001-11-06), "Движение 88-M13", протокол встречи UTC / L2 # 88 | |||||
3.0 | U + 202F, 2048..2049 | 3 | L2 / 97-288 | N1603 | Умамахесваран, ВС (1997-10-24), "8.18", неподтвержденный протокол заседания, РГ 2, заседание № 33, Ираклион, Крит, Греция, 20 июня - 4 июля 1997 г. | |
L2 / 98-088 | N1711 | Рабочее совещание по монгольскому кодированию с участием представителей Китая и Монголии , 15 февраля 1998 г. | ||||
L2 / 98-104 | N1734 | Уистлер, Кен (1998-03-20), Комментарии к предложению по монгольскому кодированию, WG2 N1711 | ||||
L2 / 98-252 (pdf , txt ) | N1833RM (pdf , doc ) | Мур, Ричард (1998-05-04), Отзыв на комментарии Кена Уистлера о монгольской кодировке: N 1734 | ||||
L2 / 98-251 (pdf , html , txt ) | N1808 (pdf , doc ) | Ответ на «Предложение WG2 N1734», поднятый на встрече в Сиэтле по поводу «Proposal WG2 N1711» , 1998-07-09 | ||||
L2 / 98-281R (pdf , html ) | Алипранд, Джоан (1998-07-31), "Монгольский (IV.A)", неподтвержденные протоколы - UTC № 77 и NCITS подгруппа L2 № 174 СОВМЕСТНОЕ ВСТРЕЧА, Редмонд, Вашингтон - 29-31 июля 1998 г. | |||||
N1862 | Редакция N1711 - Монгольский , 1998-09-17 | |||||
N1865 | Позиция США - монгольский (N1711, N1734 и N1808) , 1998-09-18 | |||||
N1918 | Патерсон, Брюс (1998-10-28), Текст для комбинированного регистрационного и учетного бюллетеня PDAM - SC2 N 3208 | |||||
L2 / 99-010 | N1903 (pdf , html , doc ) | Умамахесваран, ВС (1998-12-30), «8.1.3», Протокол заседания РГ 2 35, Лондон, Великобритания; 1998-09-21-25 | ||||
L2 / 99-075.1 | N1973 | Комментарии ирландцев к SC 2 N 3208 , 1999-01-19 | ||||
L2 / 99-075 | N1972 (pdf , html , doc ) | Резюме голосования по SC 2 N 3208, бюллетень PDAM по WD для ISO / IEC 10646-1 / Amd. 29: монгольский , 1999-02-12 | ||||
N2020 | Патерсон, Брюс (1999-04-05), FPDAM 29 Текст - монгольский | |||||
L2 / 99-113 | Текст для бюллетеня FPDAM ISO / IEC 10646, Amd. 29 - Монгольский , 1999-04-06 | |||||
L2 / 99-232 | N2003 | Умамахесваран, ВС (1999-08-03), "6.1.3 PDAM29 - Монгольский сценарий", Протокол заседания 36 РГ 2, Фукуока, Япония, 1999-03-09-15 | ||||
L2 / 99-304 | N2126 | Патерсон, Брюс (1999-10-01), пересмотренный текст бюллетеня FDAM ISO / IEC 10646-1 / FDAM 29, ПОПРАВКА 29: монгольский | ||||
L2 / 99-381 | Окончательный текст ISO / IEC 10646-1, FDAM 29 - монгольский , 1999-12-07 | |||||
L2 / 00-010 | N2103 | Умамахесваран, ВС (2000-01-05), "6.4.4", Протокол 37-го заседания РГ 2, Копенгаген, Дания: 1999-09-13-16 | ||||
L2 / 07-209 | Уистлер, Кен (2007-07-05), UTR 14 и U + 202F УЗКОЕ БЕЗПРЕРЫВНОЕ ПРОСТРАНСТВО | |||||
L2 / 11-438 [b] [c] | N4182 | Эдберг, Питер (2011-12-22), Последовательности вариаций эмодзи (редакция L2 / 11-429) | ||||
L2 / 15-187 | Мур, Лиза (11 августа 2015 г.), "B.14.5", UTC # 144 Минуты | |||||
L2 / 16-258 | N4752R2 | Экк, Грег (2016-09-19), Монгольские базовые формы, позиционные формы и варианты форм | ||||
L2 / 16-259 | N4753 | Эк, Грег; Рилеке, Орлог Оу (20.09.2016), WG2 # 65, Монгольские вопросы для обсуждения | ||||
L2 / 16-266 | N4763 | Андерсон, Дебора; Уистлер, Кен; Макгоуэн, Рик; Пурнадер, Рузбех; Гласс, Андрей; Янку, Лауреньиу; Мур, Лиза (2016-09-26), «1. Монгольский», комментарии к монгольским, малым киданьским и другим документам WG2 # 65 | ||||
L2 / 16-297 | N4769 | Андерсон, Дебора (2016-10-27), специальный доклад по Монголии | ||||
U + 204A | 1 | L2 / 98-214 | N1747 | Эверсон, Майкл (1998-05-25), Сокращение персонажей для UCS | ||
L2 / 98-281R (pdf , html ) | Алипранд, Джоан (1998-07-31), «Персонажи из ISO 5426-2 (IV.C.5-6)», неподтвержденные минуты - UTC # 77 и NCITS подгруппа L2 # 174 СОВМЕСТНОЕ ВСТРЕЧА, Редмонд, Вашингтон - июль 29-31, 1998 г. | |||||
L2 / 98-292R (pdf , html , рисунок 1 ) | «2.6», комментарии к предложениям по добавлению символов из стандартов ISO, разработанных ISO / TC 46 / SC 4 , 1998-08-19 | |||||
L2 / 98-292 | N1840 | «2.6», комментарии к предложениям по добавлению символов из стандартов ISO, разработанных ISO / TC 46 / SC 4 , 1998-08-25 | ||||
L2 / 98-301 | N1847 | Эверсон, Майкл (1998-09-12), Responses to NCITS / L2 и Unicode Consortium комментирует многочисленные предложения | ||||
L2 / 98-372 | N1884R2 (pdf , doc ) | Уистлер, Кен; и другие. (1998-09-22), Дополнительные персонажи для UCS | ||||
L2 / 98-329 | N1920 | Комбинированный бюллетень регистрации и рассмотрения PDAM на WD для ISO / IEC 10646-1 / Amd. 30, ПОПРАВКА 30: Дополнительные латинские и другие символы , 1998-10-28 | ||||
L2 / 99-010 | N1903 (pdf , html , doc ) | Умамахесваран, ВС (1998-12-30), "8.1.5.1", Протокол заседания РГ 2 № 35, Лондон, Великобритания; 1998-09-21-25 | ||||
U + 204B..204D | 3 | L2 / 98-215 | N1748 | Эверсон, Майкл (1998-05-25), Дополнительные символы подписи для UCS | ||
L2 / 98-281R (pdf , html ) | Алипранд, Джоан (1998-07-31), «Знаки подписи (IV.C.7)», неподтвержденные протоколы - UTC № 77 и NCITS подгруппа L2 № 174 СОВМЕСТНОЕ ВСТРЕЧА, Редмонд, Вашингтон, 29-31 июля 1998 г. | |||||
L2 / 98-292R (pdf , html , рисунок 1 ) | "2.7", Комментарии к предложениям по добавлению символов из стандартов ISO, разработанных ISO / TC 46 / SC 4 , 1998-08-19 | |||||
L2 / 98-292 | N1840 | "2.7", Комментарии к предложениям по добавлению символов из стандартов ISO, разработанных ISO / TC 46 / SC 4 , 1998-08-25 | ||||
L2 / 98-301 | N1847 | Эверсон, Майкл (1998-09-12), Responses to NCITS / L2 и Unicode Consortium комментирует многочисленные предложения | ||||
L2 / 98-372 | N1884R2 (pdf , doc ) | Уистлер, Кен; и другие. (1998-09-22), Дополнительные персонажи для UCS | ||||
L2 / 98-329 | N1920 | Комбинированный бюллетень регистрации и рассмотрения PDAM на WD для ISO / IEC 10646-1 / Amd. 30, ПОПРАВКА 30: Дополнительные латинские и другие символы , 1998-10-28 | ||||
L2 / 99-010 | N1903 (pdf , html , doc ) | Умамахесваран, ВС (1998-12-30), "8.1.5.1", Протокол заседания РГ 2 № 35, Лондон, Великобритания; 1998-09-21-25 | ||||
3,2 | U + 2047, 2051 | 2 | L2 / 99-238 | Сводный документ, содержащий 6 предложений Японии , 1999-07-15 | ||
N2092 | Добавление сорока восьми символов , 1999-09-13 | |||||
L2 / 99-365 | Мур, Лиза (1999-11-23), Комментарии к предложениям JCS | |||||
L2 / 00-024 | Шибано, Коджи (2000-01-31), предложение JCS пересмотрено | |||||
L2 / 99-260R | Мур, Лиза (2000-02-07), "Предложения JCS", Протокол встречи UTC / L2 в Миссии Вьехо, 26-28 октября 1999 г. | |||||
L2 / 00-098 , L2 / 00-098-page5 | N2195 | Обоснование использования символов без кандзи, предложенное комитетом JCS , 2000-03-15 | ||||
L2 / 00-119 [д] | N2191R | Уистлер, Кен; Фрейтаг, Асмус (2000-04-19), Кодирование дополнительных математических символов в Unicode | ||||
L2 / 00-234 | N2203 (RTF , TXT ) | Умамахесваран, ВС (2000-07-21), "8.18, 8.20", Протокол заседания SC2 / WG2 в Пекине, 21.03.2000 - 24 | ||||
L2 / 00-115R2 | Мур, Лиза (2008-08-08), "Движение 83-M11", Протокол собрания № 83 по всемирному координированному времени | |||||
L2 / 00-297 | N2257 | Sato, TK (2000-09-04), символы JIS X 0213 часть-1 | ||||
L2 / 00-342 | N2278 | Сато, ТЗ; Эверсон, Майкл; Уистлер, Кен; Фрейтаг, Асмус (2000-09-20), Специальный отчет по отзывам Японии N2257 и N2258 | ||||
L2 / 01-050 | N2253 | Умамахесваран, VS (2001-01-21), «7.16 JIS X0213 Symbols», Протокол заседания SC2 / WG2 в Афинах, сентябрь 2000 г. | ||||
U + 204E..2050, 2057, 205F, 2061..2062 | 7 | L2 / 00-005R2 | Мур, Лиза (2000-02-14), "Движение 82-M11", Минуты UTC № 82 в Сан-Хосе | |||
L2 / 00-119 [д] | N2191R | Уистлер, Кен; Фрейтаг, Асмус (2000-04-19), Кодирование дополнительных математических символов в Unicode | ||||
L2 / 00-234 | N2203 (RTF , TXT ) | Умамахесваран, ВС (2000-07-21), «8.18», Протокол заседания SC2 / WG2 в Пекине, 21.03.2000 - 24 | ||||
L2 / 00-115R2 | Мур, Лиза (2008-08-08), "Движение 83-M11", Протокол собрания № 83 по всемирному координированному времени | |||||
U + 2052, 2063 | 2 | L2 / 01-142 [d] | N2336 | Битон, Барбара; Фрейтаг, Асмус; Ион, Патрик (2001-04-02), Дополнительные математические символы | ||
L2 / 01-156 | N2356 | Фрейтаг, Асмус (2001-04-03), Дополнительные математические символы (Проект 10) | ||||
L2 / 01-344 | N2353 (pdf , doc ) | Умамахесваран, VS (2001-09-09), "7.7 Mathematical Symbols", Протокол заседания № 40 SC2 / WG2 - Маунтин-Вью, апрель 2001 г. | ||||
U + 2060 | 1 | L2 / 99-260R | Мур, Лиза (2000-02-07), "Unicode в языках разметки", Протокол встречи UTC / L2 в Mission Viejo, 26-28 октября 1999 г. | |||
L2 / 00-005R2 | Мур, Лиза (2000-02-14), « Разрыв / соединение графемы с нулевой шириной», Протоколы UTC № 82 в Сан-Хосе , задание для Арнольда Винклера: Поскольку предложение о разрыве / соединении графемы нулевой ширины было отозвано, откройте заново Пункт действий 81-12 (для Марка Дэвиса подготовить предложение для WG2 по соединителю слов нулевой ширины). | |||||
L2 / 00-258 | N2235 | Дэвис, Марк (2000-08-09), Предложение о добавлении ZERO WIDTH WORD JOINER | ||||
L2 / 00-369 | Уистлер, Кен (2000-10-06), "e. (ZERO WIDTH) WORD JOINER", WG2 в Вулиагмени (Афины) | |||||
L2 / 01-050 | N2253 | Умамахесваран, В.С. (2001-01-21), "7.7 Предложение о добавлении НУЛЕВОЙ ШИРИНЫ WORDJOINER", Протокол заседания SC2 / WG2 в Афинах, сентябрь 2000 г. | ||||
4.0 | U + 2053..2054 | 2 | L2 / 02-141 | N2419 | Эверсон, Майкл; и другие. (2002-03-20), символы уральского фонетического алфавита для UCS | |
L2 / 02-192 | Эверсон, Майкл (2002-05-02), Ответ Эверсона на UPA | |||||
N2442 | Эверсон, Майкл; Kolehmainen, Erkki I .; Руппель, Клаас; Тростеруд, Тронд (21.05.2002), Обоснование размещения уральского фонетического алфавита в BMP | |||||
L2 / 02-291 | Уистлер, Кен (2002-05-31), отчет WG2 из Дублина | |||||
L2 / 02-292 | Уистлер, Кен (2002-06-03), Ранний взгляд на протокол согласия WG2 | |||||
L2 / 02-166R2 | Мур, Лиза (9 августа 2002 г.), "Сценарии и новые персонажи - УПА", UTC № 91 Минуты | |||||
L2 / 02-253 | Мур, Лиза (2002-10-21), "Consensus 92-C2", UTC # 92 Минуты | |||||
4.1 | U + 2055 | 1 | L2 / 03-151R | Констебль, Питер; Ллойд-Уильямс, Джеймс; Ллойд-Уильямс, Сью; Чоудхури, Шамсул Ислам; Али, Асаддар; Садик, Мохаммед; Чоудхури, Матиар Рахман (10 мая 2003 г.), Пересмотренное предложение по кодированию скрипта Syloti Nagri в BMP | ||
L2 / 03-136 | Мур, Лиза (18 августа 2003 г.), "Сценарии и новые персонажи - Сценарий Силоти Нагри", UTC # 95 минут | |||||
U + 2056, 2058..2059 | 3 | L2 / 03-282R | N2610R | Эверсон, Майкл; Клеминсон, Ральф (2003-09-04), Окончательное предложение по кодированию глаголицы в UCS | ||
L2 / 03-324 | N2642 | Пантелия, Мария (2003-10-06), Предложение о кодировании дополнительных греческих редакционных символов и знаков препинания в UCS | ||||
U + 205A..205C | 3 | L2 / 03-157 | Пантелия, Мария (19 мая 2003 г.), Дополнительные символы бета-кода не в Юникоде (WIP) | |||
L2 / 03-193R | N2612-7 | Пантелия, Мария (11.06.2003), Предложение о кодировании дополнительных знаков препинания в UCS | ||||
U + 205D | 1 | L2 / 02-312R | Пантелия, Мария (2002-11-07), Предложение о кодировании дополнительных греческих редакционных символов и знаков препинания в UCS | |||
L2 / 03-324 | N2642 | Пантелия, Мария (2003-10-06), Предложение о кодировании дополнительных греческих редакционных символов и знаков препинания в UCS | ||||
U + 205E | 1 | L2 / 03-354 | N2655 | Фрейтаг, Асмус (10.10.2003), Предложение - символы, используемые в словарях | ||
L2 / 03-356R2 | Мур, Лиза (2003-10-22), "Consensus 97-C15", UTC # 97 Минуты | |||||
5.1 | U + 2064 | 1 | L2 / 07-011R | N3198R | Фрейтаг, Асмус; Битон, Барбара; Ион, Патрик; Сарджент, Мюррей; Карлайл, Дэвид; Pournader, Roozbeh (2007-01-15), 29 дополнительных математических и символьных символов | |
L2 / 07-015 | Мур, Лиза (2007-02-08), «Математические символы и символы (C.4)», UTC # 110 минут | |||||
L2 / 07-268 | N3253 (pdf , doc ) | Умамахесваран, Вирджиния (2007-07-26), "M50.16", неподтвержденный протокол заседания РГ 2 50, Франкфурт-на-Майне, Германия; 2007-04-24 / 27 | ||||
6.3 | U + 2066..2069 | 4 | L2 / 12-186R | Ланин, Аарон; Дэвис, Марк; Pournader, Roozbeh (24.07.2012), Предложение для биди-изолятов в Unicode | ||
L2 / 12-290 | N4310 | Ланин, Аарон; Дэвис, Марк; Пурнадер, Рузбех (31.07.2012), Предложение о четырех персонажах для Биди | ||||
L2 / 12-239 | Мур, Лиза (14 августа 2012 г.), "Consensus 132-C12", UTC № 132 Минуты | |||||
L2 / 13-040 | Пурнадер, Рузбех; Ланин, Аарон ( 29 января 2013 г. ), Fasttracking Arabic Letter Mark (ALM) | |||||
L2 / 13-125 | N4447 | Констебль, Питер (2013-06-10), Отчет о взаимодействии по Unicode для WG2 | ||||
|
Ссылки [ править ]
- ^ "База данных символов Юникода" . Стандарт Юникода . Проверено 9 июля 2016 .
- ^ «Нумерованные версии стандарта Unicode» . Стандарт Юникода . Проверено 9 июля 2016 .
- ^ "UTR # 51: Unicode Emoji" . Консорциум Unicode. 2020-02-11.
- ^ «UCD: данные эмодзи для UTR №51» . Консорциум Unicode. 2020-01-28.
- ^ "UTS # 51 Последовательности вариаций эмодзи" . Консорциум Unicode.