Из Википедии, свободной энциклопедии
  (Перенаправлено из общей пунктуации (блок Unicode) )
Перейти к навигации Перейти к поиску

Общие знаки пунктуации - это блок Unicode, содержащий знаки пунктуации, пробелы и форматирования для использования со всеми скриптами и системами письма. Включены пробелы определенной ширины , форматы соединения, направленные форматы, умные кавычки , устаревшие и новые знаки препинания, такие как межблочный переход , и невидимые математические операторы.

Дополнительные символы пунктуации находятся в блоке Supplemental Punctuation и добавлены в десятки других блоков Unicode.

Заблокировать [ редактировать ]

Некоторые символы в этом блоке обычно не отображаются с помощью непосредственно видимого глифа. Десять символов пробельных U + 2002 через U + 200B (фиксированные ен или 1 / 2 ет, ет, 1 / 3 ют, 1 / 4 ет, 1 / 6 ет, рис и знаки пунктуация пространства , переменное тонкие или 1 / 5 ет и волосы пространство , фиксированное нулевой ширина пространства ) и U + 205F ( математика средний или 2 /9 em) различаются шириной по горизонтали, в то время как U + 2000 и U + 2001 (enиem quad) фактически являются псевдонимами U + 2002 и U + 2003 соответственно; еще два, U + 202F и U + 2060 (некорректное объединениеслов) являются вариантами U + 2009 или U + 2004 и U + 200B, которые запрещают перенос строки. Три нулевой ширины символов U + 200B через U + 200D (пространство, не-столярныеистолярные) отличаются темкак они влияютлигированиеи формирование соседних буквтаких какконтекстные формына арабском. Одиннадцать невидимых символов U + 200E, U + 200F (знакислева направоисправа налево), U + 202A - U + 202E (вставки, всплывающиеи переопределяет ) и от U + 2066 до U + 2069 ( изолирует ) управляет направленностью текста, если разметка более высокого уровня не переопределяет их. В U + 2028 и U + 2029 есть явные разделители строк и абзацев .

Emoji [ править ]

Блок общей пунктуации содержит два эмодзи : U + 203C и U + 2049. [3] [4]

Блок имеет четыре стандартизированных варианта, определенных для указания стиля эмодзи (U + FE0F VS16) или текстового представления (U + FE0E VS15) для двух эмодзи, оба из которых по умолчанию представляют собой текстовое представление. [5]

История [ править ]

Следующие документы, относящиеся к Unicode, фиксируют цель и процесс определения определенных символов в блоке General Punctuation:

Ссылки [ править ]

  1. ^ "База данных символов Юникода" . Стандарт Юникода . Проверено 9 июля 2016 .
  2. ^ «Нумерованные версии стандарта Unicode» . Стандарт Юникода . Проверено 9 июля 2016 .
  3. ^ "UTR # 51: Unicode Emoji" . Консорциум Unicode. 2020-02-11.
  4. ^ «UCD: данные эмодзи для UTR №51» . Консорциум Unicode. 2020-01-28.
  5. ^ "UTS # 51 Последовательности вариаций эмодзи" . Консорциум Unicode.