Не соединяющийся с нулевой шириной символ ( ZWNJ ) - это непечатаемый символ, используемый при компьютеризации систем письма , использующих лигатуры . При размещении между двумя символами, которые в противном случае были бы связаны в лигатуру, ZWNJ заставляет их печатать в их окончательной и исходной формах соответственно. Это также эффект пробела , но ZWNJ используется, когда желательно держать слова ближе друг к другу или связать слово с его морфемой.
ZWNJ кодируется в Юникоде как U + 200C ZERO WIDTH NON-JOINER (HTML ‌
· ‌
).
Использование ZWNJ и разделителя единиц для правильной типографики [ править ]
В некоторых языках ZWNJ необходим для однозначного определения правильной типографской формы последовательности символов.
Раньше использовался разделитель единиц управляющего кода ASCII . [ сомнительно ]
Правильно (с ZWNJ) | Неверно | Смысл | ||||
---|---|---|---|---|---|---|
Отображать | Картина | Код | Отображать | Картина | Код | |
میخواهم | می‌خواهم (отображается справа налево): می‌خواهم | میخواهم | میخواهم | Персидский "я хочу" | ||
הֱֽיֹות | הֱ‌ֽיֹות (отображается справа налево): הֱ‌ֽיֹות | הֱֽיֹות | הֱֽיֹות | Древнееврейское "быть" | ||
Auflage | Auf‌lage | Auflage | Auflage | Немецкое «издание» ( соединение « auf » + « Lage ») | ||
Brotzeit | Brot‌zeit | Brotzeit | Brotzeit | Немецкий (региональный) '(вид) закуска' (составное существительное « Brot » + « Zeit » = «время хлеба»), показанный во Fraktur | ||
глухо | deaf‌ly | глухо | deafly | Не соединение «деа» + «летать», а наречие «глухой». | ||
श्रीमान्को | श्रीमान्‌को | श्रीमान्को | श्रीमान्को | В непальском «мужа» или «уважаемого человека» в зависимости от того, что используется для обозначения (мужа или уважаемого человека). | ||
র্যাঁদা | র‌্যাঁদা | র্যাঁদা | র্যাঁদা | Бенгальское слово, обозначающее плотницкий самолет . |
На картинке показано, как выглядит код при правильном рендеринге , и в каждой строке правильные и неправильные изображения должны быть разными. Если правильный дисплей и неправильный вам кажутся одинаковыми или если одно из них значительно отличается от соответствующего изображения, ваша система неправильно отображает Unicode.
В этом примере на библейском иврите метег расположен слева от сегола , он имеет знак шва, записанный в виде двух вертикальных точек для обозначения короткой гласной. Если бы метег был размещен слева от шва , это было бы ошибочно. В современном иврите нет причин использовать метег для разговорной речи, поэтому он редко используется при наборе на современном иврите.
В немецкой типографике лигатуры не могут пересекать границы составных частей . Таким образом, в первом немецком примере префикс Auf- отделяется от остальной части слова, чтобы запретить лигатуру fl . Точно так же в английском языке некоторые утверждают, что лигатуры не должны пересекать границы морфем . [1] Например, в некоторых словах «летать» и «рыба» - это морфемы, а в других - нет; поэтому такие слова, как «глухой» и «эгоистичный» не должны иметь лигатуры (соответственно fl и fi), в то время как «муха» и «сом» должны иметь их.
Персидский язык широко использует этот символ для определенных префиксов, суффиксов и сложных слов. [2] Это необходимо для устранения неоднозначности составных слов из несоставных слов, в которых используется полный пробел.
Использование ZWNJ для отображения альтернативных форм [ править ]
В индийских сценариях вставка ZWNJ после согласного с галантом или перед зависимым гласным препятствует правильному соединению символов: [3]
В деванагари символы क् и ष обычно объединяются, образуя when , но когда между ними вставляется ZWNJ , вместо них отображается क्ष (код :) .क्‌ष
В каннаде символы ನ್ и ನ вместе образуют ನ್ನ, но когда между ними вставляется ZWNJ, отображается ನ್ನ. Этот стиль обычно используется для написания слов, отличных от каннада, в сценарии каннада: « Facebook » пишется как ಫೇಸ್ಬುಕ್, хотя его можно записать как. ರಾಜ್ಕುಮಾರ್ и ರಾಮ್ಗೊಪಾಲ್ - примеры других имен собственных, которым нужен ZWNJ.
В бенгальском языке , когда бенгальская буква য встречается в конце группы согласных, т. Е. য, перед которой стоит ◌্ ( hôsôntô ), она появляется в особой форме , известной как য-ফলা ( ja-phala ), например как в ক্য (ক ্ য). Однако, когда бенгальская буква র встречается в начале группы согласных, т. Е. После র, за которой следует хосонто, она появляется в особой форме, известной как রেফ ( реф ). Таким образом, последовательность র ্ য по умолчанию отображается как র্য. Когда необходимо сохранить форму-ফলা, а не форму রেফ, ZWNJ вставляется сразу после র, то есть র & zwnj; ্য для рендеринга র্য. [4] র্য обычно используется для заимствований из английского языка, таких как র্যান্ডম (случайный). Такие слова, как উদ্ঘাটন (код:উদ্
& zwnj; ঘাটন
), где хосонто должно отображаться явно, также требуется, чтобы ZWNJ вставлялся после хосонто .
Символ [ править ]
Символ, который будет использоваться на клавиатурах, которые позволяют вводить ZWNJ напрямую, стандартизирован в Поправке 1 (2012) ISO / IEC 9995-7 : 2009 «Информационные технологии - Раскладки клавиатуры для текстовых и офисных систем - Символы, используемые для представления функций» как символ номер 81, и в IEC 60417 «Графические символы для использования на оборудовании» как символ номер. МЭК 60417-6177-2.
См. Также [ править ]
- Соединитель нулевой ширины
- Пространство нулевой ширины
- Разделитель слов
Ссылки [ править ]
- ^ "Когда мне не следует использовать лигатуры при наборе английского языка?" . english.stackexchange.org .[ нужен лучший источник ]
- ^ "Не-присоединяющийся нулевой ширины" . nmelrc.org . Архивировано из оригинала 8 июля 2012 года.
- ^ «FAQ - Индийские скрипты и языки» . www.unicode.org . Проверено 15 марта 2020 .
- ^ «FAQ - Бенгальский (Bangla)» . www.unicode.org . Проверено 15 марта 2020 .
Внешние ссылки [ править ]
- Использование ZWNJ на персидском языке
- У каждого персонажа есть история №19: U + 200c и U + 200d (ZERO WIDTH [NON] JOINER)