Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В символах региональных индикаторов представляют собой набор из 26 алфавитных Unicode символов (A-Z) , предназначенные для использования для кодирования 3166-1 альфа - 2-ISO двухбуквенных кодов стран таким образом , что позволяет дополнительно специальной обработке.

Они были определены в как часть поддержки Unicode 6.0 для эмодзи , как альтернатива кодированию отдельных символов для каждого флага страны. Хотя они могут отображаться как латинские буквы, предполагается, что реализации могут выбрать отображение их другими способами, например, с помощью национальных флагов . [1] [2] В FAQ по Unicode указано, что этот механизм следует использовать и что символы национальных флагов не будут кодироваться напрямую. [3]

Они кодируются в диапазоне от U + 1F1E6 СИМВОЛ РЕГИОНАЛЬНОГО ИНДИКАТОРА БУКВА A (HTML  🇦) до U + 1F1FF 🇿 СИМВОЛ РЕГИОНАЛЬНОГО ИНДИКАТОРА БУКВА Z (HTML  ) в блоке закрытого буквенно- цифрового дополнения на дополнительной многоязычной плоскости . [4] 🇿

Последовательности флагов эмодзи [ править ]

Пара символов региональных индикаторов называется последовательностью флагов эмодзи (хотя она представляет конкретную область, а не конкретный флаг для этой области). [6]

Из 676 возможных пар символов региональных индикаторов (26 × 26) только 270 считаются действительными кодами регионов Unicode. Это подмножество последовательностей регионов в репозитории общих локальных данных (CLDR): [6] [7] [8]

  • Все 256 последовательностей регулярных областей в CLDR
    • 249 официально присвоенных кодов ISO 3166-1 alpha-2
    • 6 исключительных резерваций (остров Вознесения, остров Клиппертон, Диего-Гарсия, Сеута и Мелилья, Канарские острова и Тристан-да-Кунья)
    • 1 присвоенный пользователем временный код страны (Косово)
  • Две из 35 последовательностей макрорегионов в CLDR (ЕС и ООН)
  • Все 12 устаревших последовательностей областей в CLDR (настоятельно не рекомендуется - предназначены только для обратной совместимости)

Отдельный механизм ( последовательности тегов эмодзи ) используется для региональных флагов, таких как Англия 🏴󠁧󠁢󠁥󠁮󠁧󠁿, Шотландия 🏴󠁧󠁢󠁳󠁣󠁴󠁿, Уэльс 🏴󠁧󠁢󠁷󠁬󠁳󠁿, Техас 🏴󠁵󠁳󠁴󠁸󠁿. или Калифорния 🏴󠁵󠁳󠁣󠁡󠁿 [12] Он использует U + 1F3F4 🏴 WAVING BLACK FLAG и символы тега форматирования вместо символов региональных индикаторов. Он основан на регионах ISO 3166-2 с удаленным дефисом и строчными буквами, например GB-ENG → gbeng, оканчивающимся U + E007F CANCEL TAG . Флаг Англии поэтому представлен последовательностью U + 1F3F4 , U + E0067 , U + E0062 , U + E0065 , U + E006E , U + E0067 , U + E007F . В десятой редакции консорциум Unicode рассматривал вместо этого U + 1F3F3 🏳 WAVING WHITE FLAG [13], но с одиннадцатой и далее он стал черным. [14]

Блок Unicode [ править ]

Фон [ править ]

В 2007 году Техническому комитету Unicode был представлен проект предложения по кодированию символов эмодзи , особенно тех, которые широко используются на мобильных телефонах японскими телекоммуникационными компаниями DoCoMo , KDDI и SoftBank . [15] Предложенные символы включали десять национальных флагов: [16] Китая (🇨🇳), Германии (🇩🇪), Испании (🇪🇸), Франции (🇫🇷), Великобритании (🇬🇧), Италии (🇮🇹). , Япония (🇯🇵), Южная Корея (🇰🇷), Россия (🇷🇺) и США(🇺🇸). Некоторые считают, что кодирование этих флагов, но не флагов других стран, наносит ущерб. [17] Одно отклоненное решение заключалось в том, чтобы закодировать десять флагов, но назвать их «СИМВОЛ СОВМЕСТИМОСТИ EMOJI-n» и представить их визуально в Стандарте как «EC n» вместо того, чтобы показывать флаги, которые они представляют. [18] В другом отклоненном решении было бы выделено 676 кодовых точек (26 × 26) для каждой возможной двухбуквенной комбинации A – Z. Они будут представлять политические субъекты, основанные на ISO 3166, такие как «FR» для Франции или нДВУ в Интернете ( домены верхнего уровня с кодом страны ), такие как «ЕС» для Европейского Союза. [19]

Было принято решение добавить 26 символов к буквам, используемым для представления региональных индикаторов, которые в парах будут представлять десять национальных флагов и возможные будущие расширения. [2] Согласно Стандарту Юникода, «основная цель таких пар [символ регионального индикатора] состоит в том, чтобы обеспечить однозначное двустороннее сопоставление определенных символов, используемых в основных наборах эмодзи» [20], в частности, десяти национальных флагов: [21] 🇨🇳, 🇩🇪, 🇪🇸, 🇫🇷, 🇬🇧, 🇮🇹, 🇯🇵, 🇰🇷, 🇷🇺 и 🇺🇸.

Ссылки [ править ]

  1. ^ Эндрю Уэст . «Что нового в Unicode 6.0» . Вавилонский камень . Проверено 18 августа 2014 .
  2. ^ а б Майкл Эверсон и Кен Уистлер. «N3727: Предложение о кодировании символов региональных индикаторов в ПСК» (PDF) . Документ рабочей группы, ISO / IEC JTC1 / SC2 / WG2 и UTC . Проверено 18 августа 2014 .
  3. ^ «Unicode FAQ: Emoji and Dingbats» . Консорциум Unicode. 2009-10-28 . Проверено 18 августа 2014 .
  4. ^ «Дополнение к тексту и цифрам, диапазон 1F100 - 1F1FF, стандарт Unicode, версия 6.0» (PDF) . Консорциум Unicode. 2010 . Проверено 18 августа 2014 .
  5. ^ «Флаги» . emojipedia.com . Проверено 4 февраля 2020 .
  6. ^ a b UTR # 51: Unicode Emoji, Приложение B: Valid Emoji Flag Sequences , Unicode Consortium web, 2020-02-11
  7. ^ "UTR # 35: язык разметки данных локали Unicode (LDML), данные о действительности" . Консорциум Unicode.
  8. ^ "Данные о валидности региона CLDR v38" . Репозиторий данных Unicode Common Locale (CLDR) . 2020-10-28.
  9. ^ «UCD: данные последовательности эмодзи для UTR №51» . Консорциум Unicode. 2020-01-28.
  10. ^ «UTR # 35: язык разметки данных локали Unicode (LDML), дополнительные метаданные» . Консорциум Unicode.
  11. ^ "Дополнительные метаданные CLDR v38" . Репозиторий данных Unicode Common Locale (CLDR) . 2020-10-28.
  12. ^ "UTR # 51: Unicode Emoji" . Консорциум Unicode. 2017-05-18.
  13. ^ http://www.unicode.org/reports/tr51/tr51-10.html
  14. ^ http://www.unicode.org/reports/tr51/tr51-11.html
  15. ^ Момои, Кэт; Дэвис, Марк; Шерер, Маркус (2007-08-03). «L2 / 07-257: Рабочий проект предложения по кодированию символов эмодзи» . Проверено 18 августа 2014 .
  16. ^ «Отображение Unicode для Emoji со ссылкой на японских операторов связи, AU / KDDI, DoCoMo и Softbank» (формат файла архива ZIP) . Проверено 18 августа 2014 .
  17. ^ «L2 / 09-114 N3607: На пути к кодированию символов символов, используемых в качестве эмодзи» (PDF) . 2009-04-06 . Проверено 18 августа 2014 .
  18. ^ «INCITS / L2 / 09-304: Комментарии, сопровождающие голосование США против PDAM 8 по ISO / IEC 10646: 2003 (SC2 N4078)» (PDF) . 2009-08-15 . Проверено 18 августа 2014 .
  19. ^ Pentzlin, Карл (2008-08-09). «L2 / 08-305: Некоторые предложения по кодированию национальных флагов в соответствии с предложением Emoji» (PDF) . Проверено 18 августа 2014 .
  20. ^ Стандарт Unicode, версия 6.2, глава 15: Символы (PDF) . Unicode, Inc., сентябрь 2012 г., стр. 534. ISBN  978-1-936213-07-8.
  21. ^ «Источники эмодзи» (простой текст) . Unicode, Inc. 2013-12-17 . Проверено 18 августа 2014 .