Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

Шрифт Zawgyi - это преобладающий шрифт, используемый для текста на бирманском языке на веб-сайтах. Он также известен как шрифт Zawgyi-One или zawgyi1, хотя обновленные версии этого шрифта не назывались Zawgyi-two. До 2019 года это был самый популярный шрифт на бирманских сайтах.

Это шрифт с бирманскими символами, реализованный в бирманском блоке Unicode, но несовместимым образом.

Несовместимость Unicode (специальные кодировки шрифтов) [ править ]

Бирманский шрифт - это сложный сценарий макета текста , в котором положение и форма графемы варьируются в зависимости от контекста. Поддержка сложного рендеринга текста для персональных компьютеров появилась только в Windows XP SP2 в 2004 году, а бирманский шрифт, использующий эту технологию, не существовал до 2005 года. [1] [2] Кроме того, в реализации Unicode бирманского скрипта были внесены значительные изменения. вплоть до Unicode 5.1 в 2008 году. [3] Добавьте к этому тот факт, что Мьянма испытала западные санкции [4], это привело к тому, что большая часть бирманской технологии локализации разрабатывалась на местном уровне, без внешнего сотрудничества.

Многочисленные бирманские поддерживающие шрифты были созданы в 2000-х годах, но они были разработаны как шрифты Unicode , которые только частично были совместимы с Unicode. [2] Некоторые кодовые точки для бирманского скрипта были реализованы, как указано в Unicode, но другие нет, поэтому шрифт несовместим с Unicode. [5] Консорциум Unicode называет это специальным кодированием шрифтов . [6] С появлением мобильных телефонов такие производители мобильных устройств, как Samsung и Huawei, просто заменяют системные шрифты, совместимые с Unicode, версиями Zawgyi. [1]

Использование специальных кодировок шрифтов имеет существенные недостатки. Как отдельная кодировка, ситуация приводит к искаженному тексту, отображаемому между пользователями Zawgyi и Unicode. [7] Поскольку кодирование шрифта Zawgyi не было реализовано так эффективно, как указано в Unicode, [6] оно должно было занимать больше кодовых точек, чем выделено для бирманского языка. Таким образом, кодировка Zawgyi взяла на себя блок Unicode, зарезервированный для этнических языков Мьянмы . [1] [2] В Zawgyi одно и то же слово может быть закодировано разными способами, что затрудняет поиск и анализ текстового корпуса Zawgyi . [8] Также сложно отсортировать текст Zawgyi. [8]Кроме того, использование Unicode упростит реализацию технологий обработки естественного языка . [2]

Правительство Мьянмы обозначило 1 октября 2019 года как «U-Day» для официального перехода на Unicode. [4] Предполагается, что полный переход займет два года. [9]

Конверсия [ править ]

International Components for Unicode поддерживает преобразование данных Zawgyi в совместимый Unicode с помощью Zawgyi-myтранслитератора. [10]

См. Также [ править ]

  • Справка: многоязычная поддержка (бирманский)

Ссылки [ править ]

  1. ^ a b c Гочкис, Гриффин (23 марта 2016 г.). «Битва шрифтов» . Граница Мьянмы . Проверено 24 декабря 2019 года .С выпуском пакета обновления 2 для Windows XP были поддержаны сложные сценарии, что позволило Windows отображать совместимый с Unicode бирманский шрифт, такой как Myanmar1 (выпущенный в 2005 году). ... Myazedi, BIT, а позже Zawgyi ограничили проблему рендеринга, добавив дополнительные кодовые точки, которые были зарезервированы для этнических языков Мьянмы. Повторное отображение не только предотвращает поддержку этнических языков в будущем, но и приводит к появлению системы набора текста, которая может сбивать с толку и неэффективна даже для опытных пользователей. ... Huawei и Samsung, два самых популярных бренда смартфонов в Мьянме, заинтересованы только в том, чтобы захватить самую большую долю рынка, что означает, что они поддерживают Zawgyi из коробки.
  2. ^ a b c d Син, Тан (7 сентября 2019 г.). «Унифицированы под одной системой шрифтов, поскольку Мьянма готовится к переходу с Zawgyi на Unicode» . Восходящие голоса . Проверено 24 декабря 2019 года . Стандартные шрифты Unicode для Мьянмы никогда не были широко распространены, в отличие от частного и частично совместимого с Unicode шрифта Zawgyi. ... Unicode улучшит обработку естественного языка
  3. ^ Hosken, Мартин (25 января 2007). «Представление Мьянмы в Юникоде» (PDF) . Консорциум Unicode . Проверено 24 декабря 2019 года .
  4. ^ a b «Unicode в, Zawgyi out: современность, наконец, догоняет цифровой мир Мьянмы | The Japan Times» . The Japan Times . 27 сентября, 2019. Архивировано из оригинала 22 августа 2020 года . Проверено 24 декабря 2019 года . 1 октября - «День U», когда Мьянма официально перейдет на новую систему. ... Microsoft и Apple много лет назад помогали другим странам стандартизировать, но западные санкции означали, что Мьянма проиграла.
  5. ^ «Зачем нужен Unicode» . Код Google: проект Zawgyi . Проверено 31 октября 2013 года .
  6. ^ а б «Мьянманские письменности и языки» . Часто задаваемые вопросы . Консорциум Unicode . Проверено 24 декабря 2019 года . "UTF-8" технически не применяется к специальным кодировкам шрифтов, таким как Zawgyi.
  7. ^ ЛаГроу, Ник; Прузан, Мири (26 сен, 2019). «Интеграция автоконверсии: путь Facebook от Zawgyi к Unicode - Facebook Engineering» . Facebook Engineering . Facebook . Проверено 25 декабря 2019 . Это затрудняет общение на цифровых платформах, поскольку контент, написанный в Unicode, кажется пользователям Zawgyi искаженным, и наоборот. ... Чтобы лучше охватить свою аудиторию, производители контента в Мьянме часто размещают в одном посте как Zawgyi, так и Unicode, не говоря уже об английском или других языках.
  8. ^ a b Уоткинс, Джастин (2 ноября 2016 г.). «Почему мы должны остановить Zawgyi. Это вредит другим и нам самим. Используйте Unicode!» (PDF) . SOAS, Лондонский университет . Проверено 24 декабря 2019 года . (1) Использование Zawgyi ограничивает возможности других языков Мьянмы развиваться в электронной форме, а Unicode - нет! (2) Zawgyi не соответствует международным компьютерным стандартам - Unicode соответствует! (3) Zawgyi не может правильно сортировать: бесполезен для хранения данных - Unicode можно использовать для чего угодно! (4) Может хранить одно и то же слово несколькими способами: бесполезно для поиска, обработки, анализа текста - Unicode можно использовать для чего угодно
  9. Видел Йи Нанда (21 ноября 2019 г.). «Мьянма переходит на Unicode на два года: разработчик приложений» . The Myanmar Times . Проверено 24 декабря 2019 года .
  10. ^ «Документация Python по инструментам для Мьянмы» . Google, LLC .

Внешние ссылки [ править ]

  • Руководство по использованию мьянманского Unicode: преобразование старых мьянманских шрифтов в Unicode
  • У UNOB USA есть отдельные ссылки для загрузки шрифта Zawgyi для Windows, MAC-Apple и iPhone / iPad.
  • Конвертер Unicode Zawgyi | Инструменты для Мьянмы - Zawgyi-One с открытым исходным кодом и стандартный конвертер Unicode для Мьянмы