Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

JIS X 0212 - это японский промышленный стандарт, определяющий набор кодированных символов для кодирования дополнительных символов для использования в японском языке. Этот стандарт предназначен для дополнения JIS X 0208 (кодовая страница 952). Он имеет номер 953 или 5049 как кодовую страницу IBM (см. Ниже).

Это один из исходных стандартов для унифицированных иероглифов Unicode CJK .

История [ править ]

В 1990 году Японская ассоциация стандартов (JSA) выпустила дополнительный стандарт набора символов: JIS X 0212-1990 Код дополнительного набора японских графических символов для обмена информацией (情報 交換 用 漢字 符号 - 補助 漢字, Jōhō Kōkan'yō Kanji Fugō - Hojo Кандзи ) . Этот стандарт был разработан на основе диапазона символов, доступных в основном наборе символов JIS X 0208 , и для устранения недостатков в охвате этого набора.

Особенности [ править ]

Диаграмма Эйлера, сравнивающая репертуары JIS X 0208 , JIS X 0212, JIS X 0213 , Windows-31J , стандартный репертуар Microsoft и Unicode .

Стандарт определяет 6067 знаков, включая:

  • 21 греческий символ с диакритическими знаками
  • 26 восточноевропейских символов с диакритическими знаками (в основном кириллица)
  • 198 буквенных знаков с диакритическими знаками
  • 5,801 кандзи

Кодировки [ править ]

Следующие кодировки или инкапсуляции используются для включения символов JIS X 0212 в файлах и т. Д.

  • в EUC-JP символы представлены тремя байтами, первый из которых - 0x8F, а следующие два - в диапазоне 0xA1 - 0xFE.
  • в ISO 2022 последовательность «ESC $ (D») используется для обозначения символов JIS X 0212.

Инкапсуляция символов JIS X 0212 в популярной кодировке Shift JIS невозможна, поскольку Shift JIS не имеет достаточного нераспределенного кодового пространства для символов.

Реализации [ править ]

JIS X 0212 называется кодовой страницей 953 от IBM и включает расширения поставщиков. [1] [2] [3] Альтернативный CCSID 5049 исключает эти расширения. [4]

Поскольку символы JIS X 0212 не могут быть закодированы в Shift JIS, системе кодирования, которая традиционно доминировала в японской обработке информации, было реализовано несколько практических реализаций набора символов. Как упоминалось выше, он может быть закодирован в EUC-JP, который обычно используется в системах Unix / Linux, и именно здесь произошло большинство реализаций:

  • в начале 1990-х базовые шрифты "BDF" были скомпилированы для использования в системе Unix X Window ;
  • был скомпилирован файл преобразования IME для системы WNN;
  • kterm консольное приложение окно было расширено , чтобы поддержать его;
  • в Emacs и jstevie редакторы были расширены , чтобы поддержать его.

Многие браузеры WWW, такие как семейство Netscape / Mozilla / Firefox , Opera и т. Д., И связанные приложения, такие как Mozilla Thunderbird, поддерживают отображение символов JIS X 0212 в кодировке EUC-JP, однако Internet Explorer не поддерживает символы JIS X 0212. Современные пакеты эмуляции терминала, такие как терминал GNOME, также поддерживают символы JIS X 0212.

Приложения, которые поддерживают JIS X 0212 в кодировке EUC, включают:

  • программа словаря xjdic для Unix / Linux;
  • WWWJDIC словарь сервер японского языка (однако , как Internet Explorer не поддерживает расширения JIS X 0212 в EUC, этот сервер посылает битовые графики для этих символов когда установлены в режиме EUC-JP) .

JIS X 0212 и Unicode [ править ]

Кандзи в JIS X 0212 были взяты в качестве одного из источников для унификации хань, что привело к унифицированному набору символов CJK в исходном стандарте ISO 10646 / Unicode . Были включены все 5801 кандзи.

Будущее [ править ]

Помимо упомянутых выше приложений, стандарт JIS X 0212 фактически мертв. 2743 кандзи из него были включены в более поздний стандарт JIS X 0213 . В более долгосрочной перспективе его вклад, вероятно, будет заключаться в 5801 кандзи, которые были включены в Unicode .

См. Также [ править ]

  • JIS X 0208
  • JIS X 0213

Ссылки [ править ]

  • JIS X 0212-1990 情報 交換 用 漢字 符号 - 補助 漢字, 日本 規格 協会, 東京 (1990 年 10 1 制定). (документ японских стандартов)
  • Понимание обработки информации в Японии, Кен Лунде, O'Reilly & Assoc. 1993 г.
  • Обработка информации CJKV, Кен Лунде, O'Reilly & Assoc. 1999, 2008.
  1. ^ "Кодовая страница 953 информационного документа" . Архивировано из оригинала на 2016-03-17.
  2. ^ "Информационный документ CCSID 953" . Архивировано из оригинала на 2016-03-28.
  3. ^ Кодовая страница CPGID 00953 (pdf) (PDF) , IBM
  4. ^ "Информационный документ CCSID 5049" . Архивировано из оригинала на 2016-03-27.

Внешние ссылки [ править ]

  • Статья JIS X 0212 в японской Википедии
  • Документация по базе данных KANJD212
  • Таблица кодов JIS X 0212
  • Международные компоненты для Unicode (ICU), jisx-212.ucm