Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Символы CJKV, полученные от древних китайских иероглифов Слева направо: японский, вьетнамский, корейский, упрощенный китайский, тайваньский традиционный китайский.

В интернационализации , КИЕ символы это собирательный термин для китайцев , японцев и корейских языков, все из которых включают в себя китайские иероглифы и их производные в их системах письма, иногда в сочетании с другими сценариями. В совокупности символы CJK часто включают ханзи в китайском , кандзи , кана в японском , ханджа и хангыль в корейском . В редких случаях используется вьетнамский язык, поэтому сокращение CJKV, поскольку вьетнамцы исторически использовали и китайские иероглифы; подробнее о китайско-вьетнамских персонажах см. статью Chữ Nôm .

Репертуар персонажей [ править ]

Стандартный китайский и стандартный кантонский диалект написаны почти исключительно китайскими иероглифами. Требуется более 3000 знаков для общей грамотности и до 40 000 знаков для достаточно полного охвата. В японском языке используется меньше символов - общая грамотность японского языка составляет 2136 символов. Использование китайских иероглифов в Корее становится все более редким, хотя идиосинкразическое использование китайских иероглифов в собственных именах требует знания (и, следовательно, наличия) гораздо большего числа символов. Однако даже сегодня студентов в Южной Корее учат 1800 иероглифам.

Другие скрипты, используемые для этих языков, такие как бопомофо и пиньинь на основе латыни для китайского, хирагана и катакана для японского и хангыль для корейского, не являются строго «символами CJK», хотя наборы символов CJK почти всегда включают их по мере необходимости для полной охват целевых языков.

До начала 20 века классический китайский был письменным языком правительства и ученых во Вьетнаме. Популярная литература на вьетнамском языке была написана шрифтом chữ Nôm , состоящим из заимствованных китайских иероглифов вместе со многими иероглифами, созданными на местном уровне. С 1920-х годов для записи литературы использовался латинский вьетнамский алфавит . [1] [2]

Китаевед Карл Лебан (1971) произвел раннее обследование систем кодирования CJK.

Кодировка [ править ]

Количество символов, необходимое для полного покрытия потребностей всех этих языков, не может уместиться в 256-символьном кодовом пространстве 8-битных кодировок символов , требующих как минимум 16-битного кодирования с фиксированной шириной или многобайтовых кодировок с переменной длиной. 16-битные кодировки с фиксированной шириной, такие как от Unicode до версии 2.0 включительно, в настоящее время не рекомендуются из-за требования кодировать больше символов, чем может вместить 16-битная кодировка - Unicode 5.0 имеет около 70 000 символов Han, а требование правительства Китая, чтобы программное обеспечение в Китае поддерживало набор символов GB 18030 .

Хотя кодировки CJK имеют общие наборы символов, часто используемые для их представления кодировки были разработаны отдельно правительствами разных стран Восточной Азии и компаниями-разработчиками программного обеспечения и несовместимы друг с другом. Unicode попытался, но с некоторыми противоречиями, унифицировать наборы символов в процессе, известном как ханьское объединение .

Кодировки символов CJK должны состоять как минимум из символов хань плюс фонетические сценарии для конкретного языка, такие как пиньинь , бопомофо , хирагана, катакана и хангыль.

Кодировки символов CJK включают:

  • Big5 (наиболее распространенная кодировка до внедрения Unicode)
  • CCCII
  • CNS 11643 (официальный стандарт Китайской Республики )
  • EUC-JP
  • EUC-KR
  • GB2312 (подмножество и предшественник GB18030)
  • GB18030 (обязательный стандарт в Китайской Народной Республике )
  • Набор символов Giga (GCS)
  • ISO 2022-JP
  • KS C 5861
  • Shift-JIS
  • TRON
  • Unicode

Наборы символов CJK занимают большую часть назначенного кодового пространства Unicode . Среди японских экспертов по китайским иероглифам существует много разногласий по поводу желательности и технических достоинств процесса унификации хань, используемого для преобразования нескольких наборов китайских и японских символов в один набор унифицированных символов. [ необходима цитата ]

Все три языка могут быть написаны как слева направо, так и сверху вниз (справа налево и сверху вниз в древних документах), но при обсуждении вопросов кодирования обычно рассматриваются как сценарии с написанием слева направо .

Правовой статус [ править ]

Библиотеки сотрудничали в разработке стандартов кодирования символов JACKPHY в начале 1980-х годов. По словам Кена Лунде , аббревиатура «Дальневосточные» был зарегистрирован товарный знак из исследовательских библиотек [3] (которая объединилась с OCLC в 2006 году). Срок действия товарного знака, принадлежавшего OCLC с 1987 по 2009 год, истек. [4]

См. Также [ править ]

  • Языки описания китайских иероглифов
  • Кодировка китайских символов
  • Китайские методы ввода для компьютеров
  • Идеографы совместимости CJK
  • CJK удары
  • Унифицированные идеограммы CJK
  • Языки со сложной компоновкой текста (CTL)
  • Редактор метода ввода
  • Японский язык и компьютеры
  • Корейский язык и компьютеры
  • Список шрифтов CJK
  • Синоксеник
  • Кодирование переменной ширины

Ссылки [ править ]

  1. ^ Coulmas (1991) , стр. 113-115.
  2. ^ DeFrancis (1997) .
  3. ^ Кен Лунде, 1996
  4. ^ Список Justia

Эта статья основана на материалах, взятых из Free On-line Dictionary of Computing до 1 ноября 2008 г. и включенных в соответствии с условиями «перелицензирования» GFDL версии 1.3 или новее.

  • ДеФрансис, Джон . Китайский язык: факты и вымыслы . Гонолулу: Гавайский университет Press, 1990. ISBN  0-8248-1068-6 .
  • Ханнас, Орфографическая дилемма Уильяма К. Асии . Гонолулу: Гавайский университет Press, 1997. ISBN 0-8248-1892-X (мягкая обложка); ISBN 0-8248-1842-3 (твердый переплет).  
  • Лемберг, Вернер: Пакет CJK для LATEX2ε - многоязычная поддержка за пределами babel. TUGboat, Том 18 (1997), № 3 - Труды годового собрания 1997 года.
  • Ливан, Карл. Автоматизированные орфографические системы для языков Восточной Азии (китайский, японский, корейский) , Отчет о современном состоянии, подготовленный для Совета директоров, Ассоциация азиатских исследований. 1971 г.
  • Лунде, Кен . CJKV Обработка информации . Севастополь, Калифорния: O'Reilly & Associates, 1998. ISBN 1-56592-224-7 . 

Внешние ссылки [ править ]

  • CJKV: краткое введение
  • Lemberg CJK статья сверху, TUGboat18-3
  • На «Единый идеограф CJK» с сайта Wenlin.com
  • FGA: рационализация набора символов Unicode CJKV