Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Windows-1258 - это кодовая страница, используемая в Microsoft Windows для представления вьетнамских текстов. Он использует комбинирование диакритических знаков .

Windows-1258 не совместима ни с вьетнамским стандартом ( TCVN 5712 / VSCII), ни с другими кодировками, используемыми на практике ( VISCII , VNI , VPS ). Скорее, он очень похож на Windows-1252 , с той разницей, что отсутствуют s-caron и z-caron (которые были добавлены в Windows-1252 позже), пять букв с диакритическими знаками были заменены объединением диакритических знаков для вьетнамского языка. тональные знаки , один был заменен знаком đông , а восемь других (по четыре на каждый случай) заменены четырьмя вьетнамскими буквами, которые иначе не поддерживались .

Использование комбинированных диакритических знаков означает, что Windows-1258 может охватывать большое количество комбинаций букв и тоновых знаков на вьетнамском языке без ущерба для покрытия управляющих кодов или символов. Однако это также означает, что программное обеспечение должно быть осторожным при обработке преобразований между предварительно составленными символами и правильном объединении последовательностей при преобразовании в / из других кодировок и затрудняет определение видимой для пользователя длины строки.

IBM использует кодовую страницу 1258 ( CCSID 1258 и расширенный код евро CCSID 5354) для Windows-1258. [1] [2] [3]

UTF-8 является предпочтительной кодировкой для вьетнамского языка в современных приложениях. Windows-1258 не всегда может передавать вьетнамский кодировщик Unicode туда и обратно из-за изменений, вызванных нормализацией Unicode . [4] Комбинированные диакритические знаки кодируются после буквы как в Windows-1258, так и в Unicode [4] (как VNI , в отличие от ANSEL ).

Набор символов [ править ]

В следующей таблице показана Windows-1258. Каждый символ отображается с его эквивалентом в Юникоде .

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный  Отличия от Windows-1252

Кодовая страница 1129 [ править ]

Кодовая страница IBM 1129 ( CCSID 1129 и знак евро расширенный CCSID 1163) [11] [12] [13] аналогична кодовой странице 1258, но со следующими отличиями:

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный  Отличия от Windows-1258

См. Также [ править ]

  • VSCII
  • VISCII
  • Набор символов VNI
  • Кодировка символов VPS

Ссылки [ править ]

  1. ^ "Кодовая страница 1258 информационного документа" . Архивировано из оригинала на 2016-03-03.
  2. ^ "Информационный документ CCSID 1258" . Архивировано из оригинала на 2014-11-29.
  3. ^ "Информационный документ CCSID 5354" . Архивировано из оригинала на 2014-11-29.
  4. ^ a b Каплан, Майкл С. (19 апреля 2005 г.). "Несколько ошибок MultiByteToWideChar" . Разбираемся со всем .
  5. ^ Стил, Шон (1998-04-15). «cp1258 в таблицу Unicode» . Microsoft .
  6. ^ Отображение Unicode окон 1258 с "наилучшим соответствием"
  7. ^ Кодовая страница CPGID 01258 (pdf) (PDF) , IBM
  8. ^ Кодовая страница CPGID 01258 (txt) , IBM
  9. ^ Международные компоненты для Unicode (ICU), ibm-1258_P100-1997.ucm , 2002-12-03
  10. ^ Международные компоненты для Unicode (ICU), ibm-5354_P100-1998.ucm , 2002-12-03
  11. ^ "Кодовая страница 1129 информационного документа" . Архивировано из оригинала на 2010-09-21.
  12. ^ "Информационный документ CCSID 1129" . Архивировано из оригинала на 2016-03-27.
  13. ^ "Информационный документ CCSID 1163" . Архивировано из оригинала на 2014-11-29.
  14. ^ Лунде, Кен. «Приложение L: Наборы вьетнамских символов» (PDF) . CJKV Обработка информации (2-е изд.). ISBN  978-0-596-51447-1.
  15. ^ Кодовая страница CPGID 01129 (pdf) (PDF) , IBM
  16. ^ Кодовая страница CPGID 01129 (txt) , IBM
  17. ^ Международные компоненты для Unicode (ICU), ibm-1129_P100-1997.ucm , 2002-12-03
  18. ^ Кодовая страница CPGID 01163 (pdf) (PDF) , IBM
  19. ^ Кодовая страница CPGID 01163 (txt) , IBM

Внешние ссылки [ править ]

  • Регистрация имени кодировки IANA для windows-1258
  • Блог Майкла Каплана, описывающий поведение кодировки Windows 1258