Из Википедии, свободной энциклопедии
  (Перенаправлено из TCVN 5712 )
Перейти к навигации Перейти к поиску

VSCII ( Вьетнамский стандартный код для обмена информацией ), также известный как TCVN 5712 , [2] ISO-IR-180 , [3] .VN , [4] ABC [4] или просто кодировки TCVN , [4] [5] представляет собой набор из трех тесно связанных вьетнамских национальных стандартных кодировок символов для использования вьетнамского языка с компьютерами , разработанный Техническим комитетом TCVN по информационным технологиям (TCVN / TC1) и впервые принятый в 1993 году (как TCVN 5712: 1993). [2]

Его не следует путать с одноименной неофициальной кодировкой VISCII , которая иногда использовалась иностранцами, говорящими на вьетнамском языке. [4] VISCII также должен был обозначать вьетнамский стандартный код для обмена информацией , но не имеет отношения к VSCII. [6]

VSCII (TCVN) широко использовался на севере Вьетнама, в то время как VNI был популярен на юге. [4] Юникод и кодовая страница Windows-1258 теперь используются практически для всех вьетнамских компьютерных данных [ необходима ссылка ], но устаревшие файлы или заархивированные сообщения могут нуждаться в преобразовании.

Кодировки [ править ]

Во всех трех формах VSCII 95 печатаемых символов ASCII остаются неизменными.

VSCII-3 , также известный как TCVN 5712-3, VN3 или просто TCVN3, [7] включает наименьшее количество назначений. Это расширенный ASCII , потому что он сохраняет все 128 кодов ASCII неизменными. Он не переназначает управляющие коды C0 и C1 . По сравнению с ASCII он добавляет 75 символов:

  • 67 строчных символов, что обеспечивает полную поддержку строчных букв.
  • 7 заглавных букв, что позволяет использовать прописные буквы для 29 базовых букв без тональных знаков.
  • Неразрывный пробел .

Тональные отметки на гласных в верхнем регистре выполняются в TCVN3 путем переключения на шрифт, состоящий только из заглавных букв. [8]

VSCII-2 , также известный как TCVN 5712-2 и VN2, является расширенным набором VSCII-3. Это расширенный ASCII , потому что он сохраняет все 128 кодов ASCII неизменными. Он не переназначает ни один из управляющих кодов C0 и C1 , что делает его совместимым с ISO 2022 как 96-набор. [2] [3] По сравнению с VSCII-3, он добавляет (всего 96 символов, отличных от ASCII):

  • Еще 16 прописных символов с заранее составленными тональными знаками (всего 23 прописных символа, отличных от ASCII)
  • 5, объединяющая диакритические знаки для тоновых знаков , позволяя представлять другие комбинации прописных букв и тоновых знаков. Комбинированные метки следуют за базовой буквой [2], как в VNI (а не перед ними, как в ANSEL ).

VSCII-1 , также известный как TCVN 5712-1 и VN1, является расширением VSCII-2 и является модифицированным ASCII, поскольку заменяет 12 из 33 управляющих символов заранее составленными символами. По сравнению с VSCII-2 он (всего 140 символов, отличных от ASCII):

  • Добавляет еще 44 заранее составленных заглавных буквы, доводя их до того же количества, что и строчных
  • Делается это путем замены 12 управляющих символов ASCII и выделения 32 графических символов в область управления C1, нарушая совместимость ISO 2022.

Преобразование из VSCII-3 в VSCII-2 или VSCII-1 и преобразование из VSCII-2 в VSCII-1 не требуется, но может привести к уменьшению размера файлов.

Преобразование из VSCII-1 в VSCII-2 или VSCII-3 и преобразование из VSCII-2 в VSCII-3 требует расширения некоторых предварительно составленных символов.

Набор символов [ править ]

  Письмо  Число  Пунктуация  Условное обозначение  Другой  Неопределенный

Затенение шахматной доски указывает на символы, которых нет в VSCII-3. Закрашенные символы в строках 0_, 1_, 8_ и 9_ не входят в VSCII-2 или VSCII-3. [9]

Ссылки [ править ]

  1. ^ Sivonen, Анри (2014-09-26). «Изменения кодировки символов в MC требуют действия cc» . mozilla.dev.apps.thunderbird .
  2. ^ a b c d e "[новости] TCVN 5712: 1993 (VSCII) - Вьетнамский национальный стандарт" . 1993-06-02. Архивировано из оригинала на 2017-01-11.
  3. ^ а б ТВЦН (1993). «ISO-IR-180: Правая часть кодовой таблицы VSCII-2» (PDF) . ITSCJ / IPSJ .
  4. ^ a b c d e Ngo, Hoc Dinh; Тран, Тубинь. «5. Зачем нужна вьетнамская кодировка (набор символов - кодировка)?» . Некоторые специальные функции WinVNKey .
  5. ^ Нгуен, Минь Т. «Вьетнамские преобразования (Vietnet / VIQR, VNI, VPS, VISCII, VNU, TCVN, VietWare, unicode)» .
  6. ^ Лунде, Кен. «Глава 1: Обзор обработки информации CJKV (§ Идентичны ли VISCII и VSCII? А как насчет TCVN?)». CJKV Обработка информации (2-е изд.). п. 17. ISBN 978-0-596-51447-1.
  7. ^ «Юникод и вьетнамские кодировки старых символов» . Вьетнамский Unicode: часто задаваемые вопросы .
  8. ^ «Юникод и вьетнамские кодировки старых символов» . Вьетнамский Unicode: часто задаваемые вопросы . TCVN3 не является двухбайтовым, но из-за характера его кодировки заглавные буквы (гласные) отображаются в отдельный заглавный шрифт, который похож на обычный строчный шрифт.
  9. ^ Лунде, Кен. «Приложение L: Наборы вьетнамских символов» (PDF) . CJKV Обработка информации (2-е изд.). ISBN  978-0-596-51447-1.

Внешние ссылки [ править ]

  • Графики на Librewiki
  • Графики в Charset Wiki
  • таблицы с точками и именами Unicode