Псевдоним (а) | x-viet-tcvn5712 [1] |
---|---|
Язык (и) | Вьетнамский , английский |
Создан | TCVN / TC1 |
Стандарт | TCVN 5712: 1993 |
Классификация | 8-битный SBCS ; Расширенный ASCII (VSCII-2 / -3) |
VSCII ( Вьетнамский стандартный код для обмена информацией ), также известный как TCVN 5712 , [2] ISO-IR-180 , [3] .VN , [4] ABC [4] или просто кодировки TCVN , [4] [5] представляет собой набор из трех тесно связанных вьетнамских национальных стандартных кодировок символов для использования вьетнамского языка с компьютерами , разработанный Техническим комитетом TCVN по информационным технологиям (TCVN / TC1) и впервые принятый в 1993 году (как TCVN 5712: 1993). [2]
Его не следует путать с одноименной неофициальной кодировкой VISCII , которая иногда использовалась иностранцами, говорящими на вьетнамском языке. [4] VISCII также должен был обозначать вьетнамский стандартный код для обмена информацией , но не имеет отношения к VSCII. [6]
VSCII (TCVN) широко использовался на севере Вьетнама, в то время как VNI был популярен на юге. [4] Юникод и кодовая страница Windows-1258 теперь используются практически для всех вьетнамских компьютерных данных [ необходима ссылка ], но устаревшие файлы или заархивированные сообщения могут нуждаться в преобразовании.
Кодировки [ править ]
Во всех трех формах VSCII 95 печатаемых символов ASCII остаются неизменными.
VSCII-3 , также известный как TCVN 5712-3, VN3 или просто TCVN3, [7] включает наименьшее количество назначений. Это расширенный ASCII , потому что он сохраняет все 128 кодов ASCII неизменными. Он не переназначает управляющие коды C0 и C1 . По сравнению с ASCII он добавляет 75 символов:
- 67 строчных символов, что обеспечивает полную поддержку строчных букв.
- 7 заглавных букв, что позволяет использовать прописные буквы для 29 базовых букв без тональных знаков.
- Неразрывный пробел .
Тональные отметки на гласных в верхнем регистре выполняются в TCVN3 путем переключения на шрифт, состоящий только из заглавных букв. [8]
VSCII-2 , также известный как TCVN 5712-2 и VN2, является расширенным набором VSCII-3. Это расширенный ASCII , потому что он сохраняет все 128 кодов ASCII неизменными. Он не переназначает ни один из управляющих кодов C0 и C1 , что делает его совместимым с ISO 2022 как 96-набор. [2] [3] По сравнению с VSCII-3, он добавляет (всего 96 символов, отличных от ASCII):
- Еще 16 прописных символов с заранее составленными тональными знаками (всего 23 прописных символа, отличных от ASCII)
- 5, объединяющая диакритические знаки для тоновых знаков , позволяя представлять другие комбинации прописных букв и тоновых знаков. Комбинированные метки следуют за базовой буквой [2], как в VNI (а не перед ними, как в ANSEL ).
VSCII-1 , также известный как TCVN 5712-1 и VN1, является расширением VSCII-2 и является модифицированным ASCII, поскольку заменяет 12 из 33 управляющих символов заранее составленными символами. По сравнению с VSCII-2 он (всего 140 символов, отличных от ASCII):
- Добавляет еще 44 заранее составленных заглавных буквы, доводя их до того же количества, что и строчных
- Делается это путем замены 12 управляющих символов ASCII и выделения 32 графических символов в область управления C1, нарушая совместимость ISO 2022.
Преобразование из VSCII-3 в VSCII-2 или VSCII-1 и преобразование из VSCII-2 в VSCII-1 не требуется, но может привести к уменьшению размера файлов.
Преобразование из VSCII-1 в VSCII-2 или VSCII-3 и преобразование из VSCII-2 в VSCII-3 требует расширения некоторых предварительно составленных символов.
Набор символов [ править ]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | NUL 0000 | Ú 00DA | Ụ 1EE4 | ETX 0003 | Ừ 1EEA | Ử 1EEC | Ữ 1EEE | BEL 0007 | BS 0008 | HT 0009 | LF 000A | ВТ 000Б | FF 000C | CR 000D | SO 000E | SI 000F |
1_ 16 | DLE 0010 | Ứ 1EE8 | Ự 1EF0 | Ỳ 1EF2 | Ỷ 1EF6 | Ỹ 1EF8 | Ý 00DD | Ỵ 1EF4 | CAN 0018 | EM 0019 | SUB 001A | ESC 001B | FS 001C | GS 001D | RS 001E | США 001F |
2_ 32 | SP 0020 | ! 0021 | « 0022 | # 0023 | 0024 долл. США | % 0025 | & 0026 | ' 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | I 0049 | J 004A | K 004B | L 004C | M 004D | № 004E | O 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | Т 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | а 0061 | b 0062 | c 0063 | d 0064 | e 0065 | f 0066 | г 0067 | h 0068 | я 0069 | j 006A | k 006B | l 006C | м 006D | № 006E | o 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | v 0076 | w 0077 | х 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | DEL 007F |
8_ 128 | À 00C0 | Ả 1EA2 | Ã 00C3 | Á 00C1 | Ạ 1EA0 | Ặ 1EB6 | Ậ 1EAC | È 00C8 | Ẻ 1EBA | Ẽ 1EBC | É 00C9 | Ẹ 1EB8 | Ệ 1EC6 | Ì 00CC | Ỉ 1EC8 | Ĩ 0128 |
9_ 144 | Í 00CD | Ị 1ECA | Ò 00D2 | Ỏ 1ECE | Õ 00D5 | Ó 00D3 | ö 1ECC | Ộ 1ED8 | Ờ 1EDC | Ở 1EDE | Ỡ 1EE0 | Ớ 1EDA | Ợ 1EE2 | Ù 00D9 | Ủ 1EE6 | ˙U 0168 |
A_ 160 | NBSP 00A0 | Ă 0102 | Â 00C2 | Ê 00CA | Ô 00D4 | Ơ 01A0 | Ư 01AF | Đ 0110 | ă 0103 | â 00E2 | ê 00EA | ô 00F4 | ơ 01A1 | ˙U 01B0 | đ 0111 | Ằ 1EB0 |
B_ 176 | 0300 | ̉ 0309 | 0303 | 0301 | ̣ 0323 | à 00E0 | 1EA3 | ã 00E3 | á 00E1 | ạ 1EA1 | Ẳ 1EB2 | ằ 1EB1 | ẳ 1EB3 | ẵ 1EB5 | ắ 1EAF | Ẵ 1EB4 |
C_ 192 | Ắ 1EAE | Ầ 1EA6 | Ẩ 1EA8 | Ẫ 1EAA | Ấ 1EA4 | Ề 1EC0 | ặ 1EB7 | ầ 1EA7 | ẩ 1EA9 | ẫ 1EAB | ấ 1EA5 | ậ 1EAD | è 00E8 | Ể 1EC2 | ẻ 1EBB | ẽ 1EBD |
D_ 208 | é 00E9 | ẹ 1EB9 | é 1EC1 | ể 1EC3 | ễ 1EC5 | é 1EBF | ệ 1EC7 | ì 00EC | ỉ 1EC9 | Ễ 1EC4 | Ế 1EBE | Ồ 1ED2 | ĩ 0129 | í 00ED | я 1ECB | ò 00F2 |
E_ 224 | Ổ 1ED4 | ỏ 1ECF | х 00F5 | ó 00F3 | ọ 1ECD | ồ 1ED3 | ổ 1ED5 | ỗ 1ED7 | ố 1ED1 | ö 1ED9 | ờ 1EDD | ở 1EDF | ỡ 1EE1 | ớ 1EDB | ợ 1EE3 | ù 00F9 |
F_ 240 | Ỗ 1ED6 | ủ 1EE7 | ũ 0169 | ú 00FA | ụ 1EE5 | ừ 1EEB | ử 1EED | ữ 1EEF | ứ 1EE9 | ự 1EF1 | ỳ 1EF3 | ỷ 1EF7 | ỹ 1EF9 | ý 00FD | ỵ 1EF5 | Ố 1ED0 |
Письмо Число Пунктуация Условное обозначение Другой Неопределенный
Затенение шахматной доски указывает на символы, которых нет в VSCII-3. Закрашенные символы в строках 0_, 1_, 8_ и 9_ не входят в VSCII-2 или VSCII-3. [9]
Ссылки [ править ]
- ^ Sivonen, Анри (2014-09-26). «Изменения кодировки символов в MC требуют действия cc» . mozilla.dev.apps.thunderbird .
- ^ a b c d e "[новости] TCVN 5712: 1993 (VSCII) - Вьетнамский национальный стандарт" . 1993-06-02. Архивировано из оригинала на 2017-01-11.
- ^ а б ТВЦН (1993). «ISO-IR-180: Правая часть кодовой таблицы VSCII-2» (PDF) . ITSCJ / IPSJ .
- ^ a b c d e Ngo, Hoc Dinh; Тран, Тубинь. «5. Зачем нужна вьетнамская кодировка (набор символов - кодировка)?» . Некоторые специальные функции WinVNKey .
- ^ Нгуен, Минь Т. «Вьетнамские преобразования (Vietnet / VIQR, VNI, VPS, VISCII, VNU, TCVN, VietWare, unicode)» .
- ^ Лунде, Кен. «Глава 1: Обзор обработки информации CJKV (§ Идентичны ли VISCII и VSCII? А как насчет TCVN?)». CJKV Обработка информации (2-е изд.). п. 17. ISBN 978-0-596-51447-1.
- ^ «Юникод и вьетнамские кодировки старых символов» . Вьетнамский Unicode: часто задаваемые вопросы .
- ^ «Юникод и вьетнамские кодировки старых символов» . Вьетнамский Unicode: часто задаваемые вопросы .
TCVN3 не является двухбайтовым, но из-за характера его кодировки заглавные буквы (гласные) отображаются в отдельный заглавный шрифт, который похож на обычный строчный шрифт.
- ^ Лунде, Кен. «Приложение L: Наборы вьетнамских символов» (PDF) . CJKV Обработка информации (2-е изд.). ISBN 978-0-596-51447-1.
Внешние ссылки [ править ]
- Графики на Librewiki
- Графики в Charset Wiki
- таблицы с точками и именами Unicode