KS X 1001 , « Код для обмена информацией (хангыль и ханджа) », [a] [1], ранее называвшийся KS C 5601 , - это южнокорейский стандарт кодированного набора символов для представления символов хангыль и ханджа на компьютере.
MIME / IANA | ks_c_5601-1987 |
---|---|
Псевдоним (а) | KS C 5601 |
Язык (и) | Корейский , английский , русский Частичная поддержка: греческий , японский |
Стандарт | KS X 1001 |
Классификация | ISO-2022- совместимый DBCS , кодирование CJK |
Форматы кодирования | EUC-KR , ISO 2022 , UHC , Johab |
Предшествует | N-байтовый код хангыль (KS C 5601-1974) |
Другая связанная кодировка (и) | KS X 1002 , KPS 9566 , JIS X 0208 , GB 2312 , GB 12052 |
KS X 1001 кодируется наиболее общим наследием (пре- Unicode ) кодировки символов для корейского , включая EUC-KR и от Microsoft Unified хангыль кодекса (UHC). Он содержит корейские слоги хангыль , иероглифы CJK (ханджа), греческие , кириллические , японские ( хирагана и катакана ) и некоторые другие символы.
KS X 1001 организован в виде таблицы 94 × 94 в соответствии со структурой 2-байтовых кодовых слов в ISO 2022 и EUC . Следовательно, его кодовые точки представляют собой пары целых чисел 1–94. Однако некоторые кодировки (UHC и Johab ), помимо предоставления кодов для каждой кодовой точки, предоставляют дополнительные коды для символов, которые иначе могут быть представлены только как последовательности кодовых точек.
История
Этот стандарт ранее был известен как KS C 5601. В него было внесено несколько редакций. Например, изменения были в 1987, 1992, 1998 и 2002 годах.
Настоящий двухбайтовый набор символов Wansung ( 완성 , Wanseong , «предварительное составление») [1] был стандартизирован третьим изданием KS C 5601, [2], которое было опубликовано в 1986 году. [3] Это стандарт ISO 2022. совместимая кодировка, обычно используемая в форме EUC , которая назначает двухбайтовые коды для не-хангыль, хангыль-джамо и наиболее распространенных слогов хангыль, в отличие от джохаба ( 조합 , Johap , «комбинирование») [1], который несовместим с ISO 2022, но присваивает двухбайтовые коды всем слогам хангыля с использованием современного джамо. [2] Wansung технически является кодировкой переменной длины, позволяющей представлять другие слоги с помощью восьмибайтовых последовательностей (с использованием символов jamo и Hangul Filler), но эта функция не всегда реализуется. [4]
Самая ранняя редакция KS C 5601, опубликованная в 1974 г. [2], определяла 7-битный набор символов переменной длины [2], который назначал однобайтовые кодовые точки для 51 [3] базового хангыльского джамо , в некоторой степени аналогично JIS C 6220 в кодировке, известной как «N-байтовый хангыль». [5] Второе издание, опубликованное в 1982 году, сохранило основной набор символов из издания 1974 года, но определило два дополнительных набора, включая версию Джохаба. Ни одно из изданий не было принято так широко, как предполагалось. [2]
Вансон оставался неизменным в выпусках 1987 и 1992 годов. В издание 1992 года был добавлен дополнительный материал приложения [3], включая определение кодировки Johab [6] в приложении 3 и более старую N-байтовую кодировку хангыль в приложении 4. [1] [5] Оно было опубликовано в ответ на промышленное использование Johab в качестве кодировки, конкурирующей с Wansung, которая в то время использовалась текстовым процессором Hangul . После введения Microsoft Unified Hangul Code в Windows 95 и отказа текстового процессора Hangul от Johab в пользу Unicode в 2000 году, Johab перестал использоваться повсеместно. [2]
Кодировки
Кодирование схемы KS X 1001 включают в себя EUC-KR (в обоих ASCII и ISO 646 -Kr варианты , основанные, последний из которых включает в себя Won знак валюты ( ₩ ) на байт 0x 5С , а не обратной косой черты) и ISO-2022-KR , [7], а также ISO-2022-JP-2 (который также кодирует JIS X 0208 и JIS X 0212 ). Все они имеют недостаток, заключающийся в том, что они назначают коды только для 2350 предварительно составленных слогов хангыля, которые имеют свои собственные кодовые точки KS X 1001 (из 11172 в общей сложности, не считая тех, которые используют устаревшее хамо), и требуют, чтобы другие использовали восьмибайтовые композиционные последовательности, которые не поддерживаются некоторыми частичными реализациями стандарта. [4]
Johab кодирование ( это предусмотрено в приложении 3 к версии стандарта 1992 года) и EUC-KR SUPERSET известен как Единый хангыль кодекс (UHC, называемым также Окнами-949) обеспечивает одиночные коды для всех 11172 хангылите слогов. [7] [6] ISO-2022-KR и Johab используются редко. Некоторые операционные системы расширяют этот стандарт другими неоднородными способами, например, расширения EUC-KR MacKorean в классической Mac OS и IBM-949 от IBM .
Наполнитель хангыль
Символ-заполнитель хангыль используется для введения восьмибайтовых композиционных последовательностей хангыль [8] [9] и для замены отсутствующего элемента (обычно пустого финала) в такой последовательности. [9]
Unicode включает код Wansung Hangul Filler в блок Hangul Compatibility Jamo для двусторонней совместимости, но использует свою собственную систему (со своими собственными, по-разному используемыми символами-заполнителями) для составления хангыля. Система композиции KS X 1001 Hangul не используется в Unicode, и заполнитель визуализируется просто как пустое пространство; Последовательности композиции KS X 1001 с использованием современного джамо могут быть сопоставлены с предварительно составленными символами в Unicode. [9] Обычно этого не делают с Унифицированным кодом хангыль .
Для двусторонней совместимости Unicode также включает N-байтовый код хангыль Hangul Filler отдельно в блоке Halfwidth и Fullwidth Forms , называемый «Halfwidth Hangul Filler».
N-байтовый код хангыль
Это N-байтовый код хангыль [5], определенный в KS C 5601-1974 и в приложении 4 KS C 5601-1992. Вторая половина кодовой страницы 1040 [10] IBM представляет собой надмножество этой кодовой страницы , в которой символы ¢¬\~
(хотя и не £
) назначаются в те же места, что и на кодовой странице 1041 . Символ 0x40 / 0xC0 - это заполнитель хангыля (см. Выше ), используемый при объединении последовательностей.
Подобно своему японскому аналогу JIS C 6220 (JIS X 0201), N-байтовый код хангыль может использоваться как 7-битная кодировка с распределением символов в диапазоне от 0x 40 до 0x7C. [5] На приведенной ниже диаграмме показан код в 8-битной среде с установленным старшим битом (т. Е. От 0xC0 до 0xFC), как он используется, например, в кодовой странице 1040.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8_ 128 | ||||||||||||||||
9_ 144 | ||||||||||||||||
A_ 160 | ||||||||||||||||
B_ 176 | ||||||||||||||||
C_ 192 | HWHF FFA0 | ᄀ FFA1 | ㄲ FFA2 | ᆪ FFA3 | ᄂ FFA4 | ᆬ FFA5 | ᆭ FFA6 | ᄃ FFA7 | ᄄ FFA8 | ᄅ FFA9 | ᆰ FFAA | ᆱ FFAB | ᆲ FFAC | ᆳ FFAD | ᆴ FFAE | ᆵ FFAF |
D_ 208 | ᄚ FFB0 | ᄆ FFB1 | ᄇ FFB2 | ᄈ FFB3 | ᄡ FFB4 | ᄉ FFB5 | ᄊ FFB6 | ᄋ FFB7 | ᄌ FFB8 | ᄍ FFB9 | ㅊ FFBA | ᄏ FFBB | ᄐ FFBC | ᄑ FFBD | ᄒ FFBE | |
E_ 224 | ㅏ FFC2 | ᅢ FFC3 | ᅣ FFC4 | ᅤ FFC5 | ᅥ FFC6 | ᅦ FFC7 | ᅧ FFCA | ᅨ FFCB | ᅩ FFCC | ᅪ FFCD | ᅫ FFCE | ᅬ FFCF | ||||
F_ 240 | ᅭ FFD2 | ᅮ FFD3 | ᅯ FFD4 | ᅰ FFD5 | ᅱ FFD6 | ᅲ FFD7 | ᅳ FFDA | ᅴ FFDB | ᅵ FFDC |
Таблицы кодов Wansung
Ниже приведены таблицы кодов для KS X 1001 в компоновке Wansung. Если дана пара шестнадцатеричных чисел, меньшее используется при кодировании через GL (0x21-0x7E), как в ISO-2022-KR, когда корейский набор был сдвинут на, а большее используется в более типичном случае он кодируется через GR (0xA1-0xFE), как в EUC-KR или UHC. Джохаб изменяет расположение, чтобы кодировать все группы 11172 хангыль по отдельности и по порядку.
Непредварительно составленные наборы без ханджи
Набор символов 0x21 / 0xA1 (номер строки 1, специальные символы)
Этот набор содержит знаки препинания и другие символы, за исключением знаков пунктуации, присутствующих в KS X 1003 (который включен в строку 3). Кодировки, которые объединяют KS X 1001 с однобайтовым ASCII, могут использовать альтернативное отображение Unicode в блоках Halfwidth и Fullwidth Forms для обратной косой черты. Отображение в Юникоде волнового тире (тильда-тире) также различается между поставщиками и может быть U + 301C (одобрено IBM и Apple) [12] [13] [14] или U + 223C (одобрено Microsoft). [15] [16] Сравните аналогичную, но не идентичную обработку тире волны JIS и обработку тильды в следующей строке.
Если ниже показаны два сопоставления, за исключением обратной косой черты, первое используется Apple, а второе - Microsoft. [14] [16]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | | IDSP 3000 1-1 | 、 3001 1-2 | 。 3002 1-3 | · 00B7 1-4 | ‥ 2025 1–5 | … 2026 1–6 | ¨ 00A8 1-7 | 〃 3003 1–8 | - / Застенчивый 2013 / 00AD 1-9 | - / - 2014/2015 1-10 | ‖ / ∥ 2016/2225 1-11 | \ / \ 005C / FF3C 1-12 | 〜 / ∼ 301C / 223C 1-13 | ' 2018 1-14 | ' 2019 1-15 |
3_ / B_ | « 201C 1-16 | ” 201D 1-17 | 〔 3014 1–18 | 〕 3015 1–19 | 〈 3008 1-20 | 〉 3009 1-21 | 《 300A 1-22 | 》 300Б 1-23 | 「 300C 1-24 | 」 300D 1-25 | 『 300E 1-26 | 』 300F 1-27 | 【 3010 1-28 | 】 3011 1-29 | ± 00B1 1-30 | × 00D7 1-31 |
4_ / C_ | ÷ 00F7 1-32 | ≠ 2260 1-33 | ≤ 2264 1–34 | ≥ 2265 1–35 | ∞ 221E 1-36 | ∴ 2234 1-37 | ° 00B0 1-38 | ′ 2032 г. 1-39 | ″ 2033 1-40 | ℃ 2103 1-41 | Å 212B 1-42 | ¢ / ¢ 00A2 / FFE0 1-43 | £ / £ 00A3 / FFE1 1-44 | ¥ / ¥ 00A5 / FFE5 1-45 | ♂ 2642 1-46 | ♀ 2640 1-47 |
5_ / D_ | ∠ 2220 1-48 | ⊥ 22A5 1-49 | ⌒ 2312 1-50 | ∂ 2202 1-51 | ∇ 2207 1-52 | ≡ 2261 1-53 | ≒ 2252 1–54 | § 00A7 1-55 | ※ 203B 1-56 | ☆ 2606 1-57 | ★ 2605 1-58 | ○ 25CB 1-59 | ● 25CF 1–60 | ◎ 25CE 1-61 | ◇ 25C7 1-62 | ◆ 25C6 1-63 |
6_ / E_ | □ 25A1 1-64 | ■ 25A0 1-65 | △ 25B3 1-66 | ▲ 25B2 1-67 | ▽ 25БД 1-68 | ▼ 25 г. до н.э. 1-69 | → 2192 1-70 | ← 2190 1-71 | ↑ 2191 1-72 | ↓ 2193 1-73 | ↔ 2194 1-74 | 〓 3013 1-75 | ≪ 226А 1-76 | ≫ 226Б 1-77 | √ 221A 1-78 | ∽ 223Д 1-79 |
7_ / F_ | ∝ 221D 1-80 | ∵ 2235 1-81 | ∫ 222Б 1-82 | ∬ 222С 1-83 | ∈ 2208 1-84 | ∋ 220Б 1-85 | ⊆ 2286 1-86 | ⊇ 2287 1-87 | ⊂ 2282 1-88 | ⊃ 2283 1-89 | ∪ 222А 1-90 | ∩ 2229 1-91 | ∧ 2227 1-92 | ∨ 2228 1-93 | ¬ / ¬ 00AC / FFE2 1-94 | |
Письмо Число Пунктуация Символ Другой Неопределенный
Набор символов 0x22 / 0xA2 (номер строки 2, специальные символы)
Этот набор содержит дополнительные знаки препинания и символы. Подобно символу тильды в предыдущей строке, Apple и Microsoft используют разные сопоставления для символа тильды в этой строке (U + 02DC от Apple, FF5E от Microsoft), [14] [16], который предназначен для отображения как приподнятая тильда, тогда как тильда в предыдущей строке предназначена для отображения в строке на высоте тире. [17] Отображение точки в кружке также отличается. [14] [16]
Знак евро и зарегистрированный товарный знак были добавлены к стандарту в 1998 году, а почтовый знак (㉾) был добавлен в 2002 году. [1] До этого эти три кодовые точки могли использоваться для других, нестандартных целей. поставщики, например 1⃞, 2⃞ и 3⃞ от Apple. [18]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | | ⇒ 21D2 2-1. | ⇔ 21D4 2-2 | ∀ 2200 2–3 | ∃ 2203 2-4 | ´ 00B4 2-5 | ˜ / ~ 02DC / FF5E 2-6 | 02C7 2-7 | ˘ 02D8 2-8 | ˝ 02DD 2-9 | ˚ 02DA 2-10 | ˙ 02D9 2-11 | ¸ 00B8 2-12 | ˛ 02DB 2-13 | ¡ 00A1 2-14 | ¿ 00BF 2-15 |
3_ / B_ | ː 02D0 2-16 | ∮ 222E 2-17 | ∑ 2211 2-18 | ∏ 220F 2-19 | ¤ 00A4 2-20 | ℉ 2109 2-21 | ‰ 2030 2–22 | ◁ 25C1 2-23 | ◀ 25C0 2-24 | ▷ 25B7 2-25 | ▶ 25B6 2-26 | ♤ 2664 2–27 | ♠ 2660 2–28 | ♡ 2661 2–29 | ♥ 2665 2-30 | ♧ 2667 2–31 |
4_ / C_ | ♣ 2663 2-32 | ◉ / ⊙ 25C9 / 2299 2-33 | ◈ 25C8 2-34 | ▣ 25A3 2-35 | ◐ 25D0 2-36 | ◑ 25D1 2-37 | ▒ 2592 2–38 | ▤ 25A4 2-39 | ▥ 25A5 2-40 | ▨ 25A8 2-41 | ▧ 25A7 2-42 | ▦ 25A6 2-43 | ▩ 25A9 2-44 | ♨ 2668 2-45 | ☏ 260Ф 2-46 | ☎ 260E 2-47 |
5_ / D_ | ☜ 261C 2-48 | ☞ 261Е 2-49 | ¶ 00B6 2-50 | † 2-51 2020 г. | ‡ 2021 2–52 | ↕ 2195 2–53 | ↗ 2197 2–54 | ↙ 2199 2–55 | ↖ 2196 2–56 | ↘ 2198 2–57 | ♭ 266D 2-58 | ♩ 2669 2–59 | ♪ 266A 2-60 | ♬ 266C 2-61 | ㉿ 327F 2-62 | ㈜ 321C 2-63 |
6_ / E_ | № 2116 2-64 | ㏇ 33C7 2-65 | ™ 2122 2-66 | ㏂ 33с2 2-67 | ㏘ 33D8 2-68 | ℡ 2121 2-69 | 20 € AC 2-70 | ® 00AE 2-71 | ㉾ 327E 2-72 | 2-73 | 2-74 | 2-75 | 2-76 | 2-77 | 2-78 | 2-79 |
7_ / F_ | 2-80 | 2-81 | 2-82 | 2-83 | 2-84 | 2-85 | 2-86 | 2-87 | 2-88 | 2-89 | 2-90 | 2-91 | 2-92 | 2-93 | 2-94 | |
Набор символов 0x23 / 0xA3 (номер строки 3, базовая латиница / ISO 646-KR)
Этот набор соответствует KS X 1003 ( вариант ISO 646 для корейского языка, аналогичный набор для ASCII ), но в виде двухбайтовых кодов, которым предшествует 0x23 (или 0xA3 в форме с делегированием GR (EUC)). Он включает английский алфавит / основной латинский алфавит , западные арабские цифры и знаки препинания.
Сравните римский набор JIS X 0201 , который отличается тем, что включает знак йены, а не знак выигрыша . Сравните третьи ряды KPS 9566 и JIS X 0208 , которые соответствуют макету ISO 646, но содержат только буквы и цифры.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | | ! 0021 3-1 | " 0022 3-2 | # 0023 3-3 | $ 0024 3-4 | % 0025 3-5 | & 0026 3-6 | ' 0027 3-7 | ( 0028 3-8 | ) 0029 3-9 | * 002A 3-10 | + 002B 3-11 | , 002C 3-12 | - 002D 3-13 | . 002E 3-14 | / 002F 3-15 |
3_ / B_ | 0 0030 3-16 | 1 0031 3-17 | 2 0032 3-18 | 3 0033 3-19 | 4 0034 3-20 | 5 0035 3-21 | 6 0036 3-22 | 7 0037 3-23 | 8 0038 3-24 | 9 0039 3-25 | : 003A 3-26 | ; 003B 3-27 | < 003C 3-28 | = 003D 3-29 | > 003E 3-30 | ? 003F 3-31 |
4_ / C_ | @ 0040 3-32 | А 0041 3-33 | В 0042 3-34 | С 0043 3-35 | D 0044 3-36 | E 0045 3-37 | Ф 0046 3-38 | G 0047 3-39 | Н 0048 3-40 | I 0049 3-41 | J 004A 3-42 | К 004Б 3-43 | L 004C 3-44 | М 004Д 3-45 | № 004Е 3-46 | О 004F 3-47 |
5_ / D_ | П 0050 3-48 | Q 0051 3-49 | Р 0052 3-50 | С 0053 3-51 | Т 0054 3-52 | U 0055 3-53 | V 0056 3-54 | W 0057 3-55 | 0058 Х 3-56 | Y 0059 3-57 | Z 005A 3-58 | [ 005B 3-59 | ₩ 20A9 3-60 | ] 005D 3-61 | ^ 005E 3-62 | _ 005F 3-63 |
6_ / E_ | ` 0060 3-64 | а 0061 3-65 | б 0062 3-66 | c 0063 3-67 | д 0064 3-68 | е 0065 3-69 | ф 0066 3-70 | г 0067 3-71 | ч 0068 3-72 | я 0069 3-73 | j 006A 3-74 | к 006Б 3-75 | л 006C 3-76 | м 006Д 3-77 | n 006E 3-78 | o 006F 3-79 |
7_ / F_ | п 0070 3-80 | q 0071 3-81 | р 0072 3-82 | S 0073 3-83 | т 0074 3-84 | u 0075 3-85 | v 0076 3-86 | w 0077 3-87 | х 0078 3-88 | y 0079 3-89 | z 007A 3-90 | { 007B 3-91 | | 007C 3-92 | } 007D 3-93 | ~ 203E 3-94 | |
Кодировки, такие как EUC-KR и UHC, комбинируют KS X 1001 с однобайтовым ASCII или KS X 1003 и, следовательно, используют альтернативные отображения Unicode в блок Halfwidth и Fullwidth Forms для двухбайтовых представлений этих символов.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | | ! FF01 3-1 | " FF02 3-2 | # FF03 3-3 | $ FF04 3-4 | % FF05 3-5 | & FF06 3-6 | ' FF07 3-7 | ( FF08 3-8 | ) FF09 3-9 | * FF0A 3-10 | + FF0B 3-11 | , FF0C 3-12 | - FF0D 3-13 | . FF0E 3-14 | / FF0F 3-15 |
3_ / B_ | 0 FF10 3-16 | 1 FF11 3-17 | 2 FF12 3-18 | 3 FF13 3-19 | 4 FF14 3-20 | 5 FF15 3-21 | 6 FF16 3-22 | 7 FF17 3-23 | 8 FF18 3-24 | 9 FF19 3-25 | : FF1A 3-26 | ; FF1B 3-27 | < FF1C 3-28 | = FF1D 3-29 | > FF1E 3-30 | ? FF1F 3-31 |
4_ / C_ | @ FF20 3-32 | A FF21 3-33 | B FF22 3-34 | C FF23 3-35 | D FF24 3-36 | E FF25 3-37 | F FF26 3-38 | G FF27 3-39 | H FF28 3-40 | I FF29 3-41 | J FF2A 3-42 | K FF2B 3-43 | L FF2C 3-44 | M FF2D 3-45 | N FF2E 3-46 | O FF2F 3-47 |
5_ / D_ | P FF30 3-48 | Q FF31 3-49 | R FF32 3-50 | S FF33 3-51 | T FF34 3-52 | U FF35 3-53 | V FF36 3-54 | W FF37 3-55 | X FF38 3-56 | Y FF39 3-57 | Z FF3A 3-58 | [ FF3B 3-59 | ₩ FFE6 3-60 | ] FF3D 3-61 | ^ FF3E 3-62 | _ FF3F 3-63 |
6_ / E_ | ` FF40 3-64 | a FF41 3-65 | b FF42 3-66 | c FF43 3-67 | д FF44 3-68 | e FF45 3-69 | f FF46 3-70 | g FF47 3-71 | h FF48 3-72 | i FF49 3-73 | j FF4A 3-74 | k FF4B 3-75 | л FF4C 3-76 | m FF4D 3-77 | n FF4E 3-78 | o FF4F 3-79 |
7_ / F_ | p FF50 3-80 | q FF51 3-81 | r FF52 3-82 | s FF53 3-83 | t FF54 3-84 | u FF55 3-85 | v FF56 3-86 | w FF57 3-87 | x FF58 3-88 | y FF59 3-89 | г FF5A 3-90 | { FF5B 3-91 | | FF5C 3-92 | } FF5D 3-93 | ¯ FFE3 3-94 | |
Набор символов 0x24 / 0xA4 (строка номер 4, хангыль джамо)
Этот набор включает современные согласные хангыль, за которыми следуют гласные, оба упорядоченные по южнокорейским обычаям сопоставления, за которыми следуют устаревшие согласные. При использовании по отдельности эти символы сопоставляются с блоком Unicode Hangul Compatibility Jamo и не имеют однозначного сопоставления с позиционными символами в блоке Hangul Jamo . Сравните со строкой 4 северокорейского КПС 9566 . Символ 04-52 - это наполнитель хангыль (см. Выше ), используемый в комбинирующих последовательностях.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | | ㄱ 3131 4-1 | ㄲ 3132 4-2 | ㄳ 3133 4-3 | ㄴ 3134 4-4 | ㄵ 3135 4–5 | ㄶ 3136 4-6 | ㄷ 3137 4-7 | ㄸ 3138 4-8 | ㄹ 3139 4–9 | ㄺ 313A 4-10 | ㄻ 313Б 4-11 | ㄼ 313C 4-12 | ㄽ 313D 4-13 | ㄾ 313E 4-14 | ㄿ 313F 4-15 |
3_ / B_ | ㅀ 3140 4–16 | ㅁ 3141 4-17 | ㅂ 3142 4-18 | ㅃ 3143 4-19 | ㅄ 3144 4-20 | ㅅ 3145 4-21 | ㅆ 3146 4-22 | ㅇ 3147 4-23 | ㅈ 3148 4-24 | ㅉ 3149 4-25 | ㅊ 314А 4-26 | ㅋ 314B 4-27 | ㅌ 314C 4-28 | ㅍ 314D 4-29 | ㅎ 314E 4-30 | ㅏ 314F 4-31 |
4_ / C_ | ㅐ 3150 4-32 | ㅑ 3151 4-33 | ㅒ 3152 4-34 | ㅓ 3153 4-35 | ㅔ 3154 4-36 | ㅕ 3155 4–37 | ㅖ 3156 4–38 | ㅗ 3157 4–39 | ㅘ 3158 4-40 | ㅙ 3159 4-41 | ㅚ 315А 4-42 | ㅛ 315B 4-43 | ㅜ 315C 4-44 | ㅝ 315Д 4-45 | ㅞ 315E 4-46 | ㅟ 315Ф 4-47 |
5_ / D_ | ㅠ 3160 4-48 | ㅡ 3161 4-49 | ㅢ 3162 4-50 | ㅣ 3163 4-51 | ВЧ 3164 4-52 | ㅥ 3165 4–53 | ㅦ 3166 4–54 | ㅧ 3167 4-55 | ㅨ 3168 4–56 | ㅩ 3169 4-57 | ㅪ 316А 4-58 | ㅫ 316B 4-59 | ㅬ 316C 4-60 | ㅭ 316D 4-61 | ㅮ 316E 4-62 | ㅯ 316F 4-63 |
6_ / E_ | ㅰ 3170 4-64 | ㅱ 3171 4-65 | ㅲ 3172 4-66 | ㅳ 3173 4-67 | ㅴ 3174 4-68 | ㅵ 3175 4-69 | ㅶ 3176 4-70 | ㅷ 3177 4-71 | ㅸ 3178 4-72 | ㅹ 3179 4-73 | ㅺ 317А 4-74 | ㅻ 317Б 4-75 | ㅼ 317C 4-76 | ㅽ 317Д 4-77 | ㅾ 317E 4-78 | ㅿ 317Ф 4-79 |
7_ / F_ | ㆀ 3180 4-80 | ㆁ 3181 4-81 | ㆂ 3182 4-82 | ㆃ 3183 4-83 | ㆄ 3184 4-84 | ㆅ 3185 4-85 | ㆆ 3186 4-86 | ㆇ 3187 4-87 | ㆈ 3188 4-88 | ㆉ 3189 4-89 | ㆊ 318A 4-90 | ㆋ 318Б 4-91 | ㆌ 318C 4-92 | ㆍ 318Д 4-93 | ㆎ 318Е 4-94 | |
Набор символов 0x25 / 0xA5 (номер строки 5, римские цифры и греческие)
Этот набор содержит римские цифры и базовую поддержку греческого алфавита без диакритических знаков и последней сигмы .
Контрастный ряд 6 KPS 9566 , который включает те же символы, но в другой раскладке.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | | Ⅰ 2170 5-1 | Ⅱ 2171 5-2 | Ⅲ 2172 5–3 | Ⅳ 2173 5–4 | Ⅴ 2174 5–5 | Ⅵ 2175 5–6 | Ⅶ 2176 5–7 | Ⅷ 2177 5–8 | Ⅸ 2178 5–9 | Ⅹ 2179 5-10 | 5-11 | 5–12 | 5-13 | 5-14 | 5-15 |
3_ / B_ | Ⅰ 2160 5–16 | Ⅱ 2161 5-17 | Ⅲ 2162 5–18 | Ⅳ 2163 5-19 | Ⅴ 2164 5-20 | Ⅵ 2165 5–21 | Ⅶ 2166 5–22 | Ⅷ 2167 5-23 | Ⅸ 2168 5-24 | Ⅹ 2169 5-25 | 5–26 | 5–27 | 5–28 | 5–29 | 5-30 | 5-31 |
4_ / C_ | 5-32 | Α 0391 5-33 | Β 0392 5-34 | Γ 0393 5-35 | Δ 0394 5-36 | Ε 0395 5-37 | Ζ 0396 5-38 | Η 0397 5-39 | Θ 0398 5-40 | Ι 0399 5-41 | Κ 039A 5-42 | Λ 039Б 5-43 | Μ 039C 5-44 | Ν 039D 5-45 | Ξ 039E 5-46 | Ο 039F 5-47 |
5_ / D_ | Π 03A0 5-48 | Ρ 03A1 5-49 | Σ 03A3 5-50 | Τ 03A4 5-51 | Υ 03A5 5-52 | Φ 03A6 5-53 | Χ 03A7 5-54 | Ψ 03A8 5-55 | Ом 03A9 5-56 | 5-57 | 5-58 | 5-59 | 5-60 | 5-61 | 5-62 | 5-63 |
6_ / E_ | 5-64 | α 03B1 5-65 | β 03B2 5-66 | γ 03B3 5-67 | δ 03B4 5-68 | ε 03B5 5-69 | ζ 03B6 5-70 | η 03B7 5-71 | θ 03B8 5-72 | ι 03B9 5-73 | κ 03БА 5-74 | λ 03BB 5-75 | μ 03ВС 5-76 | ν 03БД 5-77 | ξ 03БЭ 5-78 | ο 03BF 5-79 |
7_ / F_ | π 03C0 5-80 | ρ 03C1 5-81 | σ 03C3 5-82 | τ 03C4 5-83 | υ 03C5 5-84 | φ 03C6 5-85 | χ 03C7 5-86 | ψ 03C8 5-87 | ω 03C9 5-88 | 5-89 | 5-90 | 5-91 | 5-92 | 5-93 | 5-94 | |
Набор символов 0x26 / 0xA6 (номер строки 6, рисунок рамки)
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | | ─ 2500 6-1 | │ 2502 6-2 | ┌ 250C 6-3 | ┐ 2510 6-4 | ┘ 2518 6–5 | └ 2514 6-6 | ├ 251C 6-7 | ┬ 252C 6-8 | ┤ 2524 6–9 | ┴ 2534 6-10 | ┼ 253C 6-11 | ━ 2501 6–12 | ┃ 2503 6–13 | ┏ 250F 6-14 | ┓ 2513 6-15 |
3_ / B_ | ┛ 251Б 6-16 | ┗ 2517 6–17 | ┣ 2523 6–18 | ┳ 2533 6-19 | ┫ 252Б 6-20 | ┻ 253Б 6-21 | ╋ 254Б 6-22 | ┠ 2520 6–23 | ┯ 252F 6-24 | ┨ 2528 6-25 | ┷ 2537 6-26 | ┿ 253F 6-27 | ┝ 251D 6-28 | ┰ 2530 6–29 | ┥ 2525 6–30 | ┸ 2538 6-31 |
4_ / C_ | ╂ 2542 6-32 | ┒ 2512 6-33 | ┑ 2511 6-34 | ┚ 251А 6-35 | ┙ 2519 6-36 | ┖ 2516 6-37 | ┕ 2515 6–38 | ┎ 250E 6-39 | ┍ 250D 6-40 | ┞ 251Е 6-41 | ┟ 251F 6-42 | ┡ 2521 6-43 | ┢ 2522 6-44 | ┦ 2526 6-45 | ┧ 2527 6-46 | ┩ 2529 6-47 |
5_ / D_ | ┪ 252А 6-48 | ┭ 252Д 6-49 | ┮ 252E 6-50 | ┱ 2531 6–51 | ┲ 2532 6–52 | ┵ 2535 6-53 | ┶ 2536 6–54 | ┹ 2539 6-55 | ┺ 253A 6-56 | ┽ 253D 6-57 | ┾ 253E 6-58 | ╀ 2540 6-59 | ╁ 2541 6-60 | ╃ 2543 6-61 | ╄ 2544 6-62 | ╅ 2545 6-63 |
6_ / E_ | ╆ 2546 6–64 | ╇ 2547 6-65 | ╈ 2548 6-66 | ╉ 2549 6-67 | ╊ 254А 6-68 | 6-69 | 6-70 | 6-71 | 6-72 | 6-73 | 6-74 | 6-75 | 6-76 | 6-77 | 6-78 | 6-79 |
7_ / F_ | 6-80 | 6-81 | 6-82 | 6-83 | 6-84 | 6-85 | 6-86 | 6-87 | 6-88 | 6-89 | 6-90 | 6-91 | 6-92 | 6-93 | 6-94 | |
Набор символов 0x27 / 0xA7 (номер строки 7, символы единиц)
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | | ㎕ 3395 7-1 | ㎖ 3396 7-2 | ㎗ 3397 7-3 | ℓ 2113 7-4 | ㎘ 3398 7–5 | ㏄ 33C4 7-6 | ㎣ 33A3 7-7 | ㎤ 33A4 7-8 | ㎥ 33A5 7-9 | ㎦ 33A6 7-10 | ㎙ 3399 7-11 | ㎚ 339A 7-12 | ㎛ 339Б 7-13 | ㎜ 339C 7-14 | ㎝ 339D 7-15 |
3_ / B_ | ㎞ 339E 7-16 | ㎟ 339F 7-17 | ㎠ 33A0 7-18 | ㎡ 33A1 7-19 | ㎢ 33A2 7-20 | ㏊ 33CA 7-21 | ㎍ 338D 7-22 | ㎎ 338E 7-23 | ㎏ 338F 7-24 | ㏏ 33CF 7-25 | ㎈ 3388 7-26 | ㎉ 3389 7–27 | ㏈ 33C8 7-28 | ㎧ 33A7 7-29 | ㎨ 33A8 7-30 | ㎰ 33B0 7-31 |
4_ / C_ | ㎱ 33Б1 7-32 | ㎲ 33Б2 7-33 | ㎳ 33Б3 7-34 | ㎴ 33B4 7-35 | ㎵ 33B5 7-36 | ㎶ 33B6 7-37 | ㎷ 33B7 7-38 | ㎸ 33B8 7-39 | ㎹ 33B9 7-40 | ㎀ 3380 7-41 | ㎁ 3381 7-42 | ㎂ 3382 7-43 | ㎃ 3383 7-44 | ㎄ 3384 7-45 | ㎺ 33БА 7-46 | ㎻ 33BB 7-47 |
5_ / D_ | ㎼ 33ВС 7-48 | ㎽ 33БД 7-49 | ㎾ 33BE 7-50 | ㎿ 33BF 7-51 | ㎐ 3390 7-52 | ㎑ 3391 7-53 | ㎒ 3392 7–54 | ㎓ 3393 7-55 | ㎔ 3394 7-56 | Ом 2126 7-57 | ㏀ 33C0 7-58 | ㏁ 33с1 7-59 | ㎊ 338A 7-60 | ㎋ 338Б 7-61 | ㎌ 338C 7-62 | ㏖ 33Д6 7-63 |
6_ / E_ | ㏅ 33C5 7-64 | ㎭ 33AD 7-65 | ㎮ 33АЭ 7-66 | ㎯ 33AF 7-67 | ㏛ 33ДБ 7-68 | ㎩ 33A9 7-69 | ㎪ 33AA 7-70 | ㎫ 33AB 7-71 | ㎬ 33AC 7-72 | ㏝ 33ДД 7-73 | ㏐ 33D0 7-74 | ㏓ 33Д3 7-75 | ㏃ 33C3 7-76 | ㏉ 33C9 7-77 | ㏜ 33ДК 7-78 | ㏆ 33C6 7-79 |
7_ / F_ | 7-80 | 7-81 | 7-82 | 7-83 | 7-84 | 7-85 | 7-86 | 7-87 | 7-88 | 7-89 | 7-90 | 7-91 | 7-92 | 7-93 | 7-94 | |
Набор символов 0x28 / 0xA8 (номер строки 8, расширенная латиница, в кружке, дроби)
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | | Æ 00C6 8-1 | Ð 00D0 8-2 | ª 00AA 8-3 | Ħ 0126 8-4 | 8-5 | IJ 0132 8-6 | 8-7 | Ŀ 013F 8-8 | Ł 0141 8-9 | Ø 00D8 8-10 | Œ 0152 8-11 | º 00BA 8-12 | Þ 00ДЭ 8-13 | Ŧ 0166 8-14 | Ŋ 014A 8-15 |
3_ / B_ | 8–16 | ㉠ 3260 8-17 | ㉡ 3261 8-18 | ㉢ 3262 8-19 | ㉣ 3263 8-20 | ㉤ 3264 8–21 | ㉥ 3265 8-22 | ㉦ 3266 8-23 | ㉧ 3267 8-24 | ㉨ 3268 8-25 | ㉩ 3269 8–26 | ㉪ 326A 8-27 | ㉫ 326Б 8-28 | ㉬ 326C 8-29 | ㉭ 326D 8-30 | ㉮ 326E 8-31 |
4_ / C_ | ㉯ 326Ф 8-32 | ㉰ 3270 8-33 | ㉱ 3271 8-34 | ㉲ 3272 8-35 | ㉳ 3273 8-36 | ㉴ 3274 8-37 | ㉵ 3275 8–38 | ㉶ 3276 8-39 | ㉷ 3277 8-40 | ㉸ 3278 8-41 | ㉹ 3279 8-42 | ㉺ 327А 8-43 | ㉻ 327Б 8-44 | Ⓐ 24D0 8-45 | Ⓑ 24Д1 8-46 | Ⓒ 24Д2 8-47 |
5_ / D_ | Ⓓ 24Д3 8-48 | Ⓔ 24D4 8-49 | Ⓕ 24D5 8-50 | Ⓖ 24D6 8-51 | Ⓗ 24D7 8-52 | Ⓘ 24D8 8-53 | Ⓙ 24D9 8-54 | Ⓚ 24ДА 8-55 | Ⓛ 24ДБ 8-56 | Ⓜ 24DC 8-57 | Ⓝ 24DD 8-58 | Ⓞ 24ДЕ 8-59 | Ⓟ 24DF 8-60 | Ⓠ 24E0 8-61 | Ⓡ 24Е1 8-62 | Ⓢ 24E2 8-63 |
6_ / E_ | Ⓣ 24E3 8-64 | Ⓤ 24E4 8-65 | Ⓥ 24E5 8-66 | Ⓦ 24E6 8-67 | Ⓧ 24E7 8-68 | Ⓨ 24E8 8-69 | Ⓩ 24E9 8-70 | ① 2460 8-71 | ② 2461 8-72 | ③ 2462 8-73 | ④ 2463 8-74 | ⑤ 2464 8-75 | ⑥ 2465 8-76 | ⑦ 2466 8-77 | ⑧ 2467 8-78 | ⑨ 2468 8-79 |
7_ / F_ | ⑩ 2469 8-80 | ⑪ 246А 8-81 | ⑫ 246Б 8-82 | ⑬ 246C 8-83 | ⑭ 246Д 8-84 | ⑮ 246Е 8-85 | ½ 00БД 8-86 | ⅓ 2153 8-87 | ⅔ 2154 8-88 | ¼ 00ВС 8-89 | ¾ 00BE 8-90 | ⅛ 215B 8-91 | ⅜ 215C 8-92 | ⅝ 215D 8-93 | ⅞ 215E 8-94 | |
Набор символов 0x29 / 0xA9 (номер строки 9, расширенная латиница, в кружочках, надстрочный и подстрочный)
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | | æ 00E6 9-1 | đ 0111 9-2 | ð 00F0 9-3 | ħ 0127 9-4 | № 0131 9-5 | ij 0133 9-6 | ĸ 0138 9-7 | ŀ 0140 9-8 | ł 0142 9–9 | ø 00F8 9-10 | œ 0153 9-11 | ß 00DF 9–12 | þ 00FE 9-13 | ŧ 0167 9-14 | ŋ 014B 9-15 |
3_ / B_ | ʼn 0149 9-16 | ㈀ 3200 9–17 | ㈁ 3201 9–18 | ㈂ 3202 9–19 | ㈃ 3203 9–20 | ㈄ 3204 9–21 | ㈅ 3205 9–22 | ㈆ 3206 9–23 | ㈇ 3207 9–24 | ㈈ 3208 9–25 | ㈉ 3209 9–26 | ㈊ 320A 9-27 | ㈋ 320Б 9-28 | ㈌ 320C 9-29 | ㈍ 320D 9-30 | ㈎ 320E 9-31 |
4_ / C_ | ㈏ 320F 9-32 | ㈐ 3210 9-33 | ㈑ 3211 9-34 | ㈒ 3212 9-35 | ㈓ 3213 9–36 | ㈔ 3214 9-37 | ㈕ 3215 9–38 | ㈖ 3216 9–39 | ㈗ 3217 9-40 | ㈘ 3218 9-41 | ㈙ 3219 9-42 | ㈚ 321А 9-43 | ㈛ 321B 9-44 | ⒜ 249C 9-45 | ⒝ 249Д 9-46 | ⒞ 249Е 9-47 |
5_ / D_ | ⒟ 249F 9-48 | ⒠ 24A0 9-49 | ⒡ 24A1 9-50 | ⒢ 24A2 9-51 | ⒣ 24A3 9-52 | ⒤ 24A4 9-53 | ⒥ 24A5 9-54 | ⒦ 24A6 9-55 | ⒧ 24A7 9-56 | ⒨ 24A8 9-57 | ⒩ 24A9 9-58 | ⒪ 24AA 9-59 | ⒫ 24AB 9-60 | ⒬ 24AC 9-61 | ⒭ 24AD 9-62 | ⒮ 24АЭ 9-63 |
6_ / E_ | ⒯ 24AF 9-64 | ⒰ 24B0 9-65 | ⒱ 24Б1 9-66 | ⒲ 24B2 9-67 | ⒳ 24Б3 9-68 | ⒴ 24Б4 9-69 | ⒵ 24B5 9-70 | ⑴ 2474 9-71 | ⑵ 2475 9-72 | ⑶ 2476 9-73 | ⑷ 2477 9-74 | ⑸ 2478 9-75 | ⑹ 2479 9-76 | ⑺ 247А 9-77 | ⑻ 247Б 9-78 | ⑼ 247C 9-79 |
7_ / F_ | ⑽ 247D 9-80 | ⑾ 247Е 9-81 | ⑿ 247 градусов по Фаренгейту 9-82 | ⒀ 2480 9-83 | ⒁ 2481 9-84 | ⒂ 2482 9-85 | ¹ 00B9 9-86 | ² 00B2 9-87 | ³ 00B3 9-88 | ⁴ 2074 9-89 | ⁿ 207F 9-90 | ₁ 2081 9-91 | ₂ 2082 9-92 | ₃ 2083 9-93 | ₄ 2084 9-94 | |
Набор символов 0x2A / 0xAA (номер строки 10, хирагана)
Этот набор содержит хирагану для написания японского языка .
Сравните строку 10 KPS 9566 , в которой используется такая же схема. Сравните и сопоставьте строку 4 стандарта JIS X 0208 , в котором также используется тот же макет, но в другой строке.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | | ぁ 3041 10-1 | あ 3042 10-2 | ぃ 3043 10-3 | い 3044 10-4 | ぅ 3045 10–5 | う 3046 10-6 | ぇ 3047 10-7 | え 3048 10–8 | ぉ 3049 10–9 | お 304A 10-10 | か 304B 10-11 | が 304C 10-12 | き 304D 10-13 | ぎ 304E 10-14 | く 304F 10-15 |
3_ / B_ | ぐ 3050 10–16 | け 3051 10-17 | げ 3052 10–18 | こ 3053 10-19 | ご 3054 10-20 | さ 3055 10–21 | ざ 3056 10-22 | し 3057 10–23 | じ 3058 10–24 | す 3059 10–25 | ず 305A 10-26 | せ 305Б 10-27 | ぜ 305C 10–28 | そ 305D 10-29 | ぞ 305E 10-30 | た 305F 10-31 |
4_ / C_ | だ 3060 10–32 | ち 3061 10-33 | ぢ 3062 10-34 | っ 3063 10-35 | つ 3064 10–36 | づ 3065 10–37 | て 3066 10–38 | で 3067 10–39 | と 3068 10-40 | ど 3069 10-41 | な 306А 10-42 | に 306Б 10-43 | ぬ 306C 10-44 | ね 306Д 10-45 | の 306E 10-46 | は 306F 10-47 |
5_ / D_ | ば 3070 10–48 | ぱ 3071 10-49 | ひ 3072 10–50 | び 3073 10–51 | ぴ 3074 10–52 | ふ 3075 10–53 | ぶ 3076 10–54 | ぷ 3077 10-55 | へ 3078 10–56 | べ 3079 10–57 | ぺ 307A 10-58 | ほ 307Б 10-59 | ぼ 307C 10-60 | ぽ 307Д 10-61 | ま 307Е 10-62 | み 307F 10-63 |
6_ / E_ | む 3080 10–64 | め 3081 10-65 | も 3082 10-66 | ゃ 3083 10-67 | や 3084 10-68 | ゅ 3085 10–69 | ゆ 3086 10-70 | ょ 3087 10-71 | よ 3088 10-72 | ら 3089 10-73 | り 308А 10-74 | る 308B 10-75 | れ 308С 10-76 | ろ 308D 10-77 | ゎ 308Е 10-78 | わ 308Ф 10-79 |
7_ / F_ | ゐ 3090 10–80 | ゑ 3091 10-81 | を 3092 10-82 | ん 3093 10-83 | 10-84 | 10-85 | 10-86 | 10-87 | 10-88 | 10-89 | 10-90 | 10-91 | 10-92 | 10-93 | 10-94 | |
Набор символов 0x2B / 0xAB (номер строки 11, катакана)
Этот набор содержит катакану для написания японского языка . Однако знак долгой гласной на японском языке , который используется в тексте катакана и включен в строку 1 стандарта JIS X 0208 , не включен. [19]
Сравните строку 11 KPS 9566 , в которой используется такая же компоновка. Сравните и сопоставьте строку 5 стандарта JIS X 0208 , в котором также используется тот же макет, но в другой строке.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | | ァ 30A1 11-1 | ア 30A2 11-2 | ィ 30A3 11-3 | イ 30A4 11-4 | ゥ 30A5 11-5 | ウ 30A6 11-6 | ェ 30A7 11-7 | エ 30A8 11-8 | ォ 30A9 11-9 | オ 30AA 11-10 | カ 30AB 11-11 | ガ 30AC 11-12 | キ 30AD 11-13 | ギ 30 AE 11-14 | ク 30AF 11-15 |
3_ / B_ | グ 30B0 11-16 | ケ 30B1 11-17 | ゲ 30B2 11-18 | コ 30B3 11-19 | ゴ 30B4 11-20 | サ 30B5 11-21 | ザ 30B6 11-22 | シ 30B7 11-23 | ジ 30B8 11-24 | ス 30B9 11-25 | ズ 30BA 11-26 | セ 30BB 11–27 | ゼ 30BC 11-28 | ソ 30BD 11–29 | ゾ 30BE 11-30 | タ 30BF 11-31 |
4_ / C_ | ダ 30C0 11-32 | チ 30C1 11-33 | ヂ 30C2 11-34 | ッ 30C3 11-35 | ツ 30C4 11-36 | ヅ 30C5 11-37 | テ 30C6 11-38 | デ 30C7 11-39 | ト 30C8 11-40 | ド 30C9 11-41 | ナ 30СА 11-42 | ニ 30CB 11-43 | ヌ 30CC 11-44 | ネ 30CD 11-45 | ノ 30CE 11-46 | ハ 30CF 11-47 |
5_ / D_ | バ 30D0 11-48 | パ 30Д1 11-49 | ヒ 30D2 11-50 | ビ 30D3 11-51 | ピ 30D4 11-52 | フ 30D5 11-53 | ブ 30D6 11-54 | プ 30Д7 11-55 | ヘ 30D8 11-56 | ベ 30D9 11-57 | ペ 30DA 11-58 | ホ 30ДБ 11-59 | ボ 30DC 11-60 | ポ 30ДД 11-61 | マ 30ДЕ 11-62 | ミ 30ДФ 11-63 |
6_ / E_ | ム 30E0 11-64 | メ 30E1 11-65 | モ 30E2 11-66 | ャ 30E3 11-67 | ヤ 30E4 11-68 | ュ 30E5 11-69 | ユ 30E6 11-70 | ョ 30E7 11-71 | ヨ 30E8 11-72 | ラ 30E9 11-73 | リ 30EA 11-74 | ル 30ЕБ 11-75 | レ 30EC 11-76 | ロ 30ЭД 11-77 | ヮ 30EE 11-78 | ワ 30ЭФ 11-79 |
7_ / F_ | ヰ 30F0 11-80 | ヱ 30F1 11-81 | ヲ 30F2 11-82 | ン 30Ф3 11-83 | ヴ 30Ф4 11-84 | ヵ 30F5 11-85 | ヶ 30Ф6 11-86 | 11-87 | 11-88 | 11-89 | 11-90 | 11-91 | 11-92 | 11-93 | 11-94 | |
Набор символов 0x2C / 0xAC (номер строки 12, кириллица)
Этот набор содержит современный русский алфавит , и его необязательно достаточно для представления других форм кириллицы .
Сравните строку 5 из KPS 9566 и строку 7 из JIS X 0208 , в которых используется тот же макет (но в другой строке).
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | | А 0410 12-1 | Б 0411 12-2 | В 0412 12-3 | Г 0413 12-4 | Д 0414 12-5 | Е 0415 12-6 | Ё 0401 12-7 | Ж 0416 12-8 | З 0417 12-9 | И 0418 12-10 | № 0419 12-11 | К 041A 12-12 | Л 041B 12-13 | М 041C 12-14 | Н 041D 12-15 |
3_ / B_ | О 041E 12-16 | П 041F 12-17 | Р 0420 12-18 | С 0421 12-19 | Т 0422 12-20 | У 0423 12-21 | Ф 0424 12-22 | Х 0425 12-23 | Ц 0426 12-24 | Ч 0427 12-25 | Ш 0428 12-26 | Щ 0429 12-27 | Ъ 042А 12-28 | Ы 042В 12-29 | Ь 042C 12-30 | Э 042D 12-31 |
4_ / C_ | Ю 042E 12-32 | Я 042F 12-33 | 12–34 | 12-35 | 12–36 | 12–37 | 12–38 | 12–39 | 12-40 | 12-41 | 12-42 | 12-43 | 12–44 | 12–45 | 12–46 | 12–47 |
5_ / D_ | 12–48 | а 0430 12-49 | б 0431 12-50 | в 0432 12-51 | г 0433 12-52 | д 0434 12-53 | е 0435 12-54 | ё 0451 12-55 | ж 0436 12-56 | з 0437 12-57 | и 0438 12-58 | © 0439 12-59 | к 043A 12-60 | л 043Б 12-61 | м 043C 12-62 | н 043D 12-63 |
6_ / E_ | о 043E 12-64 | п 043Ф 12-65 | р 0440 12-66 | с 0441 12-67 | т 0442 12-68 | у 0443 12-69 | ф 0444 12-70 | х 0445 12-71 | ц 0446 12-72 | ч 0447 12-73 | ш 0448 12-74 | по 0449 12-75 | ъ 044А 12-76 | ы 044Б 12-77 | ь 044С 12-78 | э 044D 12-79 |
7_ / F_ | ю 044E 12-80 | я 044F 12-81 | 12-82 | 12-83 | 12-84 | 12-85 | 12-86 | 12-87 | 12-88 | 12-89 | 12-90 | 12-91 | 12-92 | 12-93 | 12-94 | |
Предварительно составленные наборы хангыль (ряды с 16 по 40)
Кодовые точки для предварительно составленного хангыля включаются в непрерывный отсортированный блок между кодовыми точками 16-01 и 40-94 включительно. Не все возможные группы слогов включены в этот диапазон. Сравните различный порядок и доступность в KPS 9566 .
Обратите внимание, что начальные + гласные + конечные слоги 뢨, 썅, 쏀, 쓩 и 쭁 включены, но их начальные + гласные аналоги 뢔, 쌰, 쎼, 쓔 и 쬬 не включены. Раньше это вызывало проблемы при вводе, потому что методы ввода должны сначала пройти через начальный + гласный слог, чтобы ввести начальный + гласный + последний слог (например, ㅎ → 하 → 한).
Те, которые здесь не перечислены, могут быть представлены с использованием восьмибайтовых композиционных последовательностей. Всем остальным кластерам современных джамо UHC присваивает коды где-либо еще. Всем возможным кластерам современных джамо присвоены коды Джохабом.
- Ряд 16: 가 각 간 갇 갈 갉 갊 갓 갔 강 갖 갗 같 갚 객 갠 갬 갭 갰 갱 갸 걀 걋 걍 걔 걘 걷 걸 걺 검 것 겄 겆 겉 겊 겋 게 겐 겔 겜 겝 겟 겠 겪 견 겯 결 겸 겹 경 곁 계 곈 곕 곗 고 곤 곧 곪 곬 곰 곱 곶 과 곽 관 괄 괆
- Ряд 17: 괌 괍 괏 광 괘 괜 괭 괴 괵 괸 괼 굄 굅 굇 굔 굘 구 군 굳 굴 굵 굻 굽 굿 궁 궐 궜 궝 궤 귁 귈 귐 귑 귓 규 균 귤 그 극 근 귿 급 긋 긍 긔 기 긱 길 긺 김 깁 깅 깆 깊 깍 깎 깔 깖 깝 깟 깥 깨 깩 깬 깰 깸
- Ряд 18: 깹 깻 깼 깽 꺄 꺅 꺌 껀 껄 껌 껍 껏 껐 껑 껜 껨 껭 껴 껼 꼇 꼈 꼬 꼭 꼰 꼲 꼴 꽂 꽃 꽈 꽉 꽜 꽝 꽥 꽹 꾀 꾄 꾈 꾐 꾑 꾕 꾜 꾸 꾹 꿈 꿉 꿋 꿍 꿎 꿔 꿩 꿰 꿱 꿴 뀀 뀁 뀄 뀐 뀔 뀝 뀨 끅 끈 끎 끓 끔 끕 끗 끙
- Ряд 19: 끝 끼 끽 낀 낄 낌 나 낙 낚 난 낟 날 낡 낢 낫 났 낯 낳 내 낵 낸 냄 냅 냇 냈 냉 냠 냥 너 넉 넌 널 넓 넘 넙 넛 넜 넝 넣 네 넥 넨 넬 넸 넹 녀 녁 년 녈 녔 녕 녘 녜 노 녹 논 놂 놈 놋 농 놓 놔 놨 뇌 뇐 뇔 뇜 뇝
- Ряд 20: 뇟 뇨 뇩 뇬 뇰 뇹 누 눅 눈 눋 눌 눔 눕 눗 눙 눼 뉘 뉠 뉨 뉴 뉼 늄 늉 느 늑 는 늘 늣 능 늦 늪 늰 늴 닉 닌 닐 닒 님 닙 닛 닝 닢 다 닥 달 닭 닮 닯 닳 담 닸 당 닺 닻 대 댁 댄 댐 댑 댔 댕 더 덕 덛 덜 덞 덟 덤 덥
- Ряд 21: 덧 덩 덫 덮 데 덱 덴 뎄 뎅 뎌 뎐 뎔 뎠 뎬 도 돈 돋 돐 돔 동 돛 돝 돠 돤 돼 된 될 됨 됩 됴 두 둔 둘 둠 둡 둣 둥 둬 뒀 뒈 뒝 뒤 뒷 뒹 듀 듄 듈 듐 득 든 듣 들 듬 듭 듯 듸 디 딘 딛 딤 딥 딩 딪 따 딱 딴 딸
- Ряд 22: 땀 땁 땃 땄 땅 땋 땐 땔 땜 땝 땟 땠 땡 떠 떡 떪 떫 떳 떵 떻 떼 뗄 뗌 뗍 뗏 뗐 똑 똔 똘 똥 똴 뙈 뙨 뚜 뚝 뚠 뚤 뚫 뚬 뚱 뛔 뛰 뛴 뜅 뜨 뜩 뜬 뜯 뜰 뜻 띄 띈 띌 띕 띠 띤 띰 띱 띵 라 란 랄 랏 랐 랑 랒 랖 랗
- Ряд 23: 래 랙 랜 랠 램 랩 략 랸 럇 량 러 럭 런 럽 럿 렁 렇 렉 렐 렘 렛 렝 려 력 련 렷 렸 령 례 롄 롓 로 론 롤 롬 롭 롯 롱 롸 롼 뢍 뢨 뢰 룁 룃 룅 료 룐 룔 룡 루 룩 룬 룸 룹 룻 뤄 뤘 뤼 뤽 륄 륌 류 륙 륜 률 륨 륩
- Ряд 24: 륫 륭 르 륵 른 를 릉 릊 릍 릎 리 릭 린 릴 릿 링 막 만 맏 맑 맒 맙 맛 망 맞 맡 맥 맬 맴 맵 맷 맹 맺 먁 먈 먕 머 먹 먼 멀 멂 멈 멉 멋 메 멕 멘 멜 멤 멥 멩 며 멱 면 몃 몄 명 몌 모 몫 몬 몲 몸 몽 뫄 뫈 뫘 뫙 뫼
- Ряд 25: 묀 묄 묍 묏 묑 묘 무 묵 묶 문 묻 물 묽 뭅 뭇 뭍 뭏 뭔 뭘 뭡 뮈 뮌 뮐 뮤 뮨 뮴 믄 믈 믐 믓 믹 민 밀 밂 밈 밉 밋 밌 밍 및 밑 바 박 받 발 밝 밞 밟 밤 방 밭 배 백 밸 뱀 뱁 뱄 뱅 뱌 뱍 뱝 버 벋 벌 벎 범 법 벗
- Ряд 26: 벙 벚 베 벡 벤 벧 벨 벴 벵 벼 벽 변 별 볍 병 볕 볘 볜 보 볶 볼 봄 봇 봉 봐 봔 봤 뵈 뵌 뵐 뵘 뵙 뵨 부 분 붇 불 붉 붊 붐 붑 붓 붕 붙 붚 붸 뷔 뷕 뷘 뷜 뷩 뷸 븀 븃 븅 븍 븐 블 븝 븟 빅 빈 빎 빔 빙 빚 빛 빠 빡 빤
- Строка 27: 빨 빪 빰 빱 빳 빴 뺀 뺄 뺌 뺍 뺏 뺐 뺨 뻐 뻔 뻗 뻠 뻤 뻥 뼁 뼈 뼉 뼘 뼙 뼜 뽁 뽄 뽈 뽐 뽕 뾔 뿅 뿌 뿍 뿐 뿔 뿜 뿟 뿡 쀼 쁑 쁘 쁩 삐 삑 삔 삘 삠 삥 사 삭 삯 삳 살 삵 삼 삽 샀 상 새 색 샘 샙 샛 샜 생 샤
- Ряд 28: 샥 샨 샬 샴 샵 샷 섈 섐 섕 서 석 섞 섟 선 섦 섧 섭 섯 성 세 섹 셀 셈 셉 셋 셌 션 셜 셤 셥 셧 셩 셰 셸 솅 소 속 솎 손 솔 솖 솜 솝 솟 솩 솬 솰 솽 쇄 쇈 쇗 쇘 쇠 쇤 쇰 쇱 쇳 쇽 숀 숌 숍 숑 수 숟 술 숨 숩 숫 숭
- Ряд 29: 숯 숱 숲 숴 쉈 쉐 쉑 쉠 쉥 쉬 쉭 쉰 쉴 쉼 쉽 슈 슉 슛 스 슥 슨 슴 습 슷 승 시 신 싫 심 십 싯 싸 싻 싼 쌀 쌈 쌉 쌌 쌍 쌓 쌔 쌕 쌘 쌨 쌩 썅 써 썩 썬 썸 썹 썼 썽 쎈 쎌 쏀 쏙 쏜 쏠 쏢 쏩 쏭 쏸 쐈 쐐 쐤 쐬 쐰
- Ряд 30: 쐴 쐼 쐽 쑈 쑤 쑥 쑵 쑹 쒀 쒔 쒜 쒸 쒼 쓩 쓴 쓸 쓿 씀 씌 씐 씔 씩 씬 씰 씸 씹 안 앉 않 알 앎 앓 압 앗 았 앙 앝 앞 애 액 앤 앨 앰 앵 야 약 얀 얄 얇 얏 양 얕 얗 얜 얠 얩 억 언 얻 얼 얾 엄 엇 었 엉 엊 엌 엎
- Ряд 31: 에 엑 엔 엘 엠 엡 엣 엮 연 열 엶 엷 염 엽 였 옆 옇 옌 옐 옘 옙 옜 오 옥 온 올 옴 옵 옷 옹 와 왁 왈 왐 왑 왓 왔 왕 왜 왝 왠 왬 왯 왼 욀 욈 욉 욋 욍 욘 욜 욤 욥 용 우 욱 울 욹 움 웁 웅 워 월 웜 웝 웠 웡 웨
- Ряд 32: 웩 웬 웰 웸 웹 웽 윌 윕 윗 윙 유 육 윤 윱 윳 은 을 읊 읏 응 읒 읓 읔 읜 읠 읨 읫 익 인 읽 읾 잃 임 입 잇 있 잉 잊 잎 자 잗 잘 잚 잠 잡 잣 잦 재 잭 잰 잼 잽 잿 쟁 쟈 쟌 쟎 쟘 쟝 쟬 저 적 전 절 젊
- Ряд 33: 점 접 젓 정 젖 제 젝 젬 젭 젯 젱 져 젼 졀 졈 졍 졔 족 존 좀 좁 좆 좇 좋 좌 좍 좨 좼 좽 죄 죌 죔 죗 죙 죠 죡 죤 죵 주 죽 준 줄 줅 줏 중 줘 줬 줴 쥐 쥘 쥠 쥡 쥣 쥰 쥴 쥼 즉 즌 즘 즙 증 지 짇 질 짊 짐 집 짓
- Ряд 34: 징 짖 짙 짚 짜 짝 짢 짤 짬 짭 짯 짰 짱 째 짹 쨈 쨌 쨍 쨘 쨩 쩌 쩔 쩜 쩝 쩟 쩠 쩨 쪘 쪼 쪽 쫀 쫌 쫍 쫑 쫓 쫘 쫙 쫠 쫬 쫴 쬈 쬐 쬔 쬘 쭈 쭉 쭌 쭐 쭘 쭙 쭸 쭹 쮜 쮸 쯤 쯧 쯩 찍 찐 찜 찝 찢 찧 찬 찮 찰 참 찹 찻
- Ряд 35: 찼 창 찾 채 책 챈 챗 챙 챠 챤 챦 챨 챰 척 천 첨 첩 첬 청 체 첼 쳄 쳅 쳇 쳉 쳔 쳰 촁 초 촉 촐 촘 촛 총 촤 촨 촬 촹 최 쵠 쵤 쵬 쵭 춈 추 축 춘 출 춤 충 춰 췄 췌 취 췬 췰 췹 췻 츄 츈 츔 츙 츤 츨 츰 츱 츳 층
- Ряд 36: 치 칙 친 칟 칠 칡 칩 칫 칵 칸 칼 캄 캅 캇 캔 캡 캤 캬 캭 커 컥 컨 컫 컬 컵 컹 케 켁 켄 켐 켑 켕 켜 켠 켤 켬 켭 켯 켰 켱 켸 코 콤 콥 콧 콩 콰 콱 쾀 쾅 쾌 쾡 쾰 쿄 쿠 쿤 쿨 쿱 쿳 쿼 퀀 퀘 퀭 퀴 퀵 퀸 퀼
- Ряд 37: 큄 큅 큇 큉 큐 큔 큠 크 클 큼 큽 킁 키 킥 킴 타 탁 탄 탈 탉 탓 탔 탕 태 택 탯 탰 탱 탸 터 턱 털 턺 텀 텁 텃 텄 텅 테 텍 텐 텔 텡 텨 텬 텼 톄 톈 톤 톨 톰 톱 통 톺 톼 퇘 퇴 툇 툉 투 툭 툼 툽 툿 퉁 퉈 퉜
- Ряд 38: 퉤 튀 튁 튄 튈 튐 튤 튬 튱 트 특 튼 틈 틉 틔 틘 틤 틥 티 틸 팀 팁 팃 팅 팍 팔 팖 팜 팝 팠 팡 패 팩 팬 팰 팸 팹 팻 팼 팽 퍄 퍅 펄 펌 펍 펏 펐 펑 펜 펠 펨 펩 펭 펴 편 폄 폅 평 폐 폡 폣 폰 폴 폼 폽 폿 퐁
- Ряд 39: 퐈 퐝 푀 푄 표 푠 푹 푼 푿 풀 풂 품 풉 풔 풩 퓔 퓟 퓨 퓬 퓸 퓻 퓽 프 픈 플 픽 핀 필 핌 핏 핑 학 한 할 핥 함 합 핫 항 해 핵 핸 햇 했 행 햐 향 허 헐 헒 험 헙 헝 헤 헥 헬 헴 헷 헹 혁 현 협 혓 혔 형 혜 혠
- Ряд 40: 혤 혭 호 혹 혼 홀 홅 화 확 환 활 홧 홱 홴 회 횐 횔 횝 효 횬 횰 횹 횻 훅 훑 훔 훗 훙 훤 훨 훵 훼 훽 휀 휄 휑 휘 휙 휜 휠 휨 휴 휵 휸 휼 흄 흇 흑 흔 흖 흗 흙 흠 흡 흥 흩 흰 흴 흽 힁 힌 힐 힘 힙 힛 힝
Ханджа наборы
Кодировка Джохаба
KS X 1001, с 1992 года, также определяет альтернативную кодировку, известную как Johab. Это представляет слог хангыль как последовательность из трех пятибитных значений, разделенных на два 8-битных байта , сначала старший бит. Старший бит старшего байта всегда установлен (позволяет комбинировать с однобайтовым ASCII или KS X 1003 ). Эта кодировка также используется для современного джамо из строки 4 KS X 1001 с использованием значений-заполнителей для других компонентов. Кодировка Johab для хангыля показана в таблице ниже. [20]
Джохаб кодирует оставшуюся часть KS X 1001, используя ведущие байты, которые не соответствуют начальному хамо (0xE0–0xF9 для ханджа и 0xD9–0xDE [21] для не-ханджа, за исключением слогов хангыль и современного джамо), с байтами следа в диапазоны 0x31–0x7E и 0x91–0xFE. [20] Эти коды алгоритмически отображаются из кодовых точек KS X 1001 символов, [21] с двумя строками KS X 1001 на ведущий байт (сравните и сопоставьте Shift JIS ).
Кодировка Джохаба на основе ASCII имеет номер кодовой страницы 1361 от Microsoft. [22] Существуют и другие варианты Johab, определяемые поставщиком; например, IBM определяет один для использования в качестве набора Shift Out с EBCDIC . Этот вариант использует сдвиг внутрь и сдвиг для переключения между однобайтовой страницей EBCDIC и Johab, использует другую кодировку для символов, отличных от хангыля (используя ведущие байты 0x40–6C с другим макетом), и использует ведущие байты 0xD4 – DD. в качестве области , определяемой пользователем , но использует раскладку Johab для символов хангыля в состоянии сдвига. [23] IBM пронумеровывает кодовую страницу 1364 кодировки Джохаба с отслеживанием состояния на основе EBCDIC , [23], а также определяет подмножество этой кодировки, включая меньшее количество символов хангыль, но в той же структуре, что и кодовая страница 933 . [24]
Пятибитная последовательность | В качестве первоначального | Как гласный | В качестве окончательного |
---|---|---|---|
00000 | Не используется | Не используется [b] | Не используется |
00001 | Наполнитель | Не используется [c] | Наполнитель (пустой финал) |
00010 | ㄱ | Наполнитель | ㄱ |
00011 | ㄲ | ㅏ | ㄲ |
00100 | ㄴ | ㅐ | ㄳ |
00101 | ㄷ | ㅑ | ㄴ |
00110 | ㄸ | ㅒ | ㄵ |
00111 | ㄹ | ㅓ | ㄶ |
01000 | ㅁ | Не используется [b] | ㄷ |
01001 | ㅂ | Не используется [c] | ㄹ |
01010 | ㅃ | ㅔ | ㄺ |
01011 | ㅅ | ㅕ | ㄻ |
01100 | ㅆ | ㅖ | ㄼ |
01101 | ㅇ | ㅗ | ㄽ |
01110 | ㅈ | ㅘ | ㄾ |
01111 | ㅉ | ㅙ | ㄿ |
10000 | ㅊ | Не используется [b] | ㅀ |
10001 | ㅋ | Не используется [c] | ㅁ |
10010 | ㅌ | ㅚ | Не используется |
10011 | ㅍ | ㅛ | ㅂ |
10100 | ㅎ | ㅜ | ㅄ |
10101 | Не используется | ㅝ | ㅅ |
10110 | Ведущие байты не хангыль | ㅞ | ㅆ |
10111 | Ведущие байты не хангыль | ㅟ | ㅇ |
11000 | Ведущие байты не хангыль | Не используется [b] | ㅈ |
11001 | Ведущие байты не хангыль | Не используется [c] | ㅊ |
11010 | Ведущие байты не хангыль | ㅠ | ㅋ |
11011 | Ведущие байты не хангыль | ㅡ | ㅌ |
11100 | Ведущие байты не хангыль | ㅢ | ㅍ |
11101 | Ведущие байты не хангыль | ㅣ | ㅎ |
11110 | Ведущие байты не хангыль | Не используется | Не используется |
11111 | Не используется | Не используется | Не используется |
Сноски
- ^ Корейский : 정보 교환 용 부호계 (한글 및 한자) , романизированный : Чонбо Гьохванъён Бухогье (Hangeul mich Hanja)
- ^ a b c d Если бы он использовался, это привело бы к байту следа в диапазоне управляющих кодов C0 .
- ^ a b c d Если бы он использовался, это привело бы к байтам следа в строках 0x2_ и 0x3_ ASCII. Johab не использует строку 0x2_ для байтов следа, аналогично наиболее распространенным устаревшим кодировкам CJK (сравните Shift JIS , GBK , Big5 ). Версия Johab на основе EBCDIC не использует байты следа ни из одной строки, так как они находятся в диапазоне управляющего кода EBCDIC.
Рекомендации
- ^ а б в г д Лунде, Кен (2009). «Глава 3: Стандарты набора символов» . CJKV Обработка информации . п. 143-148. ISBN 978-0596514471.
- ^ а б в г д е Хван, Цзинсан (2005). Социальное формирование стандартов ИКТ: случай разногласий по поводу национальных стандартов набора кодовых символов в Корее (PDF) . Эдинбургский университет.
- ^ а б в Лунде, Кен (1995-12-18). «2.4.6: Устаревшие стандарты». CJK.INF Версия 1.9 .
- ^ а б Шин, Юнгшик. "Что такое KS X 1001 (KS C 5601) и другие коды хангыль?" . Хангыль и Интернет в Корее FAQ .
- ^ а б в г Лунде, Кен (1995-12-18). «3.3.6: N-байтовый хангыль». CJK.INF Версия 1.9 .
- ^ а б «ИНФОРМАЦИЯ: наборы символов хангыль (корейский)» , служба поддержки Майкрософт, Майкрософт
- ^ а б Жигри, Дьюла (18.06.2002). «КСК и УХК» .
- ^ Чанг, Хе-Шик. «cpython / Modules / cjkcodecs / _codecs_kr.c (версия d3faf43)» . Исходное дерево cPython . Фонд программного обеспечения Python.
- ^ а б в Чунг, Джемин (30 марта 2017 г.). Предложение добавить информативную заметку к U + 3164 HANGUL FILLER (PDF) . Консорциум Unicode . UTC L2 / 17-081.
- ^ «Кодовая страница 01040» (PDF) . IBM. Архивировано из оригинального (PDF) 08.07.2015.
- ^ «KSRI-87-37-IR: 항 을 ・ 한자 코드 표준화 에 관한 예 연구: Исследование по стандартизации кодов хангыль и ханджа» (PDF) (на корейском языке). Министерство науки и технологий . 1987. с. 68. Архивировано из оригинального (PDF) 01.03.2019.
- ^ «ibm-1363_P110-1997 (ведущий байт A1)» . Демонстрация ICU - Converter Explorer . Международные компоненты для Unicode.
- ^ «euc-kr (ведущий байт A1)» . Демонстрация ICU - Converter Explorer . Международные компоненты для Unicode.
- ^ а б в г «Преобразование (внешняя версия) из корейской кодировки Mac OS в Unicode 3.2 и выше» . Яблоко.
- ^ "windows-949-2000 (ведущий байт A1)" . Демонстрация ICU - Converter Explorer . Международные компоненты для Unicode.
- ^ а б в г «Ведущий байт A1-A2 (Кодовая страница 949)» . MSDN . Microsoft.
- ^ Корейское бюро стандартов (1988-10-01). Набор корейских графических символов для обмена информацией (PDF) . ITSCJ / IPSJ . ISO-IR- 149.
- ^ Apple (2005-04-05). «Преобразование (внешняя версия) из корейской кодировки Mac OS в Unicode 3.2 и выше» . Консорциум Unicode .
- ^ Лунде, Кен (2009). «Персонажи, которые, по-видимому, отсутствуют». Обработка информации CJKV: вычисления на китайском, японском, корейском и вьетнамском языках (2-е изд.). Севастополь, Калифорния : О'Рейли . п. 180. ISBN 978-0-596-51447-1.
- ^ а б Лунде, Кен (2008). «Глава 4: Методы кодирования (§ Кодирование Джохаба - KS X 1001: 2004)». CJKV Обработка информации (2-е изд.). Севастополь, Калифорния : O'Reilly Media . С. 268–273. ISBN 978-0-596-51447-1.
- ^ а б Шин, Юнгшик (2011-10-14) [1999-08-16]. Johab в таблицу Unicode . Консорциум Unicode .
- ^ «Идентификаторы кодовой страницы» . Центр разработки для Windows . Microsoft.
- ^ а б «ibm-1364_P110-2007» . Международные компоненты для Unicode . Консорциум Unicode .
- ^ «ibm-933_P110-1995» . Международные компоненты для Unicode . Консорциум Unicode .
Внешние ссылки
- Что такое KS X 1001 (KS C 5601) и другие коды хангыля?
- Реализация кросс-языкового преобразования кода CJKV , Кен Лунде
- Таблицы отображения Unicode для кодировок Wansung и Johab:
- Кодовая страница IBM 970 (Wansung, формат EUC-KR)
- Кодовая страница Windows 949 (унифицированный код хангыль / расширенный Wansung)
- Кодовая страница Windows 1361 (Johab, версия на основе ASCII)
- Кодовая страница IBM 1364 (Johab, версия на основе EBCDIC)