Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Южнокорейский стандартный макет Дубеолсик (двухкомпонентный).

Система письма корейского языка , хангыль , представляет собой алфавит, состоящий из блоков слогов ; символы нельзя писать просто слева направо. Из-за этого каждый возможный слог в корейском языке должен быть либо отображен как блоки слогов с помощью шрифта , либо кодироваться отдельно. Unicode использует последний вариант. Например, слог 하 (ha) состоит из символов ㅎ (h) и ㅏ (a), но оба они кодируются отдельно.

Стандартная северокорейская раскладка Дубеолсик

Кодировки символов [ править ]

В RFC 1557 описан метод, известный как ISO-2022-KR, для 7-битного кодирования корейских символов в электронной почте . Если разрешено 8 бит, предпочтительнее кодирование EUC-KR . Эти две кодировки объединяют US-ASCII ( ISO 646 ) с корейским стандартом KS X 1001 : 1992 [1] (ранее называвшимся KS C 5601: 1987). В Северной Корее используется отдельный набор символов под названием KPS 9566 , который очень похож на KS X 1001.

Международный стандарт Unicode содержит специальные символы для представления корейского языка в фонетической системе родного хангыля . Unicode поддерживает два способа. Способ , используемый Microsoft Windows , чтобы иметь каждый из 11,172 слоговых комбинаций в качестве кода и предварительно сформированного шрифт характера. Другой способ - закодировать буквы ( jamos ) и позволить программному обеспечению объединить их в правильные комбинации, что не поддерживается в Windows. Конечно, первый способ требует больше памяти для шрифтов, но дает возможность получить более точные формы, поскольку сложно создать полностью стилистически правильные комбинации, которые могут быть предпочтительнее при создании документов.

Существует также возможность просто укладки (последовательность) срединные (ы) ( юнсон ) - и затем (последовательность) окончательный (s) ( jongseong ) и / или Средний корейскую марку тангажа, при необходимости - на вершине (последовательность) начальных букв ( выбранонг ), если шрифт имеет средний и конечный джамо с интервалом нулевой ширины, которые вставляются слева от курсора или каретки, таким образом появляясь в нужном месте ниже или справа от начальный. Если слог имеет горизонтальную медиальнее ( , , , или ), начальная буква, вероятно, будет располагаться дальше слева в полном слоге, чем в случае предварительно сформированных слогов, из-за пространства, которое должно быть зарезервировано для вертикальной медиальной части, что придает эстетически плохой вид тому, что может быть единственным способом отображения среднего Текст корейского хангыля без использования изображений, латинизации, замены устаревшего хамо или нестандартных кодировок. Однако большинство современных шрифтов не поддерживают это.

Стандарт Unicode также попытался создать унифицированный набор символов CJK, который может представлять китайские ( Hanzi ), а также японские ( Kanji ) и корейские ( Hanja ) производные этого сценария посредством процесса унификации Han , который не различает язык и область для отображения китайских иероглифов, при условии, что различные типографские традиции не привели к серьезным различиям в том, как выглядит персонаж - см. Изображение: Xin-jiu-zixing.png, где приведены примеры символов, внешний вид которых недавно претерпел лишь незначительные изменения в материковом Китае . Объединение ханьцев было встречено некоторой критикой.

Ввод текста [ править ]

На клавиатуре корейского компьютера текст обычно вводится простым нажатием клавиши соответствующего джамо ; операционная система создает каждый составной символ на лету. В зависимости от IME и раскладки клавиатуры, двойные согласные можно вводить, удерживая кнопку Shift. Когда все хамо, составляющие слоговой блок, введены, пользователь может инициировать преобразование в ханджа или другие специальные символы с помощью сочетания клавиш или кнопки интерфейса; На южнокорейских клавиатурах для этого есть отдельная клавиша. Последующее полуавтоматическое преобразование ханджа в различной степени поддерживается текстовыми редакторами.

При использовании клавиатуры на другом языке большинство операционных систем требуют, чтобы пользователь набирал текст с использованием оригинальной корейской раскладки клавиатуры, наиболее распространенной из которых является 2 (du) -beolsik . Это контрастирует с некоторыми другими языками, такими как японский, где текст можно вводить с использованием системы латинизации на неродных клавиатурах.

Не так, что большинство операционных систем, таких как Linux, разрешают engine / hangul / hangul-keyboard = 'ro' , что приводит к клавиатуре ромаджа, где ввод «seonggye» приводит к 성계. [2] В этой конфигурации ㄲ получается с помощью «gg», а не с помощью shift-g. Это позволяет вводить «jasanGun» для получения 자산 군 вместо ввода «jasangun», которое давало бы 자 상운.

Ханджа [ править ]

Помимо проблем с преобразованием, упомянутых выше, некоторые корейские шрифты изначально не включают ханджа. В то же время текущие текстовые процессоры не позволяют пользователю указывать, какой шрифт использовать в качестве запасного варианта для любой ханджи, которая может встречаться в тексте. В этом случае каждая последовательность ханджа должна быть отформатирована вручную, чтобы она отображалась желаемым шрифтом.

Особые ситуации [ править ]

Имея текст запуска в вертикальных линий поддерживается слабо или вообще не использовать HTML и большинство текстовых процессоров, хотя это не является проблемой для современного корейского, как это обычно пишется горизонтально. Однако до второй половины 20 века корейский язык часто писали вертикально. Тексты 15-го века, написанные на хангыле, имели отметки высоты тона слева от слогов, которые включены в Unicode, хотя большинство современных шрифтов также не поддерживают их должным образом.

См. Раздел о кодировках символов выше для устаревшего хамо.

Программы [ править ]

Известные программы, специально разработанные для использования на корейском языке, включают:

  • Распознавание языка
    • Считается, что северокорейская программа распознавания речи распознает 100000 слов и достигает более 90% успеха. [3]
    • Mongnan ( 목란 ; KCC , [4] Северная Корея) - программное обеспечение для оптического распознавания символов с предполагаемой вероятностью успеха 99% для печатного текста и 95% для распознавания рукописного текста . [3]
  • Редакторы методов ввода
    • Тан'гун ( 단군 ; Информационный центр Пхеньяна , Северная Корея) - позволяет использовать хангыль в английских версиях Windows. [4]
    • Редактор метода ввода Nalgaeset Hangul (날개 셋 한글 입력기); Ким Ёнмук, Южная Корея) - метод ввода хангыль, специально разработанный для раскладки клавиатуры 3 (se) -beolsik (работает только в Microsoft Windows).
    • Наби ( 나비 ), ами ( 아미 ; Южная Корея) - позволяет набирать хангыль в Linux .
    • m17n  - позволяет использовать измененную латинизацию для ввода хангыль в Unix.
    • SCIM и iBus  - позволяет набирать хангыль и ханжа воперационных системах в стиле POSIX , включая Linux и BSD .
  • Текстовые процессоры  - Все программы , перечисленные ниже , включают внутренние ХАНГЫЛЬ шрифты, без ХАНГЫЛИ шрифтов и hangul- Ханджи утилиты преобразования.
    • Хангыль ( Haansoft , Южная Корея)
    • Ch'angdŏk ( 창덕 , PIC, [4] Северная Корея) - Эта популярная программа существует в MS-DOS версииразработанной в апреле 1990 года [1] и версии Windowsразработанной в 1996 году [5] Она включаетсебя своеобразный культ личности особенность при нажатииCtrl+IилиCtrl+Jсоздаются титулы, возвеличивающие Ким Ир Сена и Ким Чен Ира соответственно. [6]

Хангыль в Юникоде [ править ]

Персонажи хангыль джамо в Юникоде
Совместимость с хангылем Блок Jamo в Unicode

Буквы хангыль подробно описаны в нескольких отдельных частях спецификации Unicode:

  • Слоги хангыль (AC00 – D7A3)
  • Хангыль Джамо (1100–11FF)
  • Джамо совместимости с хангыль (3130–318F)
  • Хангыль джамо расширенный-A (A960 – A97F)
  • Хангыль джамо расширенный-B (D7B0 – D7FF)

Блок слогов хангыль [ править ]

Предварительно составленные слоги хангыль в блоке слогов хангыль в Юникоде определяются алгоритмически с использованием следующей формулы:

[(начальный) × 588 + (средний) × 28 + (конечный)] + 44032
  • Начальные согласные
  • Средние гласные
  • Конечные согласные

Например, если кто-то хочет найти кодовую точку « 한 » в Unicode:

  • Значение начальной согласной ㅎ равно 18.
  • Значение средней гласной ㅏ равно 0.
  • Значение последней согласной ㄴ равно 4.

Подставляя эти значения в приведенную выше формулу, получаем [(18 × 588) + (0 × 28) + 4] + 44032 = 54620. Это означает, что значение Unicode для 한 равно 54620 в десятичной 한системе с числовой ссылкой на символ , и U + D55C в шестнадцатеричном формате Unicode.

Блок Джамо совместимости хангыль [ править ]

Совместимость с хангылом Блок Jamo является частью Unicode, который был выделен для совместимости с набором символов KS X 1001 . Обычно он используется для представления некоторого хангыль-джамо отдельно, без разделения начального и конечного .

Блокирует хангыль-джамо [ править ]

Блоки хангыль джамо , хангыль джамо расширенный-A и хангыль джамо расширенный-B содержат начальное джамо , среднее джамо и финальное джамо , включая устаревшее джамо.

Код города Ханьян для частного использования [ править ]

Hangul (текстовый процессор) поставляется со шрифтами от Hanyang Information and Communication . Их шрифты отображают устаревшие символы хангыль в область частного использования Unicode. Несмотря на использование области частного использования вместо выделенных кодовых точек, отображение Hanyang было по состоянию на 2007 год самым популярным способом представления устаревшего хангыля в Южной Корее.

Начиная с Hangul 2010, Hancom отказался от кода Hanyang PUA и решил представлять устаревшие символы хангыль с помощью хангыль джамо в Unicode.

См. Также [ править ]

  • Японский язык и компьютеры
  • Вьетнамский язык и компьютеры
  • Список шрифтов CJK
  • МакКьюн – Райшауэр
  • Йельский романизация корейского языка
  • Пересмотренная романизация
  • Новая корейская орфография

Ссылки [ править ]

  1. ^ "KS X 1001: 1992" (PDF) .
  2. ^ https://github.com/libhangul/ibus-hangul
  3. ^ a b 김치관 (2 декабря 2000 г.).문답 으로 보는 북한 정보화 의 현주소. Tongilnews.com (на корейском языке) . Проверено 3 декабря 2006 года .
  4. ^ a b c 김효석 (2 декабря 2000 г.). "<국회 자료집> S / W 현황 과 시연 자료" . Tongilnews.com (на корейском языке) . Проверено 3 декабря 2006 года .
  5. ^ Yonhap (7 января 1998).북한 의 컴퓨터 산업 어디 까지 왔나. Tongilnews.com (на корейском языке) . Проверено 3 декабря 2006 года .[ мертвая ссылка ]
  6. ^ «북한 용어 사전: 평양 정보 센터 (PIC)» (на корейском языке). Архивировано из оригинального 28 сентября 2007 года . Проверено 3 декабря 2006 года .

Внешние ссылки [ править ]

  • Корейская виртуальная клавиатура онлайн
  • InputKing Online Input System , онлайн-инструмент для ввода корейского языка
  • «Джамо в Юникоде» (PDF) . (186 КБ)
  • «Слоги хангыль» (PDF) . (3,86 МБ)
  • Хоффманн, Франк. «Корееведение: конвертер Unicode» . koreanstudies.com ., онлайн-инструмент для преобразования корейского текста в различные форматы кодирования и наоборот.