Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

ISO 11940 является ISO стандартом для транслитерации из тайских символов , опубликованная в 1998 году и обновлена в сентябре 2003 года и подтверждено в 2008 году расширения Ан этого стандарта под названием ISO 11940-2 определяет упрощенный транскрипционные на его основе.

Согласные [ править ]

Транслитерации чистого согласных происходят от их обычного произношения в качестве начальных согласного. Немаркированный h используется для образования диграфов, обозначающих придыхательные согласные . Высокие и низкие пары согласных систематически различаются путем применения макрона к согласным высокого класса. Дальнейшая дифференциация согласных с идентичной фонетической функцией достигается путем того, что наиболее часто встречающиеся не помечены, второй по частоте отмечен точкой внизу, третий по частоте отмечен рогом, а четвертый по частоте отмечен подчеркиванием. Использование точки ниже имеет эффект, аналогичный индологическому.Практика различения ретрофлексных согласных точкой внизу, но есть тонкие различия - это транслитерации ธtho thong и ศso sala , которые пунктирны ниже, а не транслитерации соответствующих ретрофлексных согласных . Транслитерацию согласных следует вводить в порядке основной буквы, макрон, если есть, а затем точку внизу, рог или «макрон внизу».

Рог в транслитерации присутствует только у трех согласных, ฅkho khon , ฒtho phuthao и ษso ruesi , и только у одного согласного есть подчеркивание, ฑtho nang montho .

Гласные [ править ]

Буква å - единственный предварительно составленный символ, указанный в выводе транслитерации.

Lakkhangyao (ๅ) был показан только в сочетании с гласными буквами ฤ и ฦ. Стандарт просто перечисляет ฤ и ฦ с согласными, а лаккханъяо - с гласными. Изолированный лаккханъяо также транслитерируется маленькой буквой «i» с чертой ( ɨ ), но это не должно происходить в тайском языке, пали или санскрите.

Транслитерации วwo waen и อo ang были включены сюда из-за их использования в качестве полных символов гласных, но их транслитерация не зависит от того, как они используются, и стандарт просто перечисляет их вместе с согласными.

Сложные гласные символы транслитерируются в соответствии с их составными частями.

Другие объединяющие знаки [ править ]

Обратите внимание, что yamakkan (- ๎) обозначается тильдой с интервалом, а не тильдой в верхнем индексе.

Пунктуация и цифры [ править ]

ISO 11940: 1998 отличает аббревиатуру paiyannoi () от терминатора предложения angkhandiao ( even ), хотя ни национальный стандарт символов TIS 620-2533, ни Unicode Version 5.0 не различают их. Paiyannoi транслитерируется как ǂ, а angkhandiao транслитерируется как ǀ . Обратите внимание, что paiyannoi , angkhandiao и angkhankhu (๚) транслитерируются буквами, используемыми для щелкающих согласных , а не двойным кинжалом, вертикальными полосами или дандами .

Последовательность символов [ править ]

Обычно символы транслитерируются слева направо и, если символы имеют одинаковое положение по горизонтали, сверху вниз. Вертикальное чередование на самом деле просто определяется как тоновые знаки и тантхакхат (- ์), предшествующие любым другим знакам выше или ниже согласного. Стандарт отрицает в конце раздела 4.2, что комбинация sara u (◌ ุ, ◌ ู) и nikkhahit (◌ ํ) может иметь место, а затем дает пример этого при указании транслитерации nikkhahit , но не показывает транслитерацию комбинации. Эффект этих правил заключается в том, что, за исключением никкхита , все негласные знаки, прикрепленные к согласному в тайском языке, присоединяются к согласному в римской транслитерации.

Стандарт допускает, что попытка транспонирования предложенных гласных и согласных может быть удобнее тех, которые используются в латинском алфавите , но рекомендует не переносить предложенные гласные.

Например, ภาษา ไทย ( RTGSPhasa Thai ) следует транслитерировать в p̣hās̛̄āịthy, а เชียงใหม่ ( RTGSChiang Mai ) - в echīyngıh̄m̀ .

Варианты [ править ]

Причины [ править ]

Стандарт определяет порядок, в котором акценты должны вводиться, но не все системы ввода будут записывать акценты в том порядке, в котором они вводятся. Unicode определяет две нормализованные формы для букв с несколькими диакритическими знаками, и транслитерированный текст, скорее всего, будет сохранен в одной из этих форм. Это усложняет автоматическую обратную транслитерацию. Поскольку процессы, совместимые с Unicode, должны правильно обрабатывать такие варианты, транслитерации на этой странице были выбраны для простоты отображения - современные системы визуализации могут отображать эквивалентные формы по-разному.

Многие шрифты плохо отображают новые сочетания согласных и ударений. Например, Институт эстонского языка публикует в сети объяснение применения стандарта к тайскому языку , и, за одним исключением, это, похоже, соответствует стандарту. Исключением является то, что, за исключением макрона, акценты над согласными фактически смещены вправо, создавая впечатление, что они были введены как соответствующие несоединяемые символы. Стандарт определяет транслитерацию в кодовых точках, но кто-то, работающий с этим бесплатным объяснением, может легко сделать вывод, что следует использовать формы интервалов тональных акцентов.

ICU (CLDR 1.4.1) [ править ]

Реализация ICU , записанная в версии 1.4.1 хранилища данных Common Locale, спонсируемого Unicode , [1] использует штрих вместо рожка при транслитерации согласных. Это влияет на транслитерацию ฅkho khon , ฒtho phuthao и ษso bo ruesi . ฏto patak также транслитерируется по-разному, как t̩, а не .

Данная реализация транслитерирует ำ как  вместо å , чтобы избежать двусмысленности с гипотетическим тайской последовательности сценария ะํ ( сара , nikkhahit ). Реализация ICU транслитерирует ฺphinthu как ˌ вместо того, чтобы избежать проблем с нормализацией Unicode . Это имеет побочный эффект, заключающийся в улучшении разборчивости при применении к согласному звуку с тонкими точками.

Реализация ICU транслитерирует ฯpaiyannoi как (двойной кинжал) и angkhankhu как || (две вертикальные полосы ASCII). Поскольку реализация ICU использует Unicode, она не может надежно отличить angkhandiao от paiyannoi без семантического анализа и не делает таких попыток.

Последовательность символов реализации ICU отличается. Он заменяет предлог гласные на следующий согласный и обрабатывает отметки на согласном в том порядке, в котором они хранятся в памяти. (Большинство тайских методов ввода гарантируют, что знаки хранятся в порядке снизу вверх.) Он не переносит предлоговые гласные с полными группами согласных; Группы согласных не могут быть идентифицированы с полной точностью, и для транспонирования гласных с кластерами потребуется дополнительный символ, чтобы обеспечить надежное преобразование обратно в тайский сценарий.

Например, в этой реализации ภาษา ไทย транслитерируется как p̣hās̄ʹāthịy, а เชียงใหม่ - как cheīyngh̄ım̀ .

Наконец, эта реализация генерирует транслитерации в форме C нормализации Unicode (NFC).

См. Также [ править ]

  • Список транслитераций ISO
  • Романизация Лаоса
  • Романизация тайского языка
  • Королевская тайская общая система транскрипции

Ссылки [ править ]

  1. ^ http://unicode.org/Public/cldr/1.4.1/core.zip файлы преобразовывает / ThaiLogical-Latin.xml и преобразовывает / Thai-ThaiLogical.xml (используется транслитераторами ICU "Thai-Latin" и "Latin- Тайский ")

Внешние ссылки [ править ]

  • Официальный сайт ISO
  • Правила транслитерации на Unicode.org
  • Романизация тайских топонимов в базе данных KNAB Института эстонского языка