Латинизации арабского языка относится к стандартным нормам для рендеринга написано и говорили по- арабски в латинице в одном из различных систематических способов. Романизированный арабский язык используется для ряда различных целей, в том числе для транскрипции имен и названий, каталогизации произведений на арабском языке, языкового обучения, когда он используется в дополнение к арабскому письму или вместе с ним, и представления языка в научных публикациях лингвистов . Эти формальные системы, в которых часто используются диакритические знаки.и нестандартные латинские символы и используются в академической среде или для не говорящих, в отличие от неформальных средств письменного общения, используемых носителями языка, таких как латинский арабский алфавит в чате .
Различные системы и стратегии были разработаны для решения неотъемлемых проблем, связанных с отображением различных арабских разновидностей латинским шрифтом. Примерами таких проблем являются символы арабских фонем , которых нет в английском или других европейских языках; средства представления арабского определенного артикля , который всегда пишется одинаково в письменном арабском языке, но имеет множество вариантов произношения в разговорной речи в зависимости от контекста; и представление коротких гласных (обычно i u или e o , с учетом таких вариаций, как мусульманин / мусульманин или Мохаммед / Мухаммад / Мохамед ).
Методика
Романизацию часто называют «транслитерацией», но с технической точки зрения это неверно. [ необходима цитата ] Транслитерация - это прямое представление иностранных букв с использованием латинских символов, в то время как большинство систем латинизации арабского языка на самом деле являются системами транскрипции , которые представляют звучание языка. В качестве примера приведенный выше перевод слова munāẓaratu l-urūfi l-ʻarabīyah на арабском языке : مناظرة الحروف العربية - транскрипция, указывающая на произношение; пример транслитерации: mnaẓr alḥrwf alʻrbyḧ .
Стандарты и системы романизации
Основные стандарты и системы:
Смешанный диграфический и диакритический
- Латинизация BGN / PCGN (1956). [1]
- UNGEGN (1972). Группа экспертов Организации Объединенных Наций по географическим названиям, или «Вариант А измененной Бейрутской системы». Взято из BGN / PCGN. [2] [3]
- IGN System 1973 или «Вариант B измененной Бейрутской системы», который соответствует французской орфографии и предпочтительнее варианта A во франкоязычных странах, таких как Магриб и Ливан. [2] [4]
- Латинизация ADEGN (2007 г.) отличается от UNGEGN двумя способами: (1) ظ - это d͟h вместо z̧; (2) седиль заменяется суб-макроном (_) во всех символах с седилем. [2]
- ALA-LC (впервые опубликовано в 1991 г.) от Американской библиотечной ассоциации и Библиотеки Конгресса США . [5] Эта латинизация близка к латинизации Deutsche Morgenländische Gesellschaft и Hans Wehr , которая используется арабистами во всем мире в научных публикациях.
- IJMES , используемый Международным журналом исследований Ближнего Востока , очень похож на ALA-LC. [6]
- EI , Энциклопедия ислама (1-е изд., 1913–1938; 2-е изд., 1960–2005). [7]
Полностью диакритический
- DMG ( Deutsche Morgenländische Gesellschaft , 1935), принятая Международной конвенцией ученых-востоковедов в Риме. [8]
- DIN 31635 (1982), разработанный Немецким институтом стандартизации ( Deutsches Institut für Normung ).
- Транслитерация Ханса Вера (1961, 1994), модификация DIN 31635.
- EALL , Энциклопедия арабского языка и лингвистики (под редакцией Киса Верстеха, Brill, 2006–2009 гг.). [9]
- Испанская латинизация, идентичная DMG / DIN, за исключением трех букв: ǧ> ŷ, ḫ> j, ġ> g. [10]
- ISO 233 (1984), буквенный; гласные транслитерируются только в том случае, если они показаны с диакритическими знаками, в противном случае они опускаются.
- ISO 233-2 (1993), упрощенная транслитерация; всегда отображаются гласные. [ требуется проверка ]
- BS 4280 (1968), разработанный Британским институтом стандартов . [11]
На основе ASCII
- ArabTeX (с 1992 г.) был разработан в соответствии со стандартами транслитерации ISO / R 233 и DIN 31635. [12]
- Баквальтерская транслитерация (1990-е годы), разработанная в ALPNET Тимом Баквалтером ; не требует необычных диакритических знаков . [13] [14]
- Арабский алфавит в чате : [9] специальное решение для удобного ввода арабского языка с латинской клавиатуры.
Сравнительная таблица
Письмо | Юникод | Имя | IPA | BGN / PCGN | UNGEGN | ALA-LC | EI | Вер 1 | EALL | BS | DIN | ISO | ArabTeX | чат 2 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ء 3 | 0621 | хамза | ʔ | ʼ 4 | ʾ | ʼ 4 | ʾ | ʼ 4 | ʾ | , ˌ | ' | 2 | ||
ا | 0627 | алиф | аː | ā | ʾ | А | а / е / é | |||||||
ب | 0628 | ба ʼ | б | б | ||||||||||
ت | 062A | tā ʼ | т | т | ||||||||||
ث | 062B | thā ʼ | θ | th (t͟h) 5 | ṯ | _t | с / й | |||||||
ج | 062C | Джим | d͡ʒ ~ ɡ ~ ʒ | j | диджей (d͟j) 5 | j 6 | ǧ | ^ г | дж / г / диджей | |||||
ح | 062D | ḥā ʼ | час | ḩ 7 | час | .час | 7 | |||||||
خ | 062E | кха ʼ | Икс | кх (к͟х) 5 | ḵ 6 | Икс | час | час | час | _час | кх / 7 '/ 5 | |||
د | 062F | dāl | d | d | ||||||||||
ذ | 0630 | дхал | ð | дх (д͟х) 5 | ḏ | _d | з / дч / чт | |||||||
ر | 0631 | ра ʼ | р | р | ||||||||||
ز | 0632 | зайн / зай | z | z | ||||||||||
س | 0633 | син | s | s | ||||||||||
ش | 0634 | шин | ʃ | ш (су) 5 | š | ^ s | ш / ч | |||||||
ص | 0635 | грустный | sˤ | ş 7 | ṣ | .s | с / 9 | |||||||
ض | 0636 | папа | dˤ | ḑ 7 | ḍ | .d | d / 9 ' | |||||||
ط | 0637 | ṭā ʼ | tˤ | ţ 7 | ṭ | .t | т / 6 | |||||||
ظ | 0638 | ẓā ʼ | ðˤ ~ zˤ | z̧ 7 | ẓ | ḏ̣ / ẓ 11 | ẓ | .z | z / dh / 6 ' | |||||
ع | 0639 | ' айн | ʕ | ` 4 | ʿ | ʽ 4 | ʿ | ` | 3 | |||||
غ | 063A | Ghayn | ɣ | гх (г͟х) 5 | ḡ 6 | грамм | грамм | грамм | .грамм | gh / 3 ' | ||||
ف 8 | 0641 | fā ʼ | ж | ж | ||||||||||
ق 8 | 0642 | каф | q | q | 2 / г / кв / 8 | |||||||||
ك | 0643 | каф | k | k | ||||||||||
ل | 0644 | Лам | л | л | ||||||||||
م | 0645 | мим | м | м | ||||||||||
ن | 0646 | нун | п | п | ||||||||||
ه | 0647 | ха ʼ | час | час | ||||||||||
و | 0648 | wāw | w , uː | w; ū | w; U | без / о / о / о / о | ||||||||
ي 9 | 064A | йа ' | j , iː | у; я | у; я | y / i / ee / ei / ai | ||||||||
آ | 0622 | Алиф Мадда | ʔaː | ā, ʼ ā | ʾ ā | ʾ â | ' А | 2а / аа | ||||||
ة | 0629 | tā ʼ marbūṭah | а , в | час; т | -; т | час; т | ẗ | Т | а / е (ч); et / at | |||||
ال | 0627 0644 | Алиф Лам | (var.) | ал- 10 | ʾ al | аль- | эл / ал | |||||||
ى 9 | 0649 | Алиф Мак maура | аː | á | ā | ỳ | _A | а | ||||||
Вокализация | ||||||||||||||
ـَ | 064E | фатха | а | а | а / е / é | |||||||||
ـِ | 0650 | касра | я | я | i / e / é | |||||||||
ـُ | 064F | ammah | ты | ты | оу / о / о | |||||||||
ـَا | 064E 0627 | фатах алиф | аː | ā | а ' | A / aa | а | |||||||
ـِي | 0650 064A | касрах йах | я | я | иу | I / iy | я / ее | |||||||
ـُو | 064F 0648 | ammah wāw | u | ū | уф | U / uw | оу / оо / и | |||||||
ـَي | 064E 064A | фаттах йах | эй | ай | ай / ай / эй / эй | |||||||||
ـَو | 064E 0648 | Fatḥah WAW | ау | ау | aw / aou | |||||||||
ـً | 064B | фатнатан | ан | а н | ан | á | аН | ан | ||||||
ـٍ | 064D | касратан | в | я н | в | я | в | в / en | ||||||
ـٌ | 064C | ammatān | ООН | у н | ООН | ú | ООН | oun / on / oon / un |
- ^ 1 При транслитерации Hans Wehr первая буква в начале предложений и в именах собственных не используется с заглавной буквы.
- ^ 2 Таблицачатаявляется лишь демонстрацией и основана наразговорных разновидностях,которые значительно отличаются отлитературного арабского языка,на котором основана таблица IPA и остальные транслитерации.
- ^ 3 Просмотритеразличные формы хамзы .
- ^ 4 Ни один из стандартов не определяет, какуюкодовую точкуиспользовать для хамзы и ʻayn . Присвоить точки Unicode будетМодификатор буквы апострофа⟨'⟩ имодификатор письма перевернутого запятой⟨'⟩ (для ГЭГНООН и BGN / постоянного бюро транскрипции географических названий) илимодификатора письма обратной запятой⟨'⟩ (для Вер и обследования Египта системы (SES)), все это Unicode определяет как буквы. Часто правые и левые одиночныекавычки⟨«⟩, ⟨»⟩ используются вместо, но Unicode определяет их как знаки препинания, и они могут вызвать проблемы совместимости. Глоттальная остановка ( хамза ) в этих латинизациях изначально не написана дословно.
- ^ 5 В «Энциклопедии ислама»диграфы подчеркнуты, то есть t͟h, d͟j, k͟h, d͟h, s͟h, g͟h. В BGN / PCGN, наоборот, последовательностиـتـهـ, ـكـهـ, ـدهـ, ـسهـмогут латинизироваться сосредней точкойкакt · h,k · h,d · h,s · hсоответственно; букваgне используется сама по себе в BGN / PCGN, поэтому путаница междуghиg+hневозможна.
- ^ 6 В оригинальном немецком издании своего словаря (1952) Вер использовал ǧ, ḫ, ġ для j, ḵ, ḡ соответственно (то есть все используемые буквы соответствуют DMG /DIN 31635). Представленный в таблице вариант взят из английского перевода словаря (1961 г.).
- ^ 7 BGN / позволяет использовать постоянное бюро транскрипции географических названий вunderdotsвместоседиля.
- ^ 8 Fāʼ и qāf традиционно пишутся вСеверо-Западной Африкекак ڢ и ڧـ ـڧـ ـٯ , соответственно, в то время как точка последнего добавляется только изначально или посередине.
- ^ 9 В Египте, Судане и иногда в других регионах стандартной формой final-yāʼ является толькоى (без точек)в почерке и печати, как для final/ -iː /, таки для final/ -aː /. ى для последнего произношения называетсяألف لينة alif layyinah [ˈʔælef læjˈjenæ] , «гибкий алиф».
- ^ 10 ВВС и луна буквыиХамзат Уошлпроизношение правила применяются, хотя допустимо игнорировать их. Система ООН и ALA-LC предпочитают строчные буквыaи дефисы:al-Baṣrah, ar-Riyāḍ; BGN / PCGN предпочитает верхний регистрAбез дефисов:Al Baṣrah, Ar Riyā. [2]
- ^ 11 EALL предлагает ẓ «в именах собственные» (том 4, стр. 517).
Проблемы романизации
Любая система латинизации должна принимать ряд решений, которые зависят от предполагаемой области ее применения.
Гласные звуки
Одна из основных проблем состоит в том, что письменный арабский язык обычно не произносится ; т. е. многие гласные не записаны, и их должен произносить читатель, знакомый с языком. Следовательно, беззвучное арабское письмо не дает читателю, незнакомому с языком, достаточной информации для точного произношения. В результате чистая транслитерация , например, перевод قطر как qṭr , бессмысленна для неподготовленного читателя. По этой причине обычно используются транскрипции с добавлением гласных, например qaar . Однако невокализованные системы точно соответствуют письменному арабскому языку, в отличие от вокализированных систем, таких как арабский чат, который, как утверждают некоторые, снижает способность человека к произношению. [15]
Транслитерация против транскрипции
В большинстве случаев латинизация требует транскрипции, а не транслитерации : вместо транслитерации каждой написанной буквы они пытаются воспроизвести звучание слов в соответствии с правилами орфографии целевого языка: кагар . Это в равной степени относится как к научным, так и к популярным приложениям. При чистой транслитерации необходимо будет опустить гласные (например, qr ), что затруднит интерпретацию результата, за исключением некоторой части обученных читателей, свободно владеющих арабским языком. Даже если добавить гласные, система транслитерации все равно необходимо будет провести различие между несколькими способами правописания же звуком в арабской графике, например , алиф ا против алиф maqṣūrah ى для звука / A / ā , и шесть различных способов ( ء إ أ آ ؤ ئ ) записи голосовой остановки ( хамза , обычно транскрибируется ʼ ). Подобные детали бесполезно сбивают с толку, за исключением очень немногих ситуаций (например, набор текста арабским шрифтом).
Большинство вопросов, связанных с латинизацией арабского языка, связаны с транслитерацией и транскрибированием; другие, о том, что следует латинизировать:
- Некоторые транслитерации игнорируют усвоение в определенной статье аль- перед « солнечными буквами », и могут быть легко неправильно не-арабским языком. Например, «свет» النور an-nūr можно было бы более дословно транслитерировать в соответствии с линиями alnūr . В транскрипции an-nūr добавлен дефис, а непроизносимое / l / удалено для удобства неосведомленного носителя языка, не владеющего арабским языком, который в противном случае произнес бы an / l / , возможно, не понимая, что / n / in nūr имеет удвоение . В качестве альтернативы, если шадда не транслитерируется (поскольку это строго не буква), строго буквальной транслитерацией будет алнур , что создает аналогичные проблемы для неосведомленных людей, не владеющих арабским языком.
- A transliteration should render the "closed tāʼ" (tāʼ marbūṭah, ة) faithfully. Many transcriptions render the sound /a/ as a or ah and t when it denotes /at/.
- ISO 233 has a unique symbol, ẗ.
- "Restricted alif" (alif maqṣūrah, ى) should be transliterated with an acute accent, á, differentiating it from regular alif ا, but it is transcribed in many schemes like alif, ā, because it stands for /aː/.
- Nunation: what is true elsewhere is also true for nunation: transliteration renders what is seen, transcription what is heard, when in the Arabic script, it is written with diacritics, not by letters, or omitted.
A transcription may reflect the language as spoken, typically rendering names, for example, by the people of Baghdad (Baghdad Arabic), or the official standard (Literary Arabic) as spoken by a preacher in the mosque or a TV newsreader. A transcription is free to add phonological (such as vowels) or morphological (such as word boundaries) information. Transcriptions will also vary depending on the writing conventions of the target language; compare English Omar Khayyam with German Omar Chajjam, both for عمر خيام /ʕumar xajjaːm/, [ˈʕomɑr xæjˈjæːm] (unvocalized ʿmr ḫyām, vocalized ʻUmar Khayyām).
A transliteration is ideally fully reversible: a machine should be able to transliterate it back into Arabic. A transliteration can be considered as flawed for any one of the following reasons:
- A "loose" transliteration is ambiguous, rendering several Arabic phonemes with an identical transliteration, or such that digraphs for a single phoneme (such as dh gh kh sh th rather than ḏ ġ ḫ š ṯ) may be confused with two adjacent consonants—but this problem is resolved in the ALA-LC romanization system, where the prime symbol ʹ is used to separate two consonants when they do not form a digraph;[16] for example: أَكْرَمَتْها akramatʹhā ('she honored her'), in which the t and h are two distinct consonantal sounds.
- Symbols representing phonemes may be considered too similar (e.g., ʻ and ' or ʿ and ʾ for ع ʻayn and hamzah);
- ASCII transliterations using capital letters to disambiguate phonemes are easy to type, but may be considered unaesthetic.
A fully accurate transcription may not be necessary for native Arabic speakers, as they would be able to pronounce names and sentences correctly anyway, but it can be very useful for those not fully familiar with spoken Arabic and who are familiar with the Roman alphabet. An accurate transliteration serves as a valuable stepping stone for learning, pronouncing correctly, and distinguishing phonemes. It is a useful tool for anyone who is familiar with the sounds of Arabic but not fully conversant in the language.
One criticism is that a fully accurate system would require special learning that most do not have to actually pronounce names correctly, and that with a lack of a universal romanization system they will not be pronounced correctly by non-native speakers anyway. The precision will be lost if special characters are not replicated and if a reader is not familiar with Arabic pronunciation.
Примеры
Examples in Literary Arabic:
Arabic | أمجد كان له قصر | إلى المملكة المغربية |
---|---|---|
Arabic with diacritics (normally omitted) | أَمْجَدُ كَانَ لَهُ قَصْر | إِلَى الْمَمْلَكَةِ الْمَغْرِبِيَّة |
IPA | /ʔamdʒadu kaːna lahu qasˤr/ | /ʔila‿l.mamlakati‿l.maɣribij.ja/ |
ALA-LC | Amjad kāna lahu qaṣr | Ilá al-mamlakah al-Maghribīyah |
Hans Wehr | amjad kāna lahū qaṣr | ilā l-mamlaka al-maḡribīya |
DIN 31635 | ʾAmǧad kāna lahu qaṣr | ʾIlā l-mamlakah al-Maġribiyyah |
UNGEGN | Amjad kāna lahu qaşr | Ilá al-mamlakah al-maghribiyyah |
ISO 233 | ʾˈamǧad kāna lahu qaṣr | ʾˈilaỳ ʾˈalmamlakaẗ ʾˈalmaġribiȳaẗ |
ArabTeX | am^gad kAna lahu qa.sr | il_A almamlakaT alma.gribiyyaT |
English | Amjad had a palace | To the Moroccan Kingdom |
Арабский алфавит и национализм
There have been many instances of national movements to convert Arabic script into Latin script or to romanize the language.
Lebanon
A Beirut newspaper La Syrie pushed for the change from Arabic script to Latin script in 1922. The major head of this movement was Louis Massignon, a French Orientalist, who brought his concern before the Arabic Language Academy in Damascus in 1928. Massignon's attempt at romanization failed as the Academy and population viewed the proposal as an attempt from the Western world to take over their country. Sa'id Afghani, a member of the Academy, asserted that the movement to romanize the script was a Zionist plan to dominate Lebanon.[17][18]
Egypt
After the period of colonialism in Egypt, Egyptians were looking for a way to reclaim and reemphasize Egyptian culture. As a result, some Egyptians pushed for an Egyptianization of the Arabic language in which the formal Arabic and the colloquial Arabic would be combined into one language and the Latin alphabet would be used.[17][18] There was also the idea of finding a way to use hieroglyphics instead of the Latin alphabet.[17][18] A scholar, Salama Musa, agreed with the idea of applying a Latin alphabet to Egyptian Arabic, as he believed that would allow Egypt to have a closer relationship with the West. He also believed that Latin script was key to the success of Egypt as it would allow for more advances in science and technology. This change in script, he believed, would solve the problems inherent with Arabic, such as a lack of written vowels and difficulties writing foreign words.[17][18][19] Ahmad Lutfi As Sayid and Muhammad Azmi, two Egyptian intellectuals, agreed with Musa and supported the push for romanization.[17][18] The idea that romanization was necessary for modernization and growth in Egypt continued with Abd Al Aziz Fahmi in 1944. He was the chairman for the Writing and Grammar Committee for the Arabic Language Academy of Cairo.[17][18] He believed and desired to implement romanization in a way that allowed words and spellings to remain somewhat familiar to the Egyptian people. However, this effort failed as the Egyptian people felt a strong cultural tie to the Arabic alphabet, particularly the older generation.[17][18]
Смотрите также
- Arabic Chat Alphabet
- Arabic diacritics
- Arabic grammar
- Arabic names
- Glottal stop (letter)
- Maltese alphabet
- Ottoman Turkish alphabet – a Perso-Arabic-based alphabet, which was replaced by the Latin-based Turkish alphabet in 1928
- Romanization of Hebrew
- Romanization of Persian
- Standard Arabic Technical Transliteration System (SATTS)
Рекомендации
- ^ "Romanization system for Arabic. BGN/PCGN 1956 System" (PDF).
- ^ a b c d "Arabic" (PDF). UNGEGN.
- ^ Technical reference manual for the standardization of geographical names (PDF). UNGEGN. 2007. p. 12 [22].
- ^ "Systèmes français de romanisation" (PDF). UNGEGN. 2009.
- ^ "Arabic romanization table" (PDF). The Library of Congress.
- ^ "IJMES Translation & Transliteration Guide". International Journal of Middle East Studies.
- ^ "Encyclopaedia of Islam Romanization vs ALA Romanization for Arabic". University of Washington Libraries.
- ^ Brockelmann, Carl; Ronkel, Philippus Samuel van (1935). Die Transliteration der arabischen Schrift... (PDF). Leipzig.
- ^ a b Reichmuth, Philipp (2009). "Transcription". In Versteegh, Kees (ed.). Encyclopedia of Arabic Language and Linguistics. 4. Brill. pp. 515–20.
- ^ Millar, M. Angélica; Salgado, Rosa; Zedán, Marcela (2005). Gramatica de la lengua arabe para hispanohablantes. Santiago de Chile: Editorial Universitaria. pp. 53–54. ISBN 978-956-11-1799-0.
- ^ "Standards, Training, Testing, Assessment and Certification". BSI Group. Archived from the original on October 7, 2008. Retrieved 2014-05-18.
- ^ ArabTex User Manual Section 4.1 : ASCII Transliteration Encoding.
- ^ "Buckwalter Arabic Transliteration". QAMUS LLC.
- ^ "Arabic Morphological Analyzer/The Buckwalter Transliteration". Xerox. Retrieved 2017-04-30.
- ^ "Arabizi sparks concern among educators". GulfNews.com. 2013-05-09. Retrieved 2014-05-18.
- ^ "Arabic" (PDF). ALA-LC Romanization Tables. Library of Congress. p. 9. Retrieved 2013-06-14.
21. The prime (ʹ) is used: (a) To separate two letters representing two distinct consonantal sounds, when the combination might otherwise be read as a digraph.
- ^ a b c d e f g Shrivtiel, Shraybom (1998). The Question of Romanisation of the Script and The Emergence of Nationalism in the Middle East. Mediterranean Language Review. pp. 179–196.
- ^ a b c d e f g History of Arabic Writing
- ^ Shrivtiel, p. 188
Внешние ссылки
- Comparative table of DIN 31635, ISO 233, ISO/R 233, UN, ALA-LC, and Encyclopædia of Islam (not normative)