Из Википедии, бесплатной энциклопедии
  (Перенаправлено с Agglutinative )
Перейти к навигации Перейти к поиску

Средний знак на венгерском языке , который сильно агглютинирует. (Верхний и нижний знаки на румынском и немецком языках соответственно, оба склоняются .) Английский перевод - «Министерство продовольствия и сельского хозяйства: Главное управление продовольствия и сельского хозяйства округа Сату-Маре ».

Агглютинация - это лингвистический процесс, относящийся к деривационной морфологии, в которой сложные слова образуются путем объединения морфем без изменения их орфографии или фонетики. Языки, которые широко используют агглютинацию, называются агглютинативными языками . Примером такого языка является турецкий , где, например, слово evlerinizden , или «из ваших домов», состоит из морфем ev-ler-iniz-den, дословно переводимых морфема за морфемой как дом-множественное число-ваш. -с .

Агглютинативные языки часто противопоставляются как языкам, в которых синтаксическая структура выражается исключительно посредством порядка слов и вспомогательных слов ( изолирующие языки ), так и языкам, в которых один аффикс обычно выражает несколько синтаксических категорий, а одна категория может быть выражена несколькими разными аффиксы (как в флективных (фузионных) языках ). Однако как фузионные, так и изолирующие языки могут использовать агглютинацию в наиболее часто используемых конструкциях и активно использовать агглютинацию в определенных контекстах, таких как словообразование. Так обстоит дело с английским языком , который имеет агглютинированный маркер множественного числа - (e) s и производные слова, такие как shame · less · ness .

Агглютинативные суффиксы часто вставляются независимо от слоговых границ , например, путем добавления согласной к слоговой коде, как в английском языке tie - tie s . Агглютинативные языки также имеют большой набор энклитиков , которые могут быть отделены от корня слова носителями языка в повседневном использовании.

Термин агглютинация иногда используется в более общем смысле для обозначения морфологического процесса добавления суффиксов или других морфем к основанию слова. Этот вопрос более подробно рассматривается в разделе, посвященном другим использованию этого термина .

Примеры агглютинативных языков [ править ]

Хотя агглютинация характерна для определенных языковых семей, это не означает, что, когда несколько языков в определенной географической области являются агглютинативными, они обязательно филогенетически связаны. В прошлом это предположение побудило лингвистов предложить так называемую урало-алтайскую языковую семью , которая включала (в наибольшем из когда-либо предложенных) уральские и тюркские языки, а также монгольский, корейский и японский. Современная лингвистика считает это предложение спорным. [1]

Еще одно соображение при оценке вышеупомянутого предложения состоит в том, что некоторые языки, которые развились на основе агглютинативных протоязыков, утратили свои агглютинативные особенности. Например, современный эстонский язык, который настолько близок к финскому, что оба языка понятны друг другу [2] , сместился в сторону слитного типа. [3] (Он также утратил другие черты, характерные для уральских семейств, такие как гармония гласных ).

Евразия [ править ]

Примеры агглютинативных языков включают уральские языки , такие как финский , эстонский и венгерский . В их повседневном употреблении очень агглютинированные выражения, и большинство слов двусложные или длиннее. Грамматическая информация, выраженная приставками в западных индоевропейских языках , обычно встречается в суффиксах.

Венгерский язык использует обширную агглютинацию почти во всех его частях. Суффиксы следуют друг за другом в особом порядке, в зависимости от роли суффикса, и многие из них могут быть наложены друг на друга, в результате чего слова передают сложные значения в сжатой форме. Примером является fiaiéi, где корень «fi (ú) -» означает «сын», последующие четыре гласных являются отдельными суффиксами, а все слово означает «[свойства множественного числа] принадлежат его / ее сыновьям». Вложенная притяжательная структура и выражение множественного числа весьма примечательны (обратите внимание, что в венгерском языке роды не используются).

Почти все австронезийские языки , такие как малайский и большинство филиппинских языков , также принадлежат к этой категории, что позволяет им образовывать новые слова из простых базовых форм. Индонезийское и малайское слово mempertanggungjawabkan образовано добавлением активных, причинных и переходных аффиксов к составному глаголу tanggung jawab , что означает «учитывать». На тагальском языке (и его стандартизированном регистре - филиппинском ) nakakapágpabagabag («то, что расстраивает / беспокоит») образовано от корня bagabag («расстраивает» или «тревожит»).

Японский также является агглютинирующим языком, добавляя такую ​​информацию, как отрицание , пассивный залог , прошедшее время , почетную степень и причинность в форме глагола. Распространенными примерами могут быть хатаракасераретара (働 か せ ら れ た ら) , которая сочетает в себе причинные, пассивные или потенциальные и условные спряжения, чтобы прийти к двум значениям в зависимости от контекста: «если (субъект) работал ...» и «если (субъект) может заставить (объект) работать », и tabetakunakatta (食 べ た く な か っ た) , в котором сочетаются желание, отрицание и спряжения прошедшего времени, означающие« Я / он / она / они не хотели есть ».

  • taberu ("(субъект) съест (это)")
  • tabetai ("(субъект) хочет съесть (это)")
  • tabetakunai («(субъект) не хочет есть (это)»)
  • tabetakunakatta («(субъект) не хотел есть (это)»)

Турецкий , наряду со всеми другими тюркскими языками , является еще одним агглютинирующим языком: в качестве крайнего примера выражение Muvaffakiyetsizleştiriciveremeyebileceklerimizdenmişsinizcesine произносится как одно слово на турецком языке, но его можно перевести на английский как «как если бы вы были из тех, мы не смогли бы превратиться в создателя неудачников »(« -siniz »относится к форме множественного числа от вас, где« -sin »является формой единственного числа, точно так же« -im »является« I »и« -imiz »делает его "мы").

Все дравидийские языки , включая каннада , телугу , малаялам и тамильский , являются агглютинативными.

Агглютинация - также примечательная черта басков . Спряжение глаголов, например, осуществляется путем добавления различных префиксов или суффиксов к корню глагола: dakartzat , что означает «Я приношу их», образовано da (указывает на настоящее время), kar (корень глагола ekarri → принести), tza (указывает на множественное число) и t (указывает на подлежащее, в данном случае «I»). Другой пример - склонение: Etxean = «В доме», где etxe = дом.

Африка [ править ]

Все языки банту , такие как KiKongo , IsiZulu , ChiChewa , LuGanda и суахили .

Сенегамбские языки, такие как волоф и фула .

Игбоидные языки .

Америка [ править ]

Подпишитесь на испанском, английском и кичва (агглютинативный язык).

Агглютинация используется очень сильно в большинстве индейских языков , таких как языки инуитов , науатль , мапуче , кечуа , Tz'utujil , какчикель , Cha'palaachi и киче , где одно слово может содержать достаточное количество морфем , чтобы передать смысл того , что было бы сложным предложением на других языках. И наоборот, навахо содержит аффиксы для некоторых целей, но накладывает их таким непредсказуемым и неотделимым образом, что его часто называют языком слияния. [ необходима цитата ]

Построен [ править ]

Эсперанто - это сконструированный вспомогательный язык с очень регулярной грамматикой и морфологией агглютинативных слов. См. Словарь эсперанто .

Вымышленный [ править ]

Новояз - это вымышленный язык 1984 года, основанный на единственной цели агглютинации, как выразился персонаж Сайм: «Каждое понятие, которое может когда-либо понадобиться, будет выражено ровно одним словом» [4]. Например, используя корневое слово «хорошо» «мы можем формировать такие слова, как хорошо (хорошо), plusgood (очень хорошо), doubleplusgood (очень хорошо) и ungood (плохо). Слова со значениями в сравнительной и превосходной степени также упрощаются, поэтому «лучше» становится «лучше», а «лучший» становится «самым хорошим». [5]

Слоты [ править ]

Как отмечалось выше, типичной особенностью агглютинативных языков является взаимно однозначное соответствие между суффиксами и синтаксическими категориями. Например, существительное может иметь отдельные маркеры для числа, падежа, притяжательного или соединительного употребления и т. Д. Порядок этих аффиксов фиксирован; [примечание 1], поэтому мы можем рассматривать любое данное существительное или глагол как основу, за которой следует несколько словоизменительных «слотов», то есть позиций, в которых могут встречаться флективные суффиксы. Часто бывает, что самый распространенный экземпляр данной грамматической категории не помечен, т. Е. Соответствующий аффикс пуст.

Количество слотов для данной части речи может быть на удивление большим. Например, конечный корейский глагол имеет семь слотов (внутренние круглые скобки указывают на части морфем, которые могут быть опущены в некоторых фонологических средах): [6]

  1. почетный: - (eu) si ((으) 시) используется, когда говорящий уважает подлежащее предложения
  2. время: (eo) ss (었) для завершенного (прошедшего) действия или состояния; когда этот слот пуст, время интерпретируется как настоящее ('ss' произносится как 't', если оно помещается после согласного. Например, - 었어 (eoss-eo) произносится как (eosseo), но - 었다 (eoss-ta) произносится как (eotta). Обратите внимание, что одно и то же правило применяется ко всем случаям окончания 'ss'.)
  3. экспериментально-контрастный аспект: (eo) ss (었) удвоение маркера прошедшего времени означает, что «субъект получил опыт, описанный глаголом»
  4. модальный: gess (겠) используется с субъектами от первого лица только для определенного будущего и с субъектами от второго или третьего лица также для вероятного настоящего или прошлого
  5. формальный: (eu) pni ((으) ㅂ니) выражает вежливость к слушателю
  6. ретроспективный аспект: deo ; (더) означает, что говорящий вспоминает то, что он наблюдал в прошлом, и сообщает в настоящей ситуации.
  7. настроение: da (다) для декларативного, kka (까) для вопросительного, ra / la (라) для императивного, ja (자) для высказывания, yo (요) для вежливого декларативного и большого количества других возможных маркеров настроения

Более того, пассивные и причинные глагольные формы могут быть получены путем добавления суффиксов к основанию, которое можно рассматривать как нулевой слот.

Даже несмотря на то, что некоторые комбинации суффиксов невозможны (например, только один из слотов аспектов может быть заполнен непустым суффиксом), более 400 форм глагола могут быть сформированы из одной основы. Вот несколько примеров, образованных от корня слова ga «идти»; числа указывают, какие слоты содержат непустые суффиксы:

  • 7 (маркер повелительного наклонения): суффикс повелительного наклонения -ra (라) в сочетании с корнем ga- (가) выражает повелительное наклонение: га-ра (가라) «Иди!»;
  • 7 (маркер пропозитивного настроения): если мы хотим выразить предложение, а не команду, используется маркер положительного настроения: -ja (자) вместо -ra (라): ga-ja (가자) «Поехали!»
  • 5 и 7: Если говорящий хочет проявить уважение к слушающему, он использует маркер вежливости - (eu) pni ((으) ㅂ니) (в слоте 5); одновременно могут использоваться различные маркеры настроения (в слоте 7, следовательно, после маркера вежливости): gap-ni-da (갑니다) «Он идет.», gap-ni-kka? (갑니까) 'Он идет?'
  • 6: ретроспективный аспект: Джон-и джиб-э га-део-ра (존 이 집 에 가 더라) «Я заметил, что Джон шел домой, и теперь я сообщаю об этом вам».
  • 7: простой указательный: сеон-сенг-ним-и джиб-э ган-да (선생님 이 집 에 간다) «Учитель идет домой. (не выражая уважения или вежливости) '
  • 5 и 7: вежливость по отношению к слушающему: сеон-саенг-ним-и джиб-е гап-ни-да (선생님 이 집 에 갑니다) или сеон-сенг-ним-и джиб-э га-йо (선생님 이 집 에 가요) 'Учитель идет домой.',
  • 1 и 7: уважение к предмету: сеон-сенг-ним-и джиб-э га-син-да (선생님 이 집 에 가신다) «(Уважаемый) учитель идет домой».
  • 1, 5 и 7: два вида вежливости в одном предложении: seon-saeng-nim-i jib-e ga-syeo-yo (선생님 이 집 에 가셔 요) или seon-saeng-nim-i jib-e ga- sip-ni-da (선생님 이 집 에 가십 니다) «Учитель идет домой. (выражая уважение как к слушателю, так и к учителю) »
  • 2, 3 и 7: прошедшие классы: Jon-i hak-gyo-e ga-ss-da / gat-ta (존 이 학교 에 갔다) «Джон пошел в школу (и сейчас там)», Джон- i hak-gyo-e gass-eoss-da / gass-eot-ta (존 이 학교 에 갔었다) «Джон был в школе (и вернулся)».
  • 4 и 7: модальное от первого лица: nae-ga nae-il ga-gess-da / ga-get-ta (내가 내일 가겠다) «Я пойду завтра».
  • 4 и 7: модальный вид от третьего лица: Jon-i nae-il ga-gess-da / ga-get-ta (존 이 내일 가겠다) «Я полагаю, что Джон уйдет завтра», Jon-i eo-je gass- gess-da / gat-get-ta (존 이 어제 갔 겠다) «Полагаю, Джон уехал вчера».

Суффикс или префикс [ править ]

Хотя в большинстве агглютинативных языков в Европе и Азии преобладают суффиксы, языки банту в южной части Африки известны очень сложной смесью префиксов, суффиксов и дублирования. Типичной особенностью этой языковой семьи является то, что существительные делятся на классы существительных. Для каждого класса существительных существуют определенные префиксы единственного и множественного числа, которые также служат маркерами согласия между подлежащим и глаголом. Более того, существительное определяет префиксы всех слов, которые его изменяют, а подлежащее определяет префиксы других элементов в той же глагольной фразе.

Например, существительные на суахили -toto («ребенок») и -tu («человек») относятся к классу 1 с префиксом единственного числа m- и префиксом множественного числа wa- . Существительное -tabu («книга») попадает в класс 7 с префиксом единственного числа ki- и множественным префиксом vi- . [7] Можно сформировать следующие предложения:

«Тот самый высокий человек, который прочитал эту длинную книгу».

«Те два высоких человека, которые читают эти длинные книги».

В контексте количественной лингвистики [ править ]

Американский лингвист Джозеф Гарольд Гринберг в своей статье 1960 года предложил использовать так называемый индекс агглютинативности для вычисления числового значения, которое позволило бы исследователю сравнивать «степень агглютитивности» различных языков. [8] Для Гринберга агглютинация означает, что морфы соединяются только с незначительными модификациями или без них. [9] морфемы называется автоматическим , если оно либо принимает одну форму поверхности (морфинг), или если его поверхность формы определяется фонологических правил , которые держат во всех подобных случаях на этом языке. [10]Соединение морфов - позиция в слове, где встречаются две морфы - считается агглютинативным, если обе включенные морфемы являются автоматическими. Индекс агглютинации равен среднему отношению количества агглютинативных стыков к количеству морфовых стыков. Языки с высокими значениями индекса агглютинативности являются агглютинативными, а языки с низкими значениями индекса агглютинативности - фузионными.

В той же статье Гринберг предложил несколько других индексов, многие из которых оказались актуальными для изучения агглютинации. Индекс синтетического представляет собой среднее количество морфем в слове, с наименьшим мыслимых значением , равным 1 для изоляции (аналитические) языки и ценности реальной жизни редко превышает 3. Индекс компаундирования равно среднему числу корневых морфем в слове ( в отличие от словообразовательных и словоизменительных морфем). Деривационные, флективные, префиксные и суффиксальные индексы соответствуют соответственно среднему количеству деривационных и флективных морфем, префиксов и суффиксов.

Вот таблица с примерами значений: [11]

Фонетика и агглютинация [ править ]

Однозначные отношения между аффиксом и его грамматической функцией могут несколько осложняться фонологическими процессами, активными в данном языке. Например, следующие два фонологических явления проявляются во многих уральских и тюркских языках:

  • градация согласных , означающая, что существует чередование определенных пар кластеров согласных, так что один член пары появляется в начале открытого слога, а другой - в начале закрытого слога ; (на уральских языках)
  • ассимиляция выделения согласных: аналогичный, но отличный от описанного выше процесс, ассимиляция выделения глухого согласного на конце корня; (на некоторых тюркских языках)
  • гармония гласных , означающая, что в несоставном слове сосуществуют только определенные подклассы гласных.

Несколько примеров на финском языке проиллюстрируют, как эти два правила и другие фонологические процессы приводят к отклонениям от основных однозначных отношений между морфами и их синтаксической и семантической функцией. При склонении talo 'house' не применяется никаких фонологических правил . Однако второй пример иллюстрирует несколько видов фонологических явлений. [12] [13]

Крайности [ править ]

Можно создать искусственно крайние примеры агглютинации, которые не имеют реального применения, но иллюстрируют теоретическую способность грамматики к агглютинации. Это не вопрос «длинных слов», потому что некоторые языки допускают неограниченное количество комбинаций со сложными словами, отрицательными клитиками и т. Д., Которые могут (и будут) выражаться аналитической структурой в реальном использовании.

Английский язык способен агглютинировать морфемы исключительно местного ( германского ) происхождения как не-целостность , но, вообще говоря, самые длинные слова собираются из форм латинского или древнегреческого происхождения. Классический пример - антидисестаблишментарианство . Агглютинативные языки часто имеют более сложную деривационную агглютинацию, чем изолирующие языки, поэтому они могут делать то же самое в гораздо большей степени. Например, в венгерском языке может найти реальное применение такое слово, как elnemzetietlenítetlenségnek , что означает «для [целей] неденационализации». [14]Точно так же есть слова, которые имеют значение, но, вероятно, никогда не используются, например, legeslegmegszentségteleníttethetetlenebbjeitekként , что означает «как большинство из вас, не имеющих секретности», но их трудно расшифровать даже для носителей языка. Их можно расширить с помощью флективной агглютинации. Например, официальный мировой рекорд Гиннеса - финский epäjärjestelmällistyttämättömyydellänsäkäänköhän «Интересно, даже с его / ее качеством - не быть бессистемным». Он имеет производное слово epäjärjestelmällistyttämättömyys в качестве корня и удлиняется флективными окончаниями -llänsäkäänköhän . Однако это слово грамматически необычно, потому что -kään«также» используется только в отрицательных предложениях, а -kö (вопрос) - только в вопросных предложениях.

Очень популярная турецкая агглютинация - Çekos Slovakyalılaştıramadıklarımızdanmışsınız , что означает «Вы один из тех, кого мы не смогли превратить в чехословацких». Эта историческая справка используется как шутка для людей, которых трудно изменить, или для тех, кто выделяется в группе.

С другой стороны, Afyonkarahisarlılaştırabildiklerimizdenmişsinizcesine - это более длинное слово, которое не удивляет людей и означает «Как будто вы один из тех, кого мы смогли сделать похожими на людей из Афьонкарахисара ». Недавнее дополнение к утверждениям пришло с введением следующего слова на турецком языке muvaffakiyetsizleştiricileştiriveremeyebileceklerimizdenmişsinizcesine , что означает что-то вроде «(вы говорите), как будто вы один из тех, кого мы не смогли превратить в создателя неудачников» ( кто-то, кто не обучает людей, чтобы сделать их неудачными).

Грузинский также очень агглютинативный язык. Например, слово gadmosakontrrevolucieleblebisnairebisatvisaco ( გადმოსაკონტრრევოლუციელებლებისნაირებისათვისაცო ) будет означать «(кто-то не указан) сказал, что это также для тех, кто похож на тех, кто должен быть снова / снова контрреволюционирован».

Аристофан комедия " Женщины в народном собрании включает греческое слово λοπαδο-τεμαχο-σελαχο-γαλεο-κρανιο-λειψανο-δριμ-υπο-τριμματο-σιλφιο-καραβο-μελιτο-κατακεχυ-μενο-κιχλ-επι-κοσσυφο-φαττο-περιστερ-αλεκτρυον-οπτο-κεφαλλιο-κιγκλο-πελειο-λαγῳο-σιραιο-βαφη-τραγανο-πτερύγων , вымышленное блюдо с именем , словом , которое перечисляет его ингредиенты. Он был создан, чтобы высмеять в то время тренд на длинные словосочетания на аттическом греческом языке. [ необходима цитата ]

Славянские языки считаются не агглютинативными, а слитными . Однако крайние производные, подобные тем, которые встречаются в типичных агглютинативных языках, действительно существуют. Известным примером является болгарское слово непротивоконституциослователствуйте , что означает « не выступайте против конституции и, во вторую очередь , не действуйте против конституции» . Он состоит всего из трех корней: против против , конституция конституции , заимствованного слова и, следовательно, лишен своего внутреннего состава и слова . Остальные - связанные морфемы для отрицания ( не, проклитика, иначе пишется отдельно глаголами), усилитель существительного ( -ателств ), преобразование существительного в глагол ( -ува ), повелительное наклонение, окончание множественного числа второго лица ( -йте ). Это довольно необычно, но находит свое применение, например, в газетных заголовках 13 июля 1991 г., на следующий день после принятия нынешней конституции Болгарии, вызвавшей много споров, дебатов и даже скандалов.

Другие употребления слов агглютинация и агглютинативный [ править ]

Слова агглютинация и агглютинация произошли от латинского слова agglutinare , «склеивать вместе». В лингвистике эти слова используются с 1836 года, когда посмертно опубликовал работу Вильгельма фон Гумбольдта Über die Verschiedenheit des menschlichen Sprachbaues und ihren Einfluß auf die geistige Entwicklung des Menschengeschlechts [букв .: О различиях в конструкции человеческого языка и его влиянии. о психическом развитии человечества] ввел разделение языков на изолирующие , флективные , агглютинативные и включающие . [15]

Особенно в некоторой старой литературе агглютинативный термин иногда используется как синоним слова « синтетический» . В этом случае он охватывает то, что мы называем агглютинативными и флективными языками, и является антонимом аналитического или изолирующего . Помимо четкой этимологической мотивации (в конце концов, флективные окончания также «приклеиваются» к основам), это более общее использование оправдано тем фактом, что различие между агглютинативными и флективными языками не является резким, как мы уже видели.

Во второй половине XIX века многие лингвисты считали, что существует естественный цикл эволюции языка: функциональные слова изолирующего типа приклеиваются к их заглавным словам, так что язык становится агглютинативным; более поздние морфы сливаются посредством фонологических процессов, и получается флективный язык; наконец, в быстрой речи часто опускаются флективные окончания, опускаются интонации и язык возвращается к изолирующему типу. [16]

Следующий отрывок из Lord (1960) хорошо демонстрирует весь диапазон значений, которые может иметь слово « агглютинация» .

( Агглютинация ...) состоит из соединения двух или более терминов, постоянно встречающихся как синтагматическая группа, в единое целое, которое становится либо трудным, либо невозможным для последующего анализа.

Агглютинация принимает различные формы. По-французски сварка становится полным плавлением. Латинское hanc horam «в этот час» - это французская наречная единица бис . Старофранцузское tous jours становится toujours , а dès jà («с настоящего времени») déjà («уже»). В английском языке, с другой стороны, за исключением редких комбинаций , таких как Прощайте от Бога быть с вами , грецкий орех из Уэльса орех , окна от ветра глаза (ON vindauga ), блоки, составляющие слипшиеся формы сохраняют свою идентичность. Такие слова, как черный дрозд иbeefeater - совсем другой котелок с рыбой; они сохраняют свои единицы, но их окончательное значение не может быть полностью выведено из этих единиц. (...)

Соссюр предпочитал различать составные слова и действительно синтезированные или агглютинированные комбинации. [17]

Агглютинативные языки в обработке естественного языка [ править ]

При обработке естественного языка языки с богатой морфологией создают проблемы совершенно иного рода, чем изолирующие языки. В случае агглютинативных языков главное препятствие заключается в большом количестве словоформ, которые могут быть получены из одного корня. Как мы уже видели, образование этих словоформ несколько усложняется фонологическими процессами конкретного языка. Хотя в финском языке основные однозначные отношения между формой и синтаксической функцией не нарушены, авторитетный институт языков Финляндии ( Kotus ) перечисляет 51 тип склонения для финских существительных, прилагательных, местоимений и числительных.

Еще больше проблем возникает с распознаванием словоформ. Современные лингвистические методы в значительной степени основаны на использовании корпусов; однако, когда количество возможных словоформ велико, любой корпус обязательно будет содержать лишь небольшую их часть. Hajič (2010) утверждает, что компьютерное пространство и мощность настолько дешевы в настоящее время, что все возможные словоформы могут быть сгенерированы заранее и сохранены в виде словаря, в котором перечислены все возможные интерпретации любой данной словоформы. (Структура данных словаря должна быть оптимизирована, чтобы поиск был быстрым и эффективным.) По словам Гайча, именно устранение неоднозначности этих словоформ является сложной задачей (в большей степени для флективных языков, где неоднозначность высока, чем для агглютинативных языки). [18]

Другие авторы не разделяют точку зрения Гайча о том, что пространство не является проблемой, и вместо того, чтобы перечислять все возможные словоформы в лексиконе, анализ словоформ осуществляется модулями, которые пытаются разбить поверхностную форму на последовательность морфем, встречающихся в порядке, допустимом язык. Проблемой такого анализа является большое количество границ морфем, характерных для агглютинативных языков. Слово флективного языка имеет только одно окончание, и поэтому количество возможных делений слова на основание и окончание линейно зависит от длины слова. В агглютинативном языке, где несколько суффиксов объединяются в конце слова, количество различных делений, которые необходимо проверять на непротиворечивость, велико. Этот подход использовался, например, при разработке системы для арабского языка,где агглютинация происходит, когда артикли, предлоги и союзы соединяются со следующим словом, а местоимения соединяются с предыдущим словом. См. Grefenstette et al. (2005) для получения более подробной информации.

См. Также [ править ]

  • Аффикс
  • Агглютинативный язык
  • Существительное дополнение
  • Словообразование

Заметки [ править ]

  1. ^ В языке могут существовать исключения, требующие размещения некоторых аффиксов в неожиданном слоте.

Ссылки [ править ]

  1. ^ Бернард Комри: "Введение", стр. 7 и 9 в Комри (1990).

    Например, тюркская языковая семья - это устоявшаяся языковая семья, как и каждая из уральских, монгольских и тунгусских семей. Однако спорным является вопрос о том, связаны ли эти отдельные семьи как члены еще большей семьи. Возможность существования алтайской семьи, состоящей из тюркских, монгольских и тунгусских языков, довольно широко признается, и некоторые ученые выступают за увеличение размера этой семьи путем добавления некоторых или всех уральских, корейских и японских языков.

    Например, исследование универсалий порядка слов Гринбергом («Некоторые универсалии грамматики с особым упором на порядок значимых элементов» в JH Greenberg (ed.): Universals of language, MIT Press, Cambridge, Mass, 1963, pp. 73–112) показали, что если в языке есть порядок слов в конце глагола (т. Е. Если «мужчина видел женщину» буквально выражается как «мужчина, которого видела женщина»), тогда весьма вероятно, что в нем также будут послелоги, а не предлоги (т. е. «в доме» будет выражаться как «дом в») и что перед существительным будут стоять родительные падежи (т. е. образец «кошачий дом», а не 'домик кошки'). Таким образом, если мы найдем два языка, которые имеют общие черты: порядок слов в конце глагола, послелоги, преноминальные родительные падежи, то совместное появление этих черт не свидетельствует о генетическом родстве.Многие более ранние попытки установить широкие генетические отношения страдают именно от того, что это свойство типологических паттернов не учитывается. Таким образом, тот факт, что тюркские языки, монгольские языки, тунгусские языки, корейский и японский обладают всеми этими чертами, не свидетельствует об их генетическом родстве (хотя, конечно, могут быть другие сходства, не связанные с повторяющимися типологическими паттернами, которые действительно устанавливают генетическое родство).

  2. Личное общение с Матти Паломяки, около 2001 г. См. Также обсуждение UniLang UniLang, заархивированное 16 марта 2015 г. на Wayback Machine .
  3. ^ Lehečková (1983), стр. 17:

    Flexivní typ je nejvýrazněji zastoupen v estonštině. Projevuje se kongruencí, nedostatkem posesivních sufixů, větší homonymií a synonymií a tolika alternacemi, že se dá mluvit o různých deklinacích. Koncovky jsou většinou fonologicky redukovány, takže ztrácejí slabičnou samostatnost.

  4. ^ Оруэлл, Джордж (1949). 1984 . Нью-Йорк: Харкорт.
  5. ^ Оруэлл, Джордж (1949). Девятнадцать восемьдесят четыре , «Приложение: Принципы новояза», стр. 309–323. Нью-Йорк: Плюм, 2003.
    Пинчон, Томас (2003). «Предисловие к столетнему изданию» к Nineteen Eighty-Four , стр. Vii – xxvi. Нью-Йорк: Плюм, 2003.
    Фромм, Эрих (1961). «Послесловие» к книге « Девятнадцать восемьдесят четыре» , стр. 324–337. Нью-Йорк: Плюм, 2003.
    У текста Оруэлла есть «Избранная библиография», стр. 338–9; предисловие и послесловие содержат дополнительные ссылки.
    Авторское право явно распространяется на цифровые и любые другие средства.
    Издание Plume - это перепечатка книги Харкорта в твердом переплете. Издание Plume также находится в издании Signet.
  6. Нам-Кил Ким: корейский , стр. 890–897 в Комри (1990).
  7. ^ Первые двенадцать примеров взяты из Fromkin et al. (2007) стр. 110, со следующими корректировками: я изменил предложения, которые изначально были в настоящем совершенном времени (с маркером -me- ), на предложения в простом прошедшем времени ( -li ); Я также изменил тему последних четырех предложений с -капу «корзина» на табу «книга», что относится к тому же классу. Последние два примера взяты из книги Бенджи Вальда: суахили и языки банту , стр. 1002 в Комри (1990). Для класса 7 префиксов см Mwana Simba архивации 4 мая 2011 в Wayback Machine , глава 16 архивации 26 марта 2011 наWayback Machine . О прошедшем времени см. В главе 32, заархивированной 7 апреля 2011 года в Wayback Machine, и генераторе глаголов, заархивированной 21 июля 2011 года в Wayback Machine .
  8. ^ Количественный подход к морфологической типологии языка
  9. ^ Деннинг и др. (1990), стр .
  10. ^ Удивительно,Гринберг не считает английский множественном морфемы -s быть автоматическим. Действительно, чередование фонетических реализаций -s , -z и -ez происходит автоматически, но есть и другие, хотя и редкие, случаи, когда морфема множественного числа - -en , -∅ и т. Д. См. Denning et al. (1990), стр.20 .
  11. ^ Гринберг рассчитал индексы только по одному отрывку из 100 слов для каждого языка. Значения в таблице взяты из Luschützky (2003), стр. 43; они составлены из Greenberg (1954) и из Warren Crawford Cowgill: A Search for Universals in Indo-European Diachronic Morphology , Universals of Language, MIT Press, Cambridge (Massachusetts), 1963, p. 91–113.
  12. ^ Примеры можно проверить с помощью финского морфологического анализатора .
  13. ^ Обратите внимание, что статьи на финском языке нет, поэтому использование a / the в английских переводах является произвольным.
  14. ^ Используется, напримерв книге дра Йозефа Végváry: « És mégsem mozog ...»
  15. ^ Разделение приписывается Гумбольдту в Luschützky (2003), стр. 17. Датировка взята из Михаила Лосонского (ред.): Вильгельм фон Гумбольдт: о языке, стр. xxxvi (доступно в GoogleBooks).
  16. ^ Vendryes (1925), с. 349 уже упоминает эту гипотезу как устаревшую, утверждая более современную точку зрения, согласно которой все три вида процессов присутствуют одновременно. Согласно Вендриесу, сторонниками этой гипотезы могут быть А. Ховелак: La linguistique , Paris 1888; Ф. Мистели: Charakteristik der hauptsächlichsten Typen des Sprachbaus , Берлин, 1893 г .; и, наконец, AH Sayce: Introduction to the Science of Language , 2 Vols., 3rd edition London 1890. Сравните также Lehečková (2003), p. 18–19, отрывок, который намного ближе к исходной концепции отдельных этапов.
  17. ^ Лорд (1960), стр. 160.
  18. ^ Hajič (2010), Abstract:

    Однако головную боль вызывает не сама морфология (даже для флексивных или агглютинативных языков) - с сегодняшним дешевым пространством и мощностью просто перечислить все мыслимые формы в надлежащим образом хешированный список - нормально - но это проблема разрешения неоднозначности, что, по-видимому, сложнее для таких морфологически богатых языков (возможно, на удивление больше для флективных, чем для агглютинативных), чем для аналитических.

Библиография [ править ]

  • Киммо Коскенниеми и Lingsoft Oy: Финский морфологический анализатор , Lingsoft Language Solutions, 1995–2011.
  • Бернард Комри (редактор): Основные языки мира, Oxford University Press, Нью-Йорк - Оксфорд 1990.
  • Кейт Деннинг, Сюзанна Кеммер (ред.): О языке: избранные труды Джозефа Х. Гринберга , Stanford University Press, 1990. Избранные части доступны в googlebooks .
  • Виктория Фромкин, Роберт Родман, Нина Хайамс: Введение в язык , Томпсон Уодсворт, 2007.
  • Джозеф Х. Гринберг: количественный подход к морфологической типологии языка , 1960. Доступно через JSTOR и в Denning et al. (1990), стр. 3–25. Также есть хорошее краткое резюме .
  • Грегори Грефенстетт, Насредин Семмар, Фаиза Элькатеб-Гара: Модификация системы обработки естественного языка для европейских языков для обработки арабского языка в приложениях обработки информации и поиска информации , Вычислительные подходы к семитским языкам - Материалы семинара, Мичиганский университет 2005, стр. 31-38. Доступно на [1] .
  • Ян Гайч: Вспоминая историю: истоки статистического машинного перевода и языки с богатой морфологией , IceTAL'10 Труды 7-й международной конференции по достижениям в обработке естественного языка, Springer-Verlag Berlin, Heidelberg, 2010. Резюме доступно на [2] .
  • Елена Лехечкова: Вод до ugrofinistiky, Státní pedagogické nakladatelství, Прага, 1983.
  • Роберт Лорд: научите себя сравнительной лингвистике, The English Universities Press Ltd., Дом Святого Павла, Лондон, 1967 (первое издание, 1966).
  • Ганс Христиан Лушютцкий: Uvedení do typologie jazyk , Filozofická fakulta Univerzity Karlovy, Praha 2003.
  • J. Vendryes: Language - Linguistic Introduction to History, Kegan Paul, Trench, Trubner Co., Ltd., Лондон, 1925 (перевод Пола Радина)

Внешние ссылки [ править ]

  • Мвана Симба , веб-страница о грамматике суахили.