Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В лингвистике , то катена (английское произношение: / к ə т я п ə / , множественное число катен или катен ; от латинского для «цепочки») [1] является единицей синтаксиса и морфологии , тесно связано с грамматик зависимостей . Это более гибкая и всеобъемлющая единица, чем составляющая, и поэтому она может лучше подходить, чем составляющая, служить в качестве фундаментальной единицы синтаксического и морфосинтаксического анализа. [2]

Катену послужила основу для анализа ряда явлений синтаксиса, таких как особенный смысл , эллипсис механизмов (например , неплотное прилегание , зачистной , VP-эллипсис , pseudogapping , шлюзование , ответ эллипсис , сравнительное удаление), предикат - аргумент структуры и разрывы ( topicalization , WH-противостоя , скремблирования , extraposition и т.д.). [3]Концепция катены также была взята за основу теории морфосинтаксиса, то есть для расширения зависимостей в слова; Признаются зависимости между морфами, составляющими слова. [4]

Хотя концепция катены применялась в основном к синтаксису английского языка, другие работы также демонстрируют ее применимость к синтаксису и морфологии других языков. [5]

Описания и определения [ править ]

Даны два описания и два определения единицы катены.

Катена (повседневное описание)
Любое отдельное слово или любая комбинация слов, связанных между собой зависимостями.
Катена (теоретико-графическое описание)
С точки зрения теории графов, любое синтаксическое дерево или связанный подграф дерева является катеной. Любой отдельный элемент (слово или морф) или комбинация элементов, связанных вместе в вертикальном измерении, является катеной. Предполагается, что структура предложения существует в двух измерениях. Комбинации, организованные по горизонтальному измерению (с точки зрения приоритета), называются цепочками , тогда как комбинации, организованные по вертикальному измерению (с точки зрения доминирования), являются катенами. С точки зрения декартовой системы координат , струны существуют вдоль оси x , а катены - вдоль оси y .
Катена (неформальное теоретико-графическое определение)
Любое отдельное слово или любая комбинация слов, которые непрерывны в вертикальном измерении, то есть относительно доминирования (ось Y). [6]
Катена (формальное теоретико-графическое определение)
Для данного дерева зависимостей T катена - это набор S узлов в T, такой, что есть один и только один член S, над которым не доминирует сразу какой-либо другой член S. [7]
Иллюстрация морфинга катен

Четыре единицы [ править ]

Понимание катены достигается путем различения катены и других, аналогичным образом определенных единиц. В этом отношении уместны четыре единицы (включая катену): струна , катена , компонент и составляющая . Неформальное определение катены повторяется для удобства сравнения с определениями трех других единиц: [8]

Нить
Любой отдельный элемент или комбинация элементов, которые являются непрерывными по горизонтали ( ось x ).
Катена
Любой отдельный элемент или комбинация элементов, непрерывных по вертикали ( ось y ).
Компонент
Любой отдельный элемент или комбинация элементов, образующих одновременно строку и катену.
Учредительный
Компонент , который является полным .

Компонент считается завершенным, если он включает в себя все элементы, над которыми доминирует его корневой узел. Строка и катена очевидным образом дополняют друг друга, и определение составляющей по существу такое же, как и в большинстве теорий синтаксиса, где составляющая понимается как состоящая из любого узла плюс все узлы, над которыми этот узел доминирует . Эти определения теперь будут проиллюстрированы с помощью следующего дерева зависимостей. Заглавные буквы служат для сокращения слов:

Все отдельные строки, катены, компоненты и составляющие в этом дереве перечислены здесь: [9]

Отчетливые струны
A, B, C, D, E, F, AB, BC, CD, DE, EF, ABC, BCD, CDE, DEF, ABCD, BCDE, CDEF, ABCDE, BCDEF и ABCDEF.
Отчетливые катены
A, B, C, D, E, F, AB, BC, CF, DF, EF, ABC, BCF, CDF, CEF, DEF, ABCF, BCDF, BCEF, CDEF, ABCDF, ABCEF, BCDEF и ABCDEF.
Отличительные компоненты
A, B, C, D, E, F, AB, BC, EF, ABC, DEF, CDEF, BCDEF и ABCDEF.
Отличительные составляющие
A, D, E, AB, DEF и ABCDEF.

Обращает на себя внимание тот факт, что дерево содержит 39 различных словосочетаний, не являющихся катенами, например AC, BD, CE, BCE, ADF, ABEF, ABDEF и т. Д. Также обратите внимание, что есть всего шесть составляющих, но 24 катены. Следовательно, в дереве в четыре раза больше катен, чем составных частей. Становится очевидной инклюзивность и гибкость блока катены. Следующая диаграмма Венна дает обзор того, как четыре единицы соотносятся друг с другом:

История [ править ]

Концепция катены присутствует в лингвистике несколько десятилетий. В 1970-х годах немецкий специалист по грамматике зависимости Юрген Кунце назвал эту единицу поддеревом Тейльбаума . [10] В начале 1990-х годов психолингвисты Мартин Пикеринг и Гай Барри признали единицу катены, назвав ее составляющей зависимости . [11] Однако концепция катены не вызвала особого интереса у лингвистов, пока Уильям О'Грейди в своей статье 1998 года не заметил, что слова, образующие идиомы, хранятся в лексиконе как катены. [12] О'Грэйди назвал соответствующую синтаксическую единицу цепочкой , но не катеной . Термин катенабыл введен позже Тимоти Осборном и его коллегами как средство избежать путаницы с существовавшей ранее концепцией цепи минималистской теории. [13] С тех пор концепция катены была развита за пределами анализа идиом О'Грэйди, чтобы служить основой для анализа ряда центральных явлений в синтаксисе естественных языков (например, многоточие и структуры предикат-аргумент). [14]

Идиосинкразический язык [ править ]

Идиосинкразический язык всех видов может быть описан в терминах катен. Когда значение конструируется таким образом, что не позволяет признавать смысловые блоки в качестве составных частей, задействуется катена. Единицы, несущие значение, являются катенами, а не составными частями. Эта ситуация проиллюстрирована здесь с помощью различных словосочетаний и правильных идиом.

Некоторые словосочетания [ править ]

Простые словосочетания (т. Е. Одновременное употребление определенных слов) хорошо демонстрируют концепцию катены. Идиосинкразическая природа словосочетаний глаголов частиц дает первую группу примеров: брать после , брать , брать , брать , брать и т. Д. В чистом виде глагол take означает «захватывать, хватать, владеть». Однако в этих сочетаниях с различными частицами значение take каждый раз значительно меняется в зависимости от частицы. Частица и дубль вместе передают различное значение, при этом это различное значение не может быть понято как прямая комбинация значениявзять в одиночку и только значение предлога. В таких случаях говорят, что значение не композиционно . Некомпозиционный смысл можно уловить в терминах катен. Словосочетания, которые принимают некомпозиционное значение, образуют катены (но не составляющие):

Оба предложения a и b показывают, что хотя глагол и его частица не образуют составной части, они каждый раз образуют катену. Контраст порядка слов в предложениях каждой пары иллюстрирует так называемое смещение . Сдвиг происходит с учетом относительного веса задействованных компонентов. Тяжелые составляющие предпочитают появляться справа от более легких сестринских составляющих. Сдвиг не меняет того факта, что глагол и частица каждый раз образуют катену, даже если они не образуют строку.

Многочисленные комбинации глагола и предлога являются идиосинкразическими сочетаниями, поскольку выбор предлога сильно ограничен глаголом, например, учитывать , рассчитывать , заполнять , полагаться , брать после , ждать и т. Д. Смысл многих из этих комбинаций таков: также некомпозиционный, как с глаголами частиц. Как и в случае с глаголами-частицами, комбинации образуют катены (но не составляющие) в простых повествовательных предложениях:

Глагол и предлог, которые он требует, образуют единую смысловую единицу, при этом эта единица является катеной. Таким образом, эти смысловые единицы могут храниться как катены в ментальном лексиконе говорящих. Как катены, они представляют собой конкретные единицы синтаксиса.

Последний тип словосочетаний, представленных здесь для иллюстрации катен, - это сложный предлог, например, из-за , из-за , внутри , вопреки , вне , вне и т. Д. Интонационный образец для этих предлогов предполагает, что орфографические соглашения верны в записывая их двумя (или более) словами. Эта ситуация, однако, может рассматриваться как проблема, поскольку неясно, можно ли каждый раз рассматривать два слова как составляющие. В этом отношении они, конечно, квалифицируются как катена, например

Словосочетания, проиллюстрированные в этом разделе, сосредоточены в основном на предлогах и частицах, поэтому они представляют собой лишь небольшой набор смысловых словосочетаний. Однако они весьма наводят на размышления. Кажется вероятным, что все смысловые словосочетания хранятся как катены в ментальном лексиконе пользователей языка.

Правильные идиомы [ править ]

Полные идиомы - это канонические случаи некомпозиционного значения. Фиксированные слова идиом не несут своего продуктивного значения, например, взяли его на подбородок . Тот, кто «берет его на подбородок», на самом деле не испытывает никакого физического контакта со своим подбородком, а это означает, что подбородок не имеет своего нормального продуктивного значения и, следовательно, должен быть частью более крупного словосочетания. Это более крупное словосочетание идиома, в данном случае состоящая из пяти слов. В то время как идиома возьми это на подбородокмогут быть сохранены как составляющие VP (и, следовательно, не является проблемой для основанных на составляющих теориях), существует много идиом, которые явно не могут быть сохранены как составляющие. Эти идиомы являются проблемой для теорий, основанных на конституентах, именно потому, что они не могут считаться составными частями. Однако они, конечно, квалифицируются как катены. Обсуждение здесь сосредоточено на этих идиомах, поскольку они особенно хорошо иллюстрируют ценность концепции катены.

Многие идиомы в английском языке состоят из глагола и существительного (и многих других), при этом существительное принимает обладателя, который индексируется вместе с подлежащим, и, таким образом, будет меняться в зависимости от подлежащего. Эти идиомы хранятся как катены, но явно не как составные части, например

Подобные идиомы имеют более свободный обладатель, поскольку он не обязательно совпадает с индексом с подлежащим. Эти идиомы также хранятся как катены (но не как составляющие), [15] например

Следующие идиомы включают глагол, объект и хотя бы один предлог. Опять же должно быть очевидно, что фиксированные слова идиом никоим образом не могут рассматриваться как составляющие:

Следующие идиомы включают глагол и предложную фразу в то же время, когда объект свободен:

И следующие идиомы, включающие дитранзитивный глагол, включают второй объект в то же время, когда первый объект свободен:

Конечно, высказывания тоже идиоматичны. Когда в высказывании появляется наречие (или какое-либо другое дополнение), оно не является его частью. Тем не менее, слова изречения по-прежнему образуют катену:

Многоточие [ править ]

Многоточие механизмов (гэпинг, зачистки, VP-многоточие, pseudogapping, фрагменты ответа, шлюзование, сравнительное удаление) является eliding катен, в результате чего многие из этих катен не имели компоненты. [16] Следующие примеры иллюстрируют разрыв : [17]

Пункты a являются допустимыми случаями пробелов; материал с зазором соответствует катене зеленого цвета. Пункты b - неудачные попытки пробелов; они терпят неудачу, потому что материал с зазором не соответствует катене. Следующие примеры иллюстрируют зачистку . Многие лингвисты рассматривают разделение как частное проявление пробела, когда в предложении с пробелом / вырезанием остается только один остаток: [18]

Пункты а являются допустимыми примерами зачистки, отчасти потому, что очищенный материал соответствует катене (выделено зеленым цветом). Пункты b снова терпят неудачу; они терпят неудачу, потому что очищенный материал не квалифицируется как катена. Следующие примеры иллюстрируют многоточие ответа: [19]

В каждом из допустимых фрагментов ответа (a – e) исключенный материал соответствует катене. Напротив, исключенный материал соответствует некатене в каждом из неприемлемых фрагментов ответа (f – h).

Структуры предикатов и аргументов [ править ]

Единица catena подходит для понимания предикатов и их аргументов [20] - предикат - это свойство, которое присваивается аргументу или как отношение, которое устанавливается между аргументами. Данный предикат появляется в структуре предложения как катена, как и его аргументы. Стандартный матричный предикат в предложении состоит из содержательного глагола и потенциально одного или нескольких вспомогательных глаголов. Следующие примеры иллюстрируют, как предикаты и их аргументы проявляются в синонимичных предложениях в разных языках:

Зеленые слова - это главный предикат, а красные - аргументы этого предиката. Предикат из одного слова, сказанный в английском предложении слева, соответствует предикату из двух слов hat gesagt в немецком языке. Каждый показанный предикат и каждый из показанных его аргументов являются катеной.

Следующий пример аналогичен, но на этот раз используется французское предложение, чтобы выразить мысль:

Предикаты матрицы снова отображаются зеленым цветом, а их аргументы - красным. Край зависимости со стрелкой отмечает дополнение - это соглашение не использовалось в приведенных выше примерах. В этом случае основное сказуемое в английском языке состоит из двух слов, соответствующих одному слову во французском языке.

Следующие примеры демонстрируют, каким образом сказуемое основного предложения остается катеной по мере увеличения числа вспомогательных глаголов:

Предложение a содержит один вспомогательный глагол, предложение b - два, а предложение c - три. Появление этих вспомогательных глаголов добавляет функциональную информацию к основному содержанию, обеспечиваемому глаголом содержания изменено . По мере добавления каждого дополнительного вспомогательного глагола предикат растет, а предикат catena получает связи.

При оценке подхода к структурам предикат – аргумент с точки зрения катен важно помнить, что составная единица грамматики структуры фраз гораздо менее полезна для характеристики реальных словосочетаний, которые квалифицируются как предикаты и их аргументы. Этот факт должен быть очевиден из приведенных здесь примеров, где словосочетания, выделенные зеленым цветом, не могут рассматриваться как составляющие в грамматиках фразовой структуры.

См. Также [ править ]

  • Грамматика зависимостей

Заметки [ править ]

  1. ^ "катена" . Lexico UK Dictionary . Издательство Оксфордского университета .
  2. ^ Осборн и др. (2012) подробно развивают это утверждение, а именно, что катену следует рассматривать как фундаментальную единицу синтаксиса, а не как составляющую.
  3. ^ Осборн (2019) обсуждает многие из этих механизмов синтаксиса на основе единицы катены.
  4. ^ Две статьи, в которых признаются морфы catenae, то есть катены, звеньями которых являются морфы (в отличие от полных слов), - это Groß and Osborne (2013) и Groß (2014). Первая статья,написанная нанемецком языке, демонстрирует, что конструкции часто состоят из morph catenae, а вторая статья, которая написана на английском языке, обеспечивает объяснение грамматики зависимостей клитики, основанное на catena.
  5. ^ Groß и Osborne (2013) демонстрируют применимость концепции catena к синтаксису и морфосинтаксису немецкого языка, а Imrényi (2013a, 2013b: 98–100, 2013c) показывает ее полезность для анализа глагольных комбинаций и структуры предложения в венгерском языке.
  6. ^ Это определение очень похоже на определение единицы катены, данное Осборном и Гроссом (2012a: 174).
  7. ^ Это формальное определение единицы катены дано у Осборна и Гросса (2016: 117, п. 16).
  8. ^ Определения и обсуждения четырех единиц строки, катены, компонента и составляющей, подобные приведенным здесь, можно найти в ряде мест (например, Osborne et al. 2012: 358-359; Osborne and Groß 2016: 117-118; Osborne и Groß 2018: 167).
  9. ^ Перечисление отдельных строк, катены, компонентов и составляющих, как это сделано здесь, является частым средством установления понимания единицы катены (например, Osborne and Groß 2016: 117-118; Osborne and Groß 2018: 167).
  10. ^ Для определения Кунца в Teilbaum см Кунец (1975: 12).
  11. ^ Компонент зависимости играет центральную роль в теории координации Пикеринга и Барри (1993).
  12. ^ Основная статья О'Грэйди (1998) посвящена важности единицы катены для синтаксического анализа идиом.
  13. ^ Термин катена впервые был использован Osborne et al. статья от 2012 года.
  14. ^ См. Следующие статьи, чтобы получить представление о полезности модуля catena для изучения синтаксиса естественного языка: Osborne (2005), Osborne et al. (2011), Осборн (2012), Осборн и Гросс (2012a, 2012b), Осборн и др. (2012) и Осборн (2014: 620–624), Осборн и Гросс (2018).
  15. ^ Понимание того, что правильные идиомы хранятся в виде катен (а не в качестве составных частей), является основной идеей, которая впервые установила ценность и обоснованность концепции катены для синтаксического анализа (например, O'Grady 1998; Osborne 2005: 272-275; Osborne and Groß 2012: 177-180).
  16. ^ Значение единицы катены для анализа явлений многоточия установлено в Osborne (2005: 275-285) и Osborne et al. (2012: 379-392).
  17. ^ Примеры и обсуждение упущенного материала о зазоре как катене см. В Osborne (2005: 275-280) и Osborne et al. (2012: 382-386).
  18. ^ Обсуждение и примеры исключенного материала снятия изоляции в качестве катены см. В Osborne (2005: 283-284) и Osborne et al. (2012: 382-386).
  19. ^ Примеры и обсуждение исключенного материала фрагментов ответов как катен см. В Osborne (2005: 284-285), Osborne et al. (2012: 381-382) и Осборн и Гросс (2018).
  20. Обсуждение и множество иллюстраций предикатов как катен см. В Osborne (2005: 260-270).

Ссылки [ править ]

  • О'Грэйди, В. 1998. Синтаксис идиом. Естественный язык и лингвистическая теория 16. 279–312.
  • Грос, Т. 2014. Клитика в морфологии зависимости. В лингвистике сегодня Vol. 215: Зависимая лингвистика , изд. Э. Гайчовой и др., стр. 229–252. Амстердам / Филадельфия: Издательство Джона Бенджамина.
  • Грос, Т. и Т. Осборн, 2013. Katena und Konstruktion: Ein Vorschlag zu einer dependenziellen Konstruktionsgrammatik. Zeitschrift für Sprachwissenschaft 32, 1, 41–73.
  • Имреньи, А. 2013a. Синтаксис венгерских вспомогательных средств: учетная запись грамматики зависимостей. Труды Второй Международной конференции по лингвистике зависимостей (DepLing 2013). Прага, 27–30 августа 2013 г. Карлов университет в Праге / Матфизпресс. 118–127.
  • Имрени А. 2013б. A magyar mondat viszonyhálózati modellje. ( Модель реляционной сети венгерского предложения .) Будапешт: Akadémiai Kiadó. (154 стр.).
  • Имрени, А. 2013c. Избирательный округ или зависимость? Примечания к синтаксической модели венгерского языка Самуэля Брассая. В: Szigetvári, Péter (ed.), VLlxx. Документы, представленные Ласло Варге в день его 70-летия . Будапешт: Тинта. 167–182.
  • Kunze, J. 1975. Abhängigkeitsgrammatik. Studia Grammatica XII. Берлин: Академия Верлаг.
  • Осборн, Т. 2005. Помимо составляющих: анализ DG цепей. Folia Linguistica 39, 3–4. 251–297.
  • Осборн, Т. 2012. Особенности края, категории и минимализм на основе зависимостей. Лингвистический анализ 34, 3–4, 321–366.
  • Осборн, Т. 2014. Грамматика зависимостей. В Справочнике по синтаксису Routledge , изд. А. Карни, Ю. Сато и Д. Саддики, стр. 604–626. Лондон: Рутледж.
  • Осборн, Т. 2015. Грамматика зависимостей. В Handbücher zur Sprach- und Kommunikationswissenschaft / Справочники по лингвистике и коммуникативным наукам (HSK) 42, 2, 1027–1044.
  • Осборн, Т. 2019. Многоточие в грамматике зависимостей. В Jeroen van Craenenbrock и Tanja Temmerman (ред.), Oxford Handbook of Ellipsis, 142–161. Оксфорд, Великобритания: Издательство Оксфордского университета.
  • Осборн, т. 2019. Грамматика зависимостей английского языка: введение и не только . Амстердам: Джон Бенджаминс. https://doi.org/10.1075/z.224
  • Осборн, Т. и Т. Грос, 2012a. Конструкции являются катенами: строительная грамматика встречается с грамматикой зависимостей. Когнитивная лингвистика 23, 1, 163–214.
  • Осборн, Т. и Т. Грос, 2012b. Предшествующее сдерживание: решение грамматики зависимостей с точки зрения катен. Studia Linguistica 66, 2, 94–127.
  • Осборн Т. и Т. Гросс. 2016. Самодиагностика: против конечных ВП и для плоских нефинитных ВП. Folia Linguistica 50, 1, 97–35.
  • Осборн Т. и Т. Гросс. 2018. Фрагменты ответов. Лингвистический обзор 35, 1, 161–186.
  • Осборн Т., М. Патнэм и Т. Гросс. 2011. Простая структура фраз, деревья без меток и синтаксис без спецификаторов: становится ли минимализм грамматикой зависимостей? Лингвистический обзор 28: 315–364.
  • Осборн, Т., М. Патнэм и Т. Гросс, 2012. Catenae: Введение в новую единицу синтаксического анализа. Синтаксис 15, 4, 354–396.
  • Пикеринг, М. и Дж. Барри 1993. Категориальная грамматика зависимостей и координация. Языкознание 31, 855–902.