Из Википедии, бесплатной энциклопедии
  (Перенаправлено с HPSG )
Перейти к навигации Перейти к поиску

Грамматика структуры фраз, управляемая головой ( HPSG ) - это высоко лексическая грамматика, основанная на ограничениях [1], разработанная Карлом Поллардом и Иваном Сагом . [2] [3] Это тип грамматики структуры фраз , в отличие от грамматики зависимостей , и он является непосредственным преемником грамматики обобщенной структуры фраз . HPSG опирается на другие области, такие как информатика ( теория типов данных и представление знаний ), и использует понятие знака Фердинанда де Соссюра.. Он использует единый формализм и организован по модульному принципу, что делает его привлекательным для обработки естественного языка .

Грамматика HPSG включает в себя принципы и правила грамматики и лексика записи , которые обычно не считаются принадлежащими к грамматике. Формализм основан на лексикализме. Это означает, что лексика - это больше, чем просто список статей; он сам по себе богато структурирован. Отдельные записи отмечены типами. Типы образуют иерархию. Ранние версии грамматики были очень лексикализованы с использованием нескольких грамматических правил (схем). Более поздние исследования имели тенденцию добавлять больше и более богатых правил, больше напоминающих строительную грамматику . [4]

Основным типом HPSG является знак. Слова и фразы - это два разных подтипа знака. Слово имеет две функции: [PHON] (звук, фонетическая форма) и [SYNSEM] ( синтаксическая и семантическая информация), каждая из которых разделена на подфункции. Знаки и правила формализованы как типизированные структуры признаков .

Образец грамматики [ править ]

HPSG генерирует строки путем комбинирования знаков, которые определяются их расположением в иерархии типов и их внутренней структурой признаков, представленной матрицами значений атрибутов (AVM). [3] [5] Функции принимают типы или списки типов в качестве значений, и эти значения, в свою очередь, могут иметь свою собственную структуру функций. Грамматические правила в значительной степени выражаются через знаки ограничений, накладываемые друг на друга. Структура признаков знака описывает его фонологические, синтаксические и семантические свойства. В общепринятых обозначениях АВМ пишутся с элементами в верхнем регистре и шрифтами в нижнем регистре курсивом. Пронумерованные индексы в AVM представляют идентичные значения токенов.

В упрощенном AVM для слова (в данном случае глагола, а не существительного, как в «приятных прогулках на выходные») «прогулки» ниже категориальная информация глагола (CAT) разделена на характеристики, которые его описывают (HEAD) и особенности, которые описывают его аргументы (ЗНАЧЕНИЕ).

АВМ для прогулок

«Прогулки» - это знак печатного слова с головкой от типового глагола . Как непереходный глагол, "прогулки" не имеет дополнения, но требует наличия подлежащего, являющегося существительным в единственном числе от третьего лица. Семантическое значение подлежащего (СОДЕРЖАНИЕ) коиндексируется с единственным аргументом глагола (человек, совершающий ходьбу). Следующая AVM для «она» представляет собой знак со значением SYNSEM, который может удовлетворить эти требования.

She-avm.png

Знаки типа фразы объединяются с одним или несколькими дочерними элементами и распространяют информацию вверх. Следующая AVM кодирует правило непосредственного доминирования для head-subj-фразы , которое требует двух дочерних элементов: головного дочернего элемента (глагола) и дочернего элемента без головы, который удовлетворяет ограничениям SUBJ глагола.

Head-subj-avm.png

Конечным результатом является знак с заголовком глагола, пустыми элементами подкатегории и фонологическим значением, которое упорядочивает двух дочерних элементов.

Хотя фактическая грамматика HPSG полностью состоит из структур признаков, лингвисты часто используют деревья для представления объединения знаков, где эквивалентная AVM была бы громоздкой.

Head-subj-tree.png

Реализации [ править ]

Были написаны различные парсеры, основанные на формализме HPSG, и в настоящее время изучаются возможности оптимизации. Пример системы, анализирующей немецкие предложения , предоставлен Freie Universität Berlin . [6] Кроме того, проект CoreGram [7] Группы грамматики Свободного университета Берлина предоставляет грамматики с открытым исходным кодом, которые были реализованы в системе TRALE. В настоящее время существуют грамматики для немецкого , [8] датского , [9] китайского , [10] мальтийского , [11] и персидского языков [12]. которые имеют общее ядро ​​и являются общедоступными.

Большие HPSG-грамматики различных языков разрабатываются в рамках Deep Linguistic Processing with HPSG Initiative ( DELPH-IN ). [13] Грамматики английского [14] немецкого [15] и японского [16 ] с широким охватом доступны по лицензии с открытым исходным кодом. Эти грамматики могут использоваться с множеством взаимосовместимых анализаторов HPSG с открытым исходным кодом: LKB , PET, [17] Ace, [18] и согласны . [19] Все они производят семантические представления в формате «Семантика минимальной рекурсии», MRS. [20]Декларативный характер формализма HPSG означает, что эти вычислительные грамматики обычно могут использоваться как для синтаксического анализа, так и для генерации (создания поверхностных строк из семантических входных данных). Treebanks, также распространяемые DELPH-IN , используются для разработки и тестирования грамматик, а также для обучения моделей ранжирования для принятия решения о правдоподобных интерпретациях при синтаксическом анализе (или реализациях при генерации).

Enju - это свободно доступный вероятностный анализатор HPSG с широким охватом для английского языка, разработанный лабораторией Tsujii в Токийском университете в Японии . [21]

См. Также [ править ]

  • Лексико-функциональная грамматика
  • Семантика минимальной рекурсии
  • Реляционная грамматика
  • Семантика ситуации
  • Синтаксис
  • Трансформационная грамматика
  • Тип Описание Язык

Ссылки [ править ]

  1. ^ "HPSG" .
  2. Поллард, Карл и Иван А. Саг. 1987. Информационный синтаксис и семантика. Том 1. Основы. Лекционные заметки CLSI 13.
  3. ^ a b Поллард, Карл; Иван А. Саг. (1994). Грамматика структуры фраз, управляемая головой . Чикаго: Издательство Чикагского университета.
  4. ^ Саг, Иван А. 1997. Конструкции английских относительных предложений [ постоянная мертвая ссылка ] . Журнал лингвистики. 33,2: 431-484
  5. ^ Саг, Иван А .; Томас Вазоу; И Эмили Бендер. (2003). Синтаксическая теория: формальное введение . 2-е изд. Чикаго: Издательство Чикагского университета.
  6. ^ Вавилонская система: HPSG Interactive
  7. ^ Проект CoreGram
  8. ^ Берлиграм
  9. ^ DanGram
  10. ^ Китайский
  11. ^ Мальтийский
  12. ^ Персидский
  13. ^ DELPH-IN: Глубокая обработка с открытым исходным кодом
  14. ^ Грамматика и лексика ресурсов английского языка
  15. ^ Бертольд Кризманн
  16. ^ JacyTop - Глубокая лингвистическая обработка с HPSG (DELPH-IN)
  17. ^ Анализатор ПЭТ DELPH-IN
  18. ^ Ace: механизм ограничения ответов
  19. ^ согласен грамматическая инженерия
  20. ^ Copestake А., Flickinger Д. Поллард, К., и прогибаться, IA (2005). Семантика минимальной рекурсии: введение . Исследования языка и вычислений, 3 (2-3), 281-332.
  21. Tsuji Lab: домашняя страница анализатора Enju. Архивировано 07марта 2010 г.на Wayback Machine (получено 24 ноября 2009 г.)

Дальнейшее чтение [ править ]

  • Карл Поллард , Иван А. Саг (1987): Информационный синтаксис и семантика. Том 1: Основы . Стэнфорд: публикации CSLI.
  • Карл Поллард , Иван А. Саг (1994): управляемая головой грамматика структуры фраз . Чикаго: Издательство Чикагского университета. ( [1] )
  • Иван А. Саг , Томас Вазоу , Эмили М. Бендер (2003): Синтаксическая теория: формальное введение, второе издание . Чикаго: Издательство Чикагского университета. ( [2] )
  • Левин, Роберт Д .; В. Детмар Мёрерс (2006). "Управляемая головой грамматика структуры фраз: лингвистический подход, формальные основы и вычислительная реализация" (PDF) . В Кейт Браун (ред.). Энциклопедия языка и лингвистики (второе изд.). Оксфорд: Эльзевир. Архивировано из оригинального (PDF) 05.09.2008 . Проверено 7 марта 2008 .
  • Мюллер, Стефан (2013). «Объединение всего: некоторые замечания по упрощенному синтаксису, строительной грамматике, минимализму и HPSG» . Язык . 89 (4): 920–950. DOI : 10.1353 / lan.2013.0061 .

Внешние ссылки [ править ]

  • Домашняя страница Stanford HPSG - включает в себя онлайн-материалы ежегодной конференции HPSG
  • Домашняя страница HPSG штата Огайо
  • Международная конференция по грамматике структуры фраз, управляемой головой
  • Сеть DELPH-IN для разработки грамматики HPSG
  • Базовый обзор HPSG
  • Сравнение HPSG с альтернативами и историческая перспектива
  • Библиография публикаций HPSG
  • Пакет LaTeX для рисования AVM - включает документацию