Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Грамматика структуры фраз, управляемая головой ( HPSG ) - это сильно лексикализованная грамматика на основе ограничений [1], разработанная Карлом Поллардом и Иваном Сагом . [2] [3] Это тип грамматики структуры фраз , в отличие от грамматики зависимостей , и он является непосредственным преемником грамматики обобщенной структуры фраз . HPSG опирается на другие области, такие как информатика ( теория типов данных и представление знаний ), и использует понятие знака Фердинанда де Соссюра.. Он использует единый формализм и организован по модульному принципу, что делает его привлекательным для обработки естественного языка .

Грамматика HPSG включает в себя принципы и правила грамматики и лексика записи , которые обычно не считаются принадлежащими к грамматике. Формализм основан на лексикализме. Это означает, что лексика - это больше, чем просто список статей; он сам по себе богато структурирован. Отдельные записи отмечены типами. Типы образуют иерархию. Ранние версии грамматики были очень лексикализованы с использованием нескольких грамматических правил (схем). Более поздние исследования имели тенденцию добавлять больше и более обширных правил, больше напоминающих строительную грамматику . [4]

Основным типом HPSG является знак. Слова и фразы - это два разных подтипа знака. Слово имеет две функции: [PHON] (звук, фонетическая форма) и [SYNSEM] ( синтаксическая и семантическая информация), каждая из которых разбита на части. Знаки и правила формализованы как типизированные структуры признаков .

Образец грамматики [ править ]

HPSG генерирует строки путем комбинирования знаков, которые определяются их расположением в иерархии типов и их внутренней структурой признаков, представленной матрицами значений атрибутов (AVM). [3] [5] Функции принимают типы или списки типов в качестве значений, и эти значения, в свою очередь, могут иметь свою собственную структуру функций. Грамматические правила в значительной степени выражаются через знаки ограничений, накладываемые друг на друга. Структура признаков знака описывает его фонологические, синтаксические и семантические свойства. В общепринятых обозначениях AVM пишутся с элементами в верхнем регистре, а типы в нижнем регистре курсивом. Пронумерованные индексы в AVM представляют идентичные значения токенов.

В упрощенном AVM для слова (в данном случае глагола, а не существительного, как в «приятных прогулках на выходные») «прогулки» ниже категориальная информация глагола (CAT) разделена на характеристики, которые его описывают (HEAD) и особенности, которые описывают его аргументы (ВАЛЕНЦИЯ).

АВМ для прогулок

«Прогулки» - знак печатного слова с головкой от типового глагола . Как непереходный глагол, "прогулки" не имеет дополнения, но требует подлежащего, который является существительным в единственном числе от третьего лица. Семантическое значение подлежащего (СОДЕРЖАНИЕ) коиндексируется с единственным аргументом глагола (индивид, выполняющий ходьбу). Следующая AVM для «она» представляет собой знак со значением SYNSEM, который может удовлетворить эти требования.

She-avm.png

Знаки типа фразы объединяются с одним или несколькими дочерними элементами и распространяют информацию вверх. Следующая AVM кодирует правило непосредственного доминирования для head-subj-фразы , для которой требуются два дочерних элемента: головной дочерний элемент (глагол) и дочерний элемент без головы, который удовлетворяет ограничениям SUBJ глагола.

Head-subj-avm.png

Конечным результатом является знак с заголовком глагола, пустыми элементами подкатегории и фонологическим значением, которое упорядочивает двух детей.

Хотя фактическая грамматика HPSG полностью состоит из структур признаков, лингвисты часто используют деревья для представления объединения знаков, где эквивалентная AVM была бы громоздкой.

Head-subj-tree.png

Реализации [ править ]

Написаны различные синтаксические анализаторы, основанные на формализме HPSG, и в настоящее время исследуются возможности оптимизации. Пример системы, анализирующей немецкие предложения , предоставлен Freie Universität Berlin . [6] Кроме того, проект CoreGram [7] группы грамматики Свободного университета Берлина предоставляет грамматики с открытым исходным кодом, которые были реализованы в системе TRALE. В настоящее время существуют грамматики для немецкого , [8] датского , [9] китайского , [10] мальтийского , [11] и персидского языков [12]. которые имеют общее ядро ​​и являются общедоступными.

Большие HPSG-грамматики различных языков разрабатываются в рамках Deep Linguistic Processing with HPSG Initiative ( DELPH-IN ). [13] Грамматики английского [14] немецкого [15] и японского [16 ] с широким охватом доступны по лицензии с открытым исходным кодом. Эти грамматики могут использоваться с множеством взаимосовместимых анализаторов HPSG с открытым исходным кодом: LKB , PET, [17] Ace, [18] и согласны . [19] Все они производят семантические представления в формате «Семантика минимальной рекурсии», MRS. [20]Декларативный характер формализма HPSG означает, что эти вычислительные грамматики обычно могут использоваться как для синтаксического анализа, так и для генерации (создания поверхностных строк из семантических входных данных). Древовидные банки, также распространяемые DELPH-IN , используются для разработки и тестирования грамматик, а также для обучения моделей ранжирования для принятия решения о правдоподобных интерпретациях при синтаксическом анализе (или реализации при создании).

Enju - это свободно доступный вероятностный синтаксический анализатор HPSG с широким охватом для английского языка, разработанный лабораторией Tsujii в Токийском университете в Японии . [21]

См. Также [ править ]

  • Лексико-функциональная грамматика
  • Семантика минимальной рекурсии
  • Реляционная грамматика
  • Семантика ситуации
  • Синтаксис
  • Трансформационная грамматика
  • Тип Описание Язык

Ссылки [ править ]

  1. ^ "HPSG" .
  2. Поллард, Карл и Иван А. Саг. 1987. Информационный синтаксис и семантика. Том 1. Основы. Лекционные заметки CLSI 13.
  3. ^ a b Поллард, Карл; Иван А. Саг. (1994). Грамматика структуры фраз, управляемая головой . Чикаго: Издательство Чикагского университета.
  4. ^ Саг, Иван А. 1997. Конструкции английских относительных предложений [ постоянная мертвая ссылка ] . Журнал лингвистики. 33,2: 431-484
  5. ^ Саг, Иван А .; Томас Вазоу; И Эмили Бендер. (2003). Синтаксическая теория: формальное введение . 2-е изд. Чикаго: Издательство Чикагского университета.
  6. ^ Вавилонская система: HPSG Interactive
  7. ^ Проект CoreGram
  8. ^ Берлиграм
  9. ^ DanGram
  10. ^ Китайский
  11. ^ Мальтийский
  12. ^ Персидский
  13. ^ DELPH-IN: глубокая обработка с открытым исходным кодом
  14. ^ Грамматика и лексика английских ресурсов
  15. ^ Бертольд Кризманн
  16. ^ JacyTop - Глубокая лингвистическая обработка с HPSG (DELPH-IN)
  17. ^ Анализатор DELPH-IN PET
  18. ^ Ace: механизм ограничения ответов
  19. ^ согласен грамматическая инженерия
  20. ^ Copestake А., Flickinger Д. Поллард, К., и прогибаться, IA (2005). Семантика минимальной рекурсии: введение . Исследования языка и вычислений, 3 (2-3), 281-332.
  21. Tsuji Lab: домашняя страница парсера Enju. Архивировано 07марта 2010 г.на Wayback Machine (получено 24 ноября 2009 г.)

Дальнейшее чтение [ править ]

  • Карл Поллард , Иван А. Саг (1987): Информационный синтаксис и семантика. Том 1: Основы . Стэнфорд: публикации CSLI.
  • Карл Поллард , Иван А. Саг (1994): управляемая головой грамматика структуры фраз . Чикаго: Издательство Чикагского университета. ( [1] )
  • Иван А. Саг , Томас Вазоу , Эмили М. Бендер (2003): Синтаксическая теория: формальное введение, второе издание . Чикаго: Издательство Чикагского университета. ( [2] )
  • Левин, Роберт Д .; В. Детмар Мерерс (2006). "Управляемая головой грамматика структуры фраз: лингвистический подход, формальные основы и вычислительная реализация" (PDF) . В Кейт Браун (ред.). Энциклопедия языка и лингвистики (второе изд.). Оксфорд: Эльзевир. Архивировано из оригинального (PDF) 05.09.2008 . Проверено 7 марта 2008 .
  • Мюллер, Стефан (2013). «Объединение всего: некоторые замечания по упрощенному синтаксису, строительной грамматике, минимализму и HPSG» . Язык . 89 (4): 920–950. DOI : 10.1353 / lan.2013.0061 .

Внешние ссылки [ править ]

  • Домашняя страница Stanford HPSG - включает онлайн-материалы ежегодной конференции HPSG
  • Домашняя страница HPSG штата Огайо
  • Международная конференция по грамматике структуры фраз, управляемой головой
  • Сеть DELPH-IN для разработки грамматики HPSG
  • Базовый обзор HPSG
  • Сравнение HPSG с альтернативами и историческая перспектива
  • Библиография публикаций HPSG
  • Пакет LaTeX для рисования AVM - включает документацию