Грамматика структуры фраз, управляемая головой ( HPSG ) - это сильно лексикализованная грамматика на основе ограничений [1], разработанная Карлом Поллардом и Иваном Сагом . [2] [3] Это тип грамматики структуры фраз , в отличие от грамматики зависимостей , и он является непосредственным преемником грамматики обобщенной структуры фраз . HPSG опирается на другие области, такие как информатика ( теория типов данных и представление знаний ), и использует понятие знака Фердинанда де Соссюра.. Он использует единый формализм и организован по модульному принципу, что делает его привлекательным для обработки естественного языка .
Грамматика HPSG включает в себя принципы и правила грамматики и лексика записи , которые обычно не считаются принадлежащими к грамматике. Формализм основан на лексикализме. Это означает, что лексика - это больше, чем просто список статей; он сам по себе богато структурирован. Отдельные записи отмечены типами. Типы образуют иерархию. Ранние версии грамматики были очень лексикализованы с использованием нескольких грамматических правил (схем). Более поздние исследования имели тенденцию добавлять больше и более обширных правил, больше напоминающих строительную грамматику . [4]
Основным типом HPSG является знак. Слова и фразы - это два разных подтипа знака. Слово имеет две функции: [PHON] (звук, фонетическая форма) и [SYNSEM] ( синтаксическая и семантическая информация), каждая из которых разбита на части. Знаки и правила формализованы как типизированные структуры признаков .
Образец грамматики [ править ]
HPSG генерирует строки путем комбинирования знаков, которые определяются их расположением в иерархии типов и их внутренней структурой признаков, представленной матрицами значений атрибутов (AVM). [3] [5] Функции принимают типы или списки типов в качестве значений, и эти значения, в свою очередь, могут иметь свою собственную структуру функций. Грамматические правила в значительной степени выражаются через знаки ограничений, накладываемые друг на друга. Структура признаков знака описывает его фонологические, синтаксические и семантические свойства. В общепринятых обозначениях AVM пишутся с элементами в верхнем регистре, а типы в нижнем регистре курсивом. Пронумерованные индексы в AVM представляют идентичные значения токенов.
В упрощенном AVM для слова (в данном случае глагола, а не существительного, как в «приятных прогулках на выходные») «прогулки» ниже категориальная информация глагола (CAT) разделена на характеристики, которые его описывают (HEAD) и особенности, которые описывают его аргументы (ВАЛЕНЦИЯ).
«Прогулки» - знак печатного слова с головкой от типового глагола . Как непереходный глагол, "прогулки" не имеет дополнения, но требует подлежащего, который является существительным в единственном числе от третьего лица. Семантическое значение подлежащего (СОДЕРЖАНИЕ) коиндексируется с единственным аргументом глагола (индивид, выполняющий ходьбу). Следующая AVM для «она» представляет собой знак со значением SYNSEM, который может удовлетворить эти требования.
Знаки типа фразы объединяются с одним или несколькими дочерними элементами и распространяют информацию вверх. Следующая AVM кодирует правило непосредственного доминирования для head-subj-фразы , для которой требуются два дочерних элемента: головной дочерний элемент (глагол) и дочерний элемент без головы, который удовлетворяет ограничениям SUBJ глагола.
Конечным результатом является знак с заголовком глагола, пустыми элементами подкатегории и фонологическим значением, которое упорядочивает двух детей.
Хотя фактическая грамматика HPSG полностью состоит из структур признаков, лингвисты часто используют деревья для представления объединения знаков, где эквивалентная AVM была бы громоздкой.
Реализации [ править ]
Написаны различные синтаксические анализаторы, основанные на формализме HPSG, и в настоящее время исследуются возможности оптимизации. Пример системы, анализирующей немецкие предложения , предоставлен Freie Universität Berlin . [6] Кроме того, проект CoreGram [7] группы грамматики Свободного университета Берлина предоставляет грамматики с открытым исходным кодом, которые были реализованы в системе TRALE. В настоящее время существуют грамматики для немецкого , [8] датского , [9] китайского , [10] мальтийского , [11] и персидского языков [12]. которые имеют общее ядро и являются общедоступными.
Большие HPSG-грамматики различных языков разрабатываются в рамках Deep Linguistic Processing with HPSG Initiative ( DELPH-IN ). [13] Грамматики английского [14] немецкого [15] и японского [16 ] с широким охватом доступны по лицензии с открытым исходным кодом. Эти грамматики могут использоваться с множеством взаимосовместимых анализаторов HPSG с открытым исходным кодом: LKB , PET, [17] Ace, [18] и согласны . [19] Все они производят семантические представления в формате «Семантика минимальной рекурсии», MRS. [20]Декларативный характер формализма HPSG означает, что эти вычислительные грамматики обычно могут использоваться как для синтаксического анализа, так и для генерации (создания поверхностных строк из семантических входных данных). Древовидные банки, также распространяемые DELPH-IN , используются для разработки и тестирования грамматик, а также для обучения моделей ранжирования для принятия решения о правдоподобных интерпретациях при синтаксическом анализе (или реализации при создании).
Enju - это свободно доступный вероятностный синтаксический анализатор HPSG с широким охватом для английского языка, разработанный лабораторией Tsujii в Токийском университете в Японии . [21]
См. Также [ править ]
- Лексико-функциональная грамматика
- Семантика минимальной рекурсии
- Реляционная грамматика
- Семантика ситуации
- Синтаксис
- Трансформационная грамматика
- Тип Описание Язык
Ссылки [ править ]
- ^ "HPSG" .
- ↑ Поллард, Карл и Иван А. Саг. 1987. Информационный синтаксис и семантика. Том 1. Основы. Лекционные заметки CLSI 13.
- ^ a b Поллард, Карл; Иван А. Саг. (1994). Грамматика структуры фраз, управляемая головой . Чикаго: Издательство Чикагского университета.
- ^ Саг, Иван А. 1997. Конструкции английских относительных предложений [ постоянная мертвая ссылка ] . Журнал лингвистики. 33,2: 431-484
- ^ Саг, Иван А .; Томас Вазоу; И Эмили Бендер. (2003). Синтаксическая теория: формальное введение . 2-е изд. Чикаго: Издательство Чикагского университета.
- ^ Вавилонская система: HPSG Interactive
- ^ Проект CoreGram
- ^ Берлиграм
- ^ DanGram
- ^ Китайский
- ^ Мальтийский
- ^ Персидский
- ^ DELPH-IN: глубокая обработка с открытым исходным кодом
- ^ Грамматика и лексика английских ресурсов
- ^ Бертольд Кризманн
- ^ JacyTop - Глубокая лингвистическая обработка с HPSG (DELPH-IN)
- ^ Анализатор DELPH-IN PET
- ^ Ace: механизм ограничения ответов
- ^ согласен грамматическая инженерия
- ^ Copestake А., Flickinger Д. Поллард, К., и прогибаться, IA (2005). Семантика минимальной рекурсии: введение . Исследования языка и вычислений, 3 (2-3), 281-332.
- ↑ Tsuji Lab: домашняя страница парсера Enju. Архивировано 07марта 2010 г.на Wayback Machine (получено 24 ноября 2009 г.)
Дальнейшее чтение [ править ]
- Карл Поллард , Иван А. Саг (1987): Информационный синтаксис и семантика. Том 1: Основы . Стэнфорд: публикации CSLI.
- Карл Поллард , Иван А. Саг (1994): управляемая головой грамматика структуры фраз . Чикаго: Издательство Чикагского университета. ( [1] )
- Иван А. Саг , Томас Вазоу , Эмили М. Бендер (2003): Синтаксическая теория: формальное введение, второе издание . Чикаго: Издательство Чикагского университета. ( [2] )
- Левин, Роберт Д .; В. Детмар Мерерс (2006). "Управляемая головой грамматика структуры фраз: лингвистический подход, формальные основы и вычислительная реализация" (PDF) . В Кейт Браун (ред.). Энциклопедия языка и лингвистики (второе изд.). Оксфорд: Эльзевир. Архивировано из оригинального (PDF) 05.09.2008 . Проверено 7 марта 2008 .
- Мюллер, Стефан (2013). «Объединение всего: некоторые замечания по упрощенному синтаксису, строительной грамматике, минимализму и HPSG» . Язык . 89 (4): 920–950. DOI : 10.1353 / lan.2013.0061 .
Внешние ссылки [ править ]
- Домашняя страница Stanford HPSG - включает онлайн-материалы ежегодной конференции HPSG
- Домашняя страница HPSG штата Огайо
- Международная конференция по грамматике структуры фраз, управляемой головой
- Сеть DELPH-IN для разработки грамматики HPSG
- Базовый обзор HPSG
- Сравнение HPSG с альтернативами и историческая перспектива
- Библиография публикаций HPSG
- Пакет LaTeX для рисования AVM - включает документацию