Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Обобщенная контекстно-свободная грамматика (GCFG) - это грамматический формализм, который расширяет контекстно-свободные грамматики , добавляя потенциально неконтекстные функции композиции для перезаписи правил. [1] Головная грамматика (и ее слабые эквиваленты) является примером такой GCFG, которая, как известно, особенно хорошо справляется с широким спектром не-CF свойств естественного языка.

Описание [ править ]

GCFG состоит из двух компонентов: набора функций композиции, которые объединяют строковые кортежи, и набора правил перезаписи. Все функции композиции имеют форму , где либо одиночный строковый кортеж, либо некоторое использование (потенциально другой) функции композиции, которая сводится к строковому кортежу. Rewrite правило похоже , где , , ... струнные кортежи или не-терминальные символы.

Семантика перезаписи GCFG довольно проста. Появление нетерминального символа переписывается с использованием правил перезаписи, как в контекстно-свободной грамматике, что в конечном итоге дает просто композиции (функции композиции, применяемые к строковым кортежам или другим композициям). Затем применяются функции композиции, последовательно сокращая кортежи до одного кортежа.

Пример [ править ]

Простой перевод контекстно-свободной грамматики в GCFG можно выполнить следующим образом. Учитывая грамматику в ( 1 ), которая генерирует язык палиндромов , где - строка, обратная значению , мы можем определить композиционную функцию conc, как в ( 2a ), и правила перезаписи, как в ( 2b ).

Производство CF из abbbba является

S
как
abSba
abbSbba
Abbbba

и соответствующая продукция GCFG равна

Линейные системы перезаписи без контекста (LCFRS) [ править ]

Weir (1988) [1] описывает два свойства композиционных функций: линейность и регулярность. Функция, определяемая как линейная тогда и только тогда, когда каждая переменная появляется не более одного раза по обе стороны от = , что делает линейной, но не . Функция, определенная как регулярная, если левая и правая части имеют точно такие же переменные, делая регулярными, но не или .

Грамматика, в которой все функции композиции являются как линейными, так и регулярными, называется Линейной системой перезаписи без контекста (LCFRS). LCFRS является надлежащим подклассом GCFG, т. Е. Имеет строго меньшую вычислительную мощность, чем GCFG в целом.

С другой стороны, LCFRS строго более выразительны, чем грамматики с линейным индексом и их слабо эквивалентное дерево вариантов, примыкающих к грамматикам (TAG). [2] Головная грамматика - еще один пример LCFRS, который строго менее эффективен, чем класс LCFRS в целом.

LCFRS слабо эквивалентны (локально установленным) многокомпонентным тегам ( MCTAG ), а также с множественной контекстно-свободной грамматикой (MCFG [1] ). [3] и минималистские грамматики (MG). Языки, сгенерированные LCFRS (и их слабые эквиваленты), могут быть проанализированы за полиномиальное время . [4]

См. Также [ править ]

Ссылки [ править ]

  1. ^ Б Weir, Дэвид Джереми (сентябрь 1988). Описание слабо контекстно-зависимых грамматических формализмов (PDF) (доктор философии). Бумага. AAI8908403. Пенсильванский университет в Анн-Арборе.
  2. ^ Лаура Каллмейер (2010). Анализ вне контекстно-свободных грамматик . Springer Science & Business Media. п. 33. ISBN 978-3-642-14846-0.
  3. ^ Лаура Каллмейер (2010). Анализ вне контекстно-свободных грамматик . Springer Science & Business Media. п. 35-36. ISBN 978-3-642-14846-0.
  4. Йохан Ф.К. ван Бентем; Алиса тер Мёлен (2010). Справочник по логике и языку (2-е изд.). Эльзевир. п. 404. ISBN 978-0-444-53727-0.