Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Стохастическая грамматика ( статистическая грамматика ) является основой грамматики с вероятностным понятием грамматическим :

  • Стохастическая контекстно-свободная грамматика
  • Статистический анализ
  • Анализ, ориентированный на данные
  • Скрытая марковская модель
  • Теория оценок

Грамматика реализована как языковая модель . Разрешенные предложения хранятся в базе данных вместе с частотой встречаемости предложения. [1] Статистическая обработка естественного языка использует стохастические , вероятностные и статистические методы, особенно для решения трудностей, которые возникают из-за того, что более длинные предложения очень неоднозначны при обработке с реалистичными грамматиками, что дает тысячи или миллионы возможных анализов. Методы устранения неоднозначности часто включают использование корпусов и марковских моделей.. «Вероятностная модель состоит из не вероятностной модели плюс некоторых числовых величин; неверно, что вероятностные модели по своей сути проще или менее структурны, чем не вероятностные модели». [2]

Примеры [ править ]

Вероятностный метод обнаружения рифм был реализован Хирджи и Брауном [3] в их исследовании, проведенном в 2013 году для поиска внутренних и несовершенных пар рифм в рэп-текстах. Концепция адаптирована из методики выравнивания последовательностей с использованием BLOSUM ( BLO cks SU bstitution M atrix). Они смогли обнаружить рифмы, не обнаруживаемые с помощью не вероятностных моделей.

См. Также [ править ]

  • Бесцветные зеленые идеи яростно спят
  • Компьютерная лингвистика
  • L-система # Стохастические грамматики
  • Стохастическая контекстно-свободная грамматика
  • Статистическое овладение языком

Ссылки [ править ]

  1. ^ Стив Янг; Геррит Блутоофт (14 марта 2013 г.). Корпоративные методы в обработке речи и языка . Springer Science & Business Media. С. 140–. ISBN 978-94-017-1183-8.
  2. ^ Джон Голдсмит. 2002. " Вероятностные модели грамматики: фонология как минимизация информации ". Фонологические этюды № 5: 21–46.
  3. ^ Хирджи, Хусейн; Браун, Дэниел (2013). «Использование автоматического распознавания рифм для характеристики стиля рифм в рэп-музыке» (PDF) . Обзор эмпирического музыковедения .

Дальнейшее чтение [ править ]

  • Кристофер Д. Мэннинг, Хинрих Шютце: основы статистической обработки естественного языка , MIT Press (1999), ISBN 978-0-262-13360-9 . 
  • Стефан Вермтер, Эллен Рилофф, Габриэль Шелер (редакторы): коннекционист, статистические и символические подходы к обучению для обработки естественного языка , Springer (1996), ISBN 978-3-540-60925-4 . 
  • Пирани, Джанкарло, изд. Продвинутые алгоритмы и архитектуры для понимания речи. Vol. 1. Springer Science & Business Media, 2013.