Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В машинном обучении , семантический анализ из корпуса является задача построения структур, приближенных понятий из большого набора документов. Обычно это не требует предварительного семантического понимания документов. Метаязык на основе логики предикатов может анализировать речь человека. [1] : 93– Еще одна стратегия понимания семантики текста - это заземление символов . Если язык обоснован, это равносильно распознаванию машиночитаемого значения. Для ограниченной области пространственного анализа была продемонстрирована компьютерная система понимания языка. [2] : 123

Скрытый семантический анализ (иногда скрытое семантическое индексирование) - это класс методов, в которых документы представлены в виде векторов в пространстве терминов. Ярким примером является PLSI .

Скрытое распределение Дирихле предполагает присвоение терминов документа темам.

n-граммы и скрытые модели Маркова работают, представляя поток терминов в виде цепочки Маркова, где каждый член выводится из нескольких терминов перед ним.

См. Также [ править ]

  • Извлечение информации
  • Семантическое сходство
  • Изучение онтологий

Ссылки [ править ]

  1. ^ Нитин Индуркхья; Фред Дж. Дамерау (22 февраля 2010 г.). Справочник по обработке естественного языка . CRC Press. ISBN 978-1-4200-8593-8.
  2. ^ Майкл Спрангер (15 июня 2016 г.). Эволюция обоснованного пространственного языка . Language Science Press. ISBN 978-3-946234-14-2.