Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Неопределенный вывод был впервые описан CJ van Rijsbergen [1] как способ формального определения взаимосвязи запроса и документа при поиске информации . Эта формализация является логическим следствием с добавленной мерой неопределенности.

Определения [ править ]

Рийсберген предлагает, чтобы мерой неопределенности документа d по запросу q была вероятность его логического следствия, то есть:

Запрос пользователя можно интерпретировать как набор утверждений о желаемом документе. Задача системы - сделать вывод по конкретному документу, истинны ли утверждения запроса. Если они есть, документ извлекается. Во многих случаях содержимого документов недостаточно для подтверждения запросов. Необходима база знаний, содержащая факты и правила, но некоторые из них могут быть неопределенными, поскольку их использование для вывода может иметь определенную вероятность. Следовательно, мы также можем назвать это правдоподобным выводом . Правдоподобие из умозаключенияявляется функцией правдоподобия каждого утверждения запроса. Вместо того, чтобы извлекать документ, который точно соответствует запросу, мы должны ранжировать документы на основе их правдоподобия по отношению к этому запросу. Поскольку d и q генерируются пользователями, они подвержены ошибкам; таким образом сомнительно. Это повлияет на достоверность данного запроса.

Тем самым он выполняет две задачи:

  • Отделите процессы проверки вероятностей от логики.
  • Отделяйте обработку релевантности от обработки запросов

Мультимедийные документы, такие как изображения или видео, имеют разные свойства вывода для каждого типа данных. Они также отличаются от свойств текстового документа. Структура правдоподобного вывода позволяет нам измерять и комбинировать вероятности, исходящие из этих различных свойств.

Неопределенный вывод обобщает понятия аутоэпистемической логики , в которой значения истинности либо известны, либо неизвестны, а когда известны, они истинны или ложны.

Пример [ править ]

Если у нас есть запрос формы:

где A, B и C - утверждения запроса, тогда для документа D нам нужна вероятность:

Если мы преобразуем это в условную вероятность и если утверждения запроса независимы, мы сможем вычислить общую вероятность импликации как произведение вероятностей отдельных утверждений.

Дальнейшая работа [ править ]

Крофт и Кровец [2] применили неопределенный вывод к системе поиска информации для офисных документов, которую они назвали ОФИЦЕР . В офисных документах допущение независимости действительно, поскольку запрос будет сосредоточен на их индивидуальных атрибутах. Помимо анализа содержания документов, можно также запросить, например, об авторе, размере, теме или коллекции. Они разработали методы для сравнения атрибутов документов и запросов, определения их достоверности и объединения их в общую оценку для каждого документа. Помимо этой неопределенности в содержании документов и запросов, также необходимо было устранить эту проблему.

Сети вероятностной логики - это система для выполнения неопределенного вывода; четкие истинные / ложные значения истинности заменяются не только вероятностью, но и уровнем достоверности, указывающим на достоверность вероятности.

Марковские логические сети позволяют делать неопределенные выводы; неопределенности вычисляются с использованием принципа максимальной энтропии по аналогии с тем, как цепи Маркова описывают неопределенность конечных автоматов .

См. Также [ править ]

Ссылки [ править ]

  1. CJ van Rijsbergen (1986), Неклассическая логика для поиска информации (PDF) , Компьютерный журнал, стр. 481–485
  2. ^ У. Б. Крофт; Р. Krovetz (1988), "Интерактивные поиска офисные документы", конференции Генеральный спонсор ACM SIGOIS и IEEECS TC-ОА по информационным системам офиса - С. 228-235,. DOI : 10,1145 / 45410,45435 , ISBN 0897912616