Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Информационного поиска (IR) язык запросов является язык запросов используется для запросов в поисковый индекс. Язык запросов формально определяется в контекстно-свободной грамматике (CFG) и может использоваться пользователями в текстовой, визуальной / пользовательской или речевой форме. Расширенные языки запросов часто определяются для профессиональных пользователей в вертикальных поисковых системах , поэтому они получают больший контроль над формулировкой запросов.

Типы языков запросов [ править ]

  • Полнотекстовый . В простейшем языке запросов все термины трактуются как набор слов, которые должны быть сопоставлены с публикациями в инвертированном индексе и где впоследствии применяются модели ранжирования для поиска наиболее релевантных документов. В CFG определены только токены. Поисковые системы часто используют этот подход.
  • Булево . Язык запросов, который также поддерживает использование логических операторов AND, OR, NOT.
  • Структурированный . Язык, который поддерживает поиск в (комбинации) полей, когда документ структурирован и индексируется с использованием его структуры документа.
  • Естественный язык . Язык запросов, который поддерживает естественный язык путем синтаксического анализа запроса на естественном языке в форму, которая может лучше всего использоваться для извлечения соответствующих документов, например, с помощью систем ответов на вопросы или диалогового поиска .

Обратите внимание, что языки запросов IR могут представлять собой смесь разных типов. Специальные операторы с подстановочными знаками и специальные функции поиска для поиска с учетом регистра или фраз могут быть определены как часть языка запросов.

Примеры [ править ]

Примером языка запросов IR является язык контекстных запросов (CQL), формальный язык для представления запросов к информационно-поисковым системам, таким как веб-индексы, библиографические каталоги и информация о музейных собраниях.

См. Также [ править ]

Внешние ссылки [ править ]