Метапоисковая система


Метапоисковая система (метапоисковая машина) — поисковая система, которая в отличие от классических поисковых машин не имеет собственной базы данных и собственного поискового индекса, а формирует поисковую выдачу за счёт смешивания и переранжирования результатов поиска других поисковых систем.

Примеры: AskNet, Excite, Ixquick, Нигма. Исторические метапоисковые системы включают Dogpile, MetaCrawler, SUSI и Inference Find[1].

Метапоисковая система собирает ранжированные результаты поиска по конкретному запросу из нескольких поисковых систем, с помощью связующего алгоритма отсеивает дублирующиеся результаты и создаёт новый ранжированный список, предоставляемый пользователю через централизованный интерфейс[2].

Ранжируя результаты, полученные от отдельных поисковых систем, метапоисковая машина может использовать уже сформировавшийся рейтинг таких систем, основанный на качестве результатов, полученных от них при предыдущих запросах[3]. Без учёта индексов релевантности работают алгоритмы агрегации рейтингов, в которых каждая поисковая система рассматривается как избиратель на выборах, а каждая позиция поисковой выдачи — как кандидат на этих выборах. В число таких алгоритмов входят метод Борда, присваивающий каждой позиции определённое количество очков и потом суммирующий очки от всех избирателей для каждого кандидата, и метод Кондорсе, в котором очки присваиваются за однозначные «победы» в каждой паре кандидатов. Метод Кондорсе даёт более объективные результаты, тогда как метод Борда значительно легче алгоритмизировать. Ещё один метод, взвешенный алгоритм HITS, представляет собой вариант алгоритма HITS, в котором каждая поисковая система рассматривается как хаб-страница, а каждая интернет-страница, обнаруживаемая при поиске, — как авторитетная страница[4].

Метапоисковые машины нового поколения, помимо обработки конкретного запроса, выделяют ключевые слова или темы, связанные с ним, и создают облако тегов или предоставляют набор связанных ключевых запросов по теме, позволяя пользователю внести в поиск уточнения[5].

Отправка множества запросов к нескольким другим поисковым системам расширяет покрытие доступных данных по теме и позволяет найти больше информации. Метапоиск использует индексы, собранные другими поисковыми системами, агрегируя и часто перерабатывая результаты собственными уникальными способами. Метапоисковая система имеет преимущество перед выдачей от одной поисковой системы, потому что пользователь получит больше результатов при одинаковых усилиях. Это сокращает объём работ, когда пользователи для поиска ресурсов вводят запросы в разные системы по отдельности[6]. С этой точки зрения метапоисковые системы наиболее полезны начинающим пользователям и представляют меньший интерес для опытных[1].