Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Поисковый запрос является запросом на основе конкретных термина поиска , которые пользователь вводит в веб - поисковую систему , чтобы удовлетворить свои потребности в информации . Запросы веб-поиска отличаются тем, что они часто представляют собой обычный текст или гипертекст с необязательными директивами поиска (такими как "и" / "или" с "-" для исключения). Они сильно отличаются от стандартных языков запросов , которые регулируются строгими синтаксическими правилами, как языки команд с ключевыми словами или позиционными параметрами .

Типы [ править ]

Существует три широких категории, которые охватывают большинство поисковых запросов в Интернете: информационные, навигационные и транзакционные. [1] Их также называют «делай, знай, иди». [2] Хотя эта модель поиска не была получена теоретически, классификация была подтверждена эмпирически на реальных запросах поисковых систем. [3]

  • Информационные запросы - запросы, которые охватывают широкую тему (например, Колорадо или грузовики ), для которых могут быть тысячи релевантных результатов.
  • Навигационные запросы - запросы, которые ищут один веб-сайт или веб-страницу одного объекта (например, youtube или delta air lines ).
  • Транзакционные запросы - запросы, отражающие намерение пользователя выполнить определенное действие, например купить автомобиль или загрузить заставку.

Поисковые системы часто поддерживают четвертый тип запроса, который используется гораздо реже:

  • Connectivity запросы - запросы , что отчет о связности индексируемой веб - графика (например, какие ссылки указывают на этот URL , и сколько страниц проиндексировано из этого? Доменного имени ?). [4]

Характеристики [ править ]

Список поисковых предложений по поисковому запросу

Большинство коммерческих поисковых систем не раскрывают свои журналы поиска, поэтому трудно получить информацию о том, что пользователи ищут в Интернете. [5] Тем не менее, исследования начали появляться в 1998 году. [6] [7] Исследование 2001 года [8], в котором анализировались запросы от поисковой системы Excite , показало некоторые интересные характеристики веб-поиска:

  • Средняя длина запроса составила 2,4 термина.
  • Около половины пользователей вводили один запрос, а чуть менее трети пользователей вводили три или более уникальных запроса.
  • Почти половина пользователей изучали только первые одну или две страницы результатов (10 результатов на страницу).
  • Менее 5% пользователей использовали расширенные функции поиска (например, логические операторы, такие как AND, OR и NOT).
  • Четыре наиболее часто используемых термина были (пустой поиск) и, of и sex.

Изучение тех же журналов запросов Excite показало, что 19% запросов содержали географические термины (например, названия мест, почтовые индексы, географические особенности и т. Д.). [9]

Исследования также показывают, что помимо коротких запросов (запросов с небольшим количеством терминов) существуют предсказуемые закономерности того, как пользователи меняют свои запросы. [10]

Исследование журналов запросов Yahoo в 2005 году показало, что 33% запросов от одних и тех же пользователей были повторными запросами и что в 87% случаев пользователь нажимал на тот же результат. [11] Это говорит о том, что многие пользователи используют повторные запросы для повторного посещения или повторного поиска информации. Этот анализ подтверждается сообщением в блоге поисковой системы Bing, в котором говорится, что около 30% запросов являются навигационными. [12]

Кроме того, исследования показали, что частотные распределения терминов запросов соответствуют степенному закону или кривым распределения с длинным хвостом . То есть небольшая часть терминов, наблюдаемых в большом журнале запросов (например,> 100 миллионов запросов), используется наиболее часто, в то время как остальные термины используются реже по отдельности. [13] Этот пример принципа Парето (или правила 80–20 ) позволяет поисковым системам использовать такие методы оптимизации , как разделение индекса или базы данных , кэширование.и предварительная загрузка. Кроме того, были проведены исследования лингвистически ориентированных атрибутов, которые могут распознать, является ли веб-запрос навигационным, информационным или транзакционным. [14]

Исследование 2011 года показало, что средняя длина запросов неуклонно росла с течением времени, а средняя длина запросов на языках, отличных от английского, увеличилась больше, чем на английском языке. [15] Google внедрил обновление колибри в августе 2013 года, чтобы обрабатывать более длинные поисковые запросы, поскольку все больше поисковых запросов носят разговорный характер (например, «где ближайшая кофейня?»). [16]

Структурированные запросы [ править ]

С поисковыми системами, поддерживающими логические операторы и круглые скобки, можно применить метод, традиционно используемый библиотекарями. Пользователь, который ищет документы, охватывающие несколько тем или аспектов, может захотеть описать каждый из них с помощью дизъюнкции характерных слов, таких как vehicles OR cars OR automobiles. Граненая запроса является соединением таких граней; например, такой запрос, как (electronic OR computerized OR DRE) AND (voting OR elections OR election OR balloting OR electoral)вероятно, найдет документы об электронном голосовании, даже если в них будет опущено одно из слов «электронное» или «голосование», или даже и то, и другое. [17]

См. Также [ править ]

  • Поиск информации
  • Поисковая система в Интернете
  • Классификация веб-запросов
  • Таксономия для поисковых систем
  • Намерение пользователя

Ссылки [ править ]

  1. Перейти ↑ Broder, A. (2002). Таксономия веб-поиска. СИГИР Форум, 36 (2), 3–10.
  2. ^ Гиббонс, Кевин (2013-01-11). «Делай, знай, иди: как создавать контент на каждом этапе цикла покупки» . Поисковая система Watch . Проверено 24 мая 2014 .
  3. ^ Янсен, Б.Дж., Бут, Д., и Спинк, А. (2008) Определение информационного, навигационного и транзакционного намерения веб-запросов , обработка информации и управление. 44 (3), 1251-1266.
  4. ^ Мур, Росс. «Серверы подключения» . Издательство Кембриджского университета . Проверено 24 мая 2014 .
  5. ^ Дон Кавамото и Элинор Миллс (2006), AOL приносит свои извинения за публикацию пользовательских поисковых данных
  6. ^ Янсен, Б.Дж., Спинк, А., Бейтман, Дж., И Сарачевич, Т. 1998. Поиск информации в реальной жизни: исследование запросов пользователей в Интернете . СИГИР Форум, 32 (1), 5-17.
  7. ^ Силверстейн, К., Henzinger, М., Марэ H., & Moricz, М. (1999). Анализ очень большого журнала запросов поисковой системы . СИГИР Форум, 33 (1), 6–12.
  8. ^ Аманда Спинк; Дитмар Вольфрам; Майор Б.Дж. Янсен; Тефко Сарачевич (2001). « Поиск в Интернете: публика и их запросы ». Журнал Американского общества информационных наук и технологий . 52 (3): 226–234. CiteSeerX 10.1.1.23.9800 . DOI : 10.1002 / 1097-4571 (2000) 9999: 9999 <:: AID-ASI1591> 3.3.CO; 2-I .  Внешняя ссылка в |title=( помощь )
  9. ^ Марк Сандерсон и Джанет Колер (2004). «Анализ географических запросов» . Материалы семинара по географической информации (SIGIR '04) .
  10. Перейти ↑ Jansen, BJ, Booth, DL, & Spink, A. (2009). Паттерны модификации запроса при поиске в сети . Журнал Американского общества информационных наук и технологий. 60 (3), 557-570. 60 (7), 1358-1371.
  11. ^ Хайме Тиван; Эйтан Адар; Рози Джонс; Майкл Поттс (2005). «История повторяется: повторные запросы в журналах запросов Yahoo» (PDF) . Материалы 29-й ежегодной конференции ACM по исследованиям и разработкам в области информационного поиска (SIGIR '06) . С. 703–704. DOI : 10.1145 / 1148170.1148326 . [ постоянная мертвая ссылка ]
  12. ^ http://www.bing.com/community/site_blogs/b/search/archive/2011/02/10/making-search-yours.aspx
  13. ^ Рикардо Baeza-Yates (2005). «Приложения интеллектуального анализа веб-запросов». Достижения в области информационного поиска . Конспект лекций по информатике. 3408 . Springer Berlin / Heidelberg. С. 7–22. DOI : 10.1007 / 978-3-540-31865-1_2 . ISBN 978-3-540-25295-5.
  14. ^ Алехандро Фигероа (2015). «Изучение эффективных функций для распознавания намерений пользователя, стоящих за веб-запросами» . 68 . Эльзевьер: 162–169. Цитировать журнал требует |journal=( помощь )
  15. ^ Мона Тагави; Ахмед Патель; Никита Шмидт; Кристофер Уиллс; Ики Тью (2011). «Анализ журналов веб-прокси с использованием схемы распределения запросов для поисковых систем». Компьютерные стандарты и интерфейсы . 34 (1): 162–170. DOI : 10.1016 / j.csi.2011.07.001 .
  16. ^ Салливан, Дэнни (2013-09-26). "FAQ: Все о новом алгоритме Google" Колибри " . Земля поисковой машины . Проверено 24 мая 2014 .
  17. ^ Vojkan Mihajlović; Джорд Хиемстра; Хенк Эрнст Блок; Питер М.Г. Аперс (октябрь 2006 г.). «Использование структуры запроса и структуры документа для повышения эффективности поиска документов» (PDF) . Цитировать журнал требует |journal=( помощь )