Из Википедии, свободной энциклопедии
  (Перенаправлено из поисковой системы )
Перейти к навигации Перейти к поиску
Результаты поиска для термина «лунное затмение» в веб- поиска изображений двигателя

Поисковая система представляет собой программный комплекс, который предназначен для проведения веб - поиска ( поиск в Интернете ), что означает для поиска в World Wide Web на систематической основе для конкретной информации , указанной в текстовом поисковом запросе . Результаты поиска обычно представлены в виде строки результатов, часто называемой страницами результатов поисковой системы (SERP). Информация может представлять собой смесь ссылок на веб-страницы , изображения, видео, инфографику , статьи, исследовательские работы и другие типы файлы. Некоторые поисковые системы также добывают данные, доступные в базах данных.или откройте каталоги . В отличие от веб - каталоги , которые поддерживаются только человеческими редакторами, поисковые системы также поддерживают в режиме реального времени информацию, запустив алгоритм на веб - искателя . Интернет-контент, который не может быть найден поисковой системой в Интернете, обычно называется глубокой паутиной .

История [ править ]

До 1990-х годов [ править ]

Система поиска опубликованной информации, предназначенная для преодоления все возрастающих трудностей поиска информации в постоянно растущих централизованных указателях научной работы, была описана в 1945 году Ванневаром Бушем , который написал в The Atlantic Monthly статью под названием « Как мы можем думать » [1 ], в которой он представил библиотеки исследований со связанными аннотациями, мало чем отличающиеся от современных гиперссылок . [2] Анализ ссылок в конечном итоге станет важным компонентом поисковых систем с помощью таких алгоритмов, как Hyper Search и PageRank . [3] [4]

1990-е: Рождение поисковых систем [ править ]

Первые поисковые машины интернет предшествуют дебют Сети в декабре 1990 года: Кто пользователь дата поиска вернуться к 1982 году, [5] и Knowbot Информационной службы мульти-поиск сети пользователя впервые был реализован в 1989 году [6] Первый хорошо документирован поисковой системой, которая осуществляла поиск файлов содержимого, а именно файлов FTP , была Archie , дебютировавшая 10 сентября 1990 года [7].

До сентября 1993 года всемирная паутина полностью индексировалась вручную. Был список веб-серверов, отредактированный Тимом Бернерсом-Ли и размещенный на веб-сервере ЦЕРН . Один моментальный снимок списка 1992 года сохранился [8], но по мере того, как все больше и больше веб-серверов выходили в сеть, центральный список больше не успевал. На сайте NCSA были анонсированы новые серверы под заголовком «Что нового!» [9]

Первым инструментом, используемым для поиска контента (в отличие от пользователей) в Интернете, был Archie . [10] Название расшифровывается как «архив» без «v». [11] Он был создан Аланом Эмтаджем [11] [12] [13] [14] студентом факультета информатики в Университете Макгилла в Монреале, Квебек , Канада. . Программа загрузила списки каталогов всех файлов, расположенных на общедоступных анонимных сайтах FTP ( протокол передачи файлов ), создав базу данных имен файлов с возможностью поиска ; однако поисковая система Archieне индексировали содержимое этих сайтов, поскольку объем данных был настолько ограничен, что их можно было легко найти вручную.

Подъем Gopher (создан в 1991 году Марком McCahill в Университете штата Миннесота ) привели к двум новым поисковых программ, Veronica и Jughead . Как и Арчи, они искали имена и заголовки файлов, хранящиеся в индексных системах Gopher. Вероника ( V ERy Е ASY R odent- O riented Н и др шириной Я NDEX к C omputerized A rchives) при условии , поиск по ключевым словам большинства названий меню Gopher в целых списков Gopher. Jughead ( J onzy в U niversal G ОферН ierarchy Е xcavation й Д жаемый) является инструментом для получения информации меню от конкретного Gopher серверов. Хотя название поисковой системы « Archie Search Engine » не было отсылкой к серии комиксов об Арчи , « Вероника » и « Джагхед » - персонажи этого сериала, отсылающие, таким образом, к своему предшественнику.

Летом 1993 года поисковой машины в Интернете не существовало, хотя многочисленные специализированные каталоги поддерживались вручную. Оскар Ньерстрассы в Женевском университете написали ряд Perl скриптов , которые периодически зеркальные эти страницы и переписали их в стандартный формат. Это легло в основу W3Catalog , первой примитивной поисковой машины в Интернете, выпущенной 2 сентября 1993 г. [15]

В июне 1993 года Мэтью Грей, работавший тогда в Массачусетском технологическом институте , создал, вероятно, первого веб-робота , основанного на Perl World Wide Web Wanderer , и использовал его для создания индекса под названием «Wandex». Цель Wanderer состояла в том, чтобы измерить размер всемирной паутины, что он и делал до конца 1995 года. Вторая поисковая машина сети Aliweb появилась в ноябре 1993 года. Aliweb не использовала веб-робота , а зависела от уведомления веб-сайта. наличие у администраторов на каждом сайте индексного файла в определенном формате.

JumpStation (создано в декабре 1993 года [16] по Джонатону Fletcher ) использовал веб - робот , чтобы найти веб - страницу и построить свой индекс, и использовать веб - форму в качестве интерфейса для программы его запроса. Таким образом, это был первый инструмент для обнаружения ресурсов WWW, который сочетал в себе три основные функции поисковой машины в Интернете (сканирование, индексирование и поиск), как описано ниже. Из-за ограниченных ресурсов, доступных на платформе, на которой он работал, его индексирование и, следовательно, поиск были ограничены заголовками и заголовками, найденными на веб-страницах, с которыми столкнулся поисковый робот.

Одной из первых поисковых систем, основанных на "полнотекстовом" роботе, была WebCrawler , которая появилась в 1994 году. В отличие от своих предшественников, она позволяла пользователям искать любое слово на любой веб-странице, которая с тех пор стала стандартом для всех основных поисковых систем. Это была также поисковая машина, которая была широко известна публике. Также в 1994 году была запущена Lycos (которая началась в Университете Карнеги-Меллона ), ставшая крупным коммерческим предприятием.

Первой популярной поисковой системой в Интернете была Yahoo! Искать . [17] Первый продукт Yahoo! , Основанная Джерри Янг и Дэвид Фило в январе 1994 года был каталог Web называется Yahoo! Справочник . В 1995 году была добавлена ​​функция поиска, позволяющая пользователям выполнять поиск в Yahoo! Справочник! [18] [19] Он стал одним из самых популярных способов поиска интересующих веб-страниц, но его функция поиска работала в его веб-каталоге, а не в полнотекстовых копиях веб-страниц.

Вскоре после этого появился ряд поисковых систем, которые боролись за популярность. К ним относятся Magellan , Excite , Infoseek , Inktomi , Northern Light и AltaVista . Лица, ищущие информацию, могут также просматривать каталог вместо поиска по ключевым словам.

В 1996 году Робин Ли разработал алгоритм ранжирования сайта RankDex для ранжирования страниц результатов поисковых систем [20] [21] [22] и получил патент США на эту технологию. [23] Это была первая поисковая система, которая использовала гиперссылки для измерения качества индексируемых веб-сайтов [24], предшествовавшая патенту на очень похожий алгоритм, поданному Google двумя годами позже в 1998 году. [25] Ларри Пейдж упоминал работы Ли в некоторых из них. его патентов США на PageRank. [26] Позже Ли использовал свою технологию Rankdex для Baidu. поисковая система, основанная Робином Ли в Китае и запущенная в 2000 году.

В 1996 году Netscape хотела предоставить единственной поисковой системе эксклюзивную сделку в качестве основной поисковой системы в веб-браузере Netscape. Интерес был настолько велик, что вместо этого Netscape заключила сделки с пятью основными поисковыми системами: за 5 миллионов долларов в год каждая поисковая машина будет попеременно размещаться на странице поисковой системы Netscape. Пятью движками были Yahoo !, Magellan, Lycos, Infoseek и Excite. [27] [28]

Google перенял идею продажи поисковых запросов в 1998 году от небольшой поисковой компании goto.com . Этот шаг оказал значительное влияние на бизнес SE, который превратился из тяжелого бизнеса в один из самых прибыльных в Интернете. [29]

Поисковые системы также были известны как одни из самых ярких звезд в безумном инвестировании в Интернет, которое произошло в конце 1990-х годов. [30] Несколько компаний впечатляюще вышли на рынок, получив рекордную прибыль во время своего первоначального публичного размещения акций . Некоторые закрыли свои общедоступные поисковые системы и продают корпоративные версии, например Northern Light. Многие компании, занимающиеся поисковыми системами, оказались вовлечены в пузырь доткомов - рыночный бум, вызванный спекуляциями, пик которого пришелся на 1990 год и закончился в 2000 году.

2000's-Present: Сообщение дот-комов [ править ]

Примерно в 2000 году поисковая система Google приобрела известность. [31] Компания достигла лучших результатов по многим поисковым запросам с помощью алгоритма под названием PageRank , как было объяснено в статье « Анатомия поисковой системы», написанной Сергеем Брином и Ларри Пейджем , более поздними основателями Google. [4] Этот итеративный алгоритм ранжирует веб-страницы на основе количества и PageRank других веб-сайтов и страниц, которые на них ссылаются, при условии, что хорошие или желательные страницы связаны больше, чем другие. Патент Ларри Пейджа на PageRank ссылается на более ранний патент RankDex Робина Ли как на влияние. [26]Google также сохранил минималистичный интерфейс своей поисковой системы. Напротив, многие из его конкурентов встроили поисковую систему в веб-портал . Фактически, поисковая система Google стала настолько популярной, что появились спуфинговые машины, такие как Mystery Seeker .

К 2000 году Yahoo! предоставлял поисковые услуги на основе поисковой системы Inktomi. Yahoo! приобрела Inktomi в 2002 году и Overture (которой принадлежали AlltheWeb и AltaVista) в 2003 году. Yahoo! перешла на поисковую систему Google до 2004 года, когда она запустила собственную поисковую систему, основанную на комбинированных технологиях своих приобретений.

Microsoft впервые запустила MSN Search осенью 1998 года, используя результаты поиска Inktomi. В начале 1999 года сайт начал отображать списки Looksmart , смешанные с результатами Inktomi. На короткое время в 1999 году поисковая система MSN вместо этого использовала результаты AltaVista. В 2004 году Microsoft начала переход на собственную технологию поиска, основанную на собственном поисковом роботе (называемом msnbot ).

Обновленная поисковая система Microsoft, Bing , была запущена 1 июня 2009 года. 29 июля 2009 года Yahoo! и Microsoft завершили сделку, по которой Yahoo! Поиск будет основан на технологии Microsoft Bing.

По состоянию на 2019 год активные сканеры поисковых систем включают Google , Sogou , Baidu , Bing , Gigablast , Mojeek , DuckDuckGo и Яндекс .

Подход [ править ]

Поисковая система поддерживает следующие процессы почти в реальном времени:

  1. Веб-сканирование
  2. Индексирование
  3. Поиск [32]

Поисковые системы получают информацию путем обхода веб-страниц с сайта на сайт. «Паук» проверяет адресованное ему стандартное имя файла robots.txt . Файл robots.txt содержит директивы для поисковых роботов, сообщающие ему, какие страницы сканировать. После проверки файла robots.txt и обнаружения его или нет, паук отправляет определенную информацию обратно для индексации в зависимости от многих факторов, таких как заголовки, содержимое страницы, JavaScript , каскадные таблицы стилей (CSS), заголовки или свои метаданные в HTML мета-теги. После определенного количества просканированных страниц, количества проиндексированных данных или времени, проведенного на сайте, паук прекращает сканирование и продолжает движение. "[Нет] веб-сканер может фактически сканировать всю доступную сеть. Из-за бесконечного количества веб-сайтов, ловушек-пауков, спама и других требований реальной сети поисковые роботы вместо этого применяют политику сканирования, чтобы определить, когда сканирование сайта должно считаться достаточно. Некоторые веб-сайты сканируются полностью, а другие - только частично ". [33]

Индексирование означает связывание слов и других определяемых токенов, найденных на веб-страницах, с их доменными именами и полями на основе HTML . Связи размещаются в общедоступной базе данных, доступной для поисковых запросов в Интернете. Запрос от пользователя может состоять из одного слова, нескольких слов или предложения. Индекс помогает как можно быстрее найти информацию, относящуюся к запросу. [32] Некоторые методы индексирования и кэширования являются коммерческой тайной, тогда как сканирование в Интернете - это простой процесс посещения всех сайтов на систематической основе.

Между посещениями паука кэшированная версия страницы (часть или весь контент, необходимый для ее отображения), хранящаяся в рабочей памяти поисковой системы, быстро отправляется запрашивающему. Если посещение просрочено, поисковая система может вместо этого действовать как веб-прокси . В этом случае страница может отличаться от проиндексированных поисковых запросов. [32] Кэшированная страница сохраняет внешний вид версии, слова которой были ранее проиндексированы, поэтому кешированная версия страницы может быть полезна для веб-сайта, когда фактическая страница была потеряна, но эта проблема также считается легкой формой линкрот .

Высокоуровневая архитектура стандартного поискового робота

Обычно, когда пользователь вводит запрос в поисковую систему, это несколько ключевых слов . [34] В индексе уже есть имена сайтов, содержащих ключевые слова, и они мгновенно получаются из индекса. Реальная нагрузка обработки связана с созданием веб-страниц, которые являются списком результатов поиска: каждая страница во всем списке должна быть взвешена в соответствии с информацией в индексах. [32] Затем для самого популярного элемента результатов поиска требуется поиск, реконструкция и разметка фрагментов.показывая контекст совпадающих ключевых слов. Это только часть обработки, необходимой для каждой веб-страницы результатов поиска, а для последующих страниц (рядом с верхними) требуется дополнительная обработка этой публикации.

Помимо простого поиска по ключевым словам, поисковые системы предлагают собственные операторы с графическим интерфейсом или команды и параметры поиска для уточнения результатов поиска. Они обеспечивают необходимые элементы управления для пользователя, вовлеченного в цикл обратной связи, создаваемый пользователями путем фильтрации и взвешивания при уточнении результатов поиска с учетом начальных страниц первых результатов поиска. Например, с 2007 года поисковая система Google.com позволяла фильтровать по дате, щелкая «Показать инструменты поиска» в крайнем левом столбце начальной страницы результатов поиска, а затем выбирая желаемый диапазон дат. [35] Также возможно взвешивание по дате, потому что у каждой страницы есть время модификации. Большинство поисковых систем поддерживают использованиелогические операторы AND, OR и NOT, чтобы помочь конечным пользователям уточнить поисковый запрос . Логические операторы предназначены для буквального поиска, которые позволяют пользователю уточнить и расширить условия поиска. Двигатель ищет слова или фразы в точности так, как они были введены. Некоторые поисковые системы предоставляют расширенную функцию, называемую поиском по близости , которая позволяет пользователям определять расстояние между ключевыми словами. [32] Существует также поиск на основе концепций, при котором исследование включает использование статистического анализа страниц, содержащих искомые слова или фразы. Кроме того, запросы на естественном языке позволяют пользователю вводить вопрос в той же форме, в которой он задается человеку. [36] Такой сайт будет ask.com. [37]

Полезность поисковой системы зависит от значимости этого набора результатов он возвращает. Хотя могут быть миллионы веб-страниц, содержащих определенное слово или фразу, некоторые страницы могут быть более релевантными, популярными или авторитетными, чем другие. Большинство поисковых систем используют методы ранжирования результатов, чтобы в первую очередь предоставлять «лучшие» результаты. То, как поисковая система определяет, какие страницы лучше всего подходят и в каком порядке должны отображаться результаты, сильно различается от одной системы к другой. [32]Методы также меняются со временем по мере того, как меняется использование Интернета и появляются новые методы. Развиваются два основных типа поисковых систем: первый - это система заранее определенных и иерархически упорядоченных ключевых слов, которые люди широко запрограммировали. Другой - система, которая генерирует « перевернутый индекс », анализируя тексты, которые она находит. Эта первая форма в большей степени полагается на сам компьютер, который выполняет основную часть работы.

Большинство поисковых систем - это коммерческие предприятия, поддерживаемые доходами от рекламы, и поэтому некоторые из них позволяют рекламодателям за определенную плату повышать рейтинг своих объявлений в результатах поиска. Поисковые системы, которые не принимают деньги за результаты поиска, зарабатывают деньги, размещая объявления, связанные с поиском, рядом с результатами обычных поисковых систем. Поисковые системы зарабатывают деньги каждый раз, когда кто-то нажимает на одно из этих объявлений. [38]

Локальный поиск [ править ]

Локальный поиск - это процесс, оптимизирующий усилия местных предприятий. Они сосредоточены на изменениях, чтобы обеспечить согласованность всех поисковых запросов. Это важно, потому что многие люди определяют, куда они планируют пойти и что купить, на основе своих запросов. [39]

Доля рынка [ править ]

По состоянию на февраль 2021 года [40] Google является самой используемой поисковой системой в мире с долей рынка 92,04%, а другими наиболее часто используемыми поисковыми системами в мире были:

Россия и Восточная Азия [ править ]

В России доля Яндекса составляет 61,9% по сравнению с 28,3% у Google. [41] В Китае Baidu - самая популярная поисковая система. [42] Собственный поисковый портал Южной Кореи Naver используется для 70% поисковых запросов в стране. [43] Yahoo! Япония и Yahoo! Тайвань является наиболее популярным местом для поиска в Интернете в Японии и на Тайване соответственно. [44] Китай - одна из немногих стран, где Google не входит в тройку ведущих поисковых систем по доле рынка. Ранее Google был ведущей поисковой системой в Китае, но был вынужден прекратить свою деятельность из-за несоблюдения китайских законов. [45]

Европа [ править ]

На рынках большинства стран Западной Европы доминирует Google, за исключением Чехии , где Seznam является сильным конкурентом. [46]

Предвзятость поисковой системы [ править ]

Хотя поисковые системы запрограммированы на ранжирование веб-сайтов на основе некоторого сочетания их популярности и релевантности, эмпирические исследования указывают на различные политические, экономические и социальные предубеждения в предоставляемой ими информации [47] [48] и лежащих в основе предположениях о технологии. [49] Эти предубеждения могут быть прямым результатом экономических и коммерческих процессов (например, компании, которые размещают рекламу с помощью поисковой системы, также могут стать более популярными в своих обычных результатах поиска ), и политических процессов (например, удаление результатов поиска для соответствия с местным законодательством). [50] Например, Google не будет показывать некоторые неонацистские веб - сайты во Франции и Германии, где отрицание Холокоста незаконно.

Предубеждения также могут быть результатом социальных процессов, поскольку алгоритмы поисковых систем часто предназначены для исключения ненормативных точек зрения в пользу более «популярных» результатов. [51] Алгоритмы индексирования основных поисковых систем смещены в сторону охвата сайтов в США, а не сайтов из других стран. [48]

Использование Google Bombing является одним из примеров попытки манипулировать результатами поиска по политическим, социальным или коммерческим причинам.

Некоторые ученые изучали культурные изменения , запускаемые поисковые системы, [52] и представление некоторых спорных вопросов в своих результатах, такие как терроризм в Ирландии , [53] изменение климата отрицание , [54] и теории заговора . [55]

Настроенные результаты и пузыри фильтров [ править ]

Многие поисковые системы, такие как Google и Bing, предоставляют настраиваемые результаты на основе истории активности пользователя. Это приводит к эффекту, который получил название пузыря фильтра . Этот термин описывает явление, при котором веб-сайты используют алгоритмы, чтобы выборочно угадывать, какую информацию пользователь хотел бы видеть, на основе информации о пользователе (такой как местоположение, прошлые клики и история поиска). В результате веб-сайты, как правило, показывают только ту информацию, которая соответствует прошлой точке зрения пользователя. Это ставит пользователя в состояние интеллектуальной изоляции без информации об обратном. Яркими примерами являются персонализированные результаты поиска Google и персонализированный поток новостей Facebook . По словам Эли Паризера, кто придумал этот термин, пользователи меньше сталкиваются с противоречивыми точками зрения и интеллектуально изолированы в собственном информационном пузыре. Паризер привел пример, в котором один пользователь искал в Google по запросу "BP" и получил инвестиционные новости о British Petroleum, в то время как другой поисковик получил информацию о разливе нефти Deepwater Horizon и о том, что две страницы результатов поиска были "разительно разными". [56] [57] [58] По словам Паризера, эффект пузыря может иметь негативные последствия для гражданского дискурса. [59] С тех пор, как эта проблема была обнаружена, появились конкурирующие поисковые системы, которые стремятся избежать этой проблемы, не отслеживая или не «всплывая» пользователей, например DuckDuckGo.. Другие ученые не разделяют точку зрения Паризера, считая доказательства в поддержку его тезиса неубедительными. [60]

Религиозные поисковые системы [ править ]

Глобальный рост Интернета и электронных СМИ в арабском и мусульманском мире в течение последнего десятилетия побудил приверженцев ислама на Ближнем Востоке и на азиатском субконтиненте попробовать свои собственные поисковые системы, свои собственные поисковые порталы с фильтрами, которые позволили бы пользователям выполнять безопасный поиск . Эти исламские веб-порталы, более чем обычные фильтры безопасного поиска , классифицируют веб-сайты как « халяльные » или « харам » на основании толкования «Закона ислама» . ImHalal пришел онлайн в сентябре 2011 года Halalgooglingпоявился в сети в июле 2013 года. Они используют фильтры харама в коллекциях от Google и Bing (и других). [61]

В то время как отсутствие инвестиций и медленные темпы развития технологий в мусульманском мире препятствовали прогрессу и препятствовали успеху исламской поисковой системы, ориентированной на основных потребителей, приверженцев ислама, такие проекты, как Muxlim , сайт о мусульманском образе жизни, действительно получили миллионы долларов от таких инвесторов, как Rite Internet Ventures, и это тоже пошатнулось. Другие поисковые системы, ориентированные на религию, - это Jewogle, еврейская версия Google, [62] и SeekFind.org, которая является христианской. SeekFind фильтрует сайты, которые атакуют или унижают их веру. [63]

Представление поисковой системы [ править ]

Отправка веб-сайта в поисковую систему - это процесс, в котором веб-мастер отправляет веб-сайт непосредственно в поисковую систему. Хотя отправка в поисковую систему иногда представляется как способ продвижения веб-сайта, обычно в этом нет необходимости, поскольку основные поисковые системы используют веб-сканеры, которые в конечном итоге находят большинство веб-сайтов в Интернете без посторонней помощи. Они могут либо отправлять по одной веб-странице за раз, либо они могут отправлять весь сайт с помощью карты сайта , но обычно требуется только отправить домашнюю страницу.веб-сайта, поскольку поисковые системы могут сканировать хорошо спроектированный веб-сайт. Есть две оставшиеся причины для отправки веб-сайта или веб-страницы в поисковую систему: добавить совершенно новый веб-сайт, не дожидаясь, пока поисковая машина обнаружит его, и обновить запись веб-сайта после существенного изменения дизайна.

Некоторое программное обеспечение для отправки в поисковые системы не только отправляет веб-сайты в несколько поисковых систем, но также добавляет ссылки на веб-сайты с их собственных страниц. Это может оказаться полезным для повышения рейтинга веб-сайта, поскольку внешние ссылки являются одним из наиболее важных факторов, определяющих рейтинг веб-сайта. Однако Джон Мюллер из Google заявил, что это «может привести к появлению огромного количества неестественных ссылок для вашего сайта», что отрицательно скажется на рейтинге сайта. [64]

См. Также [ править ]

  • Сравнение поисковых систем
  • Поиск информации
  • Список поисковых систем
  • Ответ на вопрос
  • Пузырь с фильтром
  • Эффект Google
  • Использование поисковых систем в библиотеках
  • Семантическая сеть
  • Программа проверки орфографии
  • Инструменты веб-разработки
  • Эффект манипулирования поисковой системой
  • Конфиденциальность поисковой системы

Ссылки [ править ]

  1. ^ "Search Engine History.com" . www.searchenginehistory.com . Проверено 2 июля 2020 .
  2. ^ «Защищенный вход в систему WebAccess штата Пенсильвания» . webaccess.psu.edu . Проверено 2 июля 2020 .
  3. ^ Маркиори, Массимо (1997). «В поисках правильной информации в Интернете: гиперпоисковые системы» . Материалы Шестой Международной конференции в Интернете (WWW6) . Проверено 10 января 2021 .
  4. ^ a b Брин, Сергей; Пейдж, Ларри (1998). «Анатомия крупномасштабной гипертекстовой поисковой системы в Интернете» (PDF) . Материалы Седьмой Международной конференции в Интернете (WWW7) . Проверено 10 января 2021 .
  5. ^ «RFC 812 - ИМЯ / WHOIS» . ietf.org .
  6. ^ «Программирование Knowbot: Системная поддержка мобильных агентов» . cnri.reston.va.us .
  7. ^ Дойч, Питер (11 сентября 1990 г.). "[следующий] Сервер архивирования Интернета (был о Лиспе)" . groups.google.com . Проверено 29 декабря 2017 .
  8. ^ «Серверы всемирной паутины» . W3.org . Проверено 14 мая 2012 .
  9. ^ "Что нового! Февраль 1994" . Home.mcom.com . Проверено 14 мая 2012 .
  10. ^ "История Интернета - поисковые системы" (от Search Engine Watch ), Лейденский университет, Нидерланды, сентябрь 2001 г., веб-сайт: LeidenU-Archie .
  11. ^ a b pcmag. «Арчи» . pcmag.com . Проверено 20 сентября 2020 .
  12. ^ Александра Самуэль. «Познакомьтесь с Аланом Эмтаджем, черным технологом, который изобрел ARCHIE, первую поисковую систему в Интернете» . ИТАКА . Проверено 20 сентября 2020 .
  13. ^ петля новостей барбадос. "Алан Эмтадж - барбадосец, которого вы должны знать" . loopnewsbarbados.com . Проверено 21 сентября 2020 .
  14. ^ Dino Grandoni, Алан Эмтедж. «Алан Эмтаж: Человек, который изобрел первую в мире поисковую систему (но не запатентовал ее)» . HuffingtonPost .co.uk . Проверено 21 сентября 2020 .
  15. ^ Оскар Ньерстрасс (2 сентября 1993). "Каталог WWW ресурсов с возможностью поиска (экспериментальный)" .
  16. ^ "Архив NCSA, что нового на странице декабря 1993" . 2001-06-20. Архивировано из оригинала на 2001-06-20 . Проверено 14 мая 2012 .
  17. ^ "Что такое первопроходец?" . SearchCIO . TechTarget . Сентябрь 2005 . Дата обращения 5 сентября 2019 .
  18. ^ Оппиц, Маркус; Томсу, Питер (2017). Изобретая век облаков: как облачность продолжает менять нашу жизнь, экономику и технологии . Springer. п. 238. ISBN 9783319611617.
  19. ^ "Yahoo! Search" . Yahoo! . 28 ноября 1996 года Архивировано из оригинала 28 ноября 1996 года . Дата обращения 5 сентября 2019 .
  20. Гринберг, Энди, «Человек, обыгрывающий Google» ,журнал Forbes , 5 октября 2009 г.
  21. ^ Яньхонг Ли, «К качественной поисковой системе», IEEE Internet Computing , vol. 2, вып. 4. С. 24–29, июль / авг. 1998, DOI : 10,1109 / +4236,707687
  22. ^ "О сайте: RankDex" , rankdex.com
  23. ^ USPTO, "Hypertext Document поисковая система и метод" , США Номер патента: 5920859, изобретатель: Yanhong Li, дата подачи: 5 февраля 1997, дата выпуска: Июль 6, 1999
  24. ^ "Baidu против Google: близнецы поиска по сравнению" . FourWeekMBA . 18 сентября 2018 . Проверено 16 июня 2019 .
  25. ^ Altucher, Джеймс (18 марта 2011). «10 необычных вещей о Google» . Forbes . Проверено 16 июня 2019 .
  26. ^ a b «Метод ранжирования узлов в связанной базе данных» . Патенты Google. Архивировано 15 октября 2015 года . Проверено 19 октября 2015 года .
  27. ^ «Yahoo! и Netscape Ink International Distribution Deal» (PDF) . Архивировано из оригинального (PDF) 16 ноября 2013 года . Проверено 12 августа 2009 .
  28. ^ «Браузерные сделки подтолкнули Netscape к росту на 7,8%» . Лос-Анджелес Таймс . 1 апреля 1996 г.
  29. ^ Пурсель, Барт. Поисковые системы . Издательство Penn State Pressbooks . Проверено 20 февраля 2018 года .
  30. ^ Gandal, Нил (2001). «Динамика конкуренции на рынке поисковых систем в Интернете» . Международный журнал промышленной организации . 19 (7): 1103–1117. DOI : 10.1016 / S0167-7187 (01) 00065-0 .
  31. ^ «Наша история в глубине» . W3.org . Проверено 31 октября 2012 .
  32. ^ a b c d e f Jawadekar, Waman S (2011), «8. Управление знаниями: инструменты и технологии» , Управление знаниями: текст и кейсы , Нью-Дели: Tata McGraw-Hill Education Private Ltd, стр. 278, ISBN 978-0-07-07-0086-4, получено 23 ноября 2012 г.
  33. ^ Дасгупта, Анирбан; Гош, Арпита; Кумар, Рави; Олстон, Кристофер; Панди, Сандип; и Томкинс, Эндрю. Открываемость Интернета . http://www.arpitaghosh.com/papers/discoverability.pdf
  34. ^ Янсен, Б.Дж., Спинк, А., и Сарацевич, Т. 2000. Реальная жизнь, реальные пользователи и реальные потребности: исследование и анализ запросов пользователей в Интернете. Обработка информации и управление . 36 (2), 207-227.
  35. ^ Чита, Alex (30 августа 2007). «Простой способ найти недавние веб-страницы» . Операционная система Google . Проверено 22 февраля 2015 года .
  36. ^ " Универсальные системы ответов на вопросы: видение в синтезе ", Миттал и др., IJIIDS, 5 (2), 119-142, 2011.
  37. ^ http://www.ask.com . Проверено 10 сентября 2015 года.
  38. ^ "Как работает поисковая система?" . GFO = 26 июня 2018 г.
  39. ^ «Что такое местное SEO и почему так важен местный поиск» . Журнал поисковых систем . Проверено 26 апреля 2020 .
  40. ^ «Мировая доля рынка поисковых систем» . StatCounter GlobalStats . Проверено 4 марта 2021 года .
  41. ^ «Живой Интернет - Статистика сайта» . Живой Интернет . Проверено 4 июня 2014 .
  42. ^ Артур, Чарльз (2014-06-03). «Китайские технологические компании готовы доминировать в мире» . Хранитель . Проверено 4 июня 2014 .
  43. ^ "Как Naver вредит производительности компаний" . The Wall Street Journal . 2014-05-21 . Проверено 4 июня 2014 .
  44. ^ «Эпоха Интернет-империй» . Оксфордский институт Интернета . Проверено 15 августа 2019 .
  45. ^ Уоделл, Кава (2016-01-19). «Почему Google ушел из Китая - и почему он возвращается» . Атлантика . Проверено 26 апреля 2020 .
  46. ^ Сезнам берет на себя Google в Чешской Республике . Доз.
  47. ^ Segev, El (2010). Google и цифровой разрыв: предвзятость онлайн-знаний , Оксфорд: Chandos Publishing.
  48. ^ a b Воан, Ливен; Майк Телуолл (2004). «Предвзятость охвата поисковой системой: доказательства и возможные причины». Обработка информации и управление . 40 (4): 693–707. CiteSeerX 10.1.1.65.5130 . DOI : 10.1016 / S0306-4573 (03) 00063-3 . 
  49. ^ Янсен, Б.Дж. и Рие, С. (2010) Семнадцать теоретических конструкций поиска информации и извлечения информации . Журнал Американского общества информационных наук и технологий. 61 (8), 1517-1534.
  50. ^ Центр Беркмана по Интернету и обществу (2002), «Замена Google на альтернативные поисковые системы в Китае: документация и снимки экрана» , Гарвардская школа права.
  51. ^ Интрона, Лукас; Хелен Ниссенбаум (2000). «Формирование Интернета: почему важна политика поисковых систем». Информационное общество . 16 (3): 169–185. CiteSeerX 10.1.1.24.8051 . DOI : 10.1080 / 01972240050133634 . S2CID 2111039 .  
  52. ^ Хиллис, Кен; Пети, Майкл; Джарретт, Кайли (2012-10-12). Google и культура поиска . Рутледж. ISBN 9781136933066.
  53. ^ Рейли, П. (2008-01-01). Спинк, профессор д-р Аманда; Циммер, Майкл (ред.).Террористы «гуглили»: можно ли увидеть террористов из Северной Ирландии в поисковых системах Интернета? . Информационные науки и управление знаниями. 14 . Springer Berlin Heidelberg. С. 151–175. Bibcode : 2008wsis.book..151R . DOI : 10.1007 / 978-3-540-75829-7_10 . ISBN 978-3-540-75828-0. S2CID  84831583 .
  54. ^ Хироко Tabuchi, " Как изменение климата Deniers Поднимайтесь наверх в поисках Google ", The New York Times, 29 декабря, 2017. Проверено 14 ноября 2018.
  55. ^ Ballatore, А (2015). «Google Chemtrails: методология анализа представления темы в поисковых системах» . Первый понедельник . 20 (7). DOI : 10.5210 / fm.v20i7.5597 .
  56. ^ Parramore, Линн (10 октября 2010). "Пузырь фильтра" . Атлантика . Проверено 20 апреля 2011 . С 4 декабря 2009 года Google стал персонализированным для всех. Итак, когда этой весной у меня было двое друзей из Google «ВР», один из них получил набор ссылок, посвященных инвестиционным возможностям в ВР. Другой получил информацию о разливе нефти ....
  57. ^ Вайсберг, Джейкоб (10 июня 2011 г.). «Проблема с пузырями: превращает ли веб-персонализация нас в солипсистов?» . Шифер . Проверено 15 августа 2011 .
  58. Гросс, Дуг (19 мая 2011 г.). «Что от вас скрывает Интернет» . CNN . Проверено 15 августа 2011 . У меня были друзья Google BP, когда происходил разлив нефти. Это две женщины, которые во многом были очень похожи. Получено много результатов об экологических последствиях происходящего и разлива. Другой только что получил информацию об инвестициях и вообще ничего о разливе.
  59. ^ Чжан, Юань Цао; Séaghdha, Diarmuid Ó; Quercia, Даниэле; Джамбор, Тамас (февраль 2012 г.). «Ауралист: введение интуиции в музыкальные рекомендации» (PDF) . ACM WSDM . DOI : 10.1145 / 2124295.2124300 . S2CID 2956587 .  
  60. ^ О'Хара, К. (2014-07-01). «Поклонение эху». IEEE Internet Computing . 18 (4): 79–83. DOI : 10.1109 / MIC.2014.71 . ISSN 1089-7801 . S2CID 37860225 .  
  61. ^ "Новая одобренная исламом поисковая машина для мусульман" . News.msn.com. Архивировано из оригинала на 2013-07-12 . Проверено 11 июля 2013 .
  62. ^ "Jewogle - FAQ" .
  63. ^ "Halalgoogling: мусульмане получают свой собственный" Google без греха "; должны ли христиане иметь христианский Google? - христианский блог" . Христианский блог . 2013-07-25.
  64. ^ Шварц, Барри (2012-10-29). «Google: услуги отправки в поисковые системы могут быть вредными» . Круглый стол по поисковым системам . Проверено 4 апреля 2016 .

Дальнейшее чтение [ править ]

  • Стив Лоуренс; К. Ли Джайлз (1999). «Доступность информации в сети». Природа . 400 (6740): 107–9. Bibcode : 1999Natur.400..107L . DOI : 10.1038 / 21987 . PMID  10428673 . S2CID  4347646 .CS1 maint: multiple names: authors list (link)
  • Бинг Лю (2007 г.), Интеллектуальный анализ веб-данных: изучение гиперссылок, содержимого и данных об использовании . Springer, ISBN 3-540-37881-2 
  • Бар-Илан Дж. (2004). Использование поисковых машин в Интернете в исследованиях в области информатики. АРИСТ, 38, 231–288.
  • Левен, Марк (2005). Введение в поисковые системы и веб-навигацию . Пирсон.
  • Хок, Рэндольф (2007). Справочник искателя крайностей .ISBN  978-0-910965-76-7
  • Джавед Мостафа (февраль 2005 г.). «В поисках лучших результатов поиска в Интернете». Scientific American . 292 (2): 66–73. Bibcode : 2005SciAm.292b..66M . DOI : 10.1038 / Scientificamerican0205-66 .
  • Росс, Нэнси; Вольфрам, Дитмар (2000). «Поиск конечных пользователей в Интернете: анализ тематических пар терминов, представленных поисковой системе Excite». Журнал Американского общества информационных наук . 51 (10): 949–958. DOI : 10.1002 / 1097-4571 (2000) 51:10 <949 :: AID-ASI70> 3.0.CO; 2-5 .
  • Се, М .; и другие. (1998). «Параметры качества поисковых систем Интернета». Журнал информатики . 24 (5): 365–372. DOI : 10.1177 / 016555159802400509 . S2CID  34686531 .
  • Поиск информации: внедрение и оценка поисковых систем . MIT Press. 2010 г.

Внешние ссылки [ править ]

  • Поисковые системы в Curlie