Технология поисковой системы


Поисковая система — это программа для поиска информации, которая обнаруживает, сканирует, преобразует и сохраняет информацию для поиска и представления в ответ на запросы пользователей . [1]

Поисковая система обычно состоит из четырех компонентов: поискового интерфейса, сканера (также известного как паук или бот), индексатора и базы данных. Сканер просматривает коллекцию документов, деконструирует текст документа и назначает суррогаты для хранения в индексе поисковой системы. Поисковые системы также хранят изображения, данные ссылок и метаданные документа.

Концепция гипертекста и расширения памяти восходит к статье, опубликованной в The Atlantic Monthly в июле 1945 года и написанной Ванневаром Бушем под названием « Как мы можем думать» . В этой статье Ванневар призвал ученых работать вместе, чтобы помочь создать свод знаний для всего человечества. Затем он предложил идею практически безграничной, быстрой, надежной, расширяемой, ассоциативной системы хранения и поиска в памяти. Он назвал это устройство мемексом . [2]

Буш считал понятие «ассоциативной индексации» своим ключевым концептуальным вкладом. Как он объяснил, это было «положение, согласно которому любой элемент может быть вызван по желанию немедленно и автоматически выбирать другой. Это основная особенность мемекса. Процесс связывания двух предметов вместе является важной вещью. [3]

Все документы, используемые в мемексе, будут представлены в виде копий микрофильмов, полученных как таковые или, в случае личных записей, преобразованных в микрофильмы самой машиной. Memex также будет использовать новые методы поиска, основанные на новом типе ассоциативного индексирования, основная идея которого заключается в том, что любой элемент может быть вызван по желанию немедленно и автоматически выбирать другой для создания личных «следов» через связанные документы. Новые процедуры, которые, как ожидал Буш, облегчат хранение и поиск информации, приведут к развитию совершенно новых форм энциклопедии.

Важнейшим механизмом, задуманным Бушем, является ассоциативный след. Это был бы способ создать новую линейную последовательность кадров микрофильма в любой произвольной последовательности кадров микрофильма путем создания цепной последовательности ссылок только что описанным способом, наряду с личными комментариями и боковыми следами.