Кэш поиска является кэш из веб - страниц , который показывает страницу , как это было , когда он был проиндексирован веб - искателя . Кэшированные версии веб-страниц можно использовать для просмотра содержимого страницы, когда текущая версия недоступна, была изменена или удалена. [1]
Когда поисковый робот просматривает Интернет, он собирает содержимое каждой страницы, чтобы позволить этой странице индексироваться поисковой системой . В то же время он может хранить копию этой страницы. Поисковая машина может сделать копию доступной для пользователей в результатах поисковой системы. Сканеры, соблюдающие ограничения, указанные в файле robots.txt [2] или метатегах [3] веб-мастером, могут не предоставлять кэшированную копию пользователям поисковой системы, если им не дано указание не делать этого.
Поиск кэш двигателя может быть использован для расследования преступлений , [4] судебных разбирательств [5] и журналистики . [6] [1] Примерами поисковых систем, которые предлагают своим пользователям кешированные версии веб-страниц, являются Google Search , Bing , Yandex Search и Baidu .
Кэш поисковой системы может быть не полностью защищен обычными законами, защищающими поставщиков технологий от заявлений о нарушении авторских прав. [7]
Рекомендации
- ^ a b Вильфрид Рюттен (2012). Справочник по журналистике данных . ISBN O'Reilly Media, Inc. 9781449330064.
Когда страница становится спорной, издатели могут удалить ее или изменить без уведомления. Если вы подозреваете, что столкнулись с проблемой, в первую очередь нужно обратиться к кешу страницы Google, каким он был при последнем сканировании.
- ^ «Спецификации метатега роботов, data-nosnippet и X-Robots-Tag» .
noarchive: не показывать кешированную ссылку в результатах поиска.
- ^ «Специальные теги, которые понимает Google - Справка Search Console» .
noarchive - не показывать кешированную ссылку для страницы в результатах поиска.
- ^ Тодд Г. Шипли, Арт Боукер (2013). Расследование Интернет-преступлений: Введение в раскрытие преступлений в киберпространстве . Newnes. ISBN 9780124079298.
Для исследователя это может быть ценная информация. В зависимости от того, когда Google просканировал сайт, последняя страница может содержать информацию, отличную от текущей. Поэтому документирование и захват кэшированной страницы веб-страницы Google может быть важным шагом для обеспечения сохранения этого временного снимка.
- ^ Стивен Марк Леви (2011). Регулирование ценных бумаг: Книга ответов SEC . Интернет-издатели Aspen. ISBN 9781454805434.
Всемирная паутина не так эфемерна, как можно было бы подумать. Все большее количество старых веб-страниц доступно в Интернете через такие службы, как Wayback Machine, Google Cache, Yahoo Cache или Bing Cache. Адвокаты некоторых истцов и корпоративные слепцы пользуются этими услугами в обычном порядке.
- ^ Клеланд Том (2014-10-23). «Кеши Google и поисковая система .com предоставляют решения, позволяющие« быть забытыми »» . Press Gazette .
Журналисты также могут получить доступ к удаленному контенту через кеш Google.
- ^ Герман Де Бау, Валери Ванденвеге (июнь 2011 г.). «Апелляционный суд Брюсселя оставил в силе решение против Google News и Google Cache» . Архивировано из оригинала на 2015-04-26.
Что касается функции кэширования, Суд отклонил исключение «технически необходимой копии». Это исключение не распространяется на временное воспроизведение, которое является необходимой частью технического процесса, применяемого посредником для передачи в сети между третьими сторонами. По мнению Суда, копия кеша, которую Google хранит на своем сервере, технически не требуется для эффективной передачи.