Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

archive.today - это сервис веб-архивации по запросу по адресу https://archive.today . Служба веб-архивирования позволяет редакторам Википедии уменьшить количество ссылок , сохраняя копию онлайн- источника, к которому можно получить доступ, если исходная страница перемещается, изменяется или исчезает. Не все веб-страницы можно заархивировать с помощью archive.today. [1]

archive.today может архивировать веб-страницы HTML , таблицы стилей , JavaScript и цифровые изображения .

Помимо https://archive.today , домен также доступен через псевдонимы, включая https://archive.is , .li, .fo, .ph. .vn и .md

Отличия от других архиваторов [ править ]

Другие службы веб-архивирования включают Wayback Machine и (устаревший) WebCite . Эти три функции работают по-разному, и определенные страницы могут быть заархивированы одной, но не другой. Wayback Machine в определенное время делает снимки веб-страниц, а также инициирует процесс архивирования по запросам пользователей; WebCite требует, чтобы кто-то активно заархивировал ссылку. Аналогичная функция доступна для Wayback Machine . [2] [ не удалось проверить ]

Известно, что archive.today активно блокирует определенные рекурсивные службы DNS [3] и может быть недоступен для всех в сети.

Другими стабильными, но менее известными архивами по запросу являются https://www.freezepage.com (с 2004 г. [4] ) и https://megalodon.jp (с 2006 г. [5] ).

Авторские права и robots.txt [ править ]

archive.today удаляет заархивированные страницы по запросу правообладателей в соответствии с законом США "Об авторском праве в цифровую эпоху"; [6] запросы могут быть сделаны по ссылке «Сообщить о нарушении» на заархивированных страницах archive.today. Повторный хостинг материалов, защищенных авторским правом США, без разрешения может быть нарушением Закона США об авторском праве в цифровую эпоху (DMCA) - по этой причине, чтобы избежать причастности Википедии к нарушениям законов об авторском праве и выполнения запросов на удаление DMCA, следует использовать archive.today с некоторой осторожностью в отношении содержания, защищенного авторским правом США.

История поставщиков robots.txt и архивов длиннее и сложнее, чем посвящено это эссе. Вкратце, стандарт исключения роботов никогда не предназначался для использования поставщиками архивов. Использование robots.txt для этой цели, по сути, является взломом, который привел к непредвиденным последствиям, например, домены были захвачены или сменили владельца, и новый владелец домена добавил robots.txt, который заставляет провайдеров архивов блокировать отображение архивов из исходный сайт, хотя на старом сайте никогда не было файла robots.txt - Тем не менее, некоторые поставщики архивов согласились использовать robots.txt в качестве метода, позволяющего конечным пользователям сигнализировать, что они не хотят, чтобы их страницы были публично архивированы и / или отображены если уже заархивированы). archive.today не соблюдает стандарт исключения роботов . [7]Wayback Machine ранее [8] использовала его, чтобы избежать архивирования материалов, которые владельцы сайтов не хотят архивировать. [9] [10]

Обратите внимание, что иногда может быть хорошей идеей добавить несколько поставщиков архивов для ключевого материала. В Википедию можно добавить несколько ссылок с помощью .{{webarchive}}

Как архивировать [ редактировать ]

Есть несколько способов отправить веб-страницу в archive.today для архивирования. Для новых пользователей предлагается форма сайта. Остальные методы лучше подходят тем, кто регулярно пользуется archive.today.

Форма веб-сайта [ править ]

Этот метод прост в использовании. Чтобы заархивировать веб-страницу, необходимо перейти на сайт archive.today.

  1. В https://archive.today/введите URL-адрес веб-страницы, которую вы хотите заархивировать, в поле «Мой URL-адрес активен, и я хочу заархивировать его содержимое» (красное).
  2. Нажмите кнопку «Отправить». Когда процесс архивирования завершится (обычно это занимает 5-15 секунд), вы будете отправлены на страницу архива.
  3. Рекомендуется просмотреть страницу архива, чтобы проверить, был ли процесс архивирования успешным.

Букмарклет [ править ]

Букмарклет является браузер закладки веб , который выполняет определенную функцию. Букмарклет archive.today при нажатии берет URL-адрес страницы, которую вы в данный момент просматриваете, и отправляет ее в archive.today для архивирования. Этот метод прост в настройке и удобен. Рекомендуется, чтобы ваша панель закладок / избранного была видна или, по крайней мере, ваши закладки были доступны в течение одного или двух щелчков мышью. Этот метод позволяет архивировать только страницу, которую вы просматриваете в данный момент. Чтобы заархивировать другую веб-страницу, вам придется использовать другой метод.

  1. Чтобы настроить букмарклет, сначала создайте закладку для любой страницы. Затем выполните следующие два шага, чтобы заставить его работать.
  2. Измените или введите имя закладки (например archive.today).
  3. Измените или введите javascript:void(open('https://archive.today/?run=1&url='+document.location))в поле Местоположение.
  1. Чтобы использовать букмарклет, просто щелкните его, когда вы находитесь на веб-странице, которую хотите заархивировать. Он запускает процесс архивирования. Когда процесс будет завершен (обычно это занимает 5-15 секунд), вы будете отправлены на заархивированную страницу.
  2. Рекомендуется просмотреть страницу архива, чтобы проверить, был ли процесс архивирования успешным.

Умное ключевое слово Firefox [ править ]

Интеллектуальные ключевые слова Firefox обычно используются для выполнения поиска в адресной строке Firefox или для открытия закладки путем ввода ключевого слова в адресную строку Firefox. Здесь мы собираемся использовать умное ключевое слово, чтобы отправить URL-адрес на archive.today для архивации. Этот метод довольно прост в настройке.

  1. Чтобы настроить интеллектуальное ключевое слово, нажмите Ctrl + Shift + B, чтобы открыть библиотеку закладок (или нажав оранжевую кнопку Firefox в верхнем левом углу окна, затем перейдите в «Закладки», затем «Показать все закладки»).
  2. Перейдите в место, в котором вы хотите сохранить закладку с интеллектуальными ключевыми словами.
  3. В меню вверху окна нажмите «Упорядочить», затем «Новая закладка».
  4. Введите имя закладки (например archive.today).
  5. Введите https://archive.today/?run=1&url=%sв поле Местоположение.
  6. Введите ключевое слово для закладки. Вы должны выбрать что-нибудь короткое, и это ключевое слово уже не должно использоваться для другой закладки (например wc).
  7. Нажмите кнопку «Добавить». Закройте библиотеку закладок.
  1. Чтобы использовать интеллектуальное ключевое слово, добавьте выбранное вами ключевое слово (" wc" в приведенном выше примере), а затем пробел ("  ") перед URL-адресом веб-страницы, которую вы хотите заархивировать, в адресной строке Firefox. (например, если вы используете «a» в качестве ключевого слова, текст в адресной строке будет таким a http://www.example.com/pageyouwantoarchive.html).
  2. Нажмите Enter. Он инициирует процесс архивирования. Когда процесс архивирования завершится (обычно это занимает 5-15 секунд), вы будете отправлены на страницу архива.
  3. Рекомендуется просмотреть страницу архива, чтобы проверить, был ли процесс архивирования успешным.

Поисковая система Chrome [ править ]

Хотя это создается с помощью функции поисковой системы Chrome, она работает так же, как умное ключевое слово в Firefox. Этот метод довольно прост в настройке.

  1. Чтобы настроить «поисковую систему», щелкните правой кнопкой мыши адресную строку и выберите «Редактировать поисковые системы ...». В конце появившегося списка вы можете добавить «поисковую систему».
  2. Введите название «поисковой системы» в первое поле (например, archive.today).
  3. Во втором поле введите ключевое слово для «поисковой системы». Вы должны выбрать что-нибудь короткое, и это ключевое слово уже не должно использоваться (например wc).
  4. Введите https://archive.today/?run=1&url=%s&в третье поле.
  5. Нажмите Enter, чтобы сохранить «поисковик».
  1. Чтобы использовать "поисковую систему", добавьте выбранное вами ключевое слово (" wc" в приведенном выше примере), а затем пробел ("  ") перед URL-адресом веб-страницы, которую вы хотите заархивировать, в адресной строке Chrome (например, Если вы используете «a» в качестве ключевого слова, текст в адресной строке будет иметь вид a http://www.example.com/pageyouwantoarchive.html).
  2. Нажмите Enter. Вы будете отправлены на страницу, содержащую ссылку на URL-адрес архива веб-страницы, которую вы хотите заархивировать.
  3. Рекомендуется просмотреть страницу архива, чтобы проверить, был ли процесс архивирования успешным.

Использовать в Википедии [ править ]

Ссылки, заархивированные с помощью archive.today, должны отображаться в длинном формате. (См. Обсуждение в Википедии: Использование archive.today § RfC: Следует использовать URL-адреса в коротком или длинном формате? )

Пример длинного формата:

https://archive.today/YYYY.MM.DD-hhmmss/http://www.example.com

Этот архив URL может быть вставлен в archiveurl=и его поддержку archivedate=и url-status=параметры в любой из шаблонов цитирования . Если исходный URL-адрес больше недоступен , url-statusзначение параметра должно быть установлено на dead. Если исходный URL-адрес все еще доступен, url-statusзначение параметра должно быть установлено на live.

<ref>{{cite web |last= |first= |title= |work= |publisher= |date= |url= |archive-url= |archive-date= |url-status= }}</ref>.

Поиск ранее заархивированных веб-страниц [ править ]

Веб-страницы, ранее заархивированные через archive.today, доступны через базу данных с возможностью поиска. Пользователи могут выполнять поиск по URL-адресу, домену или их подстановочным знакам .

Консенсус [ править ]

Запрос на комментарий (RFC) , состоявшийся в Википедии: Archive.is RFC 4 закончился в июне 2016 года с консенсусом , чтобы удалить archive.is из черного списка. Предыдущий консенсус, установленный ранее в Wikipedia: Archive.is RFC 3 , заключался в том, чтобы занести в черный список ссылки на archive.today, как только все существующие ссылки будут удалены.

См. Также [ править ]

  • Википедия: гниение ссылок , практическое руководство по предотвращению гниения ссылок
  • Википедия: Использование Wayback Machine , практическое руководство
  • Википедия: Использование WebCite , практическое руководство
  • Обсуждение: Perma.cc § Perma.cc и Википедия , об использовании Perma.cc

Ссылки [ править ]

  1. ^ "FAQ" . Страница не может быть заархивирована по ряду причин. archive.today не поддерживает архивирование файлов Portable Document Format , аудио и видео. Страница может быть слишком большой (ограничение на одну страницу составляет 50 МБ). Контент может быть недоступен из сети archive.today (это особенно вероятно, если вы пытаетесь получить доступ к контенту на основе подписки, на который ваше учреждение подписывается от имени своих пользователей). Кроме того, содержимое может быть нечитаемым архиватором archive.today (слишком сложные страницы, основанные на JavaScript, могут привести к сбою его браузера или выполняться слишком долго, или те, которые связаны с проверками браузера, иногда приводят к сбою нашего механизма архивирования).
  2. ^ Harihareswara, Суман (3 сентября 2013). «Wikitech-l - формат ленты последних изменений» . Список технической рассылки Wikimedia.org . Архивировано 26 октября 2013 года.
  3. ^ "archive.today в Твиттере" .
  4. ^ http://web.archive.org/web/20041211061008/http://www.freezepage.com/
  5. ^ http://web.archive.org/web/20061118031122/http://megalodon.jp/print.php
  6. ^ «Как удалить заархивированную страницу» . Блог . 24 января 2013 года. Архивировано 26 сентября 2013 года.
  7. ^ Dăscălescu, Dan (18 февраля 2013). «Архивирование веб-страниц» . Вики . Дэн Даскалеску. Архивировано 22 сентября 2013 года.
  8. ^ «Robots.txt, предназначенный для поисковых систем, не работает с веб-архивами» .
  9. ^ «Удаление документов из Wayback Machine» . Архивировано 15 октября 2002 года.
  10. ^ "Некоторые сайты недоступны из-за robots.txt или других исключений. Что это означает?" . FAQ . Архивировано 4 октября 2002 года.