Из Википедии, бесплатной энциклопедии
< Пользователь: GreenC   (перенаправлено из Википедии: WAYBACKMEDIC )
Перейти к навигации Перейти к поиску
Подпишите first aid.svg
WaybackMedic
от GreenC

Wayback Medic 2.5 - это бот, который добавляет и поддерживает ссылки из списка известных сервисов веб-архивов в английской Википедии .

Изменения, внесенные после 04.12.2018, относятся к версии 2.5.

Оператором бота является Пользователь: GreenC . Учетная запись бота - Пользователь: Бот GreenC . Бот (программное обеспечение) - «WaybackMedic».


BotWikiAwk
Технические подробности
  • Изменения URL-адресов проверяются на удаленном сайте, чтобы убедиться, что они работают.
  • Проверка ссылок в реальном времени, без базы данных ссылок. Однако ссылки проверяются в течение 24 часов перед окончательной загрузкой diff.
  • Поддерживает множество API, включая Internet Archive, Memento, WebCite и API Timemap в отдельных сервисах.
  • Множественные проверки кода состояния заголовка HTTP на уровне приложения (WaybackMedic)
  • Дополнительные тайм-аут и повторные попытки встроены в библиотеки веб-передачи.
  • Дополнительные проверки уровня рабочих процедур на наличие сетевых и других ошибок - бот частично контролируется в известных проблемных областях.
  • Множественные избыточные проверки API с использованием нескольких дат, чтобы убедиться, что страница действительно недоступна.
  • Принимает результаты API, но затем проверяет, просматривая заголовки и / или содержимое страницы
  • Бот в основном написан на Nim (компилируется в исходный код C) с вспомогательными утилитами в Awk . Библиотеки были изготовлены на заказ, включая библиотеку строковых примитивов для регулярных выражений, библиотеку синтаксического анализа шаблонов вики, библиотеку OAuth (в awk), библиотеку интерфейса API MediaWiki, детектор soft404.
  • Из-за характера задачи запуск бота включает в себя изрядные накладные расходы на надзор, поэтому он требует обучения оператора, хотя шаги задокументированы в исходном пакете.

Бег [ править ]

Примерно каждые 2–3 месяца бот создает новую партию статей для обработки, от 50 000 до 100 000, для завершения которой требуется 1-2 недели, а затем делает перерыв перед следующей партией 2–3 месяца спустя. Обычно это следует за тем, как IABot редактирует те же статьи, которые IABot делал в течение этих 2–3 месяцев. Это потому, что WaybackMedic начал свою жизнь как средство исправления ошибок для IABot, и эту задачу он все еще может выполнять по мере необходимости. Также потому, что WaybackMedic не имеет средства проверки мертвых ссылок, поэтому он полагается на IABot, чтобы пометить ссылки мертвыми, чтобы он знал, какие из них могут быть сохранены.

[ править ]

$ GreenC , в соответствии с Условиями использования Фонда Викимедиа , сообщает, что ему заплатил Интернет-архив за его вклад в Википедию. Это финансирование предназначено для постоянного развития WaybackMedic и модуля InternetArchiveBot, связанного с книгами.

Общие источники [ править ]

  • GitHub

Цитаты [ править ]

Ссылки [ править ]

  • WaybackMedic 2.1
  • WaybackMedic 2.0
  • WaybackMedic 1.0
  • Утверждение бота
  • Пробные запуски