Как и большинство крупных веб-сайтов , Википедия страдает от явления, известного как гниение ссылок , когда внешние ссылки становятся мертвыми , поскольку связанные веб-страницы или целые веб-сайты исчезают, изменяют свое содержание или перемещаются без перенаправления HTML. Это представляет собой серьезную угрозу политике надежности Википедии и ее руководящим принципам цитирования источников .
В общем, не удаляйте цитируемую информацию только потому, что URL-адрес источника больше не работает. Инструменты, процедуры и процессы доступны, как описано в этом документе.
Предотвращение гниения ссылок
Автоматическое архивирование
Ссылки, добавленные редакторами в основное пространство английской Википедии, автоматически сохраняются в Wayback Machine в течение примерно 24 часов (примечание: на практике не каждая ссылка сохраняется по разным причинам). Это делается с помощью программы под названием «NoMore404», которую запускает и поддерживает Internet Archive; включены вики-сайты на других языках. Он отслеживает API EventStreams , извлекает новые внешние URL-адреса и добавляет снимок в Wayback. Эта система стала активной где-то после 2015 года, хотя были предприняты и предыдущие попытки. Кроме того, где-то после 2012 года archive.today (он же archive.is) попытался заархивировать все внешние ссылки, которые тогда существовали в Википедии в то время. Это было неполно, но за этот период на archive.today было добавлено значительное количество ссылок, что сделало его основным архивным источником, заполняющим пробелы в охвате. Archive.today по-прежнему создает автоматические архивы по состоянию на 2020 год, хотя степень охвата и частота неизвестны.
По состоянию на 2015 год в Википедии есть бот и инструмент под названием WP: IABOT, который автоматизирует исправление гниения ссылок. Он постоянно проверяет все статьи в Википедии, если ссылка мертва, добавляет архивы в Wayback Machine (если еще нет) и заменяет мертвые ссылки в викитексте архивной версией. Этот бот запускается автоматически, но конечные пользователи также могут управлять им через веб-интерфейс. Он доступен при просмотре истории любой страницы, расположенной в верхней части страницы в строке «Внешние инструменты», с опцией «Исправить мертвые ссылки».
По состоянию на 2015 год, периодический бот WP: WAYBACKMEDIC проверяет наличие гниения ссылок в самих ссылках архива. Архивные базы данных динамичны и изменяются, архивы пропадают, перемещаются, добавляются новые и т. Д. Этот бот поддерживает существующие архивные ссылки в англоязычной Википедии. Он также выполняет архивирование по запросу на WP: URLREQ , это гибкий инструмент, который может выполнять множество пользовательских заданий.
Ручное архивирование
Предложения по способам улучшения архивирования вручную:
- Избегайте пустых URL-адресов . Используйте шаблоны цитирования, например, для цитирования и для разделов внешних ссылок.
{{cite web}}
{{webarchive}}
- Воспользуйтесь службой веб-архивирования, например Internet Archive или Archive.today . Полный список доступен на WP: Список веб-архивов в Википедии . В шаблонах цитирования введите URL-адрес архива
|archive-url=
и добавьте расширение|archive-date=
. Если ссылка все еще действительна, включите|url-status=live
, иначе установите|url-status=dead
. - Если ссылка все еще активна, но еще не заархивирована, посетите веб-сайт службы архивации по вашему выбору и запросите архивирование страницы.
- Запустите WP: IABOT на страницах через его пользовательский интерфейс.
Альтернативные методы
Большинство шаблонов цитирования имеют |quote=
параметр, который можно использовать для хранения текстовых цитат из исходного материала. Это можно использовать для хранения ограниченного количества текста из источника в шаблоне цитирования. Это особенно полезно для источников, которые нельзя заархивировать с помощью веб-служб архивирования. Он также может обеспечить страховку от сбоя выбранной службы веб-архивирования. Хранение всего текста источника не подходит для политик добросовестного использования , поэтому выбирайте только самые важные части текста, которые больше всего поддерживают утверждения в статье Википедии. Там, где это применимо, материалы, являющиеся общественным достоянием, могут быть скопированы в Викисорт .
Восстановление неработающей ссылки
Есть несколько способов восстановить неработающую ссылку, которые подробно описаны ниже:
Searching
Если мертвая ссылка содержит достаточно информации (название статьи, имена и т. Д.), Ее часто можно использовать для поиска веб-страницы в другом месте, либо на том же сайте, либо в другом месте.
Часто веб-страницы просто перемещались внутри одного и того же сайта. Индекс сайта или функция поиска по сайту - полезное место для поиска перемещенной страницы. Если эти инструменты недоступны, многие поисковые системы в Интернете разрешают поиск на указанном сайте.
В противном случае поиск страницы в Интернете может найти альтернативы.
Если вы найдете подходящий новый URL-адрес, вы можете изменить параметры в цитировании. Если цитата использует один из общих шаблонов (например , {{ цитируют сеть }}, {{ цитируют новости }}, {{ Citation }}), то вы можете редактировать следующим образом :
- Измените
|url=
указатель на новый URL-адрес; - Измените или добавьте,
|access-date=
чтобы относиться к текущей дате.
Интернет-архивы
Проверьте наличие заархивированных версий в одном из множества веб-архивов. Архивные службы «большой тройки» - это web.archive.org , webcitation.org и archive.is . На их долю приходится более 90% всех архивов Википедии, при этом web.archive.org составляет более 80% всех архивных ссылок. Другие архивные службы перечислены на WP: WEBARCHIVES .
Интерфейс Mementos позволяет выполнять поиск в нескольких службах архивации за один поиск. База данных Memento кэшируется, что означает, что результаты возвращаются быстро, но кеш также устаревает. Следовательно, на него не следует полагаться как на последнее слово - очень часто он может сообщать об отсутствии архивов, когда они на самом деле есть. Возможно, вам все равно придется выполнить работу по проверке отдельных архивных сайтов, но Mementos могут быть быстрой первой проверкой.
Архив сайта | Букмарклет |
---|---|
Archive.org | javascript : void ( window . open ( 'https://web.archive.org/web/*/' + location . href )) |
UKGWA | javascript : void ( window . open ( 'http://webarchive.nationalarchives.gov.uk/*/' + location . href )) |
Если доступно несколько архивных дат, используйте ту, которая, скорее всего, будет содержимым страницы, которую видел редактор, который ввел ссылку в |access-date=
. Если этот параметр не указан, можно выполнить поиск в истории изменений статьи, чтобы определить, когда ссылка была добавлена в статью.
Просмотрите архив, чтобы убедиться, что он содержит действительную информацию о странице. Обычно даты, близкие к времени размещения ссылки на странице Википедии или ранее, с большей вероятностью содержат достоверную информацию.
Если вы найдете подходящий URL-адрес архива, то можете добавить его в цитату. Если цитата использует один из общих шаблонов (например , {{ цитируют сеть }}, {{ цитируют новости }}, {{ Citation }}), то вы можете редактировать следующим образом :
- Оставьте
|url=
без изменений, указав на исходный URL. - Добавьте
|archive-url=
, указав на URL-адрес архива. - Добавить
|archive-date=
, указав дату сохранения архивной копии. Формат ГГГГ-ММ-ДД обычно самый простой, но можно использовать любой формат. - Добавить или изменить
|url-status=
. Используйте,|url-status=dead
если старый URL не работает. Использовать|url-status=unfit
или,|url-status=usurped
если старый URL-адрес был использован в целях рассылки спама, рекламы или иным образом непригоден. Использование|url-status=live
if по-|url=
прежнему работает и по-прежнему дает правильную информацию, но вы хотите заранее добавить|archive-url=
. - Оставьте
|access-date=
без изменений, ссылаясь на дату, когда предыдущий редактор последний раз обращался к|url=
. Некоторые редакторы считают, что|access-date=
следует удалить, как только работа|archive-url=
будет установлена, поскольку|url=
она больше не доступна, сохраняя|access-date=
ненужный беспорядок.
Устранение мертвой ссылки
Иногда все попытки восстановить ссылку оказываются безуспешными. В этом случае подумайте о поиске альтернативного источника, чтобы потеря оригинала не повредила проверяемости статьи. Альтернативные источники по широким темам обычно легко найти. Простой запрос поисковой системы может найти подходящую альтернативу, но будьте предельно осторожны, чтобы не цитировать зеркала и ответвления самой Википедии , которые нарушили бы Википедию: проверяемость .
Иногда найти подходящий источник невозможно или потребуются более обширные методы исследования, такие как посещение библиотеки или использование базы данных на основе подписки. Если это так, подумайте о том, чтобы проконсультироваться с редакторами Википедии на сайтах Wikipedia: WikiProject Resource Exchange , Wikipedia: Village pump или Wikipedia: Help desk . Также рассмотрите возможность обращения к экспертам или другим заинтересованным редакторам соответствующего WikiProject .
Иногда ссылка не работает, потому что веб-сайт переместил URL-адрес (например, http://example.com переместился на http://example.co.uk ). Если вы обнаружите подобное изменение URL-адреса, отправьте запрос на WP: BOTREQ на перемещение URL- адреса . Бот внесет изменения.
Сохранение мертвых ссылок
Мертвый неархивированный исходный URL все еще может быть полезен. Такая ссылка указывает на то, что информацию (вероятно) можно было проверить в прошлом, и эта ссылка может предоставить другому пользователю большие ресурсы или опыт с достаточной информацией, чтобы найти ссылку. Он также мог вернуться из мертвых. С помощью неработающей ссылки можно определить, цитировалась ли она в другом месте, или связаться с лицом, изначально ответственным за источник. Например, можно связаться с отделом компьютерных наук Йельского университета, если http://www.cs.yale.edu/~EliYale/Defense-in-Depth-PhD-thesis.pdf [ мертвая ссылка ] не работает. Поместите {{ dead link | date = June 2021}} после мертвой цитаты, непосредственно перед тегом, если применимо, оставив исходную ссылку нетронутой. При размещении {{ dead link }} статья автоматически классифицируется по категориям " Статьи с мертвыми внешними ссылками" и категории проекта, а также к определенной категории месячного диапазона дат на основе
|date=
параметра. Не удаляйте цитату только потому, что она давно помечена тегом {{ dead link }}.
Гниль ссылок на сайтах, не принадлежащих Викимедиа
Сайты, не принадлежащие Викимедиа, также подвержены гниению ссылок. После перемещения или удаления страницы ссылки на страницы Википедии с других веб-сайтов могут быть повреждены. В большинстве случаев перенаправление остается на старой странице - это не вызовет проблем. Но если страница полностью удалена или узурпирована (т. Е. Заменена другим контентом), гниение ссылок будет вызвано на любых внешних веб-сайтах, которые ссылаются на нее.
Замена содержимого страницы страницей устранения неоднозначности может по-прежнему вызывать гниение ссылок, но менее опасна, поскольку страница устранения неоднозначности по сути является типом мягкого перенаправления , которое приведет читателя к необходимому содержимому. Если страница узурпирована контентом для другого субъекта, который имеет такое же имя, вверху может быть размещена сноска, которая направляет читателей к исходному контенту на ее новой странице - это снова тип мягкого перенаправления, но менее очевидный. В этих случаях читатели, пришедшие по внешней неработающей ссылке, должны иметь возможность найти то, что они ищут, но такой ситуации лучше избегать, поскольку им придется попасть туда через дополнительную страницу, что может создать плохое впечатление как о Википедии, так и о ссылающийся веб-сайт.
Поскольку программное обеспечение Википедии не хранит Referer
информацию , будет невозможно определить, сколько внешних веб-страниц будет затронуто перемещением или удалением, но риск гниения ссылок, вероятно, будет наибольшим на старых и более высоких страницах профиля. По правде говоря, сделать можно не так много; обслуживание веб-сайтов, не относящихся к Викимедиа, не входит в компетенцию Викимедиа и в большинстве случаев не входит в наши возможности (хотя, если их можно исправить, было бы полезно сделать это). Однако может быть хорошей практикой подумать о потенциальном воздействии на другие сайты при удалении или перемещении страниц Википедии, особенно если не останется ни перенаправления, ни сноски. Если ожидается, что перемещение или удаление приведет к значительному ущербу, это может быть фактором, который следует учитывать в обсуждениях WP: RM , WP: AFD и WP: RFD , хотя другие факторы могут иметь большее значение.
Смотрите также
Эссе
- Википедия: Создавайте контент, чтобы выдержать
- Википедия: офлайн-источники
Инструменты и практические руководства
- Википедия: Запросы на гниение ссылок / изменение URL - просьба помочь изменить многие URL или пометить их как мертвые
- Справка: Использование Wayback Machine - практическое руководство
- Википедия: Использование WebCite - практическое руководство (примечание: с июня 2019 года WebCite больше не принимает новые запросы на архив)
- Википедия: Использование Archive.is - практическое руководство
- Special: LinkSearch - чтобы найти все страницы, содержащие определенный URL
- Википедия: Цитирование источников / Дополнительные соображения # Упреждающее архивирование - краткое руководство по использованию различных служб архивирования
- Википедия: Цитирование источников # Предотвращение и исправление мертвых ссылок
- Википедия: Внешние ссылки # Долговечность ссылок - предписывает удаление мертвых URL из раздела «Внешние ссылки»
- Категория: Статьи с голыми URL-адресами для цитирования - список статей, содержащих голые URL-адреса, подверженных риску ссылочного гниения, с разбивкой по месяцам.
- Категория: Статьи с мертвыми внешними ссылками - список статей, содержащих мертвые ссылки, с разбивкой по месяцам
Ботов
- InternetArchiveBot (IABot) - автоматически исправляет мертвые ссылки, когда это возможно, и помечает их, когда это не так.
- WaybackMedic - автоматически исправляет мертвые ссылки, которые трудно определить, другие общие исправления
- Пользователь: Legobot - может массово помечать ссылки с помощью . Запросы можно делать на User talk: Legoktm .
{{dead link}}
Внешние ссылки
- официальное дополнение Wayback для Firefox и Chrome [примечание 1]
- Resurrect Pages , сторонний дополнительный инструмент, предоставляет ссылки на семь веб-сайтов кеширования / архива при обнаружении неработающей ссылки. (Fire Fox)
- Webcache , надстройка для Opera. (снято с производства; доступны новые аналогичные надстройки)
- weblinkchecker.py - скрипт из коллекции Python Wikipedia Bot, который находит неработающие внешние ссылки.
Заметки
- ^ "Сохранить страницы в Wayback Machine" . Справочный центр Интернет-архива . 2018-08-24.