Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Эта страница предназначена для запроса изменений URL-адресов, таких как отметка мертвых или переход на новый домен. Некоторые боты предназначены для исправления гниения ссылок, они могут быть уведомлены здесь, в том числе InternetArchiveBot и WaybackMedic . Эту страницу могут отслеживать операторы ботов из вики-сайтов на других языках, поскольку изменения URL-адресов универсальны.

Бот может конвертировать ссылки в httpS? [ редактировать ]

Есть несколько тысяч «HTTP» ссылки на WP на многих различных страницах моего сайта (чья домашняя страница http://penelope.uchicago.edu/Thayer/E/home.html ) , который действительно должен быть HTTP- S . Сайт защищен действующими сертификатами и т. Д. Может ли бот с этим быстро справиться?

24.136.4.218 ( разговорное ) 19:20, 11 февраля 2021 (UTC)

Изменения CIA.gov [ править ]

Похоже, что веб-сайт ЦРУ был обновлен, и они не перенаправляют со своих старых URL-адресов. Я не уверен, влияет ли это на URL-адреса вне The World Factbook . Изменения в расположении справочника:

Так что, вероятно, потребуется расширение кодов ISO 3166-1 alpha-2 до полного имени или ручное сопоставление из списка здесь . Хотя, вероятно, затронутых больше URL-адресов, чем только это, я решил начать с того, что знаю. Perryprog ( разговор ) 17:56, 22 января 2021 (UTC)

@ Perryprog : Карта уникальна для ЦРУ. У них есть Швейцария как «sz» (ISO «ch») и «ch» как Китай, и неизвестно что еще. Мне удалось создать карту из HTML-источника ссылки, которая, к счастью, содержит сопоставление, спасибо ЦРУ за то, что ключи хранятся в открытом виде :) - Зеленый C 03:13, 23 января 2021 г. (UTC)
Ой, наверное, не стоило предполагать, что это двухбуквенные коды ISO. Спасибо за должную осмотрительность :). Perryprog ( разговор ) 18:32, 23 января 2021 (UTC)
  • Карта для записи: Википедия: Link_rot / cases / cia-world-factbook - Green C 15:27, 25 января 2021 г. (UTC)

Полученные результаты:

  • Преобразовать старые в новые: 6 580 ( пример )
  • Преобразовать старые в архив: 28 ( Пример )
  • Преобразование : 1130 ( пример ){{CIA World Factbook link}}
  • Преобразование : 165 ( пример ){{Infobox economy}} |cianame=
  • Разные другие ссылки в шаблонах: ~ 40

Это предварительные результаты, возможно, еще предстоит узнать. - Зеленый C 04:52, 25 января 2021 г. (UTC)

GreenC , черт возьми , это очень полезно, особенно в том, что касается дополнительных шаблонов. Я волновался, что мне придется самому написать бота (хотя это было до того, как я понял, что есть проблемы, помимо простого изменения некоторых ссылок), прежде чем кто-то сказал мне, что WP: URLREQ существует :). Большое спасибо. Perryprog ( разговор ) 13:52, 25 января 2021 (UTC)
Пожалуйста, изменить URL сложно по многим причинам. Невозможно выполнить простой поиск-замену. Придется поработать с добавлением / удалением тегов, добавлением / удалением , пустыми и квадратными ссылками. Добавление и удаление архивных URL. Проверка нового URL-адреса работает, включая следующие редиректы (сайты с "интересными" заголовками). В любом случае, я посмотрю на другие URL-адреса ЦРУ рядом, чтобы узнать, что еще можно переместить. - Зеленый C 15:27, 25 января 2021 г. (UTC){{dead link}}{{webarchive}}

Диаграммы Hung Medien, греческий / мексиканский [ править ]

Привет. Я хотел бы запросить, можно ли найти и добавить заархивированные ссылки для greekcharts.com и mexicancharts.com. В настоящее время они используются без архивных ссылок, например, в A State of Trance 2007 и Icon (альбом Nirvana) . Спасибо! - MrLinkinPark333 ( обсуждение ) 00:06, 30 января 2021 г. (UTC)

MrLinkinPark333 , они были обработаны ботом (очень медленно из-за загрузок Wayback) и только несколько сохранений, подозреваю, что они уже были сделаны IAbot раньше. Также установите домены в глобальный черный список в базе данных IABot. - Зеленый C 01:37, 31 января 2021 г. (UTC)

mcleans.ca [ править ]

Я нашел несколько десятков неработающих ссылок на mcleans.ca. Можно ли заменить эти ссылки на архивные URL? Jarble ( разговорное ) 19:11, 2 февраля 2021 (UTC)

Jarble : 517 пользователей используют www2. Тест пары предполагает, что их можно снова оживить, убрав «2». Любой этот отчет 404 можно заархивировать. Проверим. - Зеленый C 22:21, 2 февраля 2021 г. (UTC)

результаты : преобразовано 575 URL в 496 статей. Несколько оставшихся www2 - это архивные URL. - Зеленый C 18:17, 3 февраля 2021 г. (UTC)

Заменить ссылки Airdisaster.com [ править ]

Скопировано- вставка ветки из WP: BOTREQ

Веб-сайт airdisaster.com, похоже, используется в нескольких статьях об авиационных происшествиях, но теперь он ссылается на спам-сайт / хранилище доменов, что кажется очень нежелательным для пользователей. Может ли кто-нибудь удалить прямые ссылки и, по возможности, связать их с заархивированной страницей? В частности, если он связан как внешняя ссылка, вхождения в ссылках, по-видимому, уже исправлены. Pieceofmetalwork ( talk ) 16:07, 9 января 2021 г. (UTC)

@ Pieceofmetalwork : Вы предлагаете добавить {{ webarchive }} как это изменение ? GoingBatty ( разговор ) 18:46, 10 января 2021 (UTC)
Да, это было бы хорошим решением. Pieceofmetalwork ( обсуждение ) 18:48, 10 января 2021 (UTC)
@ Cyberpower678 : Можно ли заменить эти ссылки ботом Internet Archive Bot ? Jarble ( разговорное ) 20:18, 22 января 2021 (UTC)
Предложите попробовать WP: URLREQ , Jarble . ProcrastinatingReader ( разговор ) 16:04, 2 февраля 2021 (UTC)
Да, это URLREQ, так как он также должен переключаться |url-status=unfit. - Зеленый C 21:36, 3 февраля 2021 г. (UTC)

Готово. Примеры изменений: [1] [2] [3] [4] и т. Д. - Зеленый C 03:16, 4 февраля 2021 г. (UTC).

наблюдатель.com [ править ]

Я обнаружил много неработающих ссылок на www.observer.com: некоторые (но не все) из этих ссылок больше не ведут к статьям, которые были изначально процитированы. Jarble ( разговор ) 21:04, 13 февраля 2021 (UTC)

Поскольку это смесь живых и мертвых, вероятно, лучше оставить это IABot, который должен уметь обнаруживать мертвых. - Зеленый C 03:19, 14 февраля 2021 г. (UTC)
@ GreenC : IABot их не обнаружит. Я попытался запустить IABot на этой странице , но ссылка по-прежнему неверна. Jarble ( разговорное ) 21:35, 11 марта 2021 (UTC)

IABot не сработает. Это довольно сложно. Первое впечатление - все "https" в порядке. Все "http" без имени хоста тоже нормально. Это сужает его до тысячи возможных проблемных URL . Некоторые из них работают, а некоторые нет. Некоторые также перенаправляют на нужные спам-ссылки |url-status=unfit. Есть закономерности, но есть и исключения. Мне может потребоваться выполнить пробный запуск, зарегистрировать, что он делает, создать правила, учитывающие ошибки, а затем выполнить рабочий запуск. Сложно сказать заранее, какими должны быть правила. Потребуется время, чтобы разобраться, есть много переменных. - Зеленый C 01:45, 12 марта 2021 г. (UTC)

Полученные результаты

  • 121 URL изменен ( пример )
  • 412 URL заархивированы ( пример )

Остальные уже заархивированы, работают или помечены . После того, как были обнаружены редиректы soft404, это было несложно. Если вы заметите какие-либо проблемы, дайте мне знать. @ Jarble : - Зеленый C 21:39, 13 марта 2021 г. (UTC){{dead link}}

sfsite.com/~silverag [ редактировать ]

Мой веб-сайт, ранее расположенный по адресу www.sfsite.com/~silverag, переместился на www.stevenhsilver.com. Его цитируют на многочисленных страницах википедии. Если бот сможет заменить строку sfsite.com/~silverag на stevenhsilver.com, это исправит неработающие ссылки. Шсильвер ( разговор ) 12:57, 14 февраля 2021 (UTC)

Привет, бот переключил 108 URL. Осталось 13, бот не смог определить. - Зеленый C 17:54, 14 февраля 2021 г. (UTC)
Спасибо. Некоторые из них переключились, другие указывали на страницы, которые я решил не загружать на новый сайт. Я ценю вашу работу и работу вашего бота. Шсильвер ( разговор ) 19:19, 14 февраля 2021 (UTC)

Агентство по сохранению исторического наследия Иллинойса [ править ]

Здравствуйте, Агентство по сохранению исторических памятников штата Иллинойс недавно закрыло свой веб-сайт, потому что он был основан на Adobe Flash, нарушив множество ссылок на документацию. Я только что проверил случайный, и он был в Интернет-архиве, поэтому я предполагаю, что боты, меняющие ссылки, могут заархивировать большое количество из них. Может ли кто-нибудь заставить бота собирать все URL-адреса формы http://gis.hpa.state.il.us/pdfs/XXXXXX.pdf и запускать их все через IA? «X» представляет собой число; в некоторых из этих файлов может быть пять или меньше цифр (XXXX.pdf) или семь или более (XXXXXXXX.pdf), поэтому не предполагайте, что все они шестизначные.

Спасибо! Ниттенд ( разговорное ) 19:27, 16 февраля 2021 (UTC)

Привет, Nyttend , результаты находятся в 1151 статье, 1035 URL-адресах архивов и 217 {{dead link}}добавленных. Сообщите мне, если вы заметите какие-либо проблемы . PDF-файлы являются самыми простыми, поскольку они либо явно работают, либо нет. - Зеленый C 01:35, 17 февраля 2021 г. (UTC)

Спасибо, GreenC . Если вы нажмете любую ссылку IHPA (даже мой образец XXXXXX), вы попадете на страницу с надписью «Новая версия HARGIS будет доступна в ближайшие недели». (Так было до того, как я сделал этот запрос; я спросил, потому что нет гарантии, что новый сайт будет использовать ту же структуру ссылок для своих PDF-файлов.) У вас есть способ найти, где находятся 217 мертвых ссылок? Когда я замечаю, что они разместили новую версию сайта, я могу вернуться и попросить помощи в восстановлении работы ссылок, но только в том случае, если у вас есть способ пройти через те, которые обработал ваш бот, без нарушения работы. архивирование 1035. Nyttend ( обсуждение ) 12:19, 17 февраля 2021 (UTC)
В этом случае 217 + 1035 может снова заработать (есть логи). Пингуйте меня, когда будете готовы, и посмотрю. Бот может разворачивать архивы, заменять неработающие ссылки на живые, перемещать схемы URL-адресов, извлекать новые URL-адреса из перенаправлений и т. Д. - Зеленый C 15:39, 17 февраля 2021 г. (UTC)

whitehouse.gov [ править ]

Многие ссылки whitehouse.gov исчезли после того, как домен недавно «сменил владельца». Редкий случай, когда многие википедисты могут быть рады смерти источников. Есть архив на https://trumpwhitehouse.archives.gov . Пример старого сломанного и нового рабочего URL:

  • https://www.whitehouse.gov/briefings-statements/president-donald-j-trump-award-national-medal-arts-national-humanities-medal/ ( archive.org, 7 января 2021 г. )
  • https://trumpwhitehouse.archives.gov/briefings-statements/president-donald-j-trump-award-national-medal-arts-national-humanities-medal/

Существует небольшая вероятность / риск того, что некоторые из неработающих ссылок снова заработают примерно через четыре года. Некоторые ссылки whitehouse.gov работают и не должны изменяться. Может ли бот разобраться? PrimeHunter ( разговорное ) 13:09, 25 февраля 2021 (UTC)

Некоторые старые ссылки на источники заархивированы на https://obamawhitehouse.archives.gov или https://georgewbush-whitehouse.archives.gov .
Пример Обамы неработающей и неработающей ссылки:
  • https://www.whitehouse.gov/the-press-office/statement-press-secretary-sjres-33
  • https://obamawhitehouse.archives.gov/the-press-office/statement-press-secretary-sjres-33
Пример Буша неработающей и неработающей ссылки:
  • https://www.whitehouse.gov/nsc/nss/2006/intro.html
  • https://georgewbush-whitehouse.archives.gov/nsc/nss/2006/intro.html
Некоторые ссылки работают через редиректы:
  • https://www.whitehouse.gov/the-press-office/2013/06/24/daily-briefing-press-secretary-jay-carney-6242013
перенаправляет на
  • https://obamawhitehouse.archives.gov/the-press-office/2013/06/24/daily-briefing-press-secretary-jay-carney-6242013
https://www.archives.gov/presidential-libraries/archived-websites также упоминает архивы Клинтона. Самый новый - https://clintonwhitehouse5.archives.gov/ от января 2001 года. Я не знаю, есть ли у нас неработающие ссылки, которые он мог бы исправить.
Бот может проверить каждую ссылку whitehouse.gov, чтобы узнать, работает ли она сейчас или в каком-либо из архивов. PrimeHunter ( разговорное ) 14:02, 25 февраля 2021 (UTC)
Хорошо, основываясь на вашем исследовании, я согласен, что стоит изучить, насколько хорошо это работает. Взглянем. - Зеленый C 14:25, 25 февраля 2021 г. (UTC)
  • Результаты : изменено 8 263 URL в 5 060 статьях. Изменена информация о метаданных, например |work=whitehouse.gov. Плюс другие общие исправления от WaybackMedic. Из любопытства: 67% были обнаружены описанным выше методом сканирования, а остальные имели рабочие редиректы в заголовке. Большинство рабочих переадресаций принадлежало Обаме, у Трампа была высокая доля 404-х и не было переадресаций, возможно, плохо обслуживаемых и / или слишком быстро после ухода с должности. Также некоторые страницы (10%?) Не могут быть заархивированы какой-либо службой веб-архива, они просто не работают, на странице есть что-то, что предотвращает веб-архивирование третьими сторонами, но, несмотря на это, они все еще работают в Национальном архиве. @ PrimeHunter : - Зеленый C 16:46, 3 марта 2021 г. (UTC)
@ GreenC : Отлично! Большое спасибо. У вас есть список неработающих ссылок, которые не удалось исправить? Я заметил один в [5] : https://www.whitehouse.gov/the-press-office/2013/05/20/president-obama-announces-sally-ride-recipient-presidential-medal-freedom . Он перенаправляет, но цель не работает. Спасибо за проверку, что перенаправление не помогло. Оказалось, что это наша вина. Настоящая ссылка [6] не имеет окончательного m, которое было добавлено небрежным редактором в [7] , поэтому нет общего исправления, которое мы можем извлечь из этого. PrimeHunter ( обсуждение ) 22:30, 3 марта 2021 г. (UTC)
Их было 30: Википедия: Link rot / cases / whitehouse.gov - Green C 22:55, 3 марта 2021 г. (UTC)
@ GreenC : Спасибо. Хорошее низкое число. Я исправил многие из них с помощью угадывания или поиска в Google, не найдя системы. Некоторые из них были явно нашей ошибкой с URL-адресом, который никогда бы не сработал. Следует ли мне удалить исправленные из Википедии: ссылка rot / cases / whitehouse.gov ? PrimeHunter ( разговорное ) 02:21, 4 марта 2021 (UTC)
Да, около 0,5% URL-адресов белого дома можно объяснить локальным вводом данных или ошибками удаленного сайта, это, вероятно, лучше, чем можно было ожидать. Это хорошая идея, чтобы проверить, и здорово, что вы смогли кое-что исправить. Используйте страницу как хотите, разметьте или удалите записи. - Зеленый C 03:12, 4 марта 2021 г. (UTC)

StarWars.com [ править ]

Все, что связано с http://www.starwars.com, следует изменить на https . Спасибо. JediMasterMacaroni  (Обсуждение) 18:20, 25 февраля 2021 (UTC)

Перенаправлено на User_talk: Bender235 # StarWars.com - Green C 19:04, 25 февраля 2021 г. (UTC)
Сделаю. - bender235 ( разговор ) 19:33, 25 февраля 2021 (UTC)
Спасибо. JediMasterMacaroni  (Обсуждение) 19:34, 25 февраля 2021 (UTC)

Заменить atimes.comссылки [ править ]

Пожалуйста, замените все экземпляры atimes.comи его поддомены на asiatimes.com. Старый сайт заменен рекламным сайтом. ~ Ase1este с harge четности т IME 10:11, 28 февраля 2021 (UTC)

Также, если соответствующая страница с новым доменом не найдена, не заархивирована, и есть архив со старым доменом, то не заменяйте URL, а добавьте ссылку на архив и отметьте статус URL как unfit. Спасибо. ~ Ase1este с harge четности т IME 10:26, 28 февраля 2021 (UTC)
Ok. Может потребоваться пара проходов, сначала для перемещения домена, где это возможно, а во-вторых, чтобы добавить архивы + непригодные для остальных. Работа над сайтом whitehouse.gov, приведенным выше, может занять как минимум несколько дней. - Зеленый C 15:46, 28 февраля 2021 г. (UTC)
Хорошо, спасибо, я могу подождать. ~ Ase1este с harge четности т IME 17:42, 28 февраля 2021 (UTC)

Результаты :

  • 287 URL-адресов изменены с atimes.com на asiatimes.com
  • 1995 URL преобразованы в архивы, включая файлы |url-status=unfit. Включает CS1 | 2, квадратные и голые ссылки
  • 3 ссылок не были архивов (в Питере Хехс , Таксин Чинават , Иран-Саудовская Аравия отношениях ). Добавлен . Требуется ручное внимание.{{dead link}}
  • 11 цитат преобразованы из [квадратная ссылка] в формат с .{{webarchive}}{{cite web}}|url-status=unfit
  • 1 URL в файле: пробел
  • Статус домена установлен в «Черный список» в базе данных IABot.

@ Aseleste : Думаю, это все, если увидишь что-нибудь еще, дай мне знать. - Зеленый C 04:23, 6 марта 2021 г. (UTC)

Выглядит хорошо, спасибо! ~ Ase1este с harge четности т IME 4:28, 6 марта 2021 (UTC)

www.geek.com [ править ]

Я нашел много неработающих ссылок в этом домене: можно ли их исправить автоматически? Jarble ( разговор ) 21:30, 11 марта 2021 (UTC)

Это та же ситуация, что и Observer.com - в базе данных IABot домен занесен в белый список, поэтому бот не проверяет / исправляет мертвые ссылки. Мой бот может попробовать, это намного проще, чем наблюдатель, так как цифры маленькие и требует проверки только на 404. - Зеленый C 01:51, 12 марта 2021 г. (UTC)