archive.today (ранее archive.is ) - это сайт-архив, на котором хранятся снимки веб-страниц. [3] Он извлекает по одной странице за раз, аналогично WebCite , каждая размером менее 50 МБ, но с поддержкой тяжелых сайтов с JavaScript, таких как Google Maps и прогрессивных веб-приложений, таких как Twitter .
Тип сайта | Веб-архивирование |
---|---|
Доступно в | Многоязычный |
URL |
|
Коммерческий | да |
Регистрация | Нет |
Запущен | 16 мая 2012 г . [1] [2] |
Archive.today записывает одновременно два разных «снимка» веб-страницы. Один из них - это «Веб-страница», которая включает в себя все функциональные живые ссылки, которые есть в оригинале. Другой - «Снимок экрана», который обеспечивает статическую и неинтерактивную визуализацию представления. [4]
Функции
Функциональность
Archive.today может захватывать отдельные страницы в ответ на явные запросы пользователей. [5] [6] [7] С самого начала Archive.Today поддерживает сканирование страниц с URL-адресами, содержащими уже устаревший фрагмент хеш-бэга ( #! ). [8]
Archive.today записывает только текст и изображения, за исключением видео, XML , RTF , электронных таблиц ( xls или ods ) и другого нестатического содержимого. Он отслеживает историю сохраненных снимков, возвращая пользователю запрос на подтверждение перед добавлением нового снимка уже сохраненного Интернет-адреса. [9]
Страницы захватываются с шириной браузера 1024 пикселей. CSS преобразуется во встроенный CSS, удаляя отзывчивый веб-дизайн и селекторы, такие как :hover
и :active
. Контент, созданный с помощью JavaScript в процессе сканирования, остается в замороженном состоянии. [10] Имена классов HTML сохраняются внутри old-class
атрибута .
Когда текст выделен , апплет JavaScript [ требуется пояснение ] генерирует фрагмент URL-адреса, отображаемый в строке URL-адреса браузера, который автоматически выделяет эту часть текста при повторном посещении.
Веб-страницы не могут быть скопированы с archive.is на web.archive.org в качестве резервной копии второго уровня , поскольку archive.is делает исключение для Wayback Machine и не сохраняет свои снимки в формате WARC. Обратное - от web.archive.org к archive.is - возможно [11] [ круговая ссылка ], но копия обычно занимает больше времени, чем прямой захват. Некоторые веб-сайты удаляются из списков Internet Archive задним числом или блокируются для сохранения из-за их файла robots.txt , но Archive.today не использует это. [ необходима цитата ]
Панель инструментов исследования позволяет расширенные ключевые слова операторы, используя в *
качестве символа подстановки . Пара кавычек указывает поиск по точной последовательности ключевых слов, присутствующих в заголовке или теле веб-страницы, тогда как оператор insite ограничивает поиск конкретным доменом в Интернете. [12]
После того, как веб-страница заархивирована, ни один пользователь Интернета не может удалить ее напрямую. [13]
При сохранении динамического списка окно поиска archive.today показывает только результат, который связывает предыдущий и следующий раздел списка (например, 20 ссылок на страницу). [14] Остальные сохраненные веб-страницы фильтруются, и иногда их можно найти по одному из их вхождений. [ необходима цитата ]
Функция поиска поддерживается Google CustomSearch. Если это не дает результатов, archive.is пытается воспользоваться поиском Яндекса . [ необходима цитата ]
Если страница уже была заархивирована, archive.is просит пользователя подтвердить архивирование новой ревизии вместо того, чтобы сразу же архивировать ее. [ необходима цитата ]
При загрузке страницы отображается список URL-адресов отдельных элементов страницы с указанием размеров их содержимого, статусов HTTP и типов MIME . Этот список можно просмотреть только в процессе сканирования. [ необходима цитата ]
Можно загружать заархивированные страницы в виде ZIP-файла, за исключением страниц, заархивированных с 29 ноября 2019 года, когда Archive.Today изменил свой браузер с PhantomJS на Chromium . [15]
С июля 2013 года archive.today поддерживает интерфейс прикладного программирования (API) Memento Project . [16] [17]
История
Archive.today был основан в 2012 году. Первоначально сайт назывался archive.today, но в мае 2015 года основное зеркало было изменено на archive.is. [18]
В январе 2019 года он начал заменять домен archive.is на зеркало archive.today. [19]
Доступность по всему миру
Австралия
В марте 2019 года после стрельбы в мечети Крайстчерч сайт был заблокирован на шесть месяцев несколькими австралийскими интернет-провайдерами в попытке ограничить распространение видеозаписи нападения. [20] [21]
Китай
По данным GreatFire .org, archive.today заблокирован в Китае с марта 2016 года, [22] archive.li - с сентября 2017 года [23], а archive.fo - с июля 2018 года. [24]
Финляндия
21 июля 2015 года операторы заблокировали доступ к услуге со всех финских IP-адресов , заявив в Твиттере, что они сделали это, чтобы избежать эскалации спора с финским правительством. [25]
Россия
В России возможен только HTTP-доступ; HTTPS-соединения заблокированы. [26] [27]
по всему миру
С конца 2018 года Archive.today ввел ограничение данных , предположительно для защиты от атак типа «отказ в обслуживании» . Отдельные пользователи могут архивировать и / или извлекать только приблизительно от 10 до 20 мегабайт данных в день. После достижения этого ограничения их веб-сервер блокирует IP-адрес отдельного пользователя, больше не отвечая. [ необходима цитата ]
Смотрите также
- Цифровое сохранение
- Список инициатив веб-архивирования
- Интернет-архив
- Ссылка гниль
- Википедия: Ссылка гниль
- Perma.cc
- Wayback Machine
- Веб-архивирование
- WebCite
Рекомендации
- ^ Блог Archive.is - Когда изначально был запущен сайт Archive-is? в archive.today (архивировано 20 марта 2021 г.)
- ^ Archive.is - Викиреальность на archive.today (архивировано 29 апреля 2021 г.)
- ↑ Бринкманн, Мартин (22 апреля 2015 г.). «Создавайте общедоступные архивы веб-страниц с помощью Archive.is» . Гаки . Архивировано 12 апреля 2019 года . Дата обращения 13 июня 2015 .
- ^ Брюнель, Джастин Ф .; Келли, Мэт; Weigle, Michele C .; Нельсон, Майкл Л. (25 января 2015 г.). «Влияние JavaScript на архивируемость» (PDF) . Международный журнал электронных библиотек . 17 (2): 95–117. DOI : 10.1007 / s00799-015-0140-8 . S2CID 8433375 . Архивировано 27 мая 2019 года (PDF) .
- ^ Даскалеску, Дан (18 февраля 2013 г.). «Архивирование веб-страниц - Wiki Дэна Даскалеску (обзор)» . Wiki.dandascalescu.com. Архивировано из оригинального 22 сентября 2013 года . Проверено 3 октября 2013 года .
- ^ Коблер, Джейсон (29 октября 2014 г.). «Уважаемый GamerGate, пожалуйста, прекратите воровать наше дерьмо» . Материнская плата . Архивировано 27 мая 2019 года . Проверено 22 марта 2017 года .
Веб-сайт не может защитить себя от зеркального копирования сайта пользователем Archive.today.
- ^ "archive.is/faq" . archive.is . Проверено 15 февраля 2019 .
- ^ «Домашняя страница Archive.is в 2013 году» . Архивировано из оригинального 12 января 2013 г.
Он может сохранять страницы с сайтов Web 2.0 даже с hashbang URL - адресов, например http://twitter.com/#!/medvedevrussia
- ^ «Пример истории снимков на archive.is» .
- ^ Сгенерированная JavaScript анимация загрузкивидео Dailymotion, появляющаяся в замороженном состоянии
- ^ «Пример: страница сохранена из веб-архива в Archive.is» . Архивировано из оригинального 20 мая 2013 года . Проверено 23 октября 2019 года .
- ^ Например, строка insite: https://en.wikipedia.org "World Cup" возвращает "World + Cup" / связанные снимки.
- ^ «Некоторые часто задаваемые вопросы» . archive.is блог . 24 января 2013 года. Архивировано 26 сентября 2013 года . Проверено 12 ноября 2018 .
- ^ «Пример динамического списка, полученного Worldcat» .
- ^ «Блог Archive.is» . 17 июля 2020 г. Архивировано 3 октября 2020 г.
- ^ Нельсон, Майкл Л. (9 июля 2013 г.). «Archive.is поддерживает Memento» . Обновления исследований и преподавания . Группа исследований веб-науки и электронных библиотек в Университете Олд Доминион . Архивировано 27 июля 2013 года . Проверено 17 сентября 2013 года .
- ^ "archive.is" . Информация протокола Memento . Мементо Девелопмент Групп. Архивировано из оригинального 15 сентября 2013 года . Проверено 17 сентября 2013 года .
- ^ «Почему вы изменили URL-адрес с« archive-today »на« archive-is »?» . Archive.is Блог . 3 мая 2015. Архивировано 1 июня 2015 года . Проверено 6 января 2019 .
- ^ @archiveis (4 января 2019 г.). «Пожалуйста, не используйте зеркало archive.IS для связывания, используйте другие зеркала [.TODAY .FO .LI .VN .MD .PH]. .IS может скоро перестать работать» (твит). Архивировано 6 января 2019 года - через Twitter .
- ^ «Интернет-провайдеры в Австралии и Новой Зеландии начинают беззаконную цензуру в Интернете» . Частный доступ в Интернет . 19 марта 2019 . Проверено 20 марта 2019 .
- ^ «Новозеландские интернет-провайдеры заявляют, что блокируют сайты, которые не могут удалить видеоролики, снятые в Крайстчерче» . Gizmodo Australia . 19 марта 2019. Архивировано 18 мая 2019 года . Проверено 20 марта 2019 .
- ^ «archive.is на 100% заблокирован в Китае» . Анализатор GreatFire . 12 августа 2018. Архивировано 12 августа 2018 года.
- ^ «archive.li на 100% заблокирован в Китае» . Большой пожарный анализатор . 12 августа 2018. Архивировано 12 августа 2018 года.
- ^ «archive.fo на 100% заблокирован в Китае» . Большой пожарный анализатор . 12 августа 2018. Архивировано 12 августа 2018 года.
- ^ Лапинти, Ласси (22 июля 2015 г.). "Suomalaisilta estettiin haktivistien suosimalla verkkosivulla käynti" [доступ финнов к веб-сайту, используемому хактивистами]. Iltalehti (по-фински). Архивировано 27 мая 2019 года . Проверено 4 марта 2016 года .
- ^ Елистратов, Владимир (29 января 2016 г.). "Роскомнадзор заблокировал сервис archive.is, хранящий копии веб-сайтов"Роскомнадзор заблокировал сервис archive.is, хранящий копии веб-сайтов. TJournal (на русском языке). Архивировано 30 августа 2017 года . Проверено 30 января 2016 года .
- ^ Кушинг, Тим (4 февраля 2016 г.). «Россия блокирует еще один архивный сайт, потому что он может содержать старые страницы о наркотиках» . Techdirt . Архивировано 23 марта 2019 года . Проверено 26 февраля +2016 .
Внешние ссылки
- Официальный веб-сайт
- Блог Archive.is на Tumblr
- archive.today в Твиттере
- Archive.today на Crunchbase