Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

UK Web Archive является партнерством шести британских правовым депозитных библиотек, целью которого является собрать все веб - сайты в Великобритании , по крайней мере один раз в год. [1]

История [ править ]

В 2005 году Британская библиотека , Национальный архив , Wellcome Trust , Национальная библиотека Шотландии , Национальная библиотека Уэльса и JISC создали Консорциум веб-архивации Великобритании, проект по архивированию веб-сайтов. [3]

UKWAC заархивировал выбранные веб-сайты по лицензии или с разрешения, используя программное обеспечение PANDAS, разработанное Национальной библиотекой Австралии . В ходе проекта его участники собрали интересующие их сайты; Библиотека Wellcome собрала медицинские сайты , сайты национальных библиотек, отражающие жизнь современного Уэльса или Шотландии. Британская библиотека проводила широкую политику сбора памятников культурного, исторического и политического значения для Великобритании. [4]

Консорциум был ликвидирован в 2010 году. Рабочая группа по архивированию и сохранению взяла на себя координирующую роль UKWAC в веб-архивировании в Великобритании. Digital Сохранность коалиция принимает рабочую группу. [5]

Веб-архивирование [ править ]

Архив ежегодно выполняет сканирование .uk и других географических доменов верхнего уровня Великобритании, таких как .scot , .cymru или .london .

График, показывающий небольшую часть сканирования . Каждый круг - это отдельный веб-сайт, а каждая линия представляет собой ссылку, по которой переходили между веб-сайтами. Размер круга показывает, сколько страниц было посещено с этого сайта, а ширина линии представляет количество переходов по ссылкам. UKWA Crawls: один час за одну минуту

Сканирование архивируется в общей инфраструктуре, называемой системой цифровой библиотеки . Представители общественности могут номинировать сайты для сохранения на сайте UKWA . Весь веб-архив доступен зарегистрированным читателям в помещениях библиотеки; и если разрешение было дано или условия лицензии могут быть выполнены, копии также доступны через веб-сайт. [6]

В архиве собраны сайты, посвященные событиям, построение коллекций - в них сохранились письменные материалы и изображения, записывающие стихийные бедствия , избирательные кампании с 2005 года, блогосфера Великобритании для исследований, а также более сотни других. [7]



SHINE [ править ]

График SHINE, показывающий, как часто различные фразы для « проблемы 2000 года » появляются в период с 1996 по 2013 год на заархивированных веб-страницах .uk.

Британский веб-архив содержит коллекцию всех веб-сайтов .uk, которые были заархивированы Интернет-архивом до конца марта 2013 года. [8] SHINE - это веб-интерфейс, который можно использовать для создания повторяющихся списков результатов исторических .uk страниц. Тенденции или появления ключевых слов в наборе данных на страницах .uk за это время используют согласование для отображения ключевых слов в контексте. [9]

Сувениры [ править ]

Memento - это название предыдущих версий веб-страниц, созданных Memento Project . Интерфейс Memento веб-архива Великобритании позволяет находить сувениры в веб-архивах . [10] Интерфейс можно использовать для поиска Memento по дате в таблице снимков или для просмотра того, как часто сайт появляется в общедоступных веб-архивах.

Изучение архива [ править ]

Исследования Интернета как отражения общества помогли расширить доступ к архиву. [11] Библиотеки разработали руководства для изучения навыков, необходимых для использования веб-архивов. К ним относятся использование больших данных для выявления закономерностей или тенденций [12] или написание ссылок на архивные копии веб-сайтов. [13]

GLAM Workbench [ править ]

GLAM Workbench - это проект, который изучает, как исследователи могут использовать данные, хранящиеся в галереях, библиотеках, архивах и музеях. [14] Он включает в себя коллекцию записных книжек Jupyter, в которых используются Mementos и индексные данные. [15] В записных книжках сочетаются описание и редактируемый код, чтобы помочь исследователям находить доказательства в веб-архивах.

См. Также [ править ]

  • Национальные рекорды Службы непрерывности Интернета в Шотландии [16]
  • Веб-архив государственного архива Северной Ирландии [17]
  • Веб-архив правительства Великобритании
  • Веб-архив парламента Великобритании [18]

Ссылки [ править ]

  1. ^ "UKWA Home" . www.webarchive.org.uk . Проверено 13 октября 2020 .
  2. ^ https://www.legislation.gov.uk/uksi/2013/777/contents/made
  3. ^ «15 лет веб-архиву Великобритании - первые годы - блог британского веб-архива» . blogs.bl.uk . Архивировано 8 марта 2020 года . Проверено 13 октября 2020 .
  4. ^ «Консорциум веб-архивирования Великобритании: отчет об оценке» . Коалиция цифрового сохранения . Коалиция цифрового сохранения. Апрель 2006 Архивировано из оригинала 9 января 2017 года . Проверено 17 марта 2014 года .
  5. ^ "Рабочая группа по веб-архивированию и сохранению - Коалиция по сохранению цифровых данных" . www.dpconline.org . Архивировано 31 июля 2020 года . Проверено 13 октября 2020 .
  6. ^ "Что такое веб-архив Великобритании?" . Веб-архив Великобритании. Архивировано 5 декабря 2019 года . Проверено 17 марта 2014 года .
  7. ^ «15 лет UKWA - оглядываясь на наши первые коллекции - блог UK Web Archive» . blogs.bl.uk . Архивировано 29 июля 2020 года . Проверено 19 октября 2020 .
  8. ^ www.webarchive.org.uk. «Набор данных веб-домена JISC UK (1996-2013)» . data.webarchive.org.uk . Проверено 16 октября 2020 .
  9. ^ "Тенденции 1996-2013 гг. Для" больших данных ":: SHINE" . www.webarchive.org.uk . Проверено 13 октября 2020 .
  10. ^ "Mementos - Архивная история www.webarchive.org.uk" . Mementos - поиск исторических архивов во всемирной паутине . Проверено 9 октября 2020 .
  11. ^ Блейни, Джонатан. «Доступны другие примеры проектов» . Big UK Domain Data для искусства и гуманитарных наук . Архивировано 16 февраля 2017 года . Проверено 9 октября 2020 .
  12. McNally, Анна. «LibGuides: поиск и использование цифровых архивов во время COVID-19: веб-архивы» . libguides.westminster.ac.uk . Проверено 14 октября 2020 .
  13. ^ Томас, Сьюзен. "Oxford LibGuides: Интернет-архивы: Главная" . ox.libguides.com . Проверено 14 октября 2020 .
  14. ^ «Добро пожаловать в GLAM Workbench - GLAM Workbench» . glam-workbench.github.io . Проверено 13 октября 2020 .
  15. ^ Шеррат, Тим; Джексон, Эндрю (15.06.2020). "GLAM-Workbench / веб-архивы" . DOI : 10.5281 / zenodo.3894079 . Цитировать журнал требует |journal=( помощь )
  16. ^ Команда, Национальные рекорды Шотландии в Интернете (2013-05-31). «Служба непрерывности сети NRS» . Национальные рекорды Шотландии . Архивировано 18 января 2020 года . Проверено 13 октября 2020 .
  17. ^ "Искать в веб-архиве PRONI" . нидирект . 2015-12-09. Архивировано 27 августа 2020 года . Проверено 13 октября 2020 .
  18. ^ "MirrorWeb - веб-архив парламента Великобритании" . webarchive.par Parliament.uk . Проверено 13 октября 2020 .

Внешние ссылки [ править ]

  • Домашняя страница веб-архива Великобритании
  • Блог UKWA
  • Веб-архив правительства Великобритании Архив веб-сайтов правительства Великобритании, находящихся в ведении Национального архива Великобритании
  • Коалиция цифрового сохранения - Целевая группа по веб-архивированию и сохранению