Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Фонд памяти Интернета (ранее Европейский архивный фонд ) был некоммерческим фондом , целью которого было архивирование содержимого Всемирной паутины . Он поддерживал проекты и исследования, которые включали сохранение и защиту цифрового медиаконтента в различных формах с целью формирования цифровой библиотеки культурного контента. По состоянию на август 2018 года он не функционирует.

История [ править ]

Некоммерческое учреждение European Archive Foundation было зарегистрировано в 2004 году в Амстердаме . [1] Объявление на открытии Недели кросс-медиа в Амстердаме в сентябре 2006 г. включало цитату Брюстера Кале , основателя Интернет-архива . [2] Жюльен Масанес был его первым директором. [3] Работая из Амстердама и Парижа , он заявил, что сделает общедоступные коллекции и веб-архивы общедоступными . Масанес, ранее работавший в Национальной библиотеке Франции , в 2007 году редактировал книгу о веб-архивировании [4].Парижская организация называется Internet Memory Research и управляет службой, известной как ArchiveTheNet. [5]

В декабре 2010 года Фонд изменил свое название на Internet Memory Foundation, чтобы выразить свою цель по сохранению интернет-контента для нынешнего и будущих поколений. [6]

У фонда было много партнеров, включая учреждения культуры и исследовательские институты, которые сотрудничали в его проектах веб-архивирования. Эти партнеры включены в Великобритании Национальный архив , [7] Институт Макса Планка , Technische Universität Berlin , Университет Саутгемптона и Institut Mines-телеком . Фонд также был членом Международного консорциума по сохранению информации в Интернете . [8]

Исследование [ править ]

Фонд участвовал в исследовательских проектах по совершенствованию технологий сканирования веб-страниц , извлечения данных , интеллектуального анализа текста и сохранения для поддержки роста и использования веб-архивов. Их проекты финансировались Европейской комиссией через Седьмую рамочную программу исследований .

  • Масштабируемая среда сохранения (SCAPE, проект № 270137) работала с февраля 2011 года по июль 2014 года. [9] Компания разрабатывала масштабируемую платформу сохранения с открытым исходным кодом.
  • Масштабный кросс-языковой анализ тенденций и обобщение потоков мультимедиа в реальном времени (TrendMiner, проект № 287863) проводился с ноября 2011 года по октябрь 2014 года. [10] Он был направлен на разработку инструментов для анализа социальных сетей, особенно на нескольких языках. .
  • Сбор всех архивов для COmmunity MEMories (ARCOMEM, проект № 270239) выполнялся с января 2011 года по декабрь 2013 года. [11] Он изучал сохранение эфемерной веб-информации, такой как та, которая используется на сайтах социальных сетей .
  • В декабре 2010 года было проведено исследование веб-архивирования в Европе. В нем оценивалось состояние проектов веб-архивирования в различных европейских учреждениях. [12]
  • Продольная аналитика данных веб-архива (LAWA, проект № 258105) проводилась с сентября 2010 года по август 2013 года. [13] В рамках проекта проводились эксперименты с крупномасштабной аналитикой данных для использования в проекте Future Internet Research and Experimentation .
  • LivingKnowledge (проект № 231126) выполнялся с февраля 2009 г. по январь 2012 г. [14] Целью было улучшение навигации и поиска в больших мультимодальных наборах данных.
  • Живые веб-архивы (LiWA, проект № 216267) работали с февраля 2008 года по январь 2011 года. [15] LiWA разработала методы и инструменты веб-архивирования, которые были нацелены на создание более точных, «живых» веб-архивов. [16] [17]

Коллекции [ править ]

Аудио и видео [ править ]

Прежде чем сосредоточиться на веб-архивировании, Европейский архивный фонд собрал одну из крупнейших онлайн-коллекций бесплатной классической музыки (более 800 произведений, от Моцарта до Дворжака) и общественные информационные фильмы правительства Великобритании, созданные в сотрудничестве с Нидерландским институтом звука. и Vision и Национальный архив Великобритании.

Выборочная веб-коллекция [ править ]

Фонд заархивировал снимок итальянского веб-домена, сделанный в сотрудничестве с Национальной библиотекой Италии, архив политических веб-сайтов 25 стран-членов ЕС, снятых во время европейских конституционных дебатов, и архивы (среди прочего):

  • Национальный архив (Соединенное Королевство) [18]
  • Национальная библиотека Ирландии
  • ЦЕРН , Европейская организация по ядерным исследованиям (Швейцария)
  • Парламент Соединенного Королевства
  • Государственный архив Северной Ирландии

В проекте использовался поисковый робот Heritrix версии 3. Heritrix генерирует ресурсы, хранящиеся в стандартизированном архивном «контейнерном» формате - файле ARC (.arc). Файл ARC был расширен до формата файла Web ARChive (.warc), который был утвержден в качестве международного стандарта в июне 2009 г. (текущая редакция ISO 28500: 2017). [19]

См. Также [ править ]

  • Список инициатив веб-архивирования
  • Интернет-архив

Ссылки [ править ]

  1. ^ Миа Консальво; Чарльз Эсс, ред. (2011). Справочник интернет-исследований . Джон Вили и сыновья. п. 31. ISBN 9781444342383.
  2. ^ Masanès, Джулиан (28 сентября 2006). «Официальный запуск Европейского архивного фонда» (пресс-релиз) .
  3. ^ "Официальный запуск Европейского архивного фонда" . Пресс-релиз . 28 сентября 2006 . Проверено 7 октября 2013 года . CS1 maint: обескураженный параметр ( ссылка )
  4. ^ Жюльен Масанес, изд. (2007). Веб-архивирование . Springer. ISBN 9783540463320.
  5. ^ "Аппред: Интернет-память" . Веб-сайт для ArchiveThe.net . Проверено 7 октября 2013 года . CS1 maint: обескураженный параметр ( ссылка ) (На французском)
  6. ^ "Фонд Интернет-памяти" . Международный консорциум сохранения Интернета. Архивировано из оригинала 9 апреля 2014 года . Проверено 8 апреля 2014 года . CS1 maint: обескураженный параметр ( ссылка )
  7. Диана Мейнард ; Марк А. Гринвуд (16 мая 2012 г.). «Крупномасштабная семантическая аннотация, индексирование и поиск в национальных архивах» (PDF) . Международная конференция по языковым ресурсам и оценке .
  8. ^ Члены (Международный консорциум сохранения Интернета)
  9. ^ «Масштабируемая среда сохранения» . Веб-сайт Информационной службы общественных исследований и разработок . Европейский Союз . Проверено 7 октября 2013 года . CS1 maint: обескураженный параметр ( ссылка )
  10. ^ «Крупномасштабный кросс-языковой анализ тенденций и обобщение потоков мультимедиа в реальном времени» . Информационная служба общественных исследований и разработок . Европейский Союз . Проверено 25 апреля 2016 года . CS1 maint: обескураженный параметр ( ссылка )
  11. ^ "Архив СОобществ MEMories" . Веб-сайт Информационной службы общественных исследований и разработок . Европейский Союз . Проверено 7 октября 2013 года . CS1 maint: обескураженный параметр ( ссылка )
  12. ^ «Веб-архивирование в Европе: обзор, предоставленный Фондом памяти Интернета, 2010» (PDF) . 22 марта 2011 . Проверено 8 апреля 2014 года . CS1 maint: обескураженный параметр ( ссылка )
  13. ^ «Продольная аналитика данных веб-архива» . Веб-сайт Информационной службы общественных исследований и разработок . Европейский Союз . Проверено 7 октября 2013 года . CS1 maint: обескураженный параметр ( ссылка )
  14. ^ «Факты, мнения и предвзятость во времени LivingKnowledge» . Веб-сайт Информационной службы общественных исследований и разработок . Европейский Союз . Проверено 7 октября 2013 года . CS1 maint: обескураженный параметр ( ссылка )
  15. ^ "Живые веб-архивы" . Веб-сайт Информационной службы общественных исследований и разработок . Европейский Союз . Проверено 7 октября 2013 года . CS1 maint: обескураженный параметр ( ссылка )
  16. ^ «Отчет о« Технологиях для живых веб-архивов » » (PDF) . Итоговый отчет . 10 февраля 2011 . Проверено 7 октября 2013 года . CS1 maint: обескураженный параметр ( ссылка )
  17. ^ Димитар Денев, Артурас Мажейка, Марк Spaniol и Герхард Вейкум (апрель 2011). «Фреймворк SHARC для обеспечения качества данных в веб-архивировании» . Международный журнал об очень больших базах данных . Springer-Verlag. 20 (2): 183–207. DOI : 10.1007 / s00778-011-0219-9 .CS1 maint: использует параметр авторов ( ссылка )
  18. ^ Адриан Браун (2006). Архивирование веб-сайтов: практическое руководство для профессионалов в области управления информацией . Facet Publishing. стр.  17 -18. ISBN 9781856045537.
  19. ^ «ISO 28500: 2017» .

Внешние ссылки [ править ]

  • Официальный веб-сайт
  • Исследовательские проекты, финансируемые ЕС :
  • Живое знание
  • LAWA , Продольная аналитика данных веб-архивов
  • ARCOMEM , Европейские архивы, музеи и библиотеки в эпоху социальных сетей
  • SCAPE , Масштабируемая среда сохранения
  • LiWA , Живые веб-архивы