Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Протокол Open Archives Initiative для сбора метаданных ( OAI-PMH ) - это протокол, разработанный для сбора описаний метаданных записей в архиве, чтобы можно было создавать сервисы с использованием метаданных из многих архивов. Реализация OAI-PMH должна поддерживать представление метаданных в Dublin Core , но также может поддерживать дополнительные представления. [1]

Протокол обычно называют протоколом OAI.

OAI-PMH использует XML поверх HTTP . Версия 2.0 протокола была выпущена в 2002 году; последний раз документ обновлялся в 2015 году. Он имеет лицензию Creative Commons BY-SA.

История [ править ]

В конце 1990-х Герберт Ван де Сомпель ( Гентский университет ) работал с исследователями и библиотекарями в Лос-Аламосской национальной лаборатории (США) и созвал встречу для решения проблем, связанных с проблемами взаимодействия серверов электронной печати и цифровых репозиториев . Встреча проводилась в Санта-Фе, штат Нью-Мексико , в октябре 1999 года. [2] Ключевым событием встречи стало определение интерфейса, который позволял серверам электронной печати предоставлять метаданные для документов, которые он держал в структурированном виде, так что другие хранилища могли идентифицировать и копировать интересующие документы друг с другом. Этот интерфейс / протокол был назван «Конвенция Санта-Фе». [1][3]

В 2000 г. было проведено несколько семинаров на конференции ACM по цифровым библиотекам [4], на 1-й совместной конференции ACM / IEEE-CS по цифровым библиотекам [5] [6] и в других местах для обмена идеями из Конвенции Санта-Фе. [7] На семинарах было обнаружено, что проблемы, с которыми сталкивается сообщество электронной печати, также разделяются библиотеками, музеями, издателями журналов и другими лицами, которым необходимо совместно использовать распределенные ресурсы. Для удовлетворения этих потребностей Коалиция за сетевую информацию [8] и Федерация цифровых библиотек [9] предоставили финансирование для создания Инициативы открытых архивов.(OAI) секретариат, которым руководят Герберт Ван де Сомпель и Карл Лагозе. В сентябре 2000 года OAI провело встречу в Корнельском университете ( Итака, Нью-Йорк ) с целью улучшения интерфейса, разработанного в рамках Конвенции Санта-Фе. [10] Спецификации были уточнены по электронной почте.

OAI-PMH версии 1.0 был представлен публике в январе 2001 года на семинаре в Вашингтоне , округ Колумбия , [11] , а другой в феврале в Берлине, Германия . [12] Последующие модификации стандарта XML со стороны W3C потребовали внесения незначительных изменений в OAI-PMH, результатом которых стала версия 1.1. Текущая версия 2.0 была выпущена в июне 2002 года. Она содержит несколько технических изменений и улучшений и не имеет обратной совместимости. [13]

С 2001 г. ЦЕРН , а позже в сотрудничестве с Женевским университетом , организовывал двухгодичные семинары по OAI [14], которые со временем стали охватывать большинство аспектов открытой науки .

Использует [ редактировать ]

Некоторые коммерческие поисковые системы используют OAI-PMH для получения дополнительных ресурсов. Первоначально Google включил поддержку OAI-PMH при запуске карт сайта, однако в мае 2008 г. решил поддерживать только стандартный формат XML- файлов Sitemap . [15] В 2004 г. Yahoo! получил контент от OAIster ( Мичиганский университет ), который был получен путем сбора метаданных с помощью OAI-PMH. Викимедиа использует репозиторий OAI-PMH для предоставления фидов Википедии и связанных обновлений сайтов для поисковых систем и других задач массового анализа / повторной публикации. [16]OAI-PMH может помочь в сокращении сетевого трафика и использования других ресурсов, особенно при работе с тысячами файлов, собираемых каждый день, путем инкрементного сбора. [17] Система поиска метаданных NASA Mercury использует OAI-PMH для ежедневного индексирования тысяч записей метаданных из Global Change Master Directory (GCMD). [18]

Проект mod_oai использует OAI-PMH для предоставления веб-поисковым роботам контента, доступного с веб-серверов Apache .

Позднее OAI-PMH был применен для обмена научными данными. [19]

Программное обеспечение [ править ]

OAI-PMH основан на архитектуре клиент-сервер , в которой «комбайны» запрашивают информацию об обновленных записях из «репозиториев». Запросы данных могут быть основаны на диапазоне отметок даты и могут быть ограничены именованными наборами, определенными поставщиком. Поставщики данных должны предоставлять метаданные XML в формате Dublin Core , а также могут предоставлять их в других форматах XML.

Ряд программных систем поддерживают OAI-PMH, включая Fedora , EThOS из Британской библиотеки , GNU EPrints из Саутгемптонского университета , Open Journal Systems из проекта Public Knowledge , Desire2Learn , DSpace из MIT , HyperJournal из Пизанского университета , Digibib от Digibis, MyCoRe , Koha , Primo, DigiTool, Rosetta и MetaLib от Ex Libris , ArchivalWare от PTFS , DOOR [20] из eLab [21]в Лугано, Швейцария, panFMP из PANGEA (библиотека данных) , [22] SimpleDL от Roaring Development и jOAI. [23]

Архивы [ править ]

Ряд больших архивов поддерживает протокол, включая arXiv и сервер документов CERN .

См. Также [ править ]

  • Управление форматом данных
  • Цифровое курирование
  • Цифровое сохранение
  • Формат файла
  • Dublin Core , стандарт метаданных ISO
  • Национальная программа по инфраструктуре и сохранению цифровой информации (NDIIPP)
  • Национальная программа цифровой библиотеки (NDLP)
  • Стандарт кодирования и передачи метаданных (METS), поддерживаемый Библиотекой Конгресса
  • Сохранение метаданных: стратегии внедрения (PREMIS)
  • LOCKSS
  • Поиск как услуга
  • Веб-архивирование

Ссылки [ править ]

  1. ^ a b Marshall Breeding (сентябрь 2002 г.). «Понимание протокола для сбора метаданных Инициативы открытых архивов» . Компьютеры в библиотеках . 8 (24): 24–29 . Проверено 11 октября 2013 года .
  2. ^ Маршалл, Э. (1999). «Исследователи планируют бесплатный глобальный архив препринтов» . Наука . 286 (5441): 887a – 887. DOI : 10.1126 / science.286.5441.887a .
  3. ^ "Конвенция Санта-Фе Инициативой открытых архивов" . www.openarchives.org . Проверено 10 февраля 2021 .
  4. ^ "Конвенция Санта-Фе Инициативы открытых архивов" . dspace.library.uu.nl . Проверено 10 февраля 2021 .
  5. ^ Эдвард А. Фокс; Кристин Л. Боргман, ред. (2001). «Труды первой совместной конференции ACM / IEEE-CS по электронным библиотекам». Совместная конференция по электронным библиотекам . Роанок, Вирджиния, США: ACM Press. DOI : 10.1145 / 379437 . ISBN 978-1-58113-345-5.
  6. ^ Лагозе, Карл; Ван де Сомпель, Герберт (2001). «Инициатива открытых архивов: создание структуры взаимодействия с низкими барьерами» . Материалы первой совместной конференции ACM / IEEE-CS по электронным библиотекам - JCDL '01 . Роанок, Вирджиния, США: ACM Press: 54–62. CiteSeerX 10.1.1.161.6800 . DOI : 10.1145 / 379437.379449 . ISBN  978-1-58113-345-5.
  7. ^ Ван де Сомпель, Герберт; Лагозе, Карл (2000). «Конвенция Санта-Фе Инициативы открытых архивов» . Журнал D-Lib . 6 (2). DOI : 10,1045 / february2000-vandesompel-УРР . ISSN 1082-9873 . 
  8. ^ Коалиция сетевой информации
  9. ^ Федерация цифровых библиотек
  10. ^ "Встреча OAi-tech, Корнельский университет, 7-8 сентября 2000" . www.openarchives.org . Проверено 10 февраля 2021 .
  11. ^ «Инициатива открытых архивов: Отель Renaissance Open Meeting, Вашингтон, округ Колумбия, 23 января 2001 г.» . www.openarchives.org . Проверено 10 февраля 2021 .
  12. ^ «Инициатива открытых архивов: открытое собрание Staatsbibliothek zu Berlin, Германия, 26 февраля 2001 г.» . www.openarchives.org . Проверено 10 февраля 2021 .
  13. ^ Ван де Сомпель, Герберт; Янг, Джеффри А.; Хики, Томас Б. (2003). «Используя OAI-PMH ... По-другому» . Журнал D-Lib . 9 (7/8). DOI : 10,1045 / july2003-молодой . ISSN 1082-9873 . 
  14. ^ "OAI11 - ЦЕРН-UNIGE семинар по инновациям в научной коммуникации" . Индико . Проверено 10 февраля 2021 .
  15. ^ Блог Google для веб-мастеров
  16. ^ "Служба обновления Wikimedia" . Викимедиа Мета-Вики . Проверено 14 июля 2013 года . Цитировать журнал требует |journal=( помощь )
  17. ^ инкрементный сбор урожая
  18. ^ Р. Девараконда; Г. Паланисами; Дж. Грин; Б. Уилсон (2010). «Обмен и поиск данных использует OAI-PMH». Информатика наук о Земле . Springer Berlin / Heidelberg. 4 (1): 1–5. DOI : 10.1007 / s12145-010-0073-0 . S2CID 46330319 . 
  19. ^ Девараконда, Ранджит; Паланисами, Гири; Грин, Джеймс М .; Уилсон, Брюс Э. (2011). «Обмен данными и поиск с использованием OAI-PMH» . Информатика наук о Земле . 4 (1): 1–5. DOI : 10.1007 / s12145-010-0073-0 . ISSN 1865-0473 . 
  20. ^ ДВЕРЬ
  21. ^ eLab
  22. ^ panFMP
  23. ^ "ДЖОАЙ" . Архивировано из оригинала на 2010-01-15 . Проверено 16 ноября 2009 .


Внешние ссылки [ править ]

  • Сборщик открытых архивов Университета Сулеймана Демиреля
  • Спецификация протокола
  • Национальная библиотека Конгресса, электронные коллекции и программы
  • Библиотека Конгресса, Национальная программа по инфраструктуре и сохранению цифровой информации
  • Библиотека Конгресса, Web Capture