Протокол Open Archives Initiative для сбора метаданных ( OAI-PMH ) - это протокол, разработанный для сбора описаний метаданных записей в архиве, чтобы можно было создавать сервисы с использованием метаданных из многих архивов. Реализация OAI-PMH должна поддерживать представление метаданных в Dublin Core , но также может поддерживать дополнительные представления. [1]
Протокол обычно называют протоколом OAI.
OAI-PMH использует XML поверх HTTP . Версия 2.0 протокола была выпущена в 2002 году; последний раз документ обновлялся в 2015 году. Он имеет лицензию Creative Commons BY-SA.
История
В конце 1990-х Герберт Ван де Сомпель ( Гентский университет ) работал с исследователями и библиотекарями в Лос-Аламосской национальной лаборатории (США) и созвал встречу для решения проблем, связанных с проблемами взаимодействия серверов электронной печати и цифровых репозиториев . Встреча проводилась в Санта-Фе, штат Нью-Мексико , в октябре 1999 года. [2] Ключевым событием встречи стало определение интерфейса, который позволял серверам электронной печати предоставлять метаданные для документов, которые он держал в структурированном виде, так что другие хранилища могли идентифицировать и копировать интересующие документы друг с другом. Этот интерфейс / протокол был назван «Конвенция Санта-Фе». [1] [3]
В 2000 г. было проведено несколько семинаров на конференции ACM по цифровым библиотекам [4], на 1-й совместной конференции ACM / IEEE-CS по цифровым библиотекам [5] [6] и в других местах для обмена идеями из Конвенции Санта-Фе. [7] На семинарах было обнаружено, что проблемы, с которыми сталкивается сообщество электронной печати, также разделяются библиотеками, музеями, издателями журналов и другими лицами, которым необходимо совместно использовать распределенные ресурсы. Для удовлетворения этих потребностей Коалиция сетевой информации [8] и Федерация цифровых библиотек [9] предоставили финансирование для создания секретариата Инициативы открытых архивов (OAI), которым руководят Герберт Ван де Сомпель и Карл Лагозе. В сентябре 2000 года OAI провело встречу в Корнельском университете ( Итака, Нью-Йорк ) с целью улучшения интерфейса, разработанного в рамках Конвенции Санта-Фе. [10] Спецификации были уточнены по электронной почте.
OAI-PMH версии 1.0 был представлен публике в январе 2001 года на семинаре в Вашингтоне , округ Колумбия , [11] , а другой в феврале в Берлине, Германия . [12] Последующие модификации стандарта XML со стороны W3C потребовали внесения незначительных изменений в OAI-PMH, результатом которых стала версия 1.1. Текущая версия 2.0 была выпущена в июне 2002 года. Она содержит несколько технических изменений и улучшений и не имеет обратной совместимости. [13]
С 2001 г. ЦЕРН , а позже в сотрудничестве с Женевским университетом , организовывал двухгодичные семинары по OAI [14], которые со временем стали охватывать большинство аспектов открытой науки .
Использует
Некоторые коммерческие поисковые системы используют OAI-PMH для получения дополнительных ресурсов. Первоначально Google включил поддержку OAI-PMH при запуске карт сайта, однако в мае 2008 г. решил поддерживать только стандартный формат XML- файлов Sitemap . [15] В 2004 г. Yahoo! получил контент от OAIster ( Мичиганский университет ), который был получен путем сбора метаданных с помощью OAI-PMH. Викимедиа использует репозиторий OAI-PMH для предоставления фидов Википедии и связанных обновлений сайтов для поисковых систем и других задач массового анализа / повторной публикации. [16] Особенно при работе с тысячами файлов, собираемых каждый день, OAI-PMH может помочь в сокращении сетевого трафика и использования других ресурсов, выполняя инкрементный сбор. [17] Система поиска метаданных NASA Mercury использует OAI-PMH для ежедневного индексирования тысяч записей метаданных из Global Change Master Directory (GCMD). [18]
Проект mod_oai использует OAI-PMH для предоставления веб-поисковым роботам контента, доступного с веб-серверов Apache .
Позднее OAI-PMH был применен для обмена научными данными. [19]
Программное обеспечение
OAI-PMH основан на архитектуре клиент-сервер , в которой «комбайны» запрашивают информацию об обновленных записях из «репозиториев». Запросы данных могут быть основаны на диапазоне отметок даты и могут быть ограничены именованными наборами, определенными поставщиком. Поставщики данных должны предоставлять метаданные XML в формате Dublin Core , а также могут предоставлять их в других форматах XML.
Ряд программных систем поддерживают OAI-PMH, включая Fedora , EThOS из Британской библиотеки , GNU EPrints из Саутгемптонского университета , Open Journal Systems из проекта Public Knowledge , Desire2Learn , DSpace из MIT , HyperJournal из Пизанского университета , Digibib из Digibis, MyCoRe , Koha , Primo, DigiTool, Rosetta и MetaLib из Ex Libris , ArchivalWare из PTFS , DOOR [20] из eLab [21] в Лугано, Швейцария, panFMP из PANGEA (библиотека данных) , [22] SimpleDL от Roaring Development и jOAI. [23]
Архивы
Ряд больших архивов поддерживает протокол, включая arXiv и сервер документов CERN .
Смотрите также
- Управление форматом данных
- Цифровое курирование
- Цифровое сохранение
- Формат файла
- Dublin Core , стандарт метаданных ISO
- Национальная программа по инфраструктуре и сохранению цифровой информации (NDIIPP)
- Национальная программа цифровой библиотеки (NDLP)
- Стандарт кодирования и передачи метаданных (METS), поддерживаемый Библиотекой Конгресса
- Сохранение метаданных: стратегии внедрения (PREMIS)
- LOCKSS
- Поиск как услуга
- Веб-архивирование
Рекомендации
- ^ a b Marshall Breeding (сентябрь 2002 г.). «Понимание протокола для сбора метаданных Инициативы открытых архивов» . Компьютеры в библиотеках . 8 (24): 24–29 . Проверено 11 октября 2013 года .
- ^ Маршалл, Э. (1999). «Исследователи планируют бесплатный глобальный архив препринтов» . Наука . 286 (5441): 887a – 887. DOI : 10.1126 / science.286.5441.887a . PMID 10577235 .
- ^ «Конвенция Санта-Фе, организованная Инициативой открытых архивов» . www.openarchives.org . Проверено 10 февраля 2021 .
- ^ «Конвенция Санта-Фе Инициативы открытых архивов» . dspace.library.uu.nl . Проверено 10 февраля 2021 .
- ^ Эдвард А. Фокс; Кристин Л. Боргман, ред. (2001). «Труды первой совместной конференции ACM / IEEE-CS по электронным библиотекам». Совместная конференция по электронным библиотекам . Роанок, Вирджиния, США: ACM Press. DOI : 10.1145 / 379437 . ISBN 978-1-58113-345-5.
- ^ Лагозе, Карл; Ван де Сомпель, Герберт (2001). «Инициатива открытых архивов: создание структуры взаимодействия с низкими барьерами» . Труды Первой совместной конференции ACM / IEEE-CS по электронным библиотекам - JCDL '01 . Роанок, Вирджиния, США: ACM Press: 54–62. CiteSeerX 10.1.1.161.6800 . DOI : 10.1145 / 379437.379449 . ISBN 978-1-58113-345-5.
- ^ Ван де Сомпель, Герберт; Лагозе, Карл (2000). «Конвенция Санта-Фе Инициативы открытых архивов» . Журнал D-Lib . 6 (2). DOI : 10,1045 / february2000-vandesompel-УРР . ISSN 1082-9873 .
- ^ Коалиция сетевой информации
- ^ Федерация цифровых библиотек
- ^ "Встреча OAi-tech, Корнельский университет, 7-8 сентября 2000 г." . www.openarchives.org . Проверено 10 февраля 2021 .
- ^ «Инициатива открытых архивов: отель Renaissance Open Meeting, Вашингтон, 23 января 2001 г.» . www.openarchives.org . Проверено 10 февраля 2021 .
- ^ «Инициатива открытых архивов: открытая встреча в государственной библиотеке Берлина, Германия, 26 февраля 2001 г.» . www.openarchives.org . Проверено 10 февраля 2021 .
- ^ Ван де Сомпель, Герберт; Янг, Джеффри А.; Хики, Томас Б. (2003). «Используя OAI-PMH ... По-другому» . Журнал D-Lib . 9 (7/8). DOI : 10,1045 / july2003-молодой . ISSN 1082-9873 .
- ^ "OAI11 - Семинар ЦЕРН-UNIGE по инновациям в научной коммуникации" . Индико . Проверено 10 февраля 2021 .
- ^ Блог Google для веб-мастеров
- ^ «Служба обновления Викимедиа» . Викимедиа Мета-Вики . Проверено 14 июля 2013 года . Цитировать журнал требует
|journal=
( помощь ) - ^ инкрементный сбор урожая
- ^ Р. Девараконда; Г. Паланисами; Дж. Грин; Б. Уилсон (2010). «Обмен и поиск данных использует OAI-PMH». Информатика наук о Земле . Springer Berlin / Heidelberg. 4 (1): 1–5. DOI : 10.1007 / s12145-010-0073-0 . S2CID 46330319 .
- ^ Девараконда, Ранджит; Паланисами, Гири; Грин, Джеймс М .; Уилсон, Брюс Э. (2011). «Обмен данными и поиск с использованием OAI-PMH» . Информатика наук о Земле . 4 (1): 1–5. DOI : 10.1007 / s12145-010-0073-0 . ISSN 1865-0473 .
- ^ ДВЕРЬ
- ^ eLab
- ^ panFMP
- ^ "ДЖОАЙ" . Архивировано из оригинала на 2010-01-15 . Проверено 16 ноября 2009 .
Внешние ссылки
- Сборщик открытых архивов Университета Сулеймана Демиреля
- Спецификация протокола
- Национальная библиотека Конгресса, электронные коллекции и программы
- Библиотека Конгресса, Национальная программа цифровой инфраструктуры и сохранения информации
- Библиотека Конгресса, Web Capture