Метаданные предварительного сохранения: стратегии реализации ( PREMIS ) - это де-факто стандарт метаданных цифрового хранения. [1]
Метаданные цифрового сохранения определяют информацию, которая необходима для обеспечения долгосрочного использования цифровых объектов, чтобы они были доступны в той или иной форме в будущем. Метаданные цифрового хранения особенно важны для репозиториев, мест, где информационные объекты хранятся и управляются в течение длительного времени. Простого хранения цифровых объектов на носителе данных недостаточно, чтобы их можно было использовать. Им необходимо управлять в репозитории, чтобы они были защищены от случайного или преднамеренного повреждения и чтобы можно было создать полноценную вычислительную среду, в которой к ним можно было бы получить доступ и понять, когда они понадобятся. [2]
Информационные объекты имеют описательные метаданные, информацию об объекте, которую можно использовать для обнаружения, доступа и идентификации цифрового объекта. Однако этих метаданных недостаточно для долгосрочного сохранения цифровых объектов. Например, формат файла цифрового объекта может устареть и стать непригодным для использования в будущих программных приложениях. Для этого потребуется либо преобразовать старый формат в новый (миграция), либо воспроизвести исходный опыт с помощью более новых технологий (эмуляция). Обе стратегии потребуют дополнительной информации, такой как технические метаданные об исходных файлах, информация о старом оборудовании и программном обеспечении, на котором они работали, а также информация о действиях, которые со временем преобразовали цифровой объект. Все это типы метаданных сохранения. Таким образом, метаданные сохранения поддерживают действия, направленные на обеспечение долгосрочного использования цифрового ресурса. [3]
В начале 2000-х годов стало ясно, что для обеспечения долгосрочного сохранения постоянно растущих цифровых ресурсов необходим стандарт общих метаданных сообщества. Эксперты из ключевых институтов памяти и разработчики репозиториев объединились, чтобы определить его, в результате чего был создан Словарь данных PREMIS для метаданных сохранения, который стал де-факто стандартом, определяющим основные метаданные, необходимые для большинства репозиториев для сохранения.
Использование стандартов важно, поскольку оно поддерживает развитие сообщества передовой практики; это помогает практикам учиться на мнениях других, чтобы они случайно не упустили ключевые метаданные в своей собственной практике; он позволяет разрабатывать инструменты, упрощающие создание метаданных и управление ими; и это позволяет организациям более легко обмениваться информацией друг с другом.
История
Рабочая группа PREMIS была создана для продолжения работы более ранней инициативы, спонсируемой Центром компьютерных онлайн-библиотек OCLC и группой исследовательских библиотек RLG: рабочая группа Preservation Metadata Framework (PMF). В 2001–2002 годах рабочая группа PMF определила типы информации, которая должна быть связана с заархивированным цифровым объектом. В их отчете «Структура метаданных для поддержки сохранения цифровых объектов» ( Framework ) был предложен список прототипов элементов метаданных. На данном этапе эти предложенные элементы не могли быть реализованы, и требовалась дополнительная работа. В 2003 году рабочую группу PREMIS попросили развить выводы группы PMF и разработать словарь данных основных метаданных для архивных цифровых объектов, а также дать рекомендации и предложить лучшие практики для управления : создание, управление и использование метаданных в системы консервации. PREMIS было «поручено определить набор семантических единиц, которые не зависят от реализации, практически ориентированы и могут потребоваться большинству хранилищ». [4]
Рабочая группа состояла из многонационального списка из более чем тридцати представителей культурного, государственного и частного секторов. [5] Он стремился понять, как хранилища хранения на самом деле реализуют метаданные сохранения. Был проведен опрос 70 организаций, которые, как считается, активно или заинтересованы в сохранении цифровых данных. В декабре 2004 года рабочая группа PREMIS опубликовала свой отчет « Внедрение хранилищ цифровых материалов: текущая практика и новые тенденции в сообществе культурного наследия» .
Ранняя версия Framework и словарь данных PREMIS основаны на эталонной модели Open Archival Information System (OAIS). Информационная модель OAIS обеспечивает концептуальную основу в виде таксономии информационных объектов и пакетов для архивированных объектов, а также структуры связанных с ними метаданных. Framework , через глубоко детальное картирование сохранения метаданных эту концептуальную структуру, можно рассматривать как разработку OAIS. Словарь данных PREMIS, с другой стороны, можно рассматривать как перевод Framework в набор реализуемых семантических единиц. Словарь данных и OAIS иногда различаются по использованию терминологии, и это указано в Глоссарии. Различия обычно отражают тот факт, что семантические единицы PREMIS требуют большей специфичности, чем определения OAIS, чего следует ожидать при переходе от концептуальной основы к реализации. [6]
В мае 2005 года PREMIS выпустила Словарь данных по сохранению метаданных: Заключительный отчет рабочей группы PREMIS . Этот 237-страничный отчет включает: PREMIS Data Dictionary 1.0: исчерпывающий практический ресурс для внедрения метаданных сохранения в системы цифрового архивирования; сопроводительный отчет (с указанием контекста, модели данных, предположений); специальные темы, глоссарий, примеры использования; набор XML-схемы, который был разработан для поддержки использования словаря данных. [7]
Текущая версия PREMIS 3.0 была выпущена в июне 2015 года. [8]
Сущности
Модель данных PREMIS состоит из четырех взаимосвязанных объектов:
- Объект (разделен на три подтипа)
- Мероприятие
- Агент
- Права
С каждой семантической единицей в словаре данных, отнесенной к одной из этих областей. [9]
Интеллектуальный объект объект является типом объекта. Это набор контента, который составляет дискретную, связную интеллектуальную единицу, такую как книга или база данных. Это могут быть составные объекты, содержащие другие интеллектуальные объекты, и могут иметь несколько цифровых представлений. [10] На этом уровне обычно применяются описательные метаданные; учитывая распространение конкурирующих схем, рабочая группа не определила никаких дополнительных описательных семантических единиц [11] и разрешила взаимодействие через «контейнеры расширения» (контейнеры содержат связанную группу семантических единиц), которые могут использоваться для внешних схем. [10]
Большинство семантических единиц, перечисленных в словаре данных, относятся к сущностям объекта и события , причем первые далее делятся на три подтипа: файл , поток битов и представление . Файл является уровень , на котором большинство конечных пользователей используются для работы, «именованный и упорядоченной последовательности байтов , которые , как известно , с помощью операционной системы.» Он включает в себя множество атрибутов файловой системы, делающих ее понятной для операционной системы, включая потоки битов , которые являются «непрерывными или несмежными данными в файле, который имеет значимые общие свойства для целей сохранения». Представление , в некотором смысле, «высокий уровень» эта модель, поскольку она может включать в себя несколько файлов, чтобы правильно визуализировать структуру и содержание интеллектуальной сущности. Не все репозитории будут заботиться о сохранении репрезентаций [12], в зависимости от их назначения и потребности кураторского органа в сохранении того, что может считаться цифровой «внутренней ценностью» объекта. Кроме того, интеллектуальные объекты могут иметь несколько представлений в репозитории. События взаимосвязаны с объектами, поскольку они включают действия, которые влияют на них или агентов («человек, организация или программное обеспечение ... связанные с Событиями ... или с Правами, прикрепленными к объекту»), связанным с объектом. [10]
Наконец, включение правозащитных организаций является ответом на возросшую осведомленность и озабоченность законными требованиями авторского права и лицензирования. Он также включает информацию о конкретных разрешенных действиях; например, семантическая единица 4.1.6.1, действие, «действие, которое разрешено выполнять хранилищу хранения», включает такие предлагаемые значения, как репликация, миграция и удаление. [13]
Словарь данных
Записи словаря данных PREMIS включают двенадцать полей атрибутов, не все из которых применяются к каждой семантической единице (аналогично «элементу» в других схемах метаданных). Помимо названия и определения единицы, в полях записываются такие вещи, как обоснование включения единицы, примечания по использованию и примеры того, как значение может быть заполнено. Четыре атрибута - категория объекта, применимость, повторяемость и обязательство - связаны, поскольку последние три определены для каждого уровня сущности объекта: файл, поток битов и представление. Словарь иерархический; одни семантические единицы содержатся внутри других. Например, 1.3 preservationLevel включает четыре семантических компонента, таких как 1.3.1 preservationLevelValue и 1.3.2 preservationLevelRole. [14]
Смотрите также
- Цифровое сохранение
- Сохранение метаданных
- Метаданные
- Электронная библиотека
- Протокол сбора метаданных (OAI-PMH)
- Стандарт кодирования и передачи метаданных (METS), поддерживаемый Библиотекой Конгресса
- Dublin Core , стандарт метаданных ISO
Рекомендации
- ^ Словарь данных PREMIS (полный документ), версия 3.0 https://www.loc.gov/standards/premis/v3/premis-3-0-final.pdf
- ^ Дапперт, Анджела; Гюнтер, Ребекка Сквайр; Пейрар, Себастьян (2016). Метаданные цифрового сохранения для практиков. DOI: 10.1007 / 978-3-319-43763-7. ISBN 978-3-319-43761-3 .
- ^ Библиотека Конгресса. «PREMIS для цифрового хранения». http://www.digitalpreservation.gov/series/challenge/premis.html , 2010 г.
- ^ Каплан, Р. и Гюнтер, R. (2005). Практическая консервация: Опыт PREMIS. Библиотечные тенденции, 54, (1), 111-124.
- ^ «Деятельность по сохранению метаданных PREMIS» . Библиотека Конгресса США . Проверено 10 октября 2013 года .
- ^ Библиотека Конгресса. "Словарь данных PREMIS". https://www.loc.gov/standards/premis/v2/premis-2-0.pdf , стр. 3
- ^ PREMIS Preservation Metadata Maintenance Activity (Библиотека Конгресса) https://www.loc.gov/standards/premis/
- ^ Редакционный комитет PREMIS. (2015). Словарь данных PREMIS для сохранения метаданных, версия 3.0. URL просмотрен 11 ноября 2015 г.
- ^ Редакционный комитет PREMIS. (2008). Словарь данных PREMIS для сохранения метаданных, версия 2.0. , 5-6. URL-адрес получен 28 апреля 2008 г.
- ^ a b c Редакционный комитет PREMIS. (2008). Словарь данных PREMIS для сохранения метаданных, версия 2.0. , 6. URL, по состоянию на 28 апреля 2008 г.
- ^ Редакционный комитет PREMIS. (2008). Словарь данных PREMIS для сохранения метаданных, версия 2.0. , 23-4. URL-адрес получен 28 апреля 2008 г.
- ^ Редакционный комитет PREMIS. (2008). Словарь данных PREMIS для сохранения метаданных, версия 2.0. , 7-8. URL-адрес получен 28 апреля 2008 г.
- ^ Редакционный комитет PREMIS. (2008). Словарь данных PREMIS для сохранения метаданных, версия 2.0. , 6, 181. URL, по состоянию на 28 апреля 2008 г.
- ^ Редакционный комитет PREMIS. (2008). Словарь данных PREMIS для сохранения метаданных, версия 2.0. , 22-194. URL-адрес получен 28 апреля 2008 г.