Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Сохранение данных является актом сохранения и поддержания как безопасности и целостности в данных . Сохранение осуществляется посредством формальных действий, которые регулируются политиками, правилами и стратегиями, направленными на защиту и продление существования и подлинности данных и их метаданных . [1] Данные можно описать как элементы или единицы, в которых создаются знания и информация, [2] и метаданные представляют собой обобщающие подмножества элементов данных; или данные о данных. [3] Основная цель сохранения данных - защитить данные от потери или уничтожения и способствовать их повторному использованию и развитию.

История [ править ]

Большинство исторических данных, собранных с течением времени, потеряно или уничтожено. Причиной этого стали войны и стихийные бедствия в сочетании с отсутствием материалов и необходимых методов для сохранения и защиты данных. Обычно сохранялись только самые важные наборы данных, такие как правительственные отчеты и статистика, юридические контракты и экономические операции. Данные научных исследований и докторских диссертаций в основном были уничтожены из-за неправильного хранения и недостаточной осведомленности о сохранении данных и их выполнения. [4] Со временем сохранение данных эволюционировало и приобрело важность и осведомленность. Теперь у нас есть много разных способов сохранения данных, и в этом участвует множество различных важных организаций.

Первые решения для хранения цифровых данных появились в 1950-х годах, которые обычно были плоскими или иерархически структурированными. [5] Несмотря на то, что с этими решениями все еще существовали проблемы, они сделали хранение данных намного дешевле и более доступным. В 1970-х годах появились реляционные базы данных, а также электронные таблицы. Реляционные базы данных структурируют данные в таблицы с использованием структурированных языков запросов, что сделало их более эффективными, чем предыдущие решения для хранения, а электронные таблицы содержат большие объемы числовых данных, которые могут быть применены к этим реляционным базам данных для получения производных данных. Совсем недавно нереляционные ( неструктурированный язык запросов ) базы данных появились как дополнения к реляционным базам данных, которые содержат большие объемы данных.неструктурированные или полуструктурированные данные . [4]

Важность [ править ]

Возможности сохранения данных огромны. Все, от правительственных и деловых документов до произведений искусства, по сути, может быть представлено в виде данных и может быть потеряно. Это приводит к потере человеческой истории на вечность.

Данные могут быть потеряны в небольшом или независимом масштабе, будь то потеря личных данных или потеря данных на предприятиях и в организациях, а также в более крупном, национальном или глобальном масштабе, что может негативно и потенциально навсегда повлиять на такие вещи, как защита окружающей среды, медицинские исследования. , национальная безопасность, здоровье и безопасность населения, экономическое развитие [6] и культура. Механизмов потери данных так же много, как и они разнообразны, начиная от катастроф, войн, утечки данных, халатности, вплоть до простого забывания до естественного разложения.

Способы использования коллекций данных при правильном сохранении и хранении можно увидеть в Геологической службе США , которая хранит коллекции данных о стихийных бедствиях, природных ресурсах и ландшафтах. Данные, собранные в рамках Обзора, используются федеральными и государственными агентствами по управлению земельными ресурсами для планирования и управления землепользованием, и для них необходим постоянный доступ к историческим справочным данным. [6]

В отличие от [ править ]

Напротив, хранилища данных представляют собой наборы собранных 1 данных, которые хранятся неформально и не подготавливаются к долгосрочному хранению. Например, сбор или резервное копирование личных файлов. Хранилища данных - это, как правило, методы хранения, которые использовались в прошлом, когда данные были потеряны из-за экологических и других исторических катастроф. [4]

Кроме того, сохранение данных отличается от сохранения данных в том смысле, что по определению сохранять объект (данные) означает удерживать или сохранять владение или использование объекта. [7] Сохранять объект - значит защищать, поддерживать и поддерживать для будущего использования. [8] Политики хранения часто повторяются, когда данные также должны быть намеренно удалены и закрыты для общего доступа, в то время как сохранение сосредоточено на постоянстве и более широком совместном доступе.

Таким образом, сохранение данных превышает концепцию наличия или владения данными или резервными копиями данных. Сохранение данных обеспечивает постоянный доступ к данным за счет планирования стратегий резервного копирования и восстановления, предшествующих событию бедствия или технологического изменения. [9]

Методы [ править ]

Цифровой [ править ]

Цифровое сохранение похоже на сохранение данных, но в основном связано с технологическими угрозами и исключительно с цифровыми данными. По сути, цифровые данные - это набор формальных действий, обеспечивающих постоянное или постоянное использование и доступ к цифровым данным, превышающее вероятность технологических сбоев или изменений. [10] При хранении цифровых данных учитываются неизбежные изменения в технологиях и протоколах, поэтому данные должны быть доступны для новых типов технологий и платформ при сохранении целостности данных и метаданных. [4]

Технология, предоставляя отличный процесс сохранения данных, который, возможно, был невозможен в прошлом, также меняется с такой скоростью, что цифровые данные могут быть больше не доступны из-за несовместимости формата с новым программным обеспечением. Без использования сохранения данных большая часть наших существующих цифровых данных находится под угрозой. [9]

Большинство методов, используемых сегодня для сохранения данных, представляют собой цифровые методы, которые пока являются наиболее эффективными из существующих.

Архивы [ править ]

Архивы - это собрание исторических документов и записей. Архивы способствуют сохранению данных и работают над их сохранением, собирая хорошо организованные данные и предоставляя соответствующие метаданные для их подтверждения. [11]

Примером важного архива данных является архив данных изображений LONI, который представляет собой архив, в котором собираются данные о клинических испытаниях и клинических исследованиях. [12]

Каталоги, справочники и порталы [ править ]

Каталоги, каталоги и порталы - это консолидированные ресурсы, которые хранятся отдельными учреждениями и связаны с архивами и фондами данных. [4] Другими словами, данные не представлены на сайте, но вместо этого могут выступать в качестве метаданных и агрегаторов, а также могут управлять тщательной инвентаризацией. [13]

Хранилища [ править ]

Репозитории - это места, где можно получить доступ к архивам и хранилищам данных и хранить их. Цель репозиториев - убедиться, что все требования и протоколы архивов и хранилищ выполняются, а данные проходят сертификацию для обеспечения целостности данных и доверия пользователей. [4]

Односайтовые репозитории

Репозиторий, содержащий все наборы данных на одном сайте. [4]

Пример крупного односайтового репозитория Data Archiving and Networking Services, который представляет собой репозиторий, обеспечивающий постоянный доступ к цифровым исследовательским ресурсам для Нидерландов. [14]

Многосайтовые репозитории

Репозиторий, в котором хранятся наборы данных на нескольких сайтах организаций. [4]

Примером хорошо известного многосайтового репозитория является OpenAIRE, который представляет собой репозиторий, в котором хранятся данные исследований и публикации, сотрудничающие со всеми странами ЕС и многими другими. OpenAIRE продвигает открытые стипендии и стремится улучшить возможности обнаружения и повторного использования данных. [15]

Надежный цифровой репозиторий

Репозиторий, который стремится обеспечить надежный, доверенный доступ в течение длительного периода времени. Репозиторий может быть одно- или многосайтовым, но он должен взаимодействовать с эталонной моделью для открытой архивной информационной системы [16], а также придерживаться набора правил или атрибутов, которые способствуют его доверию, например наличие постоянной финансовой ответственности, организационной плавучесть, административная ответственность, безопасность и сохранность. [4]

Примером надежного цифрового репозитория является The Digital Repository of Ireland (DRI), который представляет собой многосайтовый репозиторий, в котором хранятся наборы данных по гуманитарным и социальным наукам Ирландии. [17]

Кибер-инфраструктуры [ править ]

Кибер-инфраструктуры, состоящие из архивных коллекций, которые доступны через систему оборудования, технологий, программного обеспечения, политик, услуг и инструментов. Кибер-инфраструктуры предназначены для обмена данными, поддерживающими одноранговое сотрудничество и культурное сообщество. [3]

Примером крупной кибер-инфраструктуры является Канадская инфраструктура геопространственных данных, которая обеспечивает доступ к пространственным данным в Канаде. [18]

См. Также [ править ]

  • Курирование данных
  • Восстановление данных
  • Убежище данных
  • Хранение данных

Ссылки [ править ]

  1. ^ «Словарные определения» . Терминологическая база данных InterPARES 2 . InterPARES2. 2013 . Проверено 21 октября 2013 года .
  2. ^ Kitchin, R (2012). «Концептуализация данных». Информационная революция . Лондон: Sage: 1-26.
  3. ^ a b Совет по киберинфраструктуре (2007). «Видение киберинфраструктуры для открытий 21 века» (PDF) . Вашингтон, округ Колумбия: Национальный научный фонд.
  4. ^ Б с д е е г ч я Китчина R (2012). «Малые данные, инфраструктуры данных и брокеры данных». Информационная революция . Лондон: Sage: 27–47.
  5. Перейти ↑ Driscoll, K (2012). «От перфокарт до« больших данных »: социальная история популизма баз данных» . Связь +1 . 1 (4) . Проверено 22 февраля 2013 года .
  6. ^ a b Пирс, Ф .; Steinmetz, J .; Дикинсон, Т .; МакХью, Дж. (2010). «Важность сохранения данных» . Геологическое общество Америки. Цитировать журнал требует |journal=( помощь )
  7. ^ (2017) Сохранить [Определение]. Марриам-Вебстер. Получено с: https://www.merriam-webster.com/dictionary/retain
  8. ^ (2107) Сохранить [Определение]. Марриам-Вебстер. Получено с: https://www.merriam-webster.com/dictionary/preserve
  9. ^ a b Corrado, E .; Сэнди, М. (2014). «Сохранение в цифровом виде для библиотек, архивов и музеев». Глава 1. Rowman & Littlefield Publishers: 3–16. Цитировать журнал требует |journal=( помощь )
  10. ^ «Сохранение данных» . Международная федерация организаций данных для социальных наук . 2012 г.
  11. ^ Lauriault, TP; Hackett, Y; Кеннеди, Э (2013). Учебник по сохранению геопространственных данных . Оттава: Хиклинг, Ауртурс и Лоу.
  12. ^ «О нас» . LONI Image and Data Archive . 2017 г.
  13. ^ О'Кэрролл, А .; Collins, S .; Gallgher, D .; Tang, J .; Уэбб, S (2013). Забота о цифровом контенте, международные подходы к картированию . Дублин: NUI Maynooth, Тринити-колледж в Дублине, Ирландская королевская академия и цифровой репозиторий Ирландии.
  14. ^ «О ДАНС» . Архивирование данных и сетевые сервисы. 2016 г.
  15. ^ "Информационные бюллетени по проекту" . OpenAIRE. 2017 г.
  16. ^ https://www.oclc.org/research/publications/library/2000/lavoie-oais.html
  17. ^ «О DRI» . Цифровой репозиторий Ирландии. 2014–2015 гг.
  18. ^ "Инфраструктура пространственных данных Канады" . Правительство Канады . 2017 г.