Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Распределенное хранилище данных представляет собой компьютерную сеть , где информация хранится на более чем одном узле , часто в реплицированную моды. [1] Обычно он используется для обозначения распределенной базы данных, в которой пользователи хранят информацию о нескольких узлах , или компьютерной сети, в которой пользователи хранят информацию о нескольких одноранговых сетевых узлах . [2]

Распределенные базы данных [ править ]

Распределенные базы данных обычно представляют собой нереляционные базы данных, которые обеспечивают быстрый доступ к данным через большое количество узлов. Некоторые распределенные базы данных предоставляют расширенные возможности запросов, в то время как другие ограничены семантикой хранилища "ключ-значение" . Примеры ограниченных распределенных баз данных являются Google «s Bigtable , что намного больше , чем распределенная файловой система или сеть равноправных узлов ЛВСА , [3] Amazon » s Динамо [4] и Microsoft Azure Storage . [5]

Поскольку возможность произвольных запросов не так важна, как доступность , разработчики распределенных хранилищ данных увеличили последнее за счет согласованности. Но высокоскоростной доступ для чтения / записи приводит к снижению согласованности, поскольку невозможно обеспечить согласованность , доступность и устойчивость к разделению сети, как это было доказано теоремой CAP .

Хранилища данных одноранговых сетевых узлов [ править ]

В одноранговых сетевых хранилищах данных пользователь обычно может отвечать взаимностью и разрешать другим пользователям также использовать свой компьютер в качестве узла хранения. Информация может быть доступна или недоступна другим пользователям в зависимости от конструкции сети.

Большинство одноранговых сетей не имеют распределенных хранилищ данных, поскольку данные пользователя доступны только тогда, когда их узел находится в сети. Однако это различие несколько размыто в такой системе, как BitTorrent , где исходный узел может отключиться, но контент будет продолжать обслуживаться. Тем не менее, это справедливо только для отдельных файлов, запрашиваемых распространителями, в отличие от таких сетей, как Freenet , Winny , Share и Perfect Dark, где любой узел может хранить любую часть файлов в сети.

В распределенных хранилищах данных обычно используется метод обнаружения и исправления ошибок . Некоторые распределенные хранилища данных (например, Parchive over NNTP) используют методы прямого исправления ошибок для восстановления исходного файла, когда части этого файла повреждены или недоступны. Другие пытаются еще раз загрузить этот файл с другого зеркала.

Примеры [ править ]

Распределенные нереляционные базы данных [ править ]

Хранилища данных одноранговых сетевых узлов [ править ]

  • BitTorrent
  • Блокчейн (база данных)
  • Аккордовый проект
  • Freenet
  • GNUnet
  • IPFS
  • Mnet
  • Napster
  • NNTP (протокол распределенного хранения данных, используемый для новостей Usenet )
  • Unity программного обеспечения Perfect Dark
  • доля
  • Siacoin
  • Storage @ home
  • STORJ
  • Тахо-ЛАФС
  • Винни
  • ZeroNet

См. Также [ править ]

  • Совместное облако хранения
  • Хранилище данных
  • Распределенная файловая система
  • Keyspace , схема DDS
  • Пиринговый
  • Распределенная хеш-таблица
  • Распределенный кеш
  • Киберустойчивость

Ссылки [ править ]

  1. ^ Янив Пессах, Распределенное хранилище (Распределенное хранилище: концепции, алгоритмы и реализации под ред.), OL  25423189M
  2. ^ «Распределенное хранилище данных - обзор | Темы ScienceDirect» .
  3. ^ "Bigtable: распределенное хранилище данных Google" . http://the-paper-trail.org/ : Paper Trail. Архивировано из оригинала на 2017-07-16 . Проверено 5 апреля 2011 .Хотя GFS обеспечивает Google надежным масштабируемым распределенным хранилищем файлов, он не предоставляет никаких средств для структурирования данных, содержащихся в файлах, за исключением иерархической структуры каталогов и значимых имен файлов. Хорошо известно, что для больших наборов данных требуются более выразительные решения. Терабайты и терабайты данных Google, которые они извлекают из веб-сканеров, среди многих других источников, нуждаются в организации, чтобы клиентские приложения могли быстро выполнять поиск и обновления с более высокой степенью детализации, чем на уровне файлов. [...] Первое, что вам нужно знать о Bigtable, это то, что это не реляционная база данных. Это не должно вызывать удивления: во всех этих статьях о крупномасштабных распределенных хранилищах данных одна постоянная тема заключается в том, что реляционные СУБД трудно сделать с хорошей производительностью. Нет ничего сложного,фиксированная схема в Bigtable, отсутствие ссылочной целостности между таблицами (поэтому нет внешних ключей) и, следовательно, небольшая поддержка оптимизированных объединений.
  4. ^ Сара Pidcock (2011-01-31). «Dynamo: высокодоступный магазин ключей и значений Amazon» (PDF) . http://www.cs.uwaterloo.ca/ : WATERLOO - ЧЕРИТОНСКАЯ ШКОЛА КОМПЬЮТЕРНЫХ НАУК. п. 2/22 . Проверено 5 апреля 2011 . Dynamo: высокодоступное и масштабируемое распределенное хранилище данных
  5. ^ «Хранилище Windows Azure» . 2011-09-16. Архивировано из оригинала 9 ноября 2011 года . Проверено 6 ноября 2011 года .