Распределенное хранилище данных

Эта статья написана как личное размышление, личное эссе или аргументированное эссе , в котором излагаются личные чувства редактора Википедии или представлены оригинальные аргументы по теме. Пожалуйста, помогите улучшить его , переписав в энциклопедическом стиле . ( Май 2012 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения )

Память компьютера и типы хранилищ данных
Общий
Ячейка памяти Согласованность памяти Согласованность кеша Иерархия памяти Шаблон доступа к памяти Карта памяти Вторичное хранилище MOS память плавающий затвор Постоянная доступность Плотность (компьютерная память) Блок (хранилище данных) Хранилище объектов Хранилище с прямым подключением Network Attached Storage Сеть хранения данных Блочное хранилище Одноэкземплярное хранилище Данные Структурированные данные Неструктурированные данные Большое количество данных Метаданные Сжатие данных Повреждение данных Очистка данных Ухудшение данных Целостность данных Безопасность данных Проверка достоверности данных Проверка и согласование данных Восстановление данных Место хранения Кластер данных Каталог Общий ресурс Обмен файлами Файловая система Кластерная файловая система Распределенная файловая система Распределенная файловая система для облака Распределенное хранилище данных Распределенная база данных База данных Банк данных Хранилище данных Хранилище данных Дедупликация данных Структура данных Избыточность данных Репликация (вычисления) Обновление памяти Запись в хранилище Информационное хранилище База знаний Компьютерный файл Файл объекта Удаление файла Копирование файлов Резервный Дамп ядра Шестнадцатеричный дамп Передача данных Передача информации Временный файл Защита от копирования Управление цифровыми правами Объем (вычисление) Загрузочный сектор Главная загрузочная запись Объем загрузочной записи Дисковый массив Образ диска Зеркальное отображение диска Дисковая агрегация Разбиение диска Сегментация памяти Местонахождение ссылки Логический диск Виртуализация хранилища Виртуальная память Файл с отображением в память Программная энтропия Программная гниль База данных в памяти Обработка в памяти Настойчивость (информатика) Постоянная структура данных RAID Архитектура дисков без RAID Подкачка памяти Смена банка Грид-вычисления Облачные вычисления Облачное хранилище Туманные вычисления Периферийные вычисления Росистые вычисления Закон Амдала Закон Мура Закон Крайдера
Летучий
баран
Аппаратный кеш Кеш процессора Память блокнота DRAM eDRAM SDRAM SGRAM LPDDR QDRSRAM EDO DRAM XDR DRAM RDRAM SDRAM DDR GDDR HBM SRAM 1T-SRAM ReRAM QRAM Память с адресацией по содержимому (CAM) VRAM Двухпортовая оперативная память Видео RAM (двухпортовая DRAM)
Исторический
Трубка Вильямса – Килбурна (1946–47) Память линии задержки (1947) Оптическая память Меллона (1951) Трубка Selectron (1952 г.) Декатрон Т-RAM (2009) Z-RAM (2002–2010)
Энергонезависимая
ПЗУ
MROM ВЫПУСКНОЙ ВЕЧЕР EPROM EEPROM ПЗУ картридж Твердотельное хранилище (SSS) Твердотельный накопитель (SSD) Твердотельный гибридный диск (SSHD) Флэш-память флешка IBM FlashSystem Модуль Flash Core Картридж памяти Карта памяти CompactFlash Карта ПК MultiMediaCard SD Card сим-карта SmartMedia Универсальное флеш-хранилище SxS MicroP2 Карта XQD Программируемая ячейка металлизации
NVRAM
Мемистор Мемристор PCM ( 3D XPoint ) MRAM Электрохимическая RAM (ECRAM) Нано-RAM CBRAM
Ранняя стадия NVRAM
FeRAM ReRAM Память FeFET
Аналоговая запись
Цилиндр фонографа Фонографическая пластинка Квадруплексная видеокассета Электронный записывающий аппарат Vision Магнитная запись Магнитное хранилище Магнитная лента Хранение данных на магнитной ленте Ленточный привод Ленточная библиотека Цифровое хранилище данных (DDS) Видеокассета Видеокассета Кассета Линейная лента-открытая Бетамакс Формат видео 8 мм DV MiniDV MicroMV U-matic VHS S-VHS VHS-C D-VHS Привод жесткого диска Microdrive Магнитная запись с подогревом (HAMR) Галька магнитная запись (SMR) Узорчатые материалы
Оптический
3D оптическое хранилище данных Оптический диск LaserDisc Компакт-диск Digital Audio (CDDA) CD CD видео CD-R CD-RW Видео CD Супер видео компакт-диск Мини-компакт-диск Оптические диски Nintendo CD-ROM Гипер CD-ROM DVD DVD + R DVD-видео DVD карта DVD-RAM MiniDVD HD DVD Блю рей Ультра HD Blu-ray Голографический универсальный диск ЧЕРВЬ
В развитии
CBRAM Память о гоночной трассе NRAM Многоножка память ЭКРАМ Узорчатые материалы Голографическое хранилище данных Электронная квантовая голография 5D оптическое хранилище данных Хранение цифровых данных ДНК Универсальная память Кристалл времени Квантовая память
Исторический
Бумажное хранилище данных (1725) Перфокарта (1725) Перфолента (1725) Plugboard Память линии задержки Барабанная память (1932) Память с магнитным сердечником (1949 г.) Позолоченный провод памяти (1957) Память сердечника веревки (1960-е) Тонкопленочная память (1962) Дисковый пакет (1962 г.) Твисторная память (~ 1968) Пузырьковая память (~ 1970) Дискета (1971)
v т е

Распределенное хранилище данных представляет собой компьютерную сеть , где информация хранится на более чем одном узле , часто в реплицированную моды. ^[1] Обычно он используется для обозначения распределенной базы данных, в которой пользователи хранят информацию о нескольких узлах , или компьютерной сети, в которой пользователи хранят информацию о нескольких одноранговых сетевых узлах . ^[2]

Распределенные базы данных [ править ]

Распределенные базы данных обычно представляют собой нереляционные базы данных, которые обеспечивают быстрый доступ к данным через большое количество узлов. Некоторые распределенные базы данных предоставляют расширенные возможности запросов, в то время как другие ограничены семантикой хранилища "ключ-значение" . Примеры ограниченных распределенных баз данных являются Google «s Bigtable , что намного больше , чем распределенная файловой система или сеть равноправных узлов ЛВСА , ^[3] Amazon » s Динамо ^[4] и Microsoft Azure Storage . ^[5]

Поскольку возможность произвольных запросов не так важна, как доступность , разработчики распределенных хранилищ данных увеличили последнее за счет согласованности. Но высокоскоростной доступ для чтения / записи приводит к снижению согласованности, поскольку невозможно обеспечить согласованность , доступность и устойчивость к разделению сети, как это было доказано теоремой CAP .

Хранилища данных одноранговых сетевых узлов [ править ]

В одноранговых сетевых хранилищах данных пользователь обычно может отвечать взаимностью и разрешать другим пользователям также использовать свой компьютер в качестве узла хранения. Информация может быть доступна или недоступна другим пользователям в зависимости от конструкции сети.

Большинство одноранговых сетей не имеют распределенных хранилищ данных, поскольку данные пользователя доступны только тогда, когда их узел находится в сети. Однако это различие несколько размыто в такой системе, как BitTorrent , где исходный узел может отключиться, но контент будет продолжать обслуживаться. Тем не менее, это справедливо только для отдельных файлов, запрашиваемых распространителями, в отличие от таких сетей, как Freenet , Winny , Share и Perfect Dark, где любой узел может хранить любую часть файлов в сети.

В распределенных хранилищах данных обычно используется метод обнаружения и исправления ошибок . Некоторые распределенные хранилища данных (например, Parchive over NNTP) используют методы прямого исправления ошибок для восстановления исходного файла, когда части этого файла повреждены или недоступны. Другие пытаются еще раз загрузить этот файл с другого зеркала.

Примеры [ править ]

Распределенные нереляционные базы данных [ править ]

Товар	Лицензия	Высокая доступность	Примечания
Apache Accumulo	AL2
Aerospike	AGPL
Apache Cassandra	AL2	да	ранее использовался Facebook
Apache Ignite	AL2
Большой стол	Проприетарный		используется Google
Диван	AL2		используется LinkedIn , PayPal и eBay
CrateDB	AL2	да
Druid (хранилище данных с открытым исходным кодом)	AL2		используется Netflix и Yahoo
Динамо	Проприетарный		используется Amazon
Hazelcast	AL2 , проприетарный
HBase	AL2	да	ранее использовался Facebook
Гипертаблица	GPL 2		Baidu
MongoDB	SSPL
Риак	AL2	да
Redis	Лицензия BSD	да
Сцилла	AGPL
Волан-де-Морт	AL2		используется LinkedIn

Хранилища данных одноранговых сетевых узлов [ править ]

BitTorrent
Блокчейн (база данных)
Аккордовый проект
Freenet
GNUnet
IPFS
Mnet
Napster
NNTP (протокол распределенного хранения данных, используемый для новостей Usenet )
Unity программного обеспечения Perfect Dark
доля
Siacoin
Storage @ home
STORJ
Тахо-ЛАФС
Винни
ZeroNet

См. Также [ править ]

Совместное облако хранения
Хранилище данных
Распределенная файловая система
Keyspace , схема DDS
Пиринговый
Распределенная хеш-таблица
Распределенный кеш
Киберустойчивость

Ссылки [ править ]

^ Янив Пессах, Распределенное хранилище (Распределенное хранилище: концепции, алгоритмы и реализации под ред.), OL 25423189M
^ «Распределенное хранилище данных - обзор | Темы ScienceDirect» .
^ "Bigtable: распределенное хранилище данных Google" . http://the-paper-trail.org/ : Paper Trail. Архивировано из оригинала на 2017-07-16 . Проверено 5 апреля 2011 .Хотя GFS обеспечивает Google надежным масштабируемым распределенным хранилищем файлов, он не предоставляет никаких средств для структурирования данных, содержащихся в файлах, за исключением иерархической структуры каталогов и значимых имен файлов. Хорошо известно, что для больших наборов данных требуются более выразительные решения. Терабайты и терабайты данных Google, которые они извлекают из веб-сканеров, среди многих других источников, нуждаются в организации, чтобы клиентские приложения могли быстро выполнять поиск и обновления с более высокой степенью детализации, чем на уровне файлов. [...] Первое, что вам нужно знать о Bigtable, это то, что это не реляционная база данных. Это не должно вызывать удивления: во всех этих статьях о крупномасштабных распределенных хранилищах данных одна постоянная тема заключается в том, что реляционные СУБД трудно сделать с хорошей производительностью. Нет ничего сложного,фиксированная схема в Bigtable, отсутствие ссылочной целостности между таблицами (поэтому нет внешних ключей) и, следовательно, небольшая поддержка оптимизированных объединений.
^ Сара Pidcock (2011-01-31). «Dynamo: высокодоступный магазин ключей и значений Amazon» (PDF) . http://www.cs.uwaterloo.ca/ : WATERLOO - ЧЕРИТОНСКАЯ ШКОЛА КОМПЬЮТЕРНЫХ НАУК. п. 2/22 . Проверено 5 апреля 2011 . Dynamo: высокодоступное и масштабируемое распределенное хранилище данных
^ «Хранилище Windows Azure» . 2011-09-16. Архивировано из оригинала 9 ноября 2011 года . Проверено 6 ноября 2011 года .

[1] Янив Пессах, Распределенное хранилище (Распределенное хранилище: концепции, алгоритмы и реализации под ред.), OL 25423189M

[urlDistributed_Data_Storage_-_an_overview_|_ScienceDirect_Topics-2] «Распределенное хранилище данных - обзор | Темы ScienceDirect» .

[3] "Bigtable: распределенное хранилище данных Google" . http://the-paper-trail.org/ : Paper Trail. Архивировано из оригинала на 2017-07-16 . Проверено 5 апреля 2011 .Хотя GFS обеспечивает Google надежным масштабируемым распределенным хранилищем файлов, он не предоставляет никаких средств для структурирования данных, содержащихся в файлах, за исключением иерархической структуры каталогов и значимых имен файлов. Хорошо известно, что для больших наборов данных требуются более выразительные решения. Терабайты и терабайты данных Google, которые они извлекают из веб-сканеров, среди многих других источников, нуждаются в организации, чтобы клиентские приложения могли быстро выполнять поиск и обновления с более высокой степенью детализации, чем на уровне файлов. [...] Первое, что вам нужно знать о Bigtable, это то, что это не реляционная база данных. Это не должно вызывать удивления: во всех этих статьях о крупномасштабных распределенных хранилищах данных одна постоянная тема заключается в том, что реляционные СУБД трудно сделать с хорошей производительностью. Нет ничего сложного,фиксированная схема в Bigtable, отсутствие ссылочной целостности между таблицами (поэтому нет внешних ключей) и, следовательно, небольшая поддержка оптимизированных объединений.

[4] Сара Pidcock (2011-01-31). «Dynamo: высокодоступный магазин ключей и значений Amazon» (PDF) . http://www.cs.uwaterloo.ca/ : WATERLOO - ЧЕРИТОНСКАЯ ШКОЛА КОМПЬЮТЕРНЫХ НАУК. п. 2/22 . Проверено 5 апреля 2011 . Dynamo: высокодоступное и масштабируемое распределенное хранилище данных

[5] «Хранилище Windows Azure» . 2011-09-16. Архивировано из оригинала 9 ноября 2011 года . Проверено 6 ноября 2011 года .