Triplestore или RDF магазин является специально построенной базой данных для хранения и извлечения троек [1] с помощью семантических запросов . Тройка - это объект данных, состоящий из субъекта- предиката- объекта, например «Бобу 35 лет» или «Боб знает Фреда».
Как и в реляционной базе данных , информация в тройном хранилище хранится и извлекается с помощью языка запросов . В отличие от реляционной базы данных, хранилище троек оптимизировано для хранения и извлечения троек. Помимо запросов, тройки обычно можно импортировать и экспортировать с помощью Resource Description Framework (RDF) и других форматов.
Реализации
Некоторые хранилища данных были созданы как механизмы баз данных с нуля, в то время как другие были созданы на основе существующих коммерческих механизмов реляционных баз данных (например, на основе SQL) [2] или механизмов баз данных, ориентированных на документы NoSQL . [3] Подобно ранней разработке баз данных онлайн-аналитической обработки (OLAP), этот промежуточный подход позволял создавать большие и мощные механизмы баз данных с минимальными затратами усилий на программирование на начальных этапах разработки Triplestore. Похоже, что родные хранилища троек будут иметь преимущество в производительности в течение более длительного периода времени. Трудность с реализацией хранилищ троек поверх SQL заключается в том, что, хотя «тройки» могут, таким образом, «храниться», реализация эффективных запросов модели RDF на основе графов (например, отображение из SPARQL ) на запросы SQL затруднена. [4]
Связанные типы баз данных
Добавление имени к тройке создает «четырехъядерный магазин» или именованный граф .
Базы данных графа имеет более обобщенную структуру , чем triplestore, используя граф структуру с узлами, ребрами и свойствами для представления и хранения данных. Базы данных Graph могут обеспечивать смежность без индекса, то есть каждый элемент содержит прямой указатель на смежные элементы, и поиск по индексу не требуется. Общие графовые базы данных, которые могут хранить любой граф, отличаются от специализированных графовых баз данных, таких как хранилища троек и сетевые базы данных.
Смотрите также
- Dataspaces
- Модель сущность – отношения
- Метаданные § Синтаксис - Первые два элемента тройки « класс-атрибут-значение» (класс, атрибут) являются частями некоторых структурных метаданных, имеющих определенную семантику. Третий элемент - это значение, предпочтительно из некоторого контролируемого словаря.
- Схема баз данных
- Семантическая модель данных
- Semantic MediaWiki - пример поддержки субъект-предикат-объект для вики , расширенной поддержки запросов и реализаций многими крупными организациями.
- SPARQL - спецификация W3C, включающая тройки субъект-предикат-объект
- Модель сущность – атрибут – значение - это аналогичный подход к моделированию данных.
Рекомендации
- ^ TripleStore , Джек Рашер, Простая система организации знаний § SWAD-Европа (2002–2004) , Практикум по хранению и поиску семантической сети - Документы с изложением позиции.
- ^ US 2003145022 , «Хранение и управление полуструктурированными данными»: использование реляционных баз данных SQL в качестве хранилища троек RDF.
- ^ Кейгл, Курт. «Семантика + поиск: MarkLogic 7 получает RDF» . Дата обращения 7 августа 2015 .
- ^ Брукстра, Джин (19 сентября 2007 г.). «Важность SPARQL невозможно переоценить» .