В вычислении , связанные данные (часто капитализированные как Linked Data ) структурированы данные , которые взаимосвязаны с другими данными , поэтому она становится более полезной с помощью семантических запросов . Он основан на стандартных веб- технологиях, таких как HTTP , RDF и URI , но вместо того, чтобы использовать их для обслуживания веб-страниц только для людей-читателей, он расширяет их, чтобы делиться информацией таким образом, чтобы компьютеры могли ее автоматически прочитать. Часть видения связанных данных заключается в том, чтобы Интернет стал глобальной базой данных . [1]
Тим Бернерс-Ли , директор Консорциума Всемирной паутины (W3C), ввел термин в заметку о дизайне проекта Семантической паутины в 2006 году . [2]
Связанные данные также могут быть открытыми данными , и в этом случае их обычно называют связанными открытыми данными ( LOD ). [3]
Принципы [ править ]
В своей заметке 2006 г. «Связанные данные» Тим Бернерс-Ли изложил четыре принципа связанных данных, перефразируя их следующим образом: [2]
- Унифицированные идентификаторы ресурсов (URI) следует использовать для именования и идентификации отдельных вещей.
- Следует использовать HTTP URI, чтобы эти вещи можно было найти, интерпретировать и впоследствии «разыменовать».
- Полезная информация о том, что идентифицирует имя, должна предоставляться через открытые стандарты, такие как RDF , SPARQL и т. Д.
- При публикации данных в Интернете следует ссылаться на другие объекты, используя их имена на основе HTTP URI.
Тим Бернерс-Ли позже подтвердил эти принципы на конференции TED 2009 года , снова перефразируя следующим образом: [4]
- Все концептуальные вещи должны иметь имя, начинающееся с HTTP.
- Поиск имени HTTP должен возвращать полезные данные о предмете, о котором идет речь, в стандартном формате.
- Все остальное, с чем эта же вещь связана через свои данные, также должно иметь имя, начинающееся с HTTP.
Компоненты [ править ]
- URI
- HTTP
- Структурированные данные с использованием терминов контролируемого словаря и определений наборов данных, выраженных в форматах сериализации Resource Description Framework , таких как RDFa , RDF / XML , N3 , Turtle или JSON-LD
- Платформа связанных данных
Связанные открытые данные [ править ]
Связанные открытые данные - это связанные данные, которые являются открытыми данными . [5] [6] [7] Тим Бернерс-Ли дает самое четкое определение связанных открытых данных в отличие от связанных данных.
Связанные открытые данные (LOD) - это связанные данные, которые выпускаются под открытой лицензией, что не препятствует их повторному использованию бесплатно.
- Тим Бернерс-Ли, Связанные данные [2] [8]
Большие связанные наборы открытых данных включают DBpedia и Wikidata .
История [ править ]
Термин «связанные открытые данные» используется по крайней мере с февраля 2007 г., когда был создан список рассылки «Связанные открытые данные» [9] . [10] Список рассылки был первоначально организован Симиле проект [11] в Массачусетском технологическом институте .
Связывание проекта сообщества Open Data [ править ]
Цель проекта сообщества Linking Open Data группы W3C Semantic Web Education and Outreach - расширить Интернет за счет общего доступа к данным путем публикации различных открытых наборов данных в виде RDF в Интернете и путем установки связей RDF между элементами данных из разных источников данных. В октябре 2007 года наборы данных состояли из более чем двух миллиардов RDF- троек , которые были связаны между собой более чем двумя миллионами RDF-ссылок. [13] [14] К сентябрю 2011 года это число выросло до 31 миллиарда троек RDF, связанных между собой примерно 504 миллионами ссылок RDF. Подробная статистическая разбивка была опубликована в 2014 году [15].
Проекты Европейского Союза [ править ]
Есть ряд проектов Европейского Союза, связанных с данными. К ним относятся проект связанных открытых данных круглосуточно (LATC), [16] проект PlanetData, [17] проект DaPaaS (данные и платформа как услуга) [18] и связанные открытые данные 2. (LOD2) проект. [19] [20] [21] Связывание данных - одна из основных целей портала открытых данных ЕС , который предоставляет тысячи наборов данных для повторного использования и связывания.
Онтологии [ править ]
Онтологии - это формальные описания структур данных. Некоторые из наиболее известных онтологий:
- FOAF - онтология, описывающая людей, их свойства и отношения
- UMBEL - облегченная ссылочная структура из 20 000 классов предметных понятий и их взаимосвязей, производных от OpenCyc , которые могут действовать как классы привязки к внешним данным; также имеет ссылки на 1,5 миллиона именованных сущностей из DBpedia и YAGO
Наборы данных [ править ]
- DBpedia - набор данных, содержащий извлеченные данные из Википедии; он содержит около 3,4 миллиона концепций, описанных 1 миллиардом троек , включая аннотации на 11 разных языках.
- GeoNames - предоставляет RDF-описания более 7 500 000 географических объектов по всему миру.
- Викиданные - совместно созданный связанный набор данных, который действует как центральное хранилище для структурированных данных дочерних проектов Фонда Викимедиа.
- Глобальная база данных идентификаторов исследований ( GRID ) - международная база данных 89 506 организаций, занимающихся академическими исследованиями, с 14 401 отношениями, моделирует два типа отношений: отношения родитель-потомок, которые определяют подчиненную ассоциацию, и связанные отношения, описывающие другие ассоциации [22 ] [23]
Отношения экземпляра набора данных и класса [ править ]
Доступны интерактивные диаграммы, которые показывают отдельные наборы данных и их отношения в созданном DBpedia облаке LOD (как показано на рисунках справа). [24] [25]
См. Также [ править ]
- American Art Collaborative - консорциум художественных музеев США, стремящийся создать критическую массу связанных открытых данных об американском искусстве.
- Авторитетный контроль - о контролируемых рубриках в каталогах библиотек
- Анализ цитирования - для цитирования между научными статьями
- Гиперданные
- Сетевая модель - старый тип системы управления базами данных
- Schema.org
- VoID - Словарь взаимосвязанных наборов данных
- Язык веб-онтологий
Ссылки [ править ]
- ^ «Связанные данные как JSON» . Связанные данные как JSON . Проверено 4 декабря 2020 .
- ^ a b c Тим Бернерс-Ли (27.07.2006). «Связанные данные» . Проблемы дизайна . W3C . Проверено 18 декабря 2010 .
- ^ «Что такое связанные данные и связанные открытые данные?» . Онтекст . Проверено 8 мая 2019 .
- ^ «Тим Бернерс-Ли в следующей сети» .
- ^ «Часто задаваемые вопросы (FAQ) - Связанные данные - Соединение распределенных данных через Интернет» .
- ^ «COAR» 7 вещей, которые вы должны знать о… связанных данных » . Архивировано из оригинала на 2015-11-18 . Проверено 29 декабря 2015 .
- ^ «Основы связанных данных для технических специалистов» .
- ^ «5 звезд открытых данных» .
- ^ "[email protected] Почтовые архивы" .
- ^ "SweoIG / TaskForces / CommunityProjects / LinkingOpenData / NewsArchive" .
- ^ «SIMILE Project - Списки рассылки» .
- ↑ Связывание диаграммы облака открытых данных 2014 г., Макс Шмахтенберг, Кристиан Бизер, Аня Йенч и Ричард Циганиак. http://lod-cloud.net/
- ^ "SweoIG / TaskForces / CommunityProjects / LinkingOpenData - W3C Wiki" . esw.w3.org . Проверено 22 марта 2018 .
- ^ Фензель, Дитер; Факка, Федерико Микеле; Симперл, Елена; Иоан, Тома (2011). Семантические веб-службы . Springer. п. 99. ISBN 978-3642191923.
- ^ Макс. «Состояние облака LOD» . connecteddatacatalog.dws.informatik.uni-mannheim.de . Проверено 22 марта 2018 .
- ^ «Связанные открытые данные круглосуточно (LATC)» . latc-project.eu . Архивировано из оригинального 19 сентября 2018 года . Проверено 22 марта 2018 .
- ^ «Добро пожаловать в PlanetData! - PlanetData» . planet-data.eu . Проверено 22 марта 2018 .
- ^ "DaPaaS" . project.dapaas.eu . Проверено 22 марта 2018 .
- ^ Связывание открытых данных 2 (LOD2)
- ^ «Проекты CORDIS FP7 ICT - LOD2» . Европейская комиссия. 2010-04-20.
- ^ «Информационный бюллетень по проекту LOD2 - Краткое изложение проекта» (PDF) . 2010-09-01. Архивировано из оригинального (PDF) 20 июля 2011 года . Проверено 18 декабря 2010 .
- ^ «Статистика GRID» . grid.ac/stats . Проверено 26 октября 2018 .
- ^ «Политики GRID» . grid.ac . Проверено 26 октября 2018 .
- ^ «Экземплярные отношения между наборами данных» . fu-berlin.de . Проверено 22 марта 2018 .
- ^ «Классовые отношения между наборами данных» . Архивировано из оригинального 28 августа 2011 года . Проверено 22 марта 2018 .
Дальнейшее чтение [ править ]
- Ахмет Сойлу, Феликс Мёдритшер и Патрик Де Каусмеккер. 2012. «Повсеместная веб-навигация через сбор встроенных семантических данных: мобильный сценарий». Интегрированная компьютерная инженерия 19 (1): 93–109.
- Связанные данные: превращение Интернета в глобальное пространство данных (2011) Тома Хита и Кристиана Бизера, Лекции по синтезу семантической сети: теория и технология, Morgan & Claypool
- Как опубликовать связанные данные в Интернете , Крис Байзер, Ричард Циганиак и Том Хит, Учебное пособие по связанным данным, Свободный университет Берлина, Германия, 27 июля 2007 г.
- Интернету исполняется 20 лет: связанные данные дают людям силу , часть 1 из 4, Марк Фишетти, Scientific American 2010, 23 октября
- Связанные данные - это просто больше данных - Пратик Джайн, Паскаль Хитцлер , Питер З. Йе, Кунал Верма и Амит П. Шет. В: Дэн Брикли, Виней К. Чаудри, Гарри Халпин и Дебора МакГиннесс: Связанные данные и искусственный интеллект . Технический отчет SS-10-07, AAAI Press, Менло-Парк, Калифорния, 2010 г., стр. 82–86.
- Выходя за рамки того же, что и с PLATO: обнаружение партономии для связанных данных - Пратик Джайн, Паскаль Хитцлер , Кунал Верма, Питер З. Йе, Амит Шет. В: Материалы 23-й конференции ACM по гипертексту и социальным сетям (HT 2012), Милуоки, Висконсин, США, 25–28 июня 2012 г.
- Фрейтас, Андре, Эдвард Карри, Жоао Габриэль Оливейра и Шон О'Риэн. 2012. «Запросы гетерогенных наборов данных в сети связанных данных: проблемы, подходы и тенденции». IEEE Internet Computing 16 (1): 24–33.
- Связывание открытых данных в сети - Крис Байзер, Том Хит, Дэнни Эйерс, Ив Раймонд. In Proceedings Poster Track, ESWC2007, Инсбрук, Австрия
- Согласование онтологий для связанных открытых данных - Пратик Джайн, Паскаль Хитцлер , Амит Шет, Кунал Верма, Питер З. Йе. В трудах 9-й Международной конференции по семантической паутине, ISWC 2010, Шанхай, Китай
- Связанные открытые данные о лекарствах для фармацевтических исследований и разработок - J Cheminform. 2011; 3:19. Самвальд, Йенч, Бутон, Каллесо, Виллигхаген, Хаджагос, Маршалл, Прюдоммо, Хассензаде, Пихлер и Стивенс (май 2011 г.)
- Интервью с Сереном Ауэром, руководителем проекта LOD2 о продолжении LOD2 в 2011 г. , июнь 2011 г.
- Связанные открытые данные: основы - Флориан Бауэр и Мартин Кальтенбек (январь 2012 г.)
- Взмах крыла бабочки - semanticweb.com Ричард Уоллис (февраль 2012 г.)
Внешние ссылки [ править ]
У Scholia есть тематический профиль для связанных данных . |
- LinkedData в W3C Wiki
- LinkedData.org
- Официальные документы по программному обеспечению OpenLink
- [постоянная мертвая ссылка ] Данные из схемы Northwind SQL в виде связанных данных, демонстрационный пример использования
- Связанные данные для дисциплины нумизматика , демонстрационный пример использования
- Интерактивная демонстрация LOD
- OptiqueVQS - инструмент визуальной формулировки запросов на основе онтологий