Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Сеть из более чем тысячи кругов, сгруппированных в группы и связанных линиями в паутину.
Викиданные в связанном облаке открытых данных. Базы данных обозначены кружками (викиданные обозначены как WD), с серыми линиями, связывающими базы данных в сети, если их данные выровнены.

В вычислении , связанные данные (часто капитализированные как Linked Data ) структурированы данные , которые взаимосвязаны с другими данными , поэтому она становится более полезной с помощью семантических запросов . Он основан на стандартных веб- технологиях, таких как HTTP , RDF и URI , но вместо того, чтобы использовать их для обслуживания веб-страниц только для людей, читающих, он расширяет их, чтобы обмениваться информацией таким образом, чтобы компьютеры могли автоматически считывать ее. Часть видения связанных данных заключается в том, чтобы Интернет стал глобальной базой данных . [1]

Тим Бернерс-Ли , директор Консорциума Всемирной паутины (W3C), ввел этот термин в заметку о дизайне проекта Семантической паутины в 2006 году . [2]

Связанные данные также могут быть открытыми данными , и в этом случае их обычно называют связанными открытыми данными ( LOD ). [3]

Принципы [ править ]

В своей заметке 2006 г. «Связанные данные» Тим Бернерс-Ли изложил четыре принципа связанных данных, перефразируя их следующим образом: [2]

  1. Унифицированные идентификаторы ресурсов (URI) следует использовать для именования и идентификации отдельных вещей.
  2. Следует использовать HTTP URI, чтобы эти вещи можно было найти, интерпретировать и впоследствии «разыменовать».
  3. Полезная информация о том, что идентифицирует имя, должна предоставляться через открытые стандарты, такие как RDF , SPARQL и т. Д.
  4. При публикации данных в Интернете следует ссылаться на другие объекты, используя их имена на основе HTTP URI.

Тим Бернерс-Ли позже подтвердил эти принципы на конференции TED 2009 года , снова перефразируя следующим образом: [4]

  1. Все концептуальные вещи должны иметь имя, начинающееся с HTTP .
  2. Поиск имени HTTP должен возвращать полезные данные о предмете, о котором идет речь, в стандартном формате.
  3. Все остальное, с чем эта же вещь связана через свои данные, также должно иметь имя, начинающееся с HTTP.

Компоненты [ править ]

Связанные открытые данные [ править ]

Связанные открытые данные - это связанные данные, которые являются открытыми данными . [5] [6] [7] Тим Бернерс-Ли дает самое четкое определение связанных открытых данных в отличие от связанных данных.

Связанные открытые данные (LOD) - это связанные данные, которые выпускаются по открытой лицензии, что не препятствует их повторному использованию бесплатно.

-  Тим Бернерс-Ли, Связанные данные [2] [8]

Большие связанные наборы открытых данных включают DBpedia и Wikidata .

5-звездочные связанные открытые данные [ править ]

Схема развертывания связанных открытых данных [9]

Тим Бернерс-Ли предложил 5-звездочную схему оценки качества открытых данных в Интернете, для которой наивысший рейтинг имеют связанные открытые данные: [10]

  • 1 звезда: данные доступны в любом формате в открытом доступе.
  • 2 звезды: данные доступны в формате структуры, таком как формат файла Microsoft Excel (.xls).
  • 3 звезды: данные доступны в непатентованном структурированном формате, например в значениях, разделенных запятыми (.csv).
  • 4 звезды: данные соответствуют стандартам W3C , таким как использование RDF и использование URI .
  • 5 звезд: все остальные, а также ссылки на другие связанные источники открытых данных.

История [ править ]

Термин «связанные открытые данные» используется по крайней мере с февраля 2007 г., когда был создан список рассылки «Связанные открытые данные» [11] . [12] Список рассылки был первоначально организован Симиле проект [13] в Массачусетском технологическом институте .

Связывание проекта сообщества Open Data [ править ]

На приведенной выше диаграмме показано, какие наборы данных Linking Open Data связаны по состоянию на август 2014 года. Это было создано в рамках проекта Linked Open Data Cloud, который был начат в 2007 году. Некоторые наборы могут включать данные, защищенные авторским правом, которые находятся в свободном доступе. [14]
Та же диаграмма, что и выше, но для февраля 2017 года, показывающая рост всего за два с половиной года.

Цель проекта сообщества Linking Open Data группы W3C Semantic Web Education and Outreach - расширить Интернет за счет общего доступа к данным путем публикации различных открытых наборов данных в виде RDF в Интернете и путем установки связей RDF между элементами данных из разных источников данных. В октябре 2007 года наборы данных состояли из более чем двух миллиардов RDF- троек , которые были связаны между собой более чем двумя миллионами RDF-ссылок. [15] [16] К сентябрю 2011 года это число выросло до 31 миллиарда троек RDF, связанных между собой примерно 504 миллионами ссылок RDF. Подробная статистическая разбивка была опубликована в 2014 году [17].

Проекты Европейского Союза [ править ]

Есть ряд проектов Европейского Союза, связанных с данными. К ним относятся проект связанных открытых данных круглосуточно (LATC), [18] проект PlanetData, [19] проект DaPaaS (данные и платформа как услуга) [20] и связанные открытые данные 2. (LOD2) проект. [21] [22] [23] Связывание данных - одна из основных целей портала открытых данных ЕС , который делает доступными тысячи наборов данных для повторного использования и связывания.

Онтологии [ править ]

Онтологии - это формальные описания структур данных. Некоторые из наиболее известных онтологий:

  • FOAF - онтология, описывающая людей, их свойства и отношения
  • UMBEL - облегченная ссылочная структура из 20 000 классов предметных понятий и их взаимосвязей, производных от OpenCyc , которые могут действовать как классы привязки к внешним данным; также имеет ссылки на 1,5 миллиона именованных сущностей из DBpedia и YAGO

Наборы данных [ править ]

  • DBpedia - набор данных, содержащий извлеченные данные из Википедии; он содержит около 3,4 миллиона концепций, описанных 1 миллиардом троек , включая аннотации на 11 разных языках.
  • GeoNames - предоставляет RDF-описания более 7 500 000 географических объектов по всему миру.
  • Викиданные - совместно созданный связанный набор данных, который действует как центральное хранилище для структурированных данных дочерних проектов Фонда Викимедиа.
  • Глобальная база данных идентификаторов исследований ( GRID ) - международная база данных 89 506 учреждений, занимающихся академическими исследованиями, с 14 401 отношениями, моделирует два типа отношений: отношения родитель-потомок, которые определяют подчиненную ассоциацию, и связанные отношения, описывающие другие ассоциации [24 ] [25]

Отношения экземпляра набора данных и класса [ править ]

Доступны интерактивные диаграммы, которые показывают отдельные наборы данных и их отношения в созданном DBpedia облаке LOD (как показано на рисунках справа). [26] [27]

См. Также [ править ]

  • American Art Collaborative - консорциум художественных музеев США, стремящийся создать критическую массу связанных открытых данных об американском искусстве.
  • Авторитетный контроль - о контролируемых рубриках в каталогах библиотек
  • Анализ цитирования - для цитирования между научными статьями
  • Гиперданные
  • Сетевая модель - старый тип системы управления базами данных
  • Schema.org
  • VoID - Словарь взаимосвязанных наборов данных
  • Язык веб-онтологий

Ссылки [ править ]

  1. ^ «Связанные данные как JSON» . Связанные данные как JSON . Проверено 4 декабря 2020 .
  2. ^ a b c Тим Бернерс-Ли (27.07.2006). «Связанные данные» . Проблемы дизайна . W3C . Проверено 18 декабря 2010 .
  3. ^ «Что такое связанные данные и связанные открытые данные?» . Онтекст . Проверено 8 мая 2019 .
  4. ^ «Тим Бернерс-Ли в следующей сети» .
  5. ^ «Часто задаваемые вопросы (FAQ) - Связанные данные - Соединение распределенных данных через Интернет» .
  6. ^ «COAR» 7 вещей, которые вы должны знать о… связанных данных » . Архивировано из оригинала на 2015-11-18 . Проверено 29 декабря 2015 .
  7. ^ «Основы связанных данных для технических специалистов» .
  8. ^ «5 звезд открытых данных» .
  9. ^ «5-звездочные открытые данные» . 5stardata.info . Проверено 7 марта 2021 .
  10. ^ «Что такое 5-звездочные связанные данные? | Группа сообщества Webize Everything» . www.w3.org . Проверено 7 марта 2021 .
  11. ^ "[email protected] Почтовые архивы" .
  12. ^ "SweoIG / TaskForces / CommunityProjects / LinkingOpenData / NewsArchive" .
  13. ^ «SIMILE Project - Списки рассылки» .
  14. ^ Связывание диаграммы облака открытых данных 2014 г., Макс Шмахтенберг, Кристиан Бизер, Аня Йенч и Ричард Циганиак. http://lod-cloud.net/
  15. ^ "SweoIG / TaskForces / CommunityProjects / LinkingOpenData - W3C Wiki" . esw.w3.org . Проверено 22 марта 2018 .
  16. ^ Фензель, Дитер; Факка, Федерико Микеле; Симперл, Елена; Иоан, Тома (2011). Семантические веб-службы . Springer. п. 99. ISBN 978-3642191923.
  17. ^ Макс. «Состояние облака LOD» . connecteddatacatalog.dws.informatik.uni-mannheim.de . Проверено 22 марта 2018 .
  18. ^ «Связанные открытые данные круглосуточно (LATC)» . latc-project.eu . Архивировано из оригинального 19 сентября 2018 года . Проверено 22 марта 2018 .
  19. ^ «Добро пожаловать в PlanetData! - PlanetData» . planet-data.eu . Проверено 22 марта 2018 .
  20. ^ "DaPaaS" . project.dapaas.eu . Проверено 22 марта 2018 .
  21. ^ Связывание открытых данных 2 (LOD2)
  22. ^ «Проекты CORDIS FP7 ICT - LOD2» . Европейская комиссия. 2010-04-20.
  23. ^ «Информационный бюллетень по проекту LOD2 - Краткое изложение проекта» (PDF) . 2010-09-01. Архивировано из оригинального (PDF) 20 июля 2011 года . Проверено 18 декабря 2010 .
  24. ^ «Статистика GRID» . grid.ac/stats . Проверено 26 октября 2018 .
  25. ^ «Политики GRID» . grid.ac . Проверено 26 октября 2018 .
  26. ^ «Экземплярные отношения между наборами данных» . fu-berlin.de . Проверено 22 марта 2018 .
  27. ^ «Классовые отношения между наборами данных» . Архивировано из оригинального 28 августа 2011 года . Проверено 22 марта 2018 .

Дальнейшее чтение [ править ]

  • Ахмет Сойлу, Феликс Мёдритшер и Патрик Де Каусмеккер. 2012. «Повсеместная веб-навигация через сбор встроенных семантических данных: мобильный сценарий». Интегрированная компьютерная инженерия 19 (1): 93–109.
  • Связанные данные: превращение Интернета в глобальное пространство данных (2011) Тома Хита и Кристиана Бизера, Лекции по синтезу семантической сети: теория и технология, Morgan & Claypool
  • Как опубликовать связанные данные в Интернете , Крис Байзер, Ричард Циганиак и Том Хит, Учебное пособие по связанным данным, Свободный университет Берлина, Германия, 27 июля 2007 г.
  • Интернету исполняется 20 лет: связанные данные дают людям силу , часть 1 из 4, Марк Фишетти, Scientific American 2010, 23 октября
  • Связанные данные - это просто больше данных - Пратик Джайн, Паскаль Хитцлер , Питер З. Йе, Кунал Верма и Амит П. Шет. В: Дэн Брикли, Виней К. Чаудри, Гарри Халпин и Дебора МакГиннесс: Связанные данные и искусственный интеллект . Технический отчет SS-10-07, AAAI Press, Менло-Парк, Калифорния, 2010 г., стр. 82–86.
  • Выходя за рамки того же, что и с PLATO: обнаружение партономии для связанных данных - Пратик Джайн, Паскаль Хитцлер , Кунал Верма, Питер З. Йе, Амит Шет. В: Материалы 23-й конференции ACM по гипертексту и социальным сетям (HT 2012), Милуоки, Висконсин, США, 25–28 июня 2012 г.
  • Фрейтас, Андре, Эдвард Карри, Жоао Габриэль Оливейра и Шон О'Риэн. 2012. «Запросы гетерогенных наборов данных в сети связанных данных: проблемы, подходы и тенденции». IEEE Internet Computing 16 (1): 24–33.
  • Связывание открытых данных в сети - Крис Байзер, Том Хит, Дэнни Эйерс, Ив Раймонд. In Proceedings Poster Track, ESWC2007, Инсбрук, Австрия
  • Согласование онтологий для связанных открытых данных - Пратик Джайн, Паскаль Хитцлер , Амит Шет, Кунал Верма, Питер З. Йе. В трудах 9-й Международной конференции по семантической паутине, ISWC 2010, Шанхай, Китай
  • Связанные открытые данные о лекарствах для фармацевтических исследований и разработок - J Cheminform. 2011; 3:19. Самвальд, Йенч, Бутон, Каллесо, Виллигхаген, Хаджагос, Маршалл, Прюдоммо, Хассензаде, Пихлер и Стивенс (май 2011 г.)
  • Интервью с Сереном Ауэром, руководителем проекта LOD2 о продолжении LOD2 в 2011 г. , июнь 2011 г.
  • Связанные открытые данные: основы - Флориан Бауэр и Мартин Кальтенбек (январь 2012 г.)
  • Взмах крыла бабочки - semanticweb.com Ричард Уоллис (февраль 2012 г.)

Внешние ссылки [ править ]

  • LinkedData в W3C Wiki
  • LinkedData.org
  • Официальные документы по программному обеспечению OpenLink
  • [постоянная мертвая ссылка ] Данные из схемы Northwind SQL в виде связанных данных, демонстрационный пример использования
  • Связанные данные для дисциплины нумизматика , демонстрационный пример использования
  • Интерактивная демонстрация LOD
  • OptiqueVQS - инструмент визуальной формулировки запросов на основе онтологий