Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Семантическая тройка , или RDF тройной или просто тройной , атомный объект данных в Описании Resource Framework (RDF) модели данных. [1] Как видно из названия, тройка - это набор из трех сущностей, которые кодифицируют утверждение о семантических данных в форме выражений субъект – предикат – объект (например, «Бобу 35 лет» или «Боб знает Джона»).

Субъект, сказуемое и объект [ править ]

Этот формат позволяет представлять знания в машиночитаемом виде. В частности, каждая часть тройки RDF адресуется индивидуально с помощью уникальных URI - например, утверждение «Боб знает Джона» может быть представлено в RDF как:

http://example.name#BobSmith12 http://xmlns.com/foaf/0.1/knows http://example.name#JohnDoe34.

При таком точном представлении семантические данные могут быть однозначно запрошены и обоснованы .

Изображение, изображающее объектное отношение субъект-предикат.
Базовая семантическая тройная модель.

Компоненты тройки, такие как утверждение «Небо имеет синий цвет», состоят из субъекта («небо»), предиката («имеет цвет») и объекта («синий»). Это похоже на классическую нотацию модели сущность-атрибут-значение в объектно-ориентированном дизайне , где этот пример может быть выражен как сущность (небо), атрибут (цвет) и значение (синий).

Исходя из этой базовой структуры, тройки можно объединить в более сложные модели , используя тройки в качестве объектов или субъектов других троек, например Mike → said → (triples → can be → objects).

Учитывая их особую согласованную структуру, набор троек часто хранится в специально созданных базах данных, называемых Triplestores .

Отличие от реляционных баз данных [ править ]

Реляционная база данных является классической формой для хранения информации. Он работает с разными таблицами, состоящими из строк. Хорошо известный язык SQL может извлекать информацию из базы данных. Напротив, тройное хранилище RDF работает с логическими предикатами. Никаких таблиц или строк не требуется, но информация хранится в текстовом файле. Хранилище RDF-triple может быть преобразовано в базу данных SQL и наоборот. [2] Если знания сильно неструктурированы, а выделенные таблицы недостаточно гибки, вместо классического хранилища SQL используются семантические тройки.

В отличие от традиционной базы данных SQL, тройное хранилище RDF не создается с помощью редакторов таблиц, но предпочтительным инструментом является редактор знаний , например Protege. [3] Protégé похож на приложение объектно-ориентированного моделирования, используемое для разработки программного обеспечения , но оно ориентировано на информацию на естественном языке. Тройки RDF объединены в базу знаний, которая позволяет внешнему синтаксическому анализатору выполнять запросы. Возможные приложения находятся в видеоиграх для создания неигровых персонажей. [4]

Ограничения [ править ]

Проблема с тройным хранилищем легко решается - это отсутствие масштабируемости базы данных для больших наборов данных. [5] Проблема стала очевидной, если не только немного информации, но и миллионы троек хранятся и извлекаются в базе данных. Время поиска больше, чем для классических баз данных на базе SQL.

Немного сложнее исправить отсутствующую способность предсказывать будущую ситуацию с помощью данной модели знаний. Даже если вся информация доступна в виде логических предикатов , модель не может ответить на вопросы « что, если» . Например, предположим, что в RDF-формате очень хорошо описан мир робота. Робот знает, где находится стол, знает расстояние до стола в сантиметрах, а также знает, что стол - это мебель. Прежде чем робот сможет спланировать следующее действие, ему необходимы способности к временному рассуждению . [6] Это означает, что модель знаний должна отвечать на гипотетические вопросы заранее, прежде чем будет предпринято действие.

См. Также [ править ]

Ссылки [ править ]

  1. ^ http://www.w3.org/TR/PR-rdf-syntax/ "Модель описания ресурсов (RDF) и спецификация синтаксиса"
  2. ^ Cuddihy, Пол и Мак, и Джастин Уильямс, Дженне Weisenberg и Mulwad, варит и Aggour, Карима S (2017). «SemTK: Онтологи-первые, семантические инструменты с открытым исходным кодом для управления и запросов к графам знаний». arXiv : 1710.11531 [ cs.AI ].CS1 maint: несколько имен: список авторов ( ссылка )
  3. ^ Katis, Эвенджелос (2018). Семантическое моделирование образовательных программ и программ (PhD). Технологический образовательный институт Крита.
  4. ^ Kluwer, Тина и Adolphs, Питер и Сюй, Feiyu и Uszkoreit, Ганс и Cheng, Xiwen (2010). Говорящие NPC в виртуальном игровом мире . Материалы демонстраций системы ACL 2010. С. 36–41.CS1 maint: несколько имен: список авторов ( ссылка )
  5. ^ Ярослав Покорный (2015). «Графические базы данных: их возможности и ограничения». Компьютерные информационные системы и промышленный менеджмент (PDF) . Конспект лекций по информатике. 9339 . Издательство Springer International. С. 58–69. DOI : 10.1007 / 978-3-319-24369-6_5 . ISBN  978-3-319-24368-9.
  6. ^ Клаудио Гутьеррес и Карлос Уртадо и Алехандро Вайсман (2007). «Введение времени в RDF». IEEE Transactions по разработке знаний и данных . Институт инженеров по электротехнике и радиоэлектронике (IEEE). 19 (2): 207–218. DOI : 10,1109 / tkde.2007.34 .

Внешние ссылки [ править ]

  • «RDF 1.1 Primer § Triples» . W3C .