Семантическая интеграция - это процесс взаимосвязи информации из различных источников, например календарей и списков дел, архивов электронной почты, информации о присутствии (физического, психологического и социального), всех видов документов, контактов (включая социальные графики ), результатов поиска и рекламная и маркетинговая релевантность, полученная от них. В связи с этим, семантика сосредотачивается на организации и действия на информации , выступая в качестве посредника между разнородными источниками данных, которые могут вступать в конфликт не только структуры , но и контекст или значение.
Приложения и методы
В интеграции корпоративных приложений (EAI) семантическая интеграция может облегчить или даже автоматизировать обмен данными между компьютерными системами с помощью публикации метаданных . Публикация метаданных потенциально предлагает возможность автоматически связывать онтологии . Один подход к (полу) автоматизированному отображению онтологий требует определения семантического расстояния или его обратного, семантического сходства и соответствующих правил. Другие подходы включают так называемые лексические методы , а также методологии, основанные на использовании структур онтологий. Для явного указания сходства / равенства в большинстве языков онтологий существуют специальные свойства или отношения. OWL , например, имеет «сова: эквивалентClass», «сова: эквивалентное свойство» и «сова: жеАс».
Со временем в системных проектах может появиться составная архитектура, в которой опубликованные интерфейсы на основе семантики объединяются, чтобы обеспечить новые и значимые возможности [ необходима цитата ] . Преимущественно они могут быть описаны с помощью декларативных спецификаций времени разработки, которые в конечном итоге могут быть отрисованы и выполнены во время выполнения [ необходима цитата ] .
Семантическая интеграция также может использоваться для облегчения операций по проектированию и отображению интерфейсов во время разработки. В этой модели семантика только явно применяется к дизайну, а системы времени выполнения работают на уровне синтаксиса [ необходима ссылка ] . Такой подход «раннего семантического связывания» может улучшить общую производительность системы, сохраняя при этом преимущества семантического проектирования [ необходима цитата ] .
Ситуации семантической интеграции
На примере промышленного использования было замечено, что семантические сопоставления выполнялись только в рамках класса онтологии или свойства типа данных. Эти идентифицированные семантические интеграции: (1) интеграция экземпляров класса онтологии в другой класс онтологии без каких-либо ограничений, (2) интеграция выбранных экземпляров в одном классе онтологии в другой класс онтологии посредством ограничения диапазона значения свойства и (3) интеграция экземпляры класса онтологии в другой класс онтологии с преобразованием значения свойства экземпляра. Каждый из них требует определенного отношения сопоставления, которое соответственно: (1) отношение сопоставления эквивалентности или подчинения, (2) отношение условного сопоставления, которое ограничивает значение свойства (диапазон данных), и (3) отношение сопоставления преобразования, которое преобразует значение свойство (преобразование единицы). Каждую идентифицированную взаимосвязь отображения можно определить как (1) тип прямого отображения, (2) тип отображения диапазона данных или (3) тип отображения единичного преобразования.
KG vs. подходы RDB
В случае интеграции дополнительного источника данных,
- KG ( граф знаний ) формально представляет значение информации, описывая концепции, отношения между вещами и категории вещей. Эта встроенная семантика данных предлагает значительные преимущества, такие как рассуждение над данными и работа с разнородными источниками данных. Правила могут быть применены к KG более эффективно с помощью графического запроса. Например, запрос графа выполняет вывод данных через связанные отношения вместо повторного полного поиска таблиц в реляционной базе данных. KG облегчает интеграцию новых разнородных данных, просто добавляя новые отношения между существующей информацией и новыми объектами. Это упрощение подчеркивается для интеграции с существующим популярным связанным открытым источником данных, таким как Wikidata.org.
- SQL- запрос тесно связан и жестко ограничен типом данных в конкретной базе данных и может объединять таблицы и извлекать данные из таблиц. Результатом обычно является таблица, а запрос может объединять таблицы по любым столбцам, которые соответствуют типу данных. Запрос SPARQL - это стандартный язык запросов и протокол для связанных открытых данных в Интернете, который слабо связан с базой данных, что облегчает повторное использование и может извлекать данные через отношения, свободные от типа данных, и не только извлекать, но и создавать дополнительный граф знаний. с более сложными операциями (логика: транзитивная / симметричная / обратная / функциональная). Запрос на основе вывода (запрос по существующим утвержденным фактам без генерации новых фактов с помощью логики) может быть быстрым по сравнению с запросом на основе аргументов (запрос по существующим плюс сгенерированным / обнаруженным фактам на основе логики).
- Интеграция информации из разнородных источников данных в традиционную базу данных является сложной, что требует изменения дизайна таблицы базы данных, например изменения структуры и / или добавления новых данных. В случае семантического запроса запрос SPARQL отражает отношения между сущностями таким образом, чтобы соответствовать человеческому пониманию предметной области, поэтому семантическое намерение запроса можно увидеть в самом запросе. В отличие от SPARQL, SQL-запрос, который отражает конкретную структуру базы данных и получен из сопоставления соответствующих первичных и внешних ключей таблиц, теряет семантику запроса из-за отсутствия взаимосвязей между сущностями. Ниже приводится пример, в котором сравниваются запросы SPARQL и SQL для лекарств, которые лечат «туберкулез позвоночника».
ВЫБЕРИТЕ? Лекарство
ГДЕ {
? Пример диагноза: Диагностика.
Пример диагноза: название «ТБ позвонка».
Пример лекарства: canTreat - диагноз.
}
ВЫБЕРИТЕ DRUG.medID
ИЗ ДИАГНОСТИКИ, НАРКОТИКОВ, НАРКОТИКОВ,
ГДЕ DIAGNOSIS.diagnosisID = DRUG_DIAGNOSIS.diagnosisID
И DRUG.medID = DRUG_DIAGNOSIS.medID
И DIAGNOSIS.name = ”TB of vertebra
Примеры
Тихоокеанский симпозиум по Biocomputing был местом для популяризации отображения онтологии задачи в области биомедицины, а также ряд статей на эту тему можно найти в его работе.