Интеграция данных на основе онтологий включает использование одной или нескольких онтологий для эффективного объединения данных или информации из нескольких разнородных источников. [1] Это один из нескольких подходов к интеграции данных, который можно отнести к категории Global-As-View (GAV). [2] Эффективность интеграции данных на основе онтологий тесно связана с согласованностью и выразительностью онтологии, используемой в процессе интеграции.
Задний план
Данные из множества источников характеризуются множественной неоднородностью. Часто используется следующая иерархия: [3] [4] [5]
- Синтаксическая неоднородность : является результатом различий в формате представления данных.
- Схематическая или структурная неоднородность : исходная модель или структура для хранения данных различаются источниками данных, что приводит к структурной неоднородности. Схематическая неоднородность, которая особенно проявляется в структурированных базах данных, также является аспектом структурной неоднородности. [3]
- Семантическая неоднородность : различия в интерпретации «значения» данных являются источником семантической неоднородности.
- Неоднородность системы : использование разных операционных систем и аппаратных платформ приводит к неоднородности системы.
Онтологии как формальные модели представления с явно определенными концепциями и связывающими их именованными отношениями используются для решения проблемы семантической неоднородности в источниках данных. В таких областях, как биоинформатика и биомедицина , быстрая разработка, принятие и общедоступность онтологий [1] позволили сообществу интеграции данных использовать их для семантической интеграции данных и информации.
Роль онтологий
Онтологии позволяют однозначно идентифицировать сущности в разнородных информационных системах и устанавливать применимые именованные отношения, которые связывают эти сущности вместе. В частности, онтологии играют следующие роли:
- Экспликация содержания
- [1] Онтология обеспечивает точную интерпретацию данных из нескольких источников посредством явного определения терминов и отношений в онтологии.
- Модель запроса
- [1] В некоторых системах, таких как SIMS, [6] запрос формулируется с использованием онтологии в качестве глобальной схемы запроса.
- Проверка
- [1] Онтология проверяет сопоставления, используемые для интеграции данных из нескольких источников. Эти сопоставления могут задаваться пользователем или создаваться системой.
Подходы с использованием онтологий для интеграции данных
В приложениях интеграции данных на основе онтологий реализуются три основные архитектуры [1], а именно:
- Подход с единой онтологией
- Одна онтология используется в качестве глобальной эталонной модели в системе. Это самый простой подход, поскольку его можно смоделировать другими подходами. [1] SIMS [6] яркий пример этого подхода. Компонент «Интеграция структурированных источников знаний» исследовательского цикла является еще одним ярким примером этого подхода. [7] [8] (Название = Использование цикла для ответов на специальные запросы клинических исследователей). Таксономический словарь-онтология Gellish также следует этому подходу. [9]
- Множественные онтологии
- Для интеграции используются комбинации нескольких онтологий, каждая из которых моделирует отдельный источник данных. Хотя этот подход более гибкий, чем подход с использованием одной онтологии, он требует создания отображений между несколькими онтологиями. Отображение онтологий - сложный вопрос, на котором сосредоточено большое количество исследований в области компьютерных наук [2] . Система OBSERVER [10] является примером такого подхода.
- Гибридные подходы
- Гибридный подход предполагает использование нескольких онтологий, которые подписываются на общий словарь верхнего уровня. [11] Словарь верхнего уровня определяет основные термины домена. Таким образом, гибридный подход упрощает использование нескольких онтологий для интеграции при наличии общего словаря.
Смотрите также
Рекомендации
- ^ Б с д е ф H. Wache; Т. Фогеле; У. Виссер; Х. Штукеншмидт; Г. Шустер; Х. Нейман; С. Хюбнер (2001). Интеграция информации на основе онтологий Обзор существующих подходов . CiteSeerX 10.1.1.142.4390 .
- ^ Маурицио Лензерини (2002). Интеграция данных: теоретическая перспектива (PDF) . С. 243–246.
- ^ а б А.П. Шет (1999). Смена акцента на совместимость информационных систем: от системы, синтаксиса, структуры к семантике (PDF) . С. 5–30.
- ^ AHM02 Урок 5: Интеграция данных и посредничество; Авторы: Б. Людашер, И. Алтинтас, А. Гупта, М. Мартоне, Р. Марчиано, X. Цянь
- ^ «AHM02 Tutorial 5: Data Integration and Mediation» . users.sdsc.edu . Проверено 23 ноября 2017 .
- ^ а б Ю. Аренс; C. Hsu; CA Knoblock (1996). Обработка запросов в информационном посреднике sims (PDF) .
- ^ http://www.cyc.com/content/semantic-knowledge-source-integration
- ^ «Архивная копия» . Архивировано из оригинала на 2010-12-31 . Проверено 15 мая 2014 .CS1 maint: заархивированная копия как заголовок ( ссылка )
- ^ https://www.gellish.net
- ^ Э. Мена; В. Кашьяп; А. Шет; А. Илларраменди (1996). НАБЛЮДАТЕЛЬ: подход к обработке запросов в глобальных информационных системах, основанный на взаимодействии существующих онтологий (PDF) .
- ^ Ченг Хиан Го (1997). Представление и рассуждение о семантических конфликтах в гетерогенных информационных системах (PDF) .
Внешние ссылки
- Домашняя страница OBSERVER
- Циклическая интеграция семантических источников знаний (SKSI)