Интеграция данных на основе онтологий - Ontology-based data integration
Интеграция данных на основе онтологий предполагает использование онтология (s) для эффективного объединения данных или информации из нескольких разнородных источников.[1] Это один из множества интеграция данных подходы и могут быть классифицированы как Global-As-View (GAV).[2] Эффективность интеграции данных на основе онтологий тесно связана с согласованностью и выразительностью онтологии, используемой в процессе интеграции.
Фон
Данные из множества источников характеризуются множественной неоднородностью. Часто используется следующая иерархия:[3][4][5]
- Синтаксическая неоднородность: является результатом различий в формате представления данных
- Схема или структурная неоднородность: исходная модель или структура для хранения данных различаются источниками данных, что приводит к структурной неоднородности. Схематическая неоднородность, которая особенно проявляется в структурированных базах данных, также является аспектом структурной неоднородности.[3]
- Семантическая неоднородность: различия в интерпретации «значения» данных являются источником семантической неоднородности
- Неоднородность системы: использование разных Операционная система, аппаратные платформы приводят к неоднородности системы
Онтологии, поскольку формальные модели представления с явно определенными концепциями и связывающими их именованными отношениями используются для решения проблемы семантическая неоднородность в источниках данных. В доменах вроде биоинформатика и биомедицина, быстрая разработка, принятие и общедоступность онтологий [1] сделал возможным интеграция данных сообщество, чтобы использовать их для семантическая интеграция данных и информации.
Роль онтологий
Онтологии позволяют однозначно идентифицировать объекты в разнородных информационных системах и устанавливать применимые именованные отношения, которые связывают эти объекты вместе. В частности, онтологии играют следующие роли:
- Экспликация содержания[1]
- Онтология обеспечивает точную интерпретацию данных из нескольких источников за счет явного определения терминов и отношений в онтологии.
- Модель запроса[1]
- В некоторых системах, таких как SIMS,[6] запрос формулируется с использованием онтологии как глобальной схемы запроса.
- Проверка[1]
- Онтология проверяет сопоставления, используемые для интеграции данных из нескольких источников. Эти сопоставления могут задаваться пользователем или генерироваться системой.
Подходы с использованием онтологий для интеграции данных
В приложениях интеграции данных на основе онтологий реализованы три основные архитектуры:[1] а именно,
- Подход с единой онтологией
- Одна онтология используется в качестве глобальной эталонной модели в системе. Это самый простой подход, поскольку его можно смоделировать другими подходами.[1] SIMS[6] яркий пример такого подхода. Компонент интеграции структурированных источников знаний Исследовательский цикл еще один яркий пример такого подхода. [7][8] (Название = Использование цикла для ответов на специальные запросы клинических исследователей). Таксономический словарь-онтология Gellish также следует этому подходу. [9]
- Множественные онтологии
- Несколько онтологий, каждая из которых моделирует отдельный источник данных, используются в комбинации для интеграции. Хотя этот подход более гибкий, чем подход с использованием одной онтологии, он требует создания отображений между несколькими онтологиями. Отображение онтологий - сложная задача, и на ней сосредоточено большое количество исследовательских усилий. Информатика [2]. Система OBSERVER[10] является примером такого подхода.
- Гибридные подходы
- Гибридный подход предполагает использование нескольких онтологий, которые подписываются на общий словарь верхнего уровня.[11] Словарь верхнего уровня определяет основные термины домена. Таким образом, гибридный подход упрощает использование нескольких онтологий для интеграции при наличии общего словаря.
Смотрите также
- Отображение данных
- Интеграция корпоративных приложений
- Интеграция корпоративной информации
- Отображение онтологий
- Соответствие схемы
Рекомендации
- ^ а б c d е ж Х. Ваче; Т. Фогеле; У. Виссер; Х. Штукеншмидт; Г. Шустер; Х. Нейман; С. Хюбнер (2001). Интеграция информации на основе онтологий Обзор существующих подходов. CiteSeerX 10.1.1.142.4390.
- ^ Маурицио Лензерини (2002). Интеграция данных: теоретическая перспектива (PDF). С. 243–246.
- ^ а б А.П. Шет (1999). Смена акцента на функциональную совместимость информационных систем: от системы, синтаксиса, структуры к семантике (PDF). С. 5–30.
- ^ AHM02 Учебное пособие 5: Интеграция и посредничество данных; Авторы: Б. Людашер, И. Алтинтас, А. Гупта, М. Мартоне, Р. Марчиано, X. Цянь
- ^ «AHM02 Tutorial 5: Data Integration and Mediation». users.sdsc.edu. Получено 2017-11-23.
- ^ а б Ю. Аренс; К. Хсу; C.A. Ноблок (1996). Обработка запросов в информационном посреднике sims (PDF).
- ^ http://www.cyc.com/content/semantic-knowledge-source-integration
- ^ «Архивная копия». Архивировано из оригинал 31 декабря 2010 г.. Получено 2014-05-15.CS1 maint: заархивированная копия как заголовок (связь)
- ^ https://www.gellish.net
- ^ Э. Мена; В. Кашьяп; А. Шет; А. Илларраменди (1996). НАБЛЮДАТЕЛЬ: подход к обработке запросов в глобальных информационных системах, основанный на взаимодействии между уже существующими онтологиями (PDF).
- ^ Ченг Хиан Го (1997). Представление и рассуждение о семантических конфликтах в гетерогенных информационных системах (PDF).