Интеграция данных на основе онтологий - Ontology-based data integration

Интеграция данных на основе онтологий предполагает использование онтология (s) для эффективного объединения данных или информации из нескольких разнородных источников.[1] Это один из множества интеграция данных подходы и могут быть классифицированы как Global-As-View (GAV).[2] Эффективность интеграции данных на основе онтологий тесно связана с согласованностью и выразительностью онтологии, используемой в процессе интеграции.

Фон

Данные из множества источников характеризуются множественной неоднородностью. Часто используется следующая иерархия:[3][4][5]

Онтологии, поскольку формальные модели представления с явно определенными концепциями и связывающими их именованными отношениями используются для решения проблемы семантическая неоднородность в источниках данных. В доменах вроде биоинформатика и биомедицина, быстрая разработка, принятие и общедоступность онтологий [1] сделал возможным интеграция данных сообщество, чтобы использовать их для семантическая интеграция данных и информации.

Роль онтологий

Онтологии позволяют однозначно идентифицировать объекты в разнородных информационных системах и устанавливать применимые именованные отношения, которые связывают эти объекты вместе. В частности, онтологии играют следующие роли:

Экспликация содержания[1]
Онтология обеспечивает точную интерпретацию данных из нескольких источников за счет явного определения терминов и отношений в онтологии.
Модель запроса[1]
В некоторых системах, таких как SIMS,[6] запрос формулируется с использованием онтологии как глобальной схемы запроса.
Проверка[1]
Онтология проверяет сопоставления, используемые для интеграции данных из нескольких источников. Эти сопоставления могут задаваться пользователем или генерироваться системой.

Подходы с использованием онтологий для интеграции данных

В приложениях интеграции данных на основе онтологий реализованы три основные архитектуры:[1] а именно,

Подход с единой онтологией
Одна онтология используется в качестве глобальной эталонной модели в системе. Это самый простой подход, поскольку его можно смоделировать другими подходами.[1] SIMS[6] яркий пример такого подхода. Компонент интеграции структурированных источников знаний Исследовательский цикл еще один яркий пример такого подхода. [7][8] (Название = Использование цикла для ответов на специальные запросы клинических исследователей). Таксономический словарь-онтология Gellish также следует этому подходу. [9]
Множественные онтологии
Несколько онтологий, каждая из которых моделирует отдельный источник данных, используются в комбинации для интеграции. Хотя этот подход более гибкий, чем подход с использованием одной онтологии, он требует создания отображений между несколькими онтологиями. Отображение онтологий - сложная задача, и на ней сосредоточено большое количество исследовательских усилий. Информатика [2]. Система OBSERVER[10] является примером такого подхода.
Гибридные подходы
Гибридный подход предполагает использование нескольких онтологий, которые подписываются на общий словарь верхнего уровня.[11] Словарь верхнего уровня определяет основные термины домена. Таким образом, гибридный подход упрощает использование нескольких онтологий для интеграции при наличии общего словаря.

Смотрите также

Рекомендации

  1. ^ а б c d е ж Х. Ваче; Т. Фогеле; У. Виссер; Х. Штукеншмидт; Г. Шустер; Х. Нейман; С. Хюбнер (2001). Интеграция информации на основе онтологий Обзор существующих подходов. CiteSeerX  10.1.1.142.4390.
  2. ^ Маурицио Лензерини (2002). Интеграция данных: теоретическая перспектива (PDF). С. 243–246.
  3. ^ а б А.П. Шет (1999). Смена акцента на функциональную совместимость информационных систем: от системы, синтаксиса, структуры к семантике (PDF). С. 5–30.
  4. ^ AHM02 Учебное пособие 5: Интеграция и посредничество данных; Авторы: Б. Людашер, И. Алтинтас, А. Гупта, М. Мартоне, Р. Марчиано, X. Цянь
  5. ^ «AHM02 Tutorial 5: Data Integration and Mediation». users.sdsc.edu. Получено 2017-11-23.
  6. ^ а б Ю. Аренс; К. Хсу; C.A. Ноблок (1996). Обработка запросов в информационном посреднике sims (PDF).
  7. ^ http://www.cyc.com/content/semantic-knowledge-source-integration
  8. ^ «Архивная копия». Архивировано из оригинал 31 декабря 2010 г.. Получено 2014-05-15.CS1 maint: заархивированная копия как заголовок (связь)
  9. ^ https://www.gellish.net
  10. ^ Э. Мена; В. Кашьяп; А. Шет; А. Илларраменди (1996). НАБЛЮДАТЕЛЬ: подход к обработке запросов в глобальных информационных системах, основанный на взаимодействии между уже существующими онтологиями (PDF).
  11. ^ Ченг Хиан Го (1997). Представление и рассуждение о семантических конфликтах в гетерогенных информационных системах (PDF).

внешняя ссылка