Система федеративных баз данных - Federated database system

А система федеративных баз данных это тип мета-система управления базами данных (СУБД), которая прозрачно отображает несколько автономных системы баз данных в один объединенная база данных. Составляющая базы данных связаны между собой через компьютерная сеть и может быть географически децентрализован. Поскольку составляющие системы баз данных остаются автономными, система федеративных баз данных является контрастной альтернативой (иногда сложной) задаче слияния нескольких разрозненных баз данных. Федеративная база данных или виртуальная база данных, представляет собой совокупность всех составляющих баз данных в системе баз данных объединения. Фактическая интеграция данных в составляющих разрозненных базах данных отсутствует в результате объединения данных.

Через абстракция данных системы федеративных баз данных могут обеспечить единообразие пользовательский интерфейс, позволяя пользователи и клиенты хранить и извлекать данные из нескольких несмежных базы данных с одним запрос —Даже если составляющие базы данных неоднородный. С этой целью система федеративных баз данных должна иметь возможность разложить запрос на подзапросы для отправки соответствующему компоненту. СУБД, после чего система должна составить наборы результатов подзапросов. Поскольку разные системы управления базами данных используют разные языки запросов, системы федеративных баз данных могут применяться обертки к подзапросам, чтобы преобразовать их в соответствующий языки запросов.

Определение

Маклеод и Хаймбигнер[1] были одними из первых, кто определил систему федеративных баз данных в середине 1980-х годов.

FDBS - это та, которая «определяет архитектуру и базы данных межсоединений, которые минимизируют центральную власть, но поддерживают частичное совместное использование и координацию между системами баз данных».[1] Это описание может неточно отражать McLeod / Heimbigner[1] определение базы данных объединения. Скорее, это описание соответствует тому, что МакЛеод / Хаймбигнер назвал составной база данных. Федеративная база данных Маклеода / Хаймбигнера представляет собой набор автономных компонентов, которые делают свои данные доступными для других членов федерации посредством публикации схемы экспорта и операций доступа; не существует единой центральной схемы, охватывающей информацию, доступную от членов федерации.

Среди других обзоров,[2] Практики определяют Федеративную базу данных как совокупность взаимодействующих компонентных систем, которые являются автономными и, возможно, неоднородный.

Три важных компонента FDBS - это автономность, неоднородность и распространение.[2] Еще одним аспектом, который также был рассмотрен, является сетевая среда. Компьютерная сеть, например, многие DBS над LAN или многие DBS через WAN обновлять связанные функции участвующих DBS (например, отсутствие обновлений, неатомарные переходы, атомарные обновления ).

Архитектура FDBS

А СУБД можно разделить на централизованные или распределенные. Централизованная система управляет одной базой данных, а распределенная - несколькими базами данных. Компонент DBS в СУБД может быть централизованным или распределенным. Множественные DBS (MDBS) можно разделить на два типа в зависимости от автономности компонентной DBS на федеративные и нефедеративные. Система нефедеративных баз данных представляет собой интеграцию компонентов СУБД которые не являются автономными. Система федеративных баз данных состоит из компонентов DBS которые являются автономными, но участвуют в федерации, чтобы разрешить частичный и контролируемый обмен их данными.

Объединенные архитектуры различаются в зависимости от уровней интеграции с системами компонентных баз данных и объема услуг, предлагаемых федерацией. FDBS можно разделить на системы со слабой или сильной связью.

  • Слабосвязанные требуют, чтобы базы данных компонентов создавали свои собственные федеративные схема. Обычно пользователь обращается к другим системам компонентных баз данных, используя язык с несколькими базами данных, но это удаляет любые уровни прозрачности местоположения, вынуждая пользователя иметь непосредственное знание объединенной схемы. Пользователь импортирует необходимые данные из других компонентных баз данных и интегрирует их со своими собственными, чтобы сформировать объединенную схему.
  • Тесно связанная система состоит из компонентных систем, которые используют независимые процессы для построения и публикации интегрированной объединенной схемы.

Множественные DBS, конкретным типом которых являются FDBS, можно охарактеризовать по трем параметрам: распределение, гетерогенность и автономность. Другая характеристика может быть основана на измерении сети, например, отдельные базы данных или несколько баз данных в одном LAN или WAN.

Распределение

Распределение данных в FDBS происходит из-за существования нескольких DBS до построения FDBS. Данные могут быть распределены между несколькими базами данных, которые могут храниться на одном компьютере или на нескольких компьютерах. Эти компьютеры могут быть географически расположены в разных местах, но связаны между собой сетью. Преимущества распределения данных помогают повысить доступность и надежность, а также сократить время доступа.

Неоднородность

Неоднородности в базах данных возникают из-за таких факторов, как различия в структурах, семантике данных, поддерживаемых ограничениях или язык запросов. Различия в структуре возникают, когда два модели данных предоставляют различные примитивы, такие как объектно-ориентированные (OO) модели которые поддерживают специализацию и наследование и реляционные модели это не так. Различия из-за ограничений возникают, когда две модели поддерживают два разных ограничения. Например, тип набора в КОДАСИЛ схема может быть частично смоделирован как ограничение ссылочной целостности в схеме отношений. КОДАСИЛ поддерживает вставку и сохранение, которые не фиксируются только ссылочной целостностью. Язык запросов, поддерживаемый одним СУБД также может способствовать неоднородность между другими компонентами СУБД. Например, различия в языках запросов с одинаковыми модели данных или разные версии языков запросов могут способствовать неоднородность.

Семантическая неоднородность возникает, когда есть разногласия относительно значения, интерпретации или предполагаемого использования данные. На уровне схемы и данных классификация возможных неоднородностей включает:

  • Конфликты имен, например базы данных использование разных имен для обозначения одной и той же концепции.
  • Конфликты доменов или данные конфликты представлений, например базы данных использование разных значений для представления одной и той же концепции.
  • Конфликты точности, например базы данных использование одинаковых значений данных из доменов разных мощности для того же данные.
  • Метаданные конфликты например те же концепции представлены на схема уровень и уровень экземпляра.
  • Данные конфликты например отсутствует атрибуты
  • Схема конфликты например таблица против конфликта таблицы, который включает конфликты имен, конфликты данных и т. д.

При создании объединенной схемы необходимо устранить такие неоднородности перед интеграцией компонентных схем БД.

Сопоставление схемы, сопоставление схемы

Работа с несовместимыми типами данных или синтаксисом запросов - не единственное препятствие для конкретной реализации FDBS. В системах, которые не планируются сверху вниз, общая проблема заключается в сопоставлении семантически эквивалентный, но по-разному названные части из разных схемы (= модели данных) (таблицы, атрибуты). Попарное отображение между п атрибуты приведут к правила сопоставления (с учетом сопоставлений эквивалентности) - число, которое быстро становится слишком большим для практических целей. Распространенный выход - предоставить глобальную схему, которая включает соответствующие части всех схем элементов и обеспечивает сопоставления в форме просмотры базы данных. Два основных подхода зависят от направления отображения:

  1. Global as View (GaV): глобальная схема определяется в терминах базовых схем.
  2. Local as View (LaV): локальные схемы определены в терминах глобальной схемы.

Оба являются примерами интеграция данных, называется соответствие схемы проблема.

Автономия

Принципиальным отличием MDBS от FDBS является концепция автономности. Важно понимать аспекты автономности для компонентных баз данных и то, как они могут быть решены, когда компонентная DBS участвует в FDBS. Существует четыре типа автономий, которые рассматриваются:

  • Автономность проектирования, которая относится к способности выбирать дизайн независимо от данных, языка запросов или концептуализации, функциональности реализации системы.

Неоднородности в FDBS в первую очередь из-за автономности дизайна.

  • Под автономностью связи понимается общая работа СУБД для связи с другими СУБД или нет.
  • Автономность выполнения позволяет компонентной СУБД контролировать операции, запрашиваемые локальными и внешними операциями.
  • Автономия ассоциации дает возможность компоненту DBS отделиться от федерации, что означает, что FDBS может работать независимо от любого отдельного DBS.

Исследовательская группа ANSI / X3 / SPARC разработала трехуровневую архитектуру описания данных, компонентами которой являются концептуальная схема, внутренняя схема и внешняя схема баз данных. Однако трехуровневая архитектура неадекватна для описания архитектур FDBS. Поэтому он был расширен для поддержки трех измерений FDBS, а именно: Распределение, Автономия и Гетерогенность. Ниже описывается пятиуровневая архитектура схемы.

Контроль параллелизма

В Неоднородность и Автономия требования создают особые проблемы в отношении контроль параллелизма в FDBS, что имеет решающее значение для правильного выполнения его параллельных сделки (смотрите также Глобальный контроль параллелизма ). Достижение глобальная сериализуемость, главный критерий корректности, по этим требованиям был охарактеризован как очень сложный и нерешенный.[2] Заказ обязательств, представленная в 1991 г., дала общее решение этой проблемы (см. Глобальная сериализуемость; Увидеть Заказ обязательств также для архитектурных аспектов решения).

Пятиуровневая схема архитектуры для FDBS

Пятиуровневая архитектура схемы включает следующее:

  • Локальная схема - это, по сути, концептуальная модель базы данных компонентов, выраженная в собственной модели данных.[3]
  • Схема компонентов - это подмножество локальной схемы, которой организация-владелец желает поделиться с другими пользователями FDBS, и она транслируется в общую модель данных.[3]
  • Схема экспорта представляет собой подмножество схемы компонентов, доступной для конкретной федерации.[3] Он может включать информацию об управлении доступом, касающуюся его использования конкретным пользователем федерации. Схема экспорта помогает в управлении потоком данных.
  • Федеративная схема - это интеграция нескольких схем экспорта. Он включает информацию о распределении данных, которая создается при интеграции схем экспорта.[3]
  • Внешняя схема извлекается из объединенной схемы и определяется для пользователей / приложений конкретной федерации.[3]

Пятиуровневая архитектура схемы, представленная выше, точно отражает современное состояние интеграции данных, но все же страдает серьезным недостатком, а именно внешним видом, навязанным ИТ. Современные пользователи данных требуют контроля над представлением данных; их потребности в некоторой степени противоречат подобным восходящим подходам к интеграции данных.

Смотрите также

использованная литература

  1. ^ а б c "Маклеод и Хаймбигнер (1985). «Федеративная архитектура для управления информацией». Транзакции ACM по информационным системам, Том 3, Выпуск 3. С. 253–278.
  2. ^ а б c "Шет и Ларсон (1990). «Системы федеративных баз данных для управления распределенными, гетерогенными и автономными базами данных». ACM Computing Surveys, Vol. 22, №3. С. 183–236.
  3. ^ а б c d е Масуд, Найер; Иглстоун, Барри (декабрь 2003 г.). «Концептуальные модели компонентов и федерации в системе федеративных баз данных» (PDF). Малазийский журнал компьютерных наук. 16 (2): 47–57. Архивировано из оригинал (PDF) на 2016-03-07. Получено 2016-03-03.

внешние ссылки