Управление основными данными - Master data management

Управление основными данными («MDM») - это технологическая дисциплина, в которой бизнес и Информационные технологии («ИТ») работают вместе, чтобы обеспечить единообразие, точность, управление, семантическую согласованность и подотчетность официальных совместно используемых основные данные ресурсы.[1][2]

Драйверы для управления основными данными

Организации или группы организаций могут установить потребность в управлении основными данными, если они хранят более одной копии данных о бизнес-объекте. Наличие более одной копии этих основных данных по сути означает, что поддержание "единственная версия правды "во всех копиях. Если не будут задействованы люди, процессы и технологии, обеспечивающие согласованность значений данных во всех копиях, практически неизбежно будут храниться разные версии информации о бизнес-объекте. Это приводит к неэффективности операционных данных использовать и ограничивает способность организаций составлять отчеты и анализировать. На базовом уровне управление основными данными направлено на то, чтобы организация не использовала несколько (потенциально непоследовательный ) версии одних и тех же основных данных в разных частях своих операций, которые могут происходить в крупных организациях.

Другие проблемы включают (например) проблемы с качество данных, последовательный классификация и идентификация данных, и сверка данных вопросы. Управление основными данными разрозненных систем данных требует преобразование данных поскольку данные, извлеченные из разрозненной исходной системы данных, преобразуются и загружаются в центр управления основными данными. Для синхронизации разнородных исходных основных данных управляемые основные данные, извлеченные из концентратора управления основными данными, снова преобразуются и загружаются в систему разнородных исходных данных по мере обновления основных данных. Как и в случае с другими Извлечь, преобразовать, загрузить Эти процессы являются дорогостоящими и неэффективными в разработке и обслуживании, что значительно снижает прибыль на инвестиции для продукта управления основными данными.

Существует ряд основных причин проблем с основными данными в организациях. К ним относятся:

  1. Сегментация бизнес-единиц и продуктовой линейки
  2. Слияние и поглощение

Сегментация бизнес-единиц и продуктовой линейки

В результате бизнес-единица и линейка продуктов сегментация, один и тот же бизнес-объект (например, Заказчик, Поставщик, Продукт) будет обслуживаться разными линейками продуктов; для обработки транзакции будут введены избыточные данные о бизнес-субъекте. Избыточность данных бизнес-сущности усугубляется в жизненном цикле от фронт-офиса к бэк-офису, когда необходим авторитетный единый источник данных о партии, аккаунте и продукте, но часто он снова вводится или дополняется избыточно.

Типичным примером является сценарий банка, в котором покупатель вынул ипотека и банк начинает посылать этому клиенту запросы на ипотеку, игнорируя тот факт, что у человека уже есть отношения с банком ипотечным счетом. Это происходит потому, что информация о клиенте, используемая отделом маркетинга в банке, не интегрирована с информацией о клиенте, используемой отделом обслуживания клиентов банка. Таким образом, обе группы не знают, что существующий клиент также считается лидером продаж. Процесс связь записи используется для связывания разных записей, которые соответствуют одному и тому же объекту, в данном случае одному и тому же человеку.

Слияние и поглощение

Одна из наиболее частых причин, по которой некоторые крупные корпорации испытывают серьезные проблемы с управлением основными данными, - это рост за счет слияния или же приобретения. Любые объединяющиеся организации обычно создают объект с дублированными основными данными (поскольку каждая из них, вероятно, имела хотя бы одну собственную главную базу данных до слияния). В идеале, администраторы баз данных решить эту проблему через дедупликация основных данных в рамках слияния. На практике, однако, согласование нескольких систем основных данных может вызвать трудности из-за зависимости существующих приложений от основных баз данных. В результате чаще всего две системы не полностью сливаются, а остаются отдельными, с определенным специальным процессом согласования, который обеспечивает согласованность между данными, хранящимися в двух системах. Однако со временем, по мере того, как происходят дальнейшие слияния и поглощения, проблема множится, появляется все больше и больше основных баз данных, а процессы согласования данных становятся чрезвычайно сложными и, следовательно, неуправляемыми и ненадежными. Из-за этой тенденции можно найти организации с 10, 15 или даже 100 отдельными, плохо интегрированными основными базами данных, что может вызвать серьезные операционные проблемы в областях удовлетворенность клиентов, операционная эффективность, поддержка при принятии решения и соответствие нормативным требованиям.

Другая проблема связана с определением надлежащей степени детализации и нормализации для включения в схему основных данных. Например, в объединенной среде управления персоналом предприятие может сосредоточиться на хранении данных о людях в качестве текущего статуса, добавив несколько полей для определения даты найма, даты последнего повышения по службе и т. Д. Однако это упрощение может привести к ошибкам, влияющим на бизнес, в зависимые системы. для планирования и прогнозирования. Заинтересованные стороны таких систем могут быть вынуждены создать параллельную сеть новых интерфейсов для отслеживания приема на работу новых сотрудников, запланированного выхода на пенсию и продажи активов, что противоречит одной из целей управления основными данными.

Люди, процессы и технологии

Управление мастер-данными есть включено технологиями, но это не просто технологии, которые делают это возможным. Возможности организации по управлению основными данными будут также включать людей и процессы в свое определение.

Люди

В MDM должно быть несколько ролей. В первую очередь это владелец данных и распорядитель данных. Вероятно, для каждой роли будет назначено несколько человек, каждый из которых будет отвечать за подмножество основных данных (например, один владелец данных для основных данных сотрудников, другой - для основных данных клиентов).

Владелец данных отвечает за требования к качеству данных, безопасности данных и т. Д., А также за соблюдение процедур управления данными и управления данными. Владелец данных также должен финансировать проекты по улучшению в случае отклонений от требований.

Управляющий данными осуществляет управление основными данными от имени владельца данных и, вероятно, также является советником владельца данных.

Процесс

Управление мастер-данными можно рассматривать как «дисциплину специализированного повышения качества».[3] определены политикой и процедурами, установленными управление данными организация. Его цель - предоставить процессы для сбор, агрегирование, сопоставление, объединение, качественный - обнадеживающий, настойчивый и распространение основные данные во всей организации для обеспечения общего понимания, последовательность, точность и контроль[4], в постоянном обслуживании и использовании этих данных приложениями.

Процессы, обычно наблюдаемые в управлении основными данными, включают идентификацию источника, сбор данных, преобразование данных, нормализация, администрирование правил, обнаружение и исправление ошибок, консолидация данных, хранилище данных, распределение данных, классификация данных, услуги таксономии, создание основной записи элемента, отображение схемы, кодификация продуктов, обогащение данных, управление иерархией, управление семантикой бизнеса и управление данными.

Технологии

Инструмент управления основными данными может использоваться для поддержки управления основными данными посредством удаление дубликатов, стандартизация данных (массовое ведение),[5] и включение правил для исключения неверных данных из системы, чтобы создать авторитетный источник основных данных. Основные данные - это продукты, счета и стороны, для которых хозяйственные операции завершены.

В тех случаях, когда технологический подход создает «золотую запись» или полагается на «источник записи» или «систему записи», обычно говорят о том, где данные «обрабатываются». Это общепринятая терминология в индустрии информационных технологий, но следует проявлять осторожность как со специалистами, так и с более широким сообществом заинтересованных сторон, чтобы не путать понятие «основные данные» с понятием «мастер-данные».

Модели реализации

Существует несколько моделей внедрения технологического решения для управления основными данными. Они зависят от основного бизнеса организации, ее корпоративной структуры и целей. К ним относятся:

  1. Источник записи
  2. Реестр
  3. Укрепление
  4. Сосуществование
  5. Транзакция / централизованная
Источник записи

Эта модель определяет отдельное приложение, базу данных или более простой источник (например, электронную таблицу) как «источник записи» (или «система записи «где полагаются исключительно на прикладные базы данных). Преимущество этой модели заключается в ее концептуальной простоте, но она может не соответствовать реалиям сложного распределения основных данных в крупных организациях.

Источник записи может быть объединен, например, по группам атрибутов (так, чтобы разные атрибуты объекта основных данных могли иметь разные источники записи) или географически (так, чтобы разные части организации могли иметь разные основные источники). Федерация применима только в определенных случаях использования, когда есть четкое разграничение, какие подмножества записей будут найдены в каких источниках.

Модель источника записи может применяться более широко, чем просто к основным данным, например, для справочные данные.

Реестр[6]

Эта модель поддерживает центральный реестр, связывающий записи из различных исходных систем. Он выявляет дубликаты, выполняя алгоритмы очистки и сопоставления, а затем назначает уникальные глобальные идентификаторы сопоставленным записям, чтобы помочь идентифицировать "единственная версия правды ". Эта модель не отправляет данные обратно в исходные системы, поэтому изменения основных данных по-прежнему вносятся через существующие исходные системы. Когда требуется единое всеобъемлющее представление о клиенте, она использует каждую справочную систему для создания представления в в реальном времени.

Эта модель может быть полезна, когда организация имеет большое количество исходных систем, разбросанных по всему миру, и трудно установить авторитетный источник. Это также позволяет анализировать данные, избегая риска перезаписи информации в исходных системах.

Укрепление[6]

В этой модели основные данные обычно консолидируются из нескольких источников в хабе для создания единой версии истины, часто называемой в этом контексте «золотой записью». Любые обновления, внесенные в основные данные, затем применяются к исходным источникам.

Консолидированные хабы недороги и быстро настраиваются (как и решения MDM!). Эта модель в основном используется для анализа и отчетности.

Сосуществование[6]

Эта модель обеспечивает «золотую запись» так же, как и модель консолидации, но изменения основных данных могут происходить как в системе MDM, так и в системах приложений. Это приводит к удорожанию развертывания.

Основное преимущество этого стиля состоит в том, что данные обрабатываются в исходных системах, а затем синхронизируются с концентратором, поэтому данные могут гармонично сосуществовать и по-прежнему предлагать единую версию истины. Еще одним преимуществом этого подхода является повышение качества основных данных и более быстрый доступ. Отчетность также упрощается, поскольку все атрибуты основных данных находятся в одном месте.

Транзакция / централизованная[6]

Эта модель хранит и поддерживает атрибуты основных данных, используя алгоритмы связывания, очистки, сопоставления и обогащения для улучшения данных. Затем расширенные данные можно опубликовать обратно в соответствующую исходную систему. Это требует вторжения в исходные системы для двустороннего взаимодействия. Исходные системы могут подписаться на обновления, публикуемые центральной системой, для обеспечения полной согласованности.

Основное преимущество этого стиля заключается в том, что основные данные всегда точны и полны, в то время как политики безопасности и видимости на уровне атрибутов данных могут поддерживаться концентратором стиля транзакций. Организация получает централизованный набор основных данных для одного или нескольких доменов.

Передача основных данных

Есть несколько способов сопоставления основных данных и их распределения в другие системы.[7] Это включает:

  1. Консолидация данных - процесс сбора основных данных из нескольких источников и интеграции в один концентратор (хранилище операционных данных ) для репликации в другие системы назначения.
  2. Федерация данных - Процесс предоставления единого виртуального представления основных данных из одного или нескольких источников в одну или несколько систем назначения.
  3. Распространение данных - процесс копирования основных данных из одной системы в другую, обычно через двухточечные интерфейсы в устаревших системах.

Управление изменениями при внедрении

Управление мастер-данными может пострадать при его внедрении в крупной организации, если "единственная версия правды "концепция не покупается заинтересованными сторонами, которые считают, что их локальное определение основных данных необходимо. Например, иерархия продуктов, используемая для управления запасами, может полностью отличаться от иерархий продуктов, используемых для поддержки маркетинговых усилий или оплаты торговых представителей. Это Прежде всего необходимо определить, действительно ли требуются разные основные данные. Если это необходимо, то реализованное решение (технология и процесс) должно допускать существование нескольких версий правды, но будет обеспечивать простые и прозрачные способы согласования Если это не требуется, процессы должны быть скорректированы. Без этого активного управления пользователи, которым нужны альтернативные версии, будут просто «обходить» официальные процессы, тем самым снижая эффективность общей программы управления основными данными компании.

Смотрите также

Рекомендации

  1. ^ «Глоссарий Gartner: Управление основными данными». Gartner. Получено 6 июн 2020.
  2. ^ Роуз, Маргарет (2018-04-09). «Определение с сайта WhatIs.com». SearchDataManagement. Получено 2018-04-09.
  3. ^ Справочник DAMA-DMBOK, 2010 DAMA International
  4. ^ «Узнайте, как создать запрос на изменение MDM - LightsOnData». LightsOnData. 2018-05-09. Получено 2018-08-17.
  5. ^ Юргенсен, Кнут (16 мая 2016 г.). «Управление основными данными (MDM): помощь или помеха?». Простой разговор. Получено 2018-04-09.
  6. ^ а б c d Лоннон, Майкл (25 мая 2018 г.). «4 общих стиля реализации управления основными данными». Стибо Системы. Получено 6 июн 2020.
  7. ^ «Создание золотого рекорда: лучшие данные с помощью химии», DAMA, слайд 26, Дональд Дж. Соулсби, 22 октября 2009 г.

внешняя ссылка