Устройство хранилища данных - Data warehouse appliance

В вычисление, период, термин устройство хранилища данных (DWA) был придуман Фостером Хиншоу[1][2] для компьютерной архитектуры для хранилища данных (DW), специально предназначенный для большое количество данных анализ и обнаружение, которое простое в использовании (не предварительная настройка) и высокая производительность для рабочей нагрузки. DWA включает в себя интегрированный набор серверов, хранилища, операционные системы, и базы данных.

В маркетинге этот термин расширился и теперь включает предварительно установленное и оптимизированное оборудование и программное обеспечение, а также аналогичные системы, состоящие только из программного обеспечения.[3] рекламируется как простая в установке на определенные рекомендуемые конфигурации оборудования или предварительно настроена как полная система.[4][5] Это маркетинговое использование термина и не отражает его техническое определение.

DWA разработан специально для высокопроизводительной аналитики больших данных и поставляется в виде простой в использовании пакетной системы. Устройства DW продаются для объемов данных в терабайт к петабайт классифицировать.

Технологии

Устройство хранилища данных (DWA) имеет несколько характеристик, которые отличают эту архитектуру от аналогичных машин в Дата центр, например, корпоративное хранилище данных (EDW).

  1. DWA имеет очень тесную интеграцию своих внутренних компонентов, которые оптимизированы для «ориентированных на данные» операций в отличие от «вычислительно-ориентированных» операций. Последние, как правило, делают упор на количество процессоров, ядер и пропускную способность сети.
  1. DWA прост в использовании и установке. В отличие от «предварительной конфигурации» компонентов, DWA имеет очень мало переключателей или опций конфигурации. Устранение таких опций значительно снижает количество ошибок конфигурации - основной причины сбоев в больших системах.
  1. DWA оптимизирован для аналитики по большое количество данных. Напротив, предыдущие архитектуры (включая параллельные) были ориентированы на «корпоративное хранилище данных», являющееся универсальным репозиторием для данных и вспомогательную аналитику в качестве вспомогательной задачи.

Большинство устройств DW используют массивно параллельный архитектуры обработки (MPP) для обеспечения высокой производительности запросов и платформы масштабируемость. Архитектура MPP состоит из независимых процессоров или серверов, работающих параллельно. Большинство архитектур MPP реализуют "архитектура без совместного использования ресурсов «где каждый сервер работает автономно и управляет своей собственной памятью и диском. Устройства DW распределяют данные на выделенные дисковые накопители, подключенные к каждому серверу в устройстве. Это распределение позволяет устройствам DW разрешать реляционный запрос путем параллельного сканирования данных на каждом сервере. Подход «разделяй и властвуй» обеспечивает высокую производительность и линейно масштабируется по мере добавления новых серверов в архитектуру.

История

«Устройство хранилища данных» - термин, придуманный Фостером Хиншоу,[1][2] основатель Netezza. При создании первого устройства хранилища данных Хиншоу и Netezza использовали основы, разработанные Модель 204, Терадата, и другие, чтобы стать пионером в новой категории для эффективного решения проблем потребительской аналитики, предоставив модульную, масштабируемую, простую в управлении систему баз данных, которая является рентабельной.

Архитектуры баз данных MPP имеют долгую историю. Некоторые считают Терадата первоначальный продукт в качестве первого устройства DW - или Бриттон-Ли с.[6][7]Компания Teradata приобрела Britton Lee - переименованную в ShareBase - в июне 1990 года.[8]Другие не согласны, считая устройства "революционной технологией" для Teradata.[9]

Дополнительные поставщики, включая Тандемные компьютеры, и Sequent Computer Systems также предлагала архитектуры MPP в 1980-х годах. Открытый исходный код и товарные вычисления Компоненты помогли возродить устройства хранилищ данных MPP. Достижения в области технологий снизили затраты и повысили производительность устройств хранения, многоядерный Процессоры и сетевые компоненты. Открытый исходный код СУБД продукты, такие как Ingres и PostgreSQL, сокращают затраты на лицензию на программное обеспечение и позволяют поставщикам DW-устройств сосредоточиться на оптимизации, а не на предоставлении базовых функций базы данных. Открытый исходный код Linux стала обычной операционной системой для устройств DW.

Другие поставщики устройств DW используют специализированное оборудование и современное программное обеспечение вместо архитектур MPP.[10] Netezza объявил о "устройстве данных" в 2003 году и использовал специализированные программируемая вентильная матрица аппаратное обеспечение.[11]Kickfire последовал в 2008 году с тем, что они назвали поток данных "sql чип".[12][нужна цитата ]

В 2009 году появилось больше техники DW. IBM интегрировала свои InfoSphere хранилище (ранее DB2 Warehouse) с собственными серверами и хранилищем для создания IBM InfoSphere Balanced Warehouse. Netezza представила свою платформу TwinFin на базе стандартного оборудования IBM. Другие поставщики устройств DW также установили партнерские отношения с основными поставщиками оборудования. ДАННЫЕ, до приобретения Microsoft, в партнерстве с Корпорация EMC и Dell и реализовал Ingres с открытым исходным кодом в Linux. Greenplum был партнером с Sun Microsystems и реализует базу данных Greenplum (на основе PostgreSQL) на Солярис с использованием ZFS файловая система. HP Neoview использует HP NonStop SQL.

На рынке также наблюдается появление пакетов хранилищ данных, в которых поставщики объединяют свое оборудование и программное обеспечение баз данных в качестве платформы хранилища данных. В Oracle Optimized Warehouse Initiative объединяет Oracle Database с оборудованием от различных производителей компьютеров (Dell, ЭМС, HP, IBM, SGI и Sun Microsystems ). Оптимизированные склады Oracle предлагают предварительно проверенные конфигурации, а программное обеспечение баз данных поставляется предустановленным. В сентябре 2008 года Oracle начала предлагать более классическое устройство - HP Oracle Database Machine, совместно разработанную платформу под совместным брендом, которую Oracle продавала и поддерживала, а HP построила конфигурации специально для Oracle.[13][14]В сентябре 2009 года Oracle выпустила второе поколение Exadata система, основанная на их приобретенных Sun Microsystems аппаратное обеспечение.[15]

Смотрите также

Рекомендации

  1. ^ а б Infostor »Представляем« устройства хранилищ данных »
  2. ^ а б TDWI »Еще одно устройство хранилища данных на подходе!
  3. ^ Блог Queries From Hell »Когда устройство - это не устройство?
  4. ^ DBMS2 - Услуги системы управления базами данных »Архив блога» Устройства хранилища данных - факты и вымысел
  5. ^ Омер Трайман, Ален Кролотт, Дэвид Стейнхофф, Рагхунатх Намбьяр, Мейкель Поесс: База данных - это не тостеры: платформа для сравнения устройств хранилищ данных
  6. ^ Кобиелус, Джеймс (22 апреля 2008 г.). "Официально Teradata Goes Appliance". Архивировано из оригинал 29 сентября 2011 г.. Получено 2011-01-14. Компания Teradata эффективно завоевала рынок устройств DW четверть века назад, когда представила первое в длинной линейке предварительно настроенных, предварительно оптимизированных решений, сочетающих процессоры, хранилище, программное обеспечение и базу данных для удовлетворения самых требовательных аналитических требований и поддержки принятия решений.
  7. ^ «Машины баз данных и устройства хранилищ данных - первые дни». Monash Research. 15 сентября 2008 г.. Получено 2011-01-15. Но для всех практических целей первыми двумя значительными поставщиками «машин баз данных» были Britton-Lee и Teradata. И поскольку Бриттон-Ли в конечном итоге был продан Teradata (после краткого изменения названия на ShareBase), Teradata имеет право на любую историческую славу, полученную благодаря инновациям в категории устройств управления базами данных.
  8. ^ Тодд Уайт (5 ноября 1990 г.). «Teradata Corp. терпит первый квартальный убыток за четыре года». Бизнес-журнал Лос-Анджелеса. Получено 2008-07-14.
  9. ^ All, Ann (6 апреля 2007 г.). "Подойдет ли вам устройство хранилища данных?". Получено 2011-01-14. У DATAllegro есть сайт в Sears. Sears использует [устройство] в качестве внешнего интерфейса к своему хранилищу Teradata для вычисления агрегатов. Поэтому, когда они хотят нарезать кубиками, сколько мы продали в каких магазинах и какого цвета, они используют это устройство ... Я думаю, что [устройства] могут стать революционной технологией для Teradata.
  10. ^ [1]
  11. ^ «Сервер производительности Netezza (NPS ™) серии 8000». Веб-страница продукта. Netezza. Архивировано из оригинал 3 февраля 2004 г.. Получено 16 августа, 2013.
  12. ^ «Архивная копия». Архивировано из оригинал на 2009-05-24. Получено 2009-07-18.CS1 maint: заархивированная копия как заголовок (связь)
  13. ^ Кевин Клоссен, архитектор производительности Oracle, Oracle Exadata Storage Server
  14. ^ «Oracle Exadata - в чем преимущество?». Архивировано из оригинал на 2008-11-20. Получено 2008-11-19.
  15. ^ Алексей Горбачев (15 сентября 2009 г.). «Представление OLTP Oracle Database Machine и Exadata v2». Блог. Пифийский. Получено 16 августа, 2013.

внешняя ссылка