Greenplum - Greenplum

Greenplum
Продукт VMware
ПромышленностьБольшое количество данных технологии
Штаб-квартираПало-Альто, Калифорния
ТоварыСистема управления базой данных программного обеспечения
База данных Greenplum
Разработчики)VMware
Стабильный выпуск
6.7.1 / апрель 2020 г.; 7 месяцев назад (2020-04)
Репозиторийgithub.com/ greenplum-db/ gpdb
Операционная системаLinux
ТипСистема управления базой данных
ЛицензияЛицензия Apache 2
Интернет сайтзеленая слива.org

Greenplum это большое количество данных технология на основе Архитектура MPP и Postgres технология баз данных с открытым исходным кодом. Технология была создана одноименной компанией со штаб-квартирой в г. Сан-Матео, Калифорния примерно в 2005 г. Greenplum был приобретен Корпорация EMC в июле 2010 г.[1]

Начиная с 2012 г. система управления базами данных программное обеспечение стало известно как База данных Pivotal Greenplum продано через Основное программное обеспечение. Pivotal разработала ядро ​​ядра с открытым исходным кодом и продолжила его разработку сообществом с открытым исходным кодом Greenplum Database и Pivotal.

Начиная с 2020 года Pivotal был приобретен VMware и VMware продолжали спонсировать сообщество с открытым исходным кодом Greenplum Database, а также коммерциализировать технологию под торговой маркой VMware Tanzu Greenplum.

Компания

Компания Greenplum была основана в сентябре 2003 года Скоттом Ярой и Люком Лонерганом. Это было слияние двух небольших компаний: Metapa (основана в августе 2000 г. Лос-Анджелес )[2] и Дидера в Фэрфакс, Вирджиния.[3]

Среди инвесторов были SoundView Ventures, Hudson Ventures и Royal Wulff Ventures. Всего АМЕРИКАНСКИЙ ДОЛЛАР$ 20 миллионов о финансировании было объявлено при слиянии.[4] Greenplum, г. Сан-Матео, Калифорния выпустила система управления базами данных программное обеспечение на основе PostgreSQL в апреле 2005 года, назвав его Bizgres.[5] Раундов венчурный капитал около 15 миллионов долларов США каждая была вложена в марте 2006 г. и феврале 2007 г.[6]

В июле 2006 года партнерство с Sun Microsystems было объявлено.[7] Sun, которая также приобрела MySQL AB, участвовал в раунде 27 миллионов долларов США инвестиций в январе 2009 г., во главе с Meritech Capital Partners.[6] В проект Bizgres входило еще несколько участников, и он поддерживался примерно в 2008 году, когда продукт также назывался «Greenplum».[8][9] В Sun Fire X4500 была эталонной архитектурой и использовалась большинством клиентов до перехода на Linux примерно в то время. Greenplum был приобретен Корпорация EMC в июле 2010 г., став основой EMC большое количество данных подразделение программного обеспечения.[1] Хотя EMC не раскрывает стоимость, она оценивается в 300 миллионов долларов США.[10][11] Продуктами Greenplum на момент приобретения были база данных Greenplum, Chorus (инструмент управления) и Data Science Labs. У Greenplum были клиенты в вертикальные рынки включая eBay.[12] Он стал частью Основное программное обеспечение в 2012.[13]

Вариант с использованием Apache Hadoop о хранении данных в файловой системе Hadoop под названием Hawq было объявлено в 2013 году.[14][15] В 2015 году GreenplumDB и Hawq программное обеспечение с открытым исходным кодом анонсированы проекты.[16]

Технологии

Продукт базы данных Greenplum компании Pivotal использует массивно параллельный технологии обработки (MPP). Каждый компьютерный кластер состоит из главного узла, резервного главного узла и узлов сегмента.[17] Все данные хранятся в узлах сегмента, а информация каталога хранится в главных узлах. Узлы сегментов запускают один или несколько сегментов, которые представляют собой измененные экземпляры базы данных PostgreSQL и которым назначается идентификатор содержимого. Для каждой таблицы данные разделяются между узлами сегмента на основе ключей столбца распределения, указанных пользователем в язык определения данных. Для каждого идентификатора содержимого сегмента существует как основной, так и зеркальный сегменты, которые не работают на одном физическом хосте. Когда запрос поступает на главный узел, он анализируется, планируется и отправляется всем сегментам для выполнения плана запроса и либо возврата запрошенных данных, либо вставки результата запроса в таблицу базы данных. В Структурированный язык запросов, версия SQL: 2003, используется для представления запросов системе. Семантика транзакции соответствует ограничениям, известным как КИСЛОТА.[18]

Среди конкурентов - другие системы управления базами данных MPP, предоставляемые крупными поставщиками, такими как Терадата, Amazon Redshift, Microsoft Azure, Alibaba AnalyticDB а в прошлом IBM Netezza.[17][19] Дополнительная конкуренция исходит от других более мелких конкурентов, колоночные базы данных например HP Vertica, Exasol и хранилище данных поставщики с архитектурой без MPP, такие как Oracle Exadata, IBM DB2 и SAP HANA.

Greenplum Версия 5

В сентябре 2017 года была выпущена версия 5 базы данных Greenplum. Версия 5 включает в себя первую итерацию стратегии проекта Greenplum по слиянию более поздних версий PostgreSQL с Greenplum и основана на PostgreSQL версии 8.3 выше предыдущей версии 8.2. [20] Версия 5 также представляет собой общедоступный оптимизатор GPORCA. [21] для оптимизации на основе затрат SQL, предназначенного для больших данных.

Greenplum Версия 6

В сентябре 2019 года была выпущена версия 6 базы данных Greenplum. Версия 6 основана на PostgreSQL версии 9.4 и отличается значительными улучшениями в [22]Производительность OLTP. Greenplum 6 был рассмотрен в СМИ несколькими источниками и упомянут за его согласованность с открытым исходным кодом Postgres. [23] и за его производительность OLTP [24]

Рекомендации

  1. ^ а б «EMC приобретает Greenplum». пресс-релиз. Корпорация EMC. 6 июля 2010 г.. Получено 15 марта, 2017.
  2. ^ «Форма D: Уведомление о продаже ценных бумаг» (PDF). SEC. 30 июля 2003 г.. Получено 15 марта, 2017.
  3. ^ Морин О'Гара (26 сентября 2003 г.). «Метапа покупает Дидеру». Новости бизнеса Linux. Получено 15 марта, 2017.
  4. ^ «Metapa приобретает Didera и закрывает дополнительное финансирование; пионеры отрасли в области высокопроизводительных вычислений объединяются для создания революционного решения кластеризации баз данных Linux для поддержки принятия решений». пресс-релиз. 23 сентября 2003 г.
  5. ^ «Проект Bizgres запущен». Веб-сайт разработчика PostgreSQL. 17 апреля 2005 г.. Получено 15 марта, 2017.
  6. ^ а б Дункан Райли (21 января 2008 г.). "Greenplum получает 27 миллионов долларов в серии C". Технический кризис. Получено 15 марта, 2017.
  7. ^ Колин Уайт, Ричард Хакаторн (26 июня 2007 г.). "Солнце / Гринплум". Лучшие практики бизнес-аналитики. Получено 15 марта, 2017.CS1 maint: использует параметр авторов (связь)
  8. ^ "История". Старый сайт Bizgres.org. Архивировано из оригинал 22 декабря 2008 г.. Получено 15 марта, 2017.
  9. ^ «Greenplum обновляет базу данных с открытым исходным кодом». Информационная неделя. 22 февраля 2008 г.. Получено 15 марта, 2017.
  10. ^ Ом Малик (6 июля 2010 г.). «Большие данные = большие деньги: EMC покупает Greenplum». ГигаОм. Получено 15 марта, 2017.
  11. ^ Александр Хайслип (7 июля 2010 г.). «Microsoft, Sun и SAP - неожиданные победители в продаже Greenplum». Forbes. Получено 15 марта, 2017.
  12. ^ "два огромных хранилища данных на ebay". Блог о СУБД2. Monash Research. 30 апреля 2009 г.. Получено 15 марта, 2017.
  13. ^ Тимоти Прикетт Морган (20 марта 2012 г.). «EMC хочет быть Linux для больших данных: открывает инструмент Chorus, предлагает гибкие программисты Pivotal Labs». Реестр. Получено 15 марта, 2017.
  14. ^ «Когда мне следует использовать базу данных Greenplum вместо HAWQ?». Веб-сайт Pivotal Guru. 31 января 2014 г.. Получено 15 марта, 2017.
  15. ^ Тимоти Прикетт Морган (25 февраля 2013 г.). «EMC превращает слона Hadoop в базу данных SQL Hawq». Реестр. Получено 15 марта, 2017.
  16. ^ Кейд Мец (17 февраля 2015 г.). «Pivotal удваивает количество открытых исходных кодов в знак изменения мира программного обеспечения». Проводной. Получено 15 марта, 2017.
  17. ^ а б Тимоти Прикетт Морган (6 апреля 2011 г.). «EMC становится жирной и яркой с приборами Greenplum: возьмите это, Teradata, Exadata, Netezza». Реестр. Получено 18 марта, 2017.
  18. ^ Сунила Голлапуди (2013). Начало работы с Greenplum для аналитики больших данных. Packt Publishing. ISBN  9781782177050.
  19. ^ «Сравнение свойств системы Amazon Redshift, Greenplum, базы данных Microsoft Azure SQL и Teradata Aster». DB-двигатели. Получено 18 марта, 2017.}
  20. ^ «Pivotal Greenplum жив и здоров». ZDNet. Получено 14 сентября, 2017.}
  21. ^ «Orca: модульная архитектура оптимизатора запросов для больших данных» (PDF). ZDNet. Получено 14 апреля, 2016.}
  22. ^ «Тесты Greenplum 6 OLTP».
  23. ^ «База данных Pivotal Greenplum вот-вот наконец-то будет согласована с проектом с открытым исходным кодом. Что это будет значить для платформы?».
  24. ^ «Существенная переработка открытого исходного кода, хранилище данных MPP предлагает высокий уровень параллелизма, встроенную аналитику и возможности анализа данных».