База данных графиков - Graph database

В вычисление, а база данных графов (GDB) это база данных который использует структуры графа за семантические запросы с узлы, края, и свойства для представления и хранения данных.[1] Ключевым понятием системы является график (или же край или же отношение). Граф связывает элементы данных в хранилище с набором узлов и ребер, причем ребра представляют отношения между узлами. Связи позволяют напрямую связывать данные в хранилище и, во многих случаях, извлекать их с помощью одной операции. В базах данных Graph отношения между данными являются приоритетными. Запрос отношений выполняется быстро, потому что они постоянно хранятся в базе данных. Отношения можно интуитивно визуализировать с помощью графовых баз данных, что делает их полезными для сильно связанных данных.[2]

Графические базы данных являются разновидностью NoSQL база данных, созданная для устранения ограничений реляционные базы данных. В то время как модель графа явно определяет зависимости между узлами данных, реляционная модель и другие модели баз данных NoSQL связывают данные неявными связями. Другими словами, отношения - это первоклассный гражданин в базе данных графа и может быть помечен, направлен и задан свойствами. Это сравнивается с реляционными подходами, в которых эти отношения подразумеваются и должны уточняться во время выполнения. Базы данных графов похожи на 1970-е сетевая модель базы данных, в которых оба представляют общие графы, но базы данных сетевой модели работают на более низком уровне абстракция[3] и не хватает легкого обход над цепочкой ребер.[4]

Базовый механизм хранения графовых баз данных может различаться. Некоторые зависят от реляционного механизма и «хранят» данные графа в стол (хотя таблица является логическим элементом, поэтому этот подход требует другого уровня абстракции между базой данных графов, системой управления базой данных графов и физическими устройствами, на которых фактически хранятся данные). Другие используют хранилище ключей и значений или же документно-ориентированная база данных для хранения, делая их по своей сути структурами NoSQL.

Для получения данных из базы данных графов требуется язык запросов Кроме как SQL, который был разработан для манипулирования данными в реляционной системе и поэтому не может "элегантно" обрабатывать обход графа.[мнение ] По состоянию на 2017 год, ни один универсальный язык запросов на основе графов не был принят так же, как SQL был принят для реляционных баз данных, и существует большое количество систем, чаще всего тесно связанных с одним продуктом. Были предприняты некоторые усилия по стандартизации, что привело к появлению языков запросов от разных поставщиков, таких как Гремлин, SPARQL, и Сайфер. Помимо интерфейсов на языке запросов, доступ к некоторым базам данных графов осуществляется через интерфейсы прикладного программирования (API).

Графические базы данных отличаются от графических вычислительных машин. Графические базы данных - это технологии, которые являются переводом реляционной онлайн-обработка транзакций (OLTP) базы данных. С другой стороны, графические вычислительные машины используются в онлайн-аналитическая обработка (OLAP) для массового анализа. Графические базы данных привлекли значительное внимание в 2000-х годах из-за успеха крупных технологических корпораций в использовании собственных графических баз данных,[5] вместе с введением Открытый исходный код Графические базы данных.

История

В середине 1960-х гг. навигационные базы данных Такие как IBM с IMS поддержанный дерево -подобные структуры в своем иерархическая модель, но строгий древовидная структура можно было обойти с помощью виртуальных записей.[6][7]

Графические структуры могли быть представлены в базах данных сетевых моделей с конца 1960-х годов. КОДАСИЛ, который определил КОБОЛ в 1959 году определил язык сетевых баз данных в 1969 году.

Помеченные графики могут быть представлены в графических базах данных середины 1980-х годов, таких как логическая модель данных.[3][8]

В начале 1990-х годов появилось несколько улучшений графовых баз данных, которые ускорились в конце 1990-х благодаря усилиям по индексации веб-страниц.

В середине-конце 2000-х годов коммерческие базы данных графов с КИСЛОТА такие гарантии, как Neo4j и Oracle Spatial и Graph стал доступен.

В 2010-х годах коммерческие базы данных графов ACID, которые могли быть масштабируется по горизонтали стал доступен. Дальше, SAP HANA привел в памяти и столбчатый технологии графических баз данных.[9] Также в 2010-е гг. многомодельные базы данных поддерживающие модели графов (и другие модели, такие как реляционная база данных или документно-ориентированная база данных ) стали доступны, например OrientDB, ArangoDB, и MarkLogic (начиная с его версии 7.0). За это время особенно популярны графовые базы данных различных типов. анализ социальных сетей с появлением компаний в социальных сетях.

Фон

Базы данных графов используют узлы, свойства и ребра.

Графические базы данных отображают данные в концептуальном виде. Это достигается путем передачи данных в узлы и их отношений в ребра.

База данных графов - это база данных, основанная на теория графов. Он состоит из набора объектов, который может быть узлом или ребром.

  • Узлы представляют собой объекты или экземпляры, такие как люди, предприятия, учетные записи или любой другой объект, который необходимо отслеживать. Они примерно эквивалентны записи, отношению или строке в реляционной базе данных или документу в базе данных хранилища документов.
  • Края, также называемый графики или же отношения, - линии, соединяющие узлы с другими узлами; представляющие отношения между ними. Значимые закономерности возникают при изучении соединений и взаимосвязей узлов, свойств и ребер. Края могут быть направленными или ненаправленными. В неориентированном графе ребро, соединяющее два узла, имеет одно значение. В ориентированном графе ребра, соединяющие два разных узла, имеют разное значение в зависимости от их направления. Ребра - это ключевая концепция в графовых базах данных, представляющая абстракцию, которая напрямую не реализуется в реляционная модель или модель хранилища документов.
  • Характеристики информация, связанная с узлами. Например, если Википедия были одним из узлов, он мог быть привязан к таким свойствам, как интернет сайт, справочный материал, или же слова на букву ш, в зависимости от того, какие аспекты Википедия уместны для данной базы данных.

Графические модели

График помеченных свойств

Модель графа помеченных свойств представлена ​​набором узлов, отношений, свойств и меток. Оба узла данных и их отношения названы и могут хранить свойства, представленные пары ключ / значение. Узлы можно пометить для группировки. Ребра, представляющие отношения, обладают двумя качествами: они всегда имеют начальный узел и конечный узел и направлены;[10] сделать график ориентированный граф. Отношения также могут иметь свойства. Это полезно для предоставления дополнительных метаданных и семантики взаимосвязей узлов.[11] Прямое хранение отношений позволяет постоянное время обход.[12]

Структура описания ресурсов (RDF)

Пример RDF-графа

В RDF В модели графа добавление информации представляется отдельным узлом. Например, представьте сценарий, в котором пользователь должен добавить свойство имени для человека, представленного в виде отдельного узла на графике. В модели графа помеченных свойств это может быть сделано путем добавления свойства имени в узел человека. Однако в RDF пользователь должен добавить отдельный узел с именем hasName подключив его к исходному узлу person. В частности, модель графа RDF состоит из узлов и дуг. Обозначение графа RDF или оператор представлены: узлом для субъекта, узлом для объекта и дугой для предиката. Узел можно оставить пустым, буквальный и / или быть идентифицированным URI. Дуга также может быть идентифицирована по URI. Литерал для узла может быть двух типов: простой (нетипизированный) и типизированный. Обычный литерал имеет лексическую форму и, возможно, языковой тег. Типизированный литерал состоит из строки с URI, который идентифицирует конкретный тип данных. Пустой узел может использоваться для точной иллюстрации состояния данных, когда данные не имеют URI.[13]

Он используется в Facebook протокол Open Graph, «позволяющий любой веб-странице иметь те же функции, что и любой другой объект на Facebook»[14] и Семантическая сеть.

Характеристики

Графические базы данных - мощный инструмент для запросов, подобных графам. Например, вычисление кратчайшего пути между двумя узлами графа. Другие графоподобные запросы могут выполняться к базе данных графов естественным образом (например, вычисление диаметра графа или обнаружение сообщества).

Графики являются гибкими, что означает, что они позволяют пользователю вставлять новые данные в существующий граф без потери функциональности приложения. Разработчику базы данных не нужно планировать подробные сведения о будущих сценариях использования базы данных.

Место хранения

Базовый механизм хранения графовых баз данных может различаться. Некоторые зависят от реляционного механизма и «хранят» данные графа в стол (хотя таблица является логическим элементом, поэтому этот подход накладывает другой уровень абстракции между базой данных графа, системой управления базой данных графа и физическими устройствами, на которых фактически хранятся данные). Другие используют хранилище ключей и значений или же документно-ориентированная база данных для хранения, делая их по своей сути NoSQL конструкции. Узел будет представлен как любое другое хранилище документов, но ребра, которые связывают два разных узла, содержат специальные атрибуты внутри его документа; атрибуты _from и _to.

Безиндексная смежность

Производительность поиска данных зависит от скорости доступа от одного конкретного узла к другому. Потому что индекс -свободная смежность заставляет узлы иметь прямые физические баран адреса и физически указывают на другие соседние узлы, это приводит к быстрому поиску. Собственная система графов с безиндексной смежностью не должна перемещаться через какие-либо другие типы структур данных, чтобы найти связи между узлами. Непосредственно связанные узлы в графе хранятся в тайник после извлечения одного из узлов поиск данных выполняется даже быстрее, чем при первом извлечении узла пользователем. Однако за такое преимущество приходится платить. безиндексная смежность приносит в жертву эффективность запросов, которые не используют обход графа. Базы данных с собственными графами используют для обработки безиндексную смежность CRUD операции с сохраненными данными.

Типы графиков

Есть несколько типов графиков, которые можно разделить на категории. Gartner предлагает пять широких категорий графиков:[15]

  • Социальный граф: это о связях между людьми; примеры включают Facebook, Twitter, и идея шесть ступеней расставания
  • График намерений: это касается рассуждений и мотивации.
  • График потребления: также известный как «график платежей», график потребления широко используется в розничной торговле. Компании электронной коммерции, такие как Amazon, eBay и Walmart, используют графики потребления для отслеживания потребления отдельных клиентов.
  • График процентов: отображает интересы человека и часто дополняется социальным графом. Он может последовать за предыдущей революцией веб-организации, отображая сеть по интересам, а не индексируя веб-страницы.
  • Мобильный график: он построен на основе мобильных данных. Мобильные данные в будущем могут включать данные из Интернета, приложений, цифровых кошельков, GPS и Интернет вещей (IoT) устройства.

Сравнение с реляционными базами данных

С Эдгар Ф. Кодд документ 1970 г. реляционная модель,[16] реляционные базы данных де-факто были отраслевым стандартом для крупномасштабных систем хранения данных. Однако реляционные модели требуют строгой схемы и нормализация данных наложенные ограничения на то, как можно запрашивать отношения.

Традиционно базы данных разрабатывались с использованием реляционной модели, в которой данные нормализуются для поддержки ACID транзакции. В процессе нормализации данных удаляются все повторяющиеся данные в базе данных. Цель нормализации данных - сохранить согласованность данных. Реляционная модель обеспечивает выполнение транзакций ACID, разделяя данные на множество таблиц.

В реляционных моделях применяется нормализация большого объема данных, чтобы гарантировать согласованность. Одним из мотивов проектирования реляционной модели было достижение быстрого построчного доступа.[16] Проблемы возникают тогда, когда возникает необходимость сформировать сложные отношения между хранимыми данными. Хотя отношения можно анализировать с помощью реляционной модели, требуются сложные запросы, выполняющие множество операций соединения с множеством различных атрибутов в нескольких таблицах. При работе с реляционными моделями иностранный ключ при извлечении отношений также следует учитывать ограничения, вызывающие дополнительные накладные расходы.

По сравнению с реляционные базы данных, графические базы данных часто работают быстрее для ассоциативных наборов данных[нужна цитата ] и более точно отобразить структуру объектно-ориентированный Приложения. Они могут масштабироваться более естественно[нужна цитата ] для больших наборов данных, поскольку они обычно не нужны присоединиться операции, которые часто могут быть дорогими. Поскольку они меньше зависят от жесткой схемы, они продаются как более подходящие для управления специальными и изменяемыми данными с помощью развивающихся схем.

И наоборот, системы управления реляционными базами данных обычно быстрее выполняют ту же операцию с большим количеством элементов данных, что позволяет манипулировать данными в их естественной структуре. Несмотря на преимущества графовых баз данных и недавнюю популярность по сравнению с реляционными базами данных, рекомендуется, чтобы сама графовая модель не была единственной причиной замены существующей реляционной базы данных. База данных графов может стать актуальной, если есть свидетельства повышения производительности на порядки и уменьшения задержки.[17]

Примеры

Реляционная модель собирает данные вместе, используя информацию в данных. Например, можно искать всех «пользователей», номер телефона которых содержит код города «311». Это можно сделать путем поиска в выбранных хранилищах данных или столы, ища в полях выбранного номера телефона строку «311». В больших таблицах это может занять много времени, поэтому реляционные базы данных предлагают индексы, которые позволяют хранить данные в меньшей подтаблице, содержащей только выбранные данные и уникальный ключ (или первичный ключ) записи. Если номера телефонов проиндексированы, такой же поиск будет выполняться в меньшей индексной таблице, собирая ключи совпадающих записей, а затем ища в основной таблице данных записи с этими ключами. Обычно таблица хранится таким образом, что поиск по ключу выполняется очень быстро.[18]

Реляционные базы данных не по своей сути содержат идею фиксированных отношений между записями. Вместо этого связанные данные связываются друг с другом путем сохранения уникального ключа одной записи в данных другой записи. Например, таблица, содержащая адреса электронной почты пользователей, может содержать элемент данных с именем userpk, который содержит первичный ключ записи пользователя, с которой он связан. Чтобы связать пользователей и их адреса электронной почты, система сначала ищет первичные ключи записей выбранного пользователя, затем ищет эти ключи в userpk столбец в таблице электронной почты (или, что более вероятно, их индекс), извлекает данные электронной почты, а затем связывает записи пользователя и электронной почты для создания составных записей, содержащих все выбранные данные. Эта операция, получившая название присоединиться, может быть дорогостоящим в вычислительном отношении. В зависимости от сложности запроса, количества объединений и индексации различных ключей системе может потребоваться поиск по нескольким таблицам и индексам, а затем их сортировка для сопоставления.[18]

Напротив, графовые базы данных напрямую хранят отношения между записями. Вместо того, чтобы найти адрес электронной почты путем поиска ключа пользователя в userpk В столбце запись пользователя содержит указатель, который напрямую ссылается на запись адреса электронной почты. То есть, выбрав пользователя, можно переходить по указателю прямо к записям электронной почты, нет необходимости искать в таблице электронной почты соответствующие записи. Это может устранить дорогостоящие операции соединения. Например, если кто-то ищет все адреса электронной почты для пользователей с кодом области «311», машина сначала выполнит обычный поиск, чтобы найти пользователей в «311», но затем получит адреса электронной почты, перейдя по ссылкам, найденным в те записи. Реляционная база данных сначала найдет всех пользователей в «311», извлечет список первичных ключей, выполнит еще один поиск любых записей в таблице электронной почты с этими первичными ключами и свяжет соответствующие записи вместе. Для этих типов общих операций графические базы данных теоретически будут быстрее.[18]

Истинная ценность графического подхода становится очевидной, когда выполняются поиски на глубину более одного уровня. Например, рассмотрим поиск пользователей, у которых есть «подписчики» (таблица, связывающая пользователей с другими пользователями) в коде зоны «311». В этом случае реляционная база данных должна сначала выполнить поиск всех пользователей с кодом области в «311», затем выполнить поиск в таблице подписчиков для любого из этих пользователей, а затем, наконец, выполнить поиск в таблице пользователей, чтобы найти подходящих пользователей. В отличие от этого, графическая база данных будет искать всех пользователей в «311», а затем следовать обратные ссылки через отношения подписчика, чтобы найти пользователей подписчика. Это позволяет избежать нескольких поисков, просмотров и использования памяти, связанного с хранением всех временных данных из нескольких записей, необходимых для создания вывода. С точки зрения нотация большой O, этот запрос будет время - то есть пропорционально логарифму размера данных. Напротив, реляционная версия будет иметь несколько поисков, плюс время, необходимое для объединения всех записей данных.[18]

Относительное преимущество поиска по графу растет с увеличением сложности запроса. Например, кто-то может захотеть узнать «этот фильм о подводных лодках с актером, который был в этом фильме с другим актером, который играл главную роль в Унесенные ветром ". Это сначала требует, чтобы система нашла актеров в Унесенные ветром, найдите все фильмы, в которых они были, найдите всех актеров во всех этих фильмах, которые не были главными в Унесенные ветром, а затем найдите все фильмы, в которых они были, и, наконец, отфильтруйте этот список до тех, в описании которых содержится слово «подводная лодка». В реляционной базе данных это потребует нескольких отдельных поисков по таблицам фильмов и актеров, выполнения еще одного поиска по фильмам о подводных лодках, поиска всех актеров в этих фильмах и последующего сравнения (больших) собранных результатов. Напротив, база данных графов будет идти от Унесенные ветром к Кларк Гейбл, соберите ссылки на фильмы, в которых он был, соберите ссылки из этих фильмов на других актеров, а затем перейдите по ссылкам этих актеров обратно в список фильмов. Затем в полученном списке фильмов можно выполнить поиск по запросу «подводная лодка». Все это можно сделать за один поиск.[19]

Характеристики добавить еще один слой абстракция в эту структуру, которая также улучшает многие общие запросы. По сути, свойства - это метки, которые можно применить к любой записи, а в некоторых случаях и к краям. Например, можно обозначить Кларка Гейбла «актером», что позволит системе быстро находить все записи с актерами, а не с режиссером или оператором. Если метки на краях разрешены, можно также отметить отношения между Унесенные ветром и Кларк Гейбл в роли «главного», а также выполнив поиск людей, которые являются «главными актерами» в фильме. Унесенные ветром, база данных создаст Вивьен Ли, Оливия де Хэвилленд и Кларк Гейбл. Эквивалентный запрос SQL должен полагаться на добавленные данные в таблице, связывающей людей и фильмы, что усложняет синтаксис запроса. Эти виды меток могут улучшить производительность поиска при определенных обстоятельствах, но, как правило, они более полезны при предоставлении дополнительных семантических данных для конечных пользователей.[19]

Реляционные базы данных очень хорошо подходят для плоских макетов данных, где отношения между данными имеют один или два уровня глубины. Например, в базе данных бухгалтерского учета может потребоваться поиск всех позиций для всех счетов-фактур для данного клиента, запрос с тремя соединениями. Базы данных Graph нацелены на наборы данных, содержащие гораздо больше ссылок. Они особенно хорошо подходят для социальная сеть системы, в которых отношения «друзей» по существу неограниченны. Эти свойства делают графические базы данных естественными, подходящими для типов поиска, которые становятся все более распространенными в онлайн-системах и большое количество данных среды. По этой причине графические базы данных становятся очень популярными для крупных онлайн-систем, таких как Facebook, Google, Twitter и подобные системы с глубокими ссылками между записями.

В качестве дополнительной иллюстрации представьте реляционную модель с двумя таблицами: люди стол (который имеет person_id и person_name столбец) и друг стол (с friend_id и person_id, который является иностранный ключ от люди стол). В этом случае поиск всех друзей Джека приведет к следующему SQL-запросу.

ВЫБРАТЬ p2.person_name ИЗ люди p1 ПРИСОЕДИНИТЬСЯ друг НА (p1.person_id = друг.person_id)ПРИСОЕДИНИТЬСЯ люди p2 НА (p2.person_id = друг.friend_id)КУДА p1.person_name = 'Джек';

Тот же запрос может быть переведен на -

  • Сайфер, база данных графов язык запросов
    МАТЧ(p1:человек)-[:ДРУГ-С]-(p2:человек)КУДАp1.имя="Джек"ВОЗВРАЩАТЬСЯp2.имя
  • SPARQL, база данных RDF-графов язык запросов стандартизировано W3C и используется в нескольких RDF Тройной и Quad магазины
    • Длинная форма
      ПРЕФИКС пена: <http://xmlns.com/foaf/0.1/>ВЫБРАТЬ ?имяКУДА { ? s а          пена:Человек .         ? s пена:имя  "Джек" .         ? s пена:знает ? o .         ? o пена:имя  ?имя .       }
    • Краткая форма
      ПРЕФИКС пена: <http://xmlns.com/foaf/0.1/>ВЫБРАТЬ ?имяКУДА { ? s пена:имя     "Джек" ;           пена:знает    ? o .           ? o пена:имя  ?имя .      }
  • SPASQL, гибридный язык запросов к базе данных, расширяющий SQL с SPARQL
    ВЫБРАТЬ люди.имяИЗ (       SPARQL ПРЕФИКС пена: <http://xmlns.com/foaf/0.1/>              ВЫБРАТЬ ?имя              КУДА { ? s пена:имя  "Джек" ;                          пена:знает ? o .                      ? o пена:имя  ?имя .                    }    ) В КАЧЕСТВЕ люди ;

Приведенные выше примеры являются простой иллюстрацией базового запроса о взаимоотношениях. Они концентрируют идею сложности запросов реляционных моделей, которая увеличивается с увеличением общего объема данных. Для сравнения, запрос к базе данных графа может легко отсортировать граф отношений для представления результатов.

Существуют также результаты, указывающие на то, что простые, сжатые и декларативные запросы к базам данных графов не обязательно обеспечивают хорошую производительность по сравнению с реляционными базами данных. В то время как графовые базы данных предлагают интуитивно понятное представление данных, реляционные базы данных предлагают лучшие результаты, когда требуются операции с наборами.[12]

Список баз данных графов

Ниже приводится список примечательный Графические базы данных:

ИмяВерсияЛицензияЯзыкОписание
АллегроГраф7.0.0 (апрель 2020 г.)Проприетарный, клиенты: Общественная лицензия Eclipse v1C #, C, Common Lisp, Ява, PythonСтруктура описания ресурсов (RDF) и база данных графов
Амазонка Нептун1.0.4.0 (октябрь 2020 г.)[20]ПроприетарныйНе разглашаетсяAmazon Neptune - это полностью управляемая база данных графов, созданная Amazon.com. Он используется как веб-сервис и является частью Веб-сервисы Amazon. Поддерживает популярные графические модели графа свойств и W3C с RDF, и их соответствующие языки запросов Apache TinkerPop Гремлин и SPARQL.
БД AnzoGraph2.1 (февраль 2020 г.)ПроприетарныйC, C ++AnzoGraph DB - это массивно параллельный собственная база данных в стиле графа GOLAP (Graph Online Analytics Processing), созданная для поддержки SPARQL и Cypher Query Language проанализировать триллионы отношений. БД AnzoGraph предназначена для интерактивного анализа больших наборов семантическая тройка данных, но также поддерживает помеченные свойства в предложенных W3C стандарты.[21][22][23][24]
ArangoDB3.7.2 / (21 августа 2020 г.)Свободный Apache 2, Проприетарный,C ++, JavaScript, .СЕТЬ, Ява, Python, Node.js, PHP, Scala, Идти, Рубин, ЭликсирNoSQL собственная многомодельная система баз данных, разработанная ArangoDB Inc. Система баз данных поддерживает три важные модели данных (ключ / значение, документы, графики) с одним ядром базы данных и унифицированным языком запросов под названием AQL (ArangoDB Query Language)
DataStax График предприятияv6.0.1 (июнь 2018 г.)ПроприетарныйЯваРаспределенная масштабируемая база данных в реальном времени; поддерживает Tinkerpop и интегрируется с Кассандра[25]
Ядро Гракна1.8.4Свободный, GNU AGPLv3ЯваГракн - это Открытый исходный код, распределен граф знаний для систем, ориентированных на знания. Это эволюция реляционной базы данных для сильно взаимосвязанных данных, поскольку она обеспечивает схема уровня концепции который полностью реализует Модель сущности-отношения (ER). Однако схема Гракна - это система типов который реализует принципы представление знаний и рассуждения. Это позволяет Grakn's декларативный язык запросов, Graql (язык запросов логики и аналитики Grakn), чтобы обеспечить более выразительный язык моделирования и способность выполнять Логическое объяснение над большими объемами сложных данных. По сути, Grakn - это база знаний за искусственный интеллект и когнитивные вычислительные системы.
InfiniteGraph3.0 (январь 2013 г.)Проприетарный, коммерческийЯваРаспределенный и облачный
ЯнусГраф0.5.2 (3 мая 2020 г.)[26]Apache 2ЯваОткрытый исходный код, масштабируемый, распределенный по базе данных графа кластера с несколькими машинами под Фонд Linux; поддерживает различные серверные части хранилища (Apache Cassandra, Apache HBase, Google Cloud Bigtable, Oracle BerkeleyDB );[27] поддерживает глобальную аналитику графических данных, отчеты и ETL за счет интеграции с платформами больших данных (Apache Spark, Apache Giraph, Apache Hadoop ); поддерживает географический, числовой диапазон и полнотекстовый поиск через внешние хранилища индексов (Elasticsearch, Apache Solr, Apache Lucene ).[28]
MarkLogic8.0.4 (2015)Проприетарный, бесплатное ПО версия для разработчиковЯваМультимодель NoSQL база данных, которая хранит документы (JSON и XML) и данные семантического графа (RDF троек); также имеет встроенную поисковую систему
Microsoft SQL Server 2017RC1ПроприетарныйSQL / T-SQL, р, PythonПредлагает возможности графической базы данных для моделирования отношений «многие ко многим». Связи графов интегрированы в Transact-SQL и используют SQL Server в качестве основной системы управления базами данных.[29]
График туманности2.0.0-альфа (ноябрь 2020 г.)Apache 2.0, открытый исходный код, Common Clause 1.0C ++, Go, Ява, PythonМасштабируемая база данных распределенных графов с открытым исходным кодом для хранения и обработки миллиардов вершин и триллионов ребер с задержкой в ​​миллисекунды. Он разработан на основе распределенной архитектуры без совместного использования ресурсов для линейной масштабируемости.[30]
Neo4j4.2.1 (ноябрь 2020 г.)[31]GPLv3 Community Edition, коммерческий & AGPLv 3 варианта для корпоративной и расширенной редакцийЯва, .СЕТЬ, JavaScript, Python, Идти,

Рубин, PHP, р, Erlang /Эликсир, C /C ++, Clojure, Perl, Haskell

Открытый исходный код, поддерживает ACID, имеет кластеризацию высокой доступности для корпоративных развертываний и поставляется с веб-администрированием, которое включает полную поддержку транзакций и визуальный обозреватель графа связей узлов; доступны из большинства языков программирования с помощью встроенного ОТДЫХ веб-API интерфейс и собственный протокол Bolt с официальными драйверами.
Открыть ссылкуВиртуоз8.2 (октябрь 2018)Версия с открытым исходным кодом GPLv 2, Enterprise Edition - это проприетарныйC, C ++Мультимодельная (гибридная) система управления реляционными базами данных (СУБД), которая поддерживает как SQL, так и SPARQL для декларативных операций (определение данных и манипулирование данными) с данными, смоделированными в виде таблиц SQL и / или графиков RDF. Также поддерживает индексацию RDF-Turtle, RDF-N-Triples, RDF-XML, JSON-LD, а также отображение и создание отношений (таблиц SQL или графиков RDF) из множества типов документов, включая CSV, XML и JSON. Может быть развернут как локальный или встроенный экземпляр (как используется в НЕПОМУК Semantic Desktop), сетевой сервер с одним экземпляром или сетевой сервер с несколькими экземплярами эластичного кластера без совместного использования ресурсов[32]
Oracle Spatial и Graph; часть База данных Oracle12.1.0.2 (2014)ПроприетарныйЯва, PL /SQLВозможности Property Graph и RDF Graph как функции многомодельной базы данных Oracle:
  1. График свойств - состоящий из набора объектов или вершин и набора стрелок или ребер, соединяющих объекты. Вершины и ребра могут иметь несколько свойств, которые представлены парами "ключ-значение". Включает PGQL, язык запросов графов, подобный SQL, и аналитический механизм в памяти (PGX) с более чем 50 предварительно созданными алгоритмами параллельных графов
  2. Семантический граф RDF: комплексное управление W3C RDF-графом в Oracle Database с встроенным логическим обоснованием и трехуровневой защитой меток.
OrientDB3.0.28 (февраль 2020 г.)Community Edition - это Apache 2, Enterprise Edition - это коммерческийЯваБаза данных с распределенными графами второго поколения с гибкостью документов в одном продукте (т.е. это одновременно база данных графов и база данных NoSQL документов); под лицензией Apache 2 с открытым исходным кодом; и имеет полный КИСЛОТА поддерживать; он имеет репликацию с несколькими мастерами и шардинг; поддерживает режимы без схемы, полный и смешанный; имеет профили безопасности на основе пользователей и ролей; поддерживает язык запросов, аналогичный SQL. Имеет HTTP ОТДЫХ и JSON API.
RedisGraph2.0.20 (сен 2020)Лицензия Redis Source AvailableCЗапрашиваемая база данных графика свойств в памяти, которая использует разреженные матрицы для представления матрицы смежности в виде графиков и линейная алгебра для запроса графика.[33]
SAP HANA2.0 SPS 05 (июнь 2020 г.)[34]ПроприетарныйC, C ++, Ява, JavaScript & SQL -подобный языкГраф свойств, поддерживаемых транзакцией ACID в памяти[35]
Sparksee5.2.0 (2015)Проприетарный, коммерческий, бесплатное ПО для оценки, исследования, развитияC ++Высокопроизводительная масштабируемая система управления базами данных от Sparsity Technologies; главная особенность - производительность запросов при поиске и исследовании больших сетей; имеет привязки для Ява, C ++, C #, Python, и Цель-C; версия 5 - это первый график мобильная база данных
Sqrrl Предприятие2.0 (февраль 2015 г.)ПроприетарныйЯваРаспределенная база данных графов в реальном времени с функциями безопасности на уровне ячеек и масштабируемости[36]
Терадата Астра7 (2016)ПроприетарныйЯва, SQL, Python, C ++, рMPP база данных, включающая запатентованные механизмы, поддерживающие собственный SQL, Уменьшение карты хранение и обработка данных графиков; предоставляет набор библиотек аналитических функций и визуализацию данных[37]
TerminusDB4.0 (2020)Apache 2Пролог, Ржавчина, JSON-LDБаза данных графов, управляемая моделями граф знаний представление

Языки программирования графовых запросов

  • AQL (язык запросов ArangoDB): SQL-подобный язык запросов, используемый в ArangoDB как для документов, так и для графиков
  • Cypher Query Language (Cypher): запрос графа декларативный язык за Neo4j что обеспечивает специальный и программный (SQL-подобный) доступ к графу.[38]
  • GQL: предлагаемый стандартный язык запросов графов ISO
  • GraphQL: язык запросов и обработки данных с открытым исходным кодом для API
  • Гремлин: язык программирования графов, который является частью проекта с открытым исходным кодом Apache TinkerPop[39]
  • SPARQL: язык запросов для баз данных RDF, который может извлекать и обрабатывать данные, хранящиеся в формате RDF.

Смотрите также

Рекомендации

  1. ^ Николаос Г. Бурбакис (1998). Искусственный интеллект и автоматизация. World Scientific. п. 381. ISBN  9789810226374. Получено 2018-04-20.
  2. ^ Юн, Бён-Ха; Ким, Сон-Кю; Ким, Сон-Ён (март 2017 г.). «Использование графической базы данных для интеграции разнородных биологических данных». Геномика и информатика. 15 (1): 19–27. Дои:10.5808 / GI.2017.15.1.19. ISSN  1598-866X. ЧВК  5389944. PMID  28416946.
  3. ^ а б Углы, Ренцо; Гутьеррес, Клаудио (1 февраля 2008 г.). «Обзор моделей графовых баз данных» (PDF). Опросы ACM Computing. 40 (1): 1–39. CiteSeerX  10.1.1.110.1072. Дои:10.1145/1322432.1322433. S2CID  207166126. Архивировано из оригинал (PDF) 15 августа 2017 г.. Получено 28 мая 2016. сетевым моделям [...] не хватает хорошего уровня абстракции: сложно отделить db-модель от реальной реализации.
  4. ^ Зильбершатц, Ави (28 января 2010 г.). Концепции системы баз данных, шестое издание (PDF). Макгроу-Хилл. п. Д-29. ISBN  978-0-07-352332-3.
  5. ^ «Графические базы данных стали мейнстримом». www.kdnuggets.com. Получено 2018-10-23.
  6. ^ Зильбершатц, Ави (28 января 2010 г.). Концепции системы баз данных, шестое издание (PDF). Макгроу-Хилл. п. E-20. ISBN  978-0-07-352332-3.
  7. ^ Паркер, Лотарингия. «Примечания IMS». vcu.edu. Получено 31 мая 2016.
  8. ^ Купер, Габриэль М. (1985). Логическая модель данных: новый подход к логике базы данных (PDF) (Кандидат наук.). Документ STAN-CS-85-1069. Получено 31 мая 2016.
  9. ^ «SAP объявляет о новых возможностях облака с HANA». 2014-10-22. Получено 2016-07-07.
  10. ^ Фризендал, Томас (22 сентября 2017 г.). «Графики свойств». graphdatamodeling.com. Получено 2018-10-23.
  11. ^ Das, S; Шринивасан, Дж; Перри, Мэтью; Чонг, Юджин; Банерджи, Джей (24 марта 2014 г.). «История двух графов: графы свойств как RDF в Oracle». Цитировать журнал требует | журнал = (помощь)
  12. ^ а б Есть, Кристиан Тейл; Дженсен, Ларс Джул (2013-10-17). «Готовы ли графические базы данных для биоинформатики?». Биоинформатика. 29 (24): 3107–3108. Дои:10.1093 / биоинформатика / btt549. ISSN  1460-2059. ЧВК  3842757. PMID  24135261.
  13. ^ «Структура описания ресурсов (RDF): концепции и абстрактный синтаксис». www.w3.org. Получено 2018-10-24.
  14. ^ «Протокол Open Graph». ogp.me. Получено 2018-10-23.
  15. ^ «Конкурентная динамика в потребительской сети: пять графиков обеспечивают устойчивое преимущество». www.gartner.com. Получено 2018-10-23.
  16. ^ а б Кодд, Э. Ф. (1970-06-01). «Реляционная модель данных для больших общих банков данных». Коммуникации ACM. 13 (6): 377–387. Дои:10.1145/362384.362685. ISSN  0001-0782. S2CID  207549016.
  17. ^ «Графические базы данных, 2-е издание». О’Рейли | Сафари. Получено 2018-10-23.
  18. ^ а б c d «От реляционных баз данных к графам». Neo4j.
  19. ^ а б "Примеры, где сияют базы данных Graph: версия Neo4j", ZeroTurnaround
  20. ^ «Amazon Neptune Engine версии 1.0.4.0 (12.10.2020)». AWS. Получено 17 ноя, 2020.
  21. ^ "База данных параллельных распределенных графов в памяти, специально созданная для аналитики". www.Cambridgesemantics.com. Получено 2018-02-20.
  22. ^ Рутер, Джон (15 февраля 2018 г.). «Cambridge Semantics объявляет о поддержке аналитики на основе графиков AnzoGraph для Amazon Neptune и графических баз данных». Businesswire. Получено 20 февраля, 2018.
  23. ^ Зейн, Барри (2 ноября 2016 г.). «Базы данных семантических графов: достойный преемник реляционных баз данных». www.dbta.com. Получено 20 февраля, 2018.
  24. ^ «Cambridge Semantics объявляет о поддержке AnzoGraph для Amazon Neptune и баз данных Graph». Тенденции и приложения баз данных. 2018-02-15. Получено 2018-03-08.
  25. ^ Вуди, Алекс (21 июня, 2016). "Beyond Titan: эволюция новой графической базы данных DataStax". Датанами. Получено 9 мая, 2017.
  26. ^ "JanusGraph версии 0.5.2". 3 мая 2020 г. - через Github.
  27. ^ "Бэкэнды хранилища JanusGraph". Архивировано из оригинал на 2018-10-02. Получено 2018-10-01.
  28. ^ "Индексные хранилища JanusGraph". Архивировано из оригинал на 2018-10-02. Получено 2018-10-01.
  29. ^ «Что нового в SQL Server 2017». Документы Microsoft. 19 апреля 2017 г.. Получено 9 мая, 2017.
  30. ^ «Дебюты Nebula Graph для открытия аналитики больших данных». Датанами. 29 июня 2020 г.. Получено 2 декабря, 2020.
  31. ^ «Примечания к выпуску: Neo4j 4.2.1». Платформа баз данных Neo4j Graph. Получено 2020-11-26.
  32. ^ "Диаграммы архитектуры развертывания кластеров для виртуоза". Вики-сайт Virtuoso с открытым исходным кодом. Программное обеспечение OpenLink. Получено 9 мая, 2017.
  33. ^ Ewbank, ключ. «RedisGraph становится общедоступным». i-programmer.info.
  34. ^ «Что нового в SAP HANA 2.0 SPS 05». Информация о товаре. Получено 2020-06-26.
  35. ^ Рудольф, Майкл; Paradies, Маркус; Борнхёвд, Кристоф; Ленер, Вольфганг. История графов базы данных SAP HANA (PDF). Конспект лекций по информатике.
  36. ^ Ваниан, Джонатан (18 февраля 2015 г.). «Связанный с АНБ Sqrrl занимается кибербезопасностью и получает финансирование в размере 7 миллионов долларов». Гигаом. Получено 9 мая, 2017.
  37. ^ Вуди, Алекс (23 октября 2015 г.). «Искусство аналитики, или чему нас могут научить зеленые волосы». Датанами. Получено 9 мая, 2017.
  38. ^ Свенссон, Йохан (5 июля 2016 г.). «Гостевой вид: реляционные базы данных или базы данных на графах: что использовать и когда?». Сан-Диего Таймс. BZ Media. Получено 30 августа 2016.
  39. ^ TinkerPop, Apache. "Apache TinkerPop". Apache TinkerPop. Получено 2016-11-02.