GraphLab - GraphLab

Тури
Разработчики)Университет Карнеги Меллон
Стабильный выпуск
v2.2 / 1 июля 2013 г. (2013-07-01)
Написано вC ++
Операционная системаLinux, macOS
ТипМашинное обучение Платформа
Лицензияпроприетарный
Интернет сайтhttps://turi.com/

Тури это график основанная на высокой производительности среда распределенных вычислений, написанная на C ++. Проект GraphLab был начат профессором Карлосом Гестрином из Университета Карнеги-Меллона в 2009 году. Это проект с открытым исходным кодом, использующий лицензию Apache. Хотя GraphLab изначально разрабатывался для Машинное обучение задач, он нашел большой успех в широком диапазоне других задач интеллектуального анализа данных; превосходит другие абстракции на порядки.[1][2]

Мотивация

По мере роста объемов собираемых данных и вычислительной мощности (многоядерные, графические процессоры, кластеры, облака) современные наборы данных больше не помещаются в один вычислительный узел. Требуются эффективные распределенные / параллельные алгоритмы для обработки крупномасштабных данных. Платформа GraphLab - это абстракция параллельного программирования, предназначенная для разреженных итеративный графовые алгоритмы. GraphLab предоставляет интерфейс программирования высокого уровня, позволяющий быстро развертывать распределенные алгоритмы машинного обучения.[3] Основными соображениями при проектировании GraphLab являются:

  • Редкие данные с локальными зависимостями
  • Итерационные алгоритмы
  • Потенциально асинхронное выполнение

Основные возможности GraphLab:

  • Единый многоядерный и распределенный API: однократная запись выполняется эффективно как в системах с общей, так и в распределенной памяти
  • Оптимизирован для производительности: оптимизированный механизм выполнения C ++ использует обширную многопоточность и асинхронный ввод-вывод
  • Масштабируемость: GraphLab разумно размещает данные и вычисления с помощью новых сложных алгоритмов.
  • HDFS Интеграция
  • Мощные инструменты машинного обучения

Наборы инструментов GraphLab

Поверх GraphLab реализовано несколько библиотек алгоритмов:

Отмеченное наградами программное обеспечение

Решение на основе библиотеки коллаборативной фильтрации Graphlab заняло 5 место в рейтинге ACM Yahoo! KDD CUP вызов, track1, из более чем 1000 участников. Команда LeBuShiShu использовала смесь из 12 различных алгоритмов и потратила 10000 часов ЦП на Суперкомпьютер BlackLight.[10] Большинство используемых алгоритмов и методов теперь являются частью Набор инструментов совместной фильтрации GraphLab.

Тури

Turi (ранее называвшаяся Dato, а до этого GraphLab Inc.) - это компания, основанная профессором Карлосом Гестрином из Вашингтонский университет в мае 2013 года, чтобы продолжить поддержку развития проекта с открытым исходным кодом GraphLab. Dato Inc. собрала серию A за 6,75 млн долларов от Madrona Venture Group и Новые партнеры предприятия (NEA). Они привлекли $ 18,5 млн Series B от Vulcan Capital и Opus Capital при участии Madrona и NEA.[11][12] 5 августа 2016 года Turi была приобретена Apple Inc. за 200000000 долларов.[13][14]

Рекомендации

  1. ^ Джозеф Гонсалес, Юченг Лоу, Хайцзе Гу, Дэнни Биксон, Карлос Гестрин (2012). «PowerGraph: Распределенные параллельные вычисления на натуральных графах». Труды проектирования и реализации операционных систем (OSDI).
  2. ^ Юченг Лоу, Джозеф Гонсалес, Аапо Кирола, Дэнни Биксон, Карлос Гестрин и Джозеф М. Хеллерстайн (2012). «Распределенная GraphLab: платформа для машинного обучения и интеллектуального анализа данных в облаке». Труды по очень большим базам данных (PVLDB).
  3. ^ Ю. Лоу, Дж. Гонсалес, А. Кирола, Д. Биксон, К. Гестрин и Дж. Хеллерстайн. GraphLab: новая платформа для параллельного машинного обучения. На 26-й конференции по неопределенности в искусственном интеллекте (UAI), остров Каталина, США, 2010 г.
  4. ^ «Архивная копия». Архивировано из оригинал на 2013-06-04. Получено 2013-05-14.CS1 maint: заархивированная копия как заголовок (связь)
  5. ^ «Архивная копия». Архивировано из оригинал на 2013-02-18. Получено 2013-05-14.CS1 maint: заархивированная копия как заголовок (связь)
  6. ^ «Архивная копия». Архивировано из оригинал на 2016-12-21. Получено 2016-12-01.CS1 maint: заархивированная копия как заголовок (связь)
  7. ^ «Архивная копия». Архивировано из оригинал на 2016-12-20. Получено 2016-12-01.CS1 maint: заархивированная копия как заголовок (связь)
  8. ^ «Архивная копия». Архивировано из оригинал на 2013-05-12. Получено 2013-05-14.CS1 maint: заархивированная копия как заголовок (связь)
  9. ^ «Архивная копия». Архивировано из оригинал на 2013-01-23. Получено 2013-05-14.CS1 maint: заархивированная копия как заголовок (связь)
  10. ^ Яо Ву, Цян Ян, Дэнни Биксон, Юйчэн Лоу, Цин Ян. Эффективная многоядерная совместная фильтрация. В мастерской ACM KDD CUP 2011.
  11. ^ Гейдж, Дебора (2015-01-08). «GraphLab, теперь Dato, привлекает 18,5 млн долларов для приложений машинного обучения». Блоги WSJ. Получено 2018-04-11.
  12. ^ Профиль GraphLab CrunchBase http://www.crunchbase.com/company/graphlab
  13. ^ Клевер, Джули. «Apple приобретает стартап Turi в области машинного обучения и искусственного интеллекта». Получено 2016-08-06.
  14. ^ «Эксклюзив: Apple приобретает Turi для крупного выхода для стартапа машинного обучения и искусственного интеллекта в Сиэтле». 2016-08-05. Получено 2016-08-06.

внешняя ссылка