GraphLab - GraphLab
Эта статья слишком полагается на Рекомендации к основные источники.Ноябрь 2011 г.) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
Разработчики) | Университет Карнеги Меллон |
---|---|
Стабильный выпуск | v2.2 / 1 июля 2013 г. |
Написано в | C ++ |
Операционная система | Linux, macOS |
Тип | Машинное обучение Платформа |
Лицензия | проприетарный |
Интернет сайт | https://turi.com/ |
Тури это график основанная на высокой производительности среда распределенных вычислений, написанная на C ++. Проект GraphLab был начат профессором Карлосом Гестрином из Университета Карнеги-Меллона в 2009 году. Это проект с открытым исходным кодом, использующий лицензию Apache. Хотя GraphLab изначально разрабатывался для Машинное обучение задач, он нашел большой успех в широком диапазоне других задач интеллектуального анализа данных; превосходит другие абстракции на порядки.[1][2]
Мотивация
По мере роста объемов собираемых данных и вычислительной мощности (многоядерные, графические процессоры, кластеры, облака) современные наборы данных больше не помещаются в один вычислительный узел. Требуются эффективные распределенные / параллельные алгоритмы для обработки крупномасштабных данных. Платформа GraphLab - это абстракция параллельного программирования, предназначенная для разреженных итеративный графовые алгоритмы. GraphLab предоставляет интерфейс программирования высокого уровня, позволяющий быстро развертывать распределенные алгоритмы машинного обучения.[3] Основными соображениями при проектировании GraphLab являются:
- Редкие данные с локальными зависимостями
- Итерационные алгоритмы
- Потенциально асинхронное выполнение
Основные возможности GraphLab:
- Единый многоядерный и распределенный API: однократная запись выполняется эффективно как в системах с общей, так и в распределенной памяти
- Оптимизирован для производительности: оптимизированный механизм выполнения C ++ использует обширную многопоточность и асинхронный ввод-вывод
- Масштабируемость: GraphLab разумно размещает данные и вычисления с помощью новых сложных алгоритмов.
- HDFS Интеграция
- Мощные инструменты машинного обучения
Наборы инструментов GraphLab
Поверх GraphLab реализовано несколько библиотек алгоритмов:
- Тематическое моделирование - содержит такие приложения, как LDA который можно использовать для кластеризации документов и извлечения тематических представлений.[4]
- Графическая аналитика - содержит приложение вроде pagerank и подсчет треугольников который может быть применен к общим графики чтобы оценить структура сообщества.[5]
- Кластеризация - содержит стандартные кластеризация данных инструменты, такие как Kmeans[6]
- Совместная фильтрация - содержит набор приложений, используемых для прогнозирования интересов пользователей и факторизовать большие матрицы.[7]
- Графические модели - содержит инструменты для создания совместных прогнозов относительно наборов связанных случайных величин.[8]
- Компьютерное зрение - содержит набор инструментов для рассуждений об изображениях.[9]
Отмеченное наградами программное обеспечение
Эта статья содержит контент, который написан как Реклама.Июнь 2015 г.) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
Решение на основе библиотеки коллаборативной фильтрации Graphlab заняло 5 место в рейтинге ACM Yahoo! KDD CUP вызов, track1, из более чем 1000 участников. Команда LeBuShiShu использовала смесь из 12 различных алгоритмов и потратила 10000 часов ЦП на Суперкомпьютер BlackLight.[10] Большинство используемых алгоритмов и методов теперь являются частью Набор инструментов совместной фильтрации GraphLab.
Тури
Turi (ранее называвшаяся Dato, а до этого GraphLab Inc.) - это компания, основанная профессором Карлосом Гестрином из Вашингтонский университет в мае 2013 года, чтобы продолжить поддержку развития проекта с открытым исходным кодом GraphLab. Dato Inc. собрала серию A за 6,75 млн долларов от Madrona Venture Group и Новые партнеры предприятия (NEA). Они привлекли $ 18,5 млн Series B от Vulcan Capital и Opus Capital при участии Madrona и NEA.[11][12] 5 августа 2016 года Turi была приобретена Apple Inc. за 200000000 долларов.[13][14]
Рекомендации
- ^ Джозеф Гонсалес, Юченг Лоу, Хайцзе Гу, Дэнни Биксон, Карлос Гестрин (2012). «PowerGraph: Распределенные параллельные вычисления на натуральных графах». Труды проектирования и реализации операционных систем (OSDI).
- ^ Юченг Лоу, Джозеф Гонсалес, Аапо Кирола, Дэнни Биксон, Карлос Гестрин и Джозеф М. Хеллерстайн (2012). «Распределенная GraphLab: платформа для машинного обучения и интеллектуального анализа данных в облаке». Труды по очень большим базам данных (PVLDB).
- ^ Ю. Лоу, Дж. Гонсалес, А. Кирола, Д. Биксон, К. Гестрин и Дж. Хеллерстайн. GraphLab: новая платформа для параллельного машинного обучения. На 26-й конференции по неопределенности в искусственном интеллекте (UAI), остров Каталина, США, 2010 г.
- ^ «Архивная копия». Архивировано из оригинал на 2013-06-04. Получено 2013-05-14.CS1 maint: заархивированная копия как заголовок (связь)
- ^ «Архивная копия». Архивировано из оригинал на 2013-02-18. Получено 2013-05-14.CS1 maint: заархивированная копия как заголовок (связь)
- ^ «Архивная копия». Архивировано из оригинал на 2016-12-21. Получено 2016-12-01.CS1 maint: заархивированная копия как заголовок (связь)
- ^ «Архивная копия». Архивировано из оригинал на 2016-12-20. Получено 2016-12-01.CS1 maint: заархивированная копия как заголовок (связь)
- ^ «Архивная копия». Архивировано из оригинал на 2013-05-12. Получено 2013-05-14.CS1 maint: заархивированная копия как заголовок (связь)
- ^ «Архивная копия». Архивировано из оригинал на 2013-01-23. Получено 2013-05-14.CS1 maint: заархивированная копия как заголовок (связь)
- ^ Яо Ву, Цян Ян, Дэнни Биксон, Юйчэн Лоу, Цин Ян. Эффективная многоядерная совместная фильтрация. В мастерской ACM KDD CUP 2011.
- ^ Гейдж, Дебора (2015-01-08). «GraphLab, теперь Dato, привлекает 18,5 млн долларов для приложений машинного обучения». Блоги WSJ. Получено 2018-04-11.
- ^ Профиль GraphLab CrunchBase http://www.crunchbase.com/company/graphlab
- ^ Клевер, Джули. «Apple приобретает стартап Turi в области машинного обучения и искусственного интеллекта». Получено 2016-08-06.
- ^ «Эксклюзив: Apple приобретает Turi для крупного выхода для стартапа машинного обучения и искусственного интеллекта в Сиэтле». 2016-08-05. Получено 2016-08-06.