KNIME - KNIME - Wikipedia

KNIME
KNIMELogoTM.svg
Разработчики)KNIME
Стабильный выпуск
4.3 / 6 декабря 2020 г.[1]
Операционная системаLinux, OS X, Windows
Доступно ванглийский
ТипУправляемая аналитика / Корпоративная отчетность / Бизнес-аналитика / Сбор данных / Глубокое обучение / Анализ данных / Текстовый анализ / Большое количество данных
ЛицензияСтандартная общественная лицензия GNU
Интернет сайтwww.knime.com

KNIME (/паɪм/), Констанц Информационный шахтер,[2] это бесплатно и с открытым исходным кодом платформа для анализа данных, отчетности и интеграции. KNIME объединяет различные компоненты для машинное обучение и сбор данных благодаря модульной концепции конвейерной передачи данных. А графический интерфейс пользователя и использование JDBC позволяет сборку узлов, смешивая разные источники данных, включая предварительную обработку (ETL: извлечение, преобразование, загрузка ), для моделирования, анализа и визуализации данных без программирования или с минимальным программированием.

С 2006 года KNIME используется в фармацевтических исследованиях,[3] он также используется в других областях, таких как CRM анализ данных клиентов, бизнес-аналитика, интеллектуальный анализ текста и анализ финансовых данных.

Штаб-квартира KNIME находится в Цюрихе, с дополнительными офисами в Констанце, Берлине и Остине (США).

История

Разработка KNIME была начата в январе 2004 года группой инженеров-программистов из Констанцский университет как запатентованный продукт. Первоначальная команда разработчиков во главе с Майклом Бертольдом происходила из компании из Кремниевой долины, поставляющей программное обеспечение для фармацевтической промышленности. Первоначальной целью было создание модульной, хорошо масштабируемой и открытой платформы обработки данных, которая позволяла бы легко интегрировать различные модули загрузки, обработки, преобразования, анализа и визуального исследования данных без акцента на какой-либо конкретной области приложения. Платформа была задумана как платформа для сотрудничества и исследований, а также должна служить платформой интеграции для различных других проектов анализа данных.[4]

В 2006 году была выпущена первая версия KNIME, и несколько фармацевтических компаний начали использовать KNIME, а ряд поставщиков программного обеспечения для наук о жизни начали интегрировать свои инструменты в KNIME.[5][6][7][8][9] Позже в том же году, после статьи в немецком журнале c't,[10] пользователи из ряда других областей[11][12] присоединился к кораблю. По состоянию на 2012 год KNIME используется более чем 15 000 реальных пользователей (то есть не считая загрузок, но пользователей, регулярно получающих обновления, когда они становятся доступными) не только в биологических науках, но и в банках, издательствах, производителях автомобилей, телекоммуникационных компаниях, консалтинговых фирмах и в различных других отраслях, а также в большом количестве исследовательских групп по всему миру. Последние обновления KNIME Server и KNIME Big Data Extensions обеспечивают поддержку Apache Spark 2.3, Parquet и хранилища типа HDFS.

Шестой год подряд KNIME занимает лидирующую позицию в области платформ для анализа данных и машинного обучения в рейтинге Gartner. Магический квадрант.

Скриншот KNIME

Внутренности

KNIME позволяет пользователям визуально создавать потоки данных (или конвейеры), выборочно выполнять некоторые или все этапы анализа, а затем проверять результаты, модели, используя интерактивные виджеты и представления. KNIME написан на Java и основан на Затмение. Он использует механизм расширения для добавления плагинов, обеспечивающих дополнительную функциональность. Базовая версия уже включает сотни модулей для интеграции данных (файловый ввод-вывод, узлы базы данных, поддерживающие все распространенные системы управления базами данных через JDBC или собственные соединители: SQLite, MS-Access, SQL Server, MySQL, Oracle, PostgreSQL, Vertica и H2) преобразование данных (фильтр, преобразователь, разделитель, объединитель, объединитель), а также широко используемые методы статистики, интеллектуального анализа данных, анализа и текстовой аналитики. Визуализация поддерживается с помощью бесплатного расширения Report Designer. Рабочие процессы KNIME можно использовать в качестве наборов данных для создания шаблонов отчетов, которые можно экспортировать в такие форматы документов, как doc, ppt, xls, pdf и другие. Другие возможности KNIME:

  • Ядро-архитектура KNIME позволяет обрабатывать большие объемы данных, которые ограничены только доступным пространством на жестком диске (не ограниченным доступной RAM). Например. KNIME позволяет анализировать 300 миллионов адресов клиентов, 20 миллионов изображений клеток и 10 миллионов молекулярных структур.
  • Дополнительные плагины позволяют интегрировать методы для интеллектуальный анализ текста, Анализ изображений, а также анализ временных рядов и сети.
  • KNIME объединяет различные другие проекты с открытым исходным кодом, например алгоритмы машинного обучения от Weka, H2O.ai, Керас, Искра, то R проект и LIBSVM; но также коварный, JFreeChart, ImageJ, а Комплект для разработки химии.[13]

KNIME реализован в Ява но также позволяет оберткам вызывать другой код в дополнение к предоставлению узлов, которые позволяют запускать Ява, Python, р, Рубин и другие фрагменты кода.

Лицензия

Начиная с версии 2.1, KNIME выпущен под GPLv3 с исключением, которое позволяет другим использовать четко определенный API узла для добавления проприетарных расширений.[14] Это также позволяет поставщикам коммерческого ПО добавлять обертки, вызывающие их инструменты из KNIME.

Курсы KNIME

KNIME предлагает две линии онлайн-курсов, основанных на направлениях Data Wrangling и Data Science.[15]

Смотрите также

Рекомендации

  1. ^ «Что нового в KNIME Analytics Platform 4.0 и KNIME Server 4.9». knime.com.
  2. ^ Бертольд, Майкл Р .; Себрон, Николас; Укроп, Фабиан; Габриэль, Томас Р .; Кёттер, Тобиас; Майнл, Торстен; Ол, Питер; Тиль, Килиан; Висведель, Бернд (16 ноября 2009 г.). «KNIME - поиск информации Констанца» (PDF). Информационный бюллетень ACM SIGKDD Explorations. 11 (1): 26. Дои:10.1145/1656274.1656280. S2CID  408188.
  3. ^ Тивари, Абхишек; Сехар, Арвинд К. (Октябрь 2007 г.). «Основа рабочего процесса для информатики наук о жизни». Вычислительная биология и химия. 31 (5–6): 305–319. Дои:10.1016 / j.compbiolchem.2007.08.009. PMID  17931570.
  4. ^ «Открыт для инноваций». KNIME.com.
  5. ^ Tripos, Inc. В архиве 2011-07-17 на Wayback Machine
  6. ^ Шредингер В архиве 2009-09-25 на Wayback Machine
  7. ^ ChemAxon В архиве 2011-07-17 на Wayback Machine
  8. ^ ООО «НоваМеханикс»
  9. ^ Консультанты Treweren
  10. ^ Datenbank-Mosaik Data Mining oder die Kunst, sich aus Millionen Datensätzen ein Bild zu machen, c't 20/2006, S. 164ff, Heise Verlag.
  11. ^ Форум на веб-сайте KNIME
  12. ^ "Всепроникающий". Архивировано из оригинал на 2010-08-29. Получено 2010-12-07.
  13. ^ Beisken, S .; Meinl, T .; Wiswedel, B .; Де Фигейредо, Л. Ф .; Бертольд, М .; Стейнбек, К. (2013). "KNIME-CDK: химинформатика, управляемая рабочим процессом". BMC Bioinformatics. 14: 257. Дои:10.1186/1471-2105-14-257. ЧВК  3765822. PMID  24103053.
  14. ^ KNIME 2.1.0 выпущен В архиве 2010-04-17 на Wayback Machine
  15. ^ новый путь обучения

внешняя ссылка