Chainer - Chainer - Wikipedia
Оригинальный автор (ы) | Сейя Токуй |
---|---|
Разработчики) | Сообщество, Preferred Networks, Inc. |
изначальный выпуск | 9 июня 2015 г.[1][2] | .
Стабильный выпуск | 7.7.0[3] / 30 июля 2020 |
Репозиторий | |
Написано в | Python |
Платформа | кросс-платформенный |
Доступно в | Python |
Тип | Глубокое обучение библиотека |
Лицензия | Массачусетский технологический институт |
Интернет сайт | цепочка |
Chainer является Открытый исходный код глубокое обучение фреймворк написан исключительно на Python на вершине NumPy и библиотеки CuPy Python. Разработкой руководит японская венчурная компания Preferred Networks в партнерстве с IBM, Intel, Microsoft, и Nvidia.[4][5][6][7]
Chainer примечателен тем, что быстро принял "определение за запуском "схема, а также ее производительность на крупномасштабных системах.[1] Первая версия была выпущена в июне 2015 года и с тех пор приобрела большую популярность в Японии.[1][2] Кроме того, в 2017 году он был включен в список KDnuggets в топ-10 проектов машинного обучения на Python с открытым кодом.[8]
В декабре 2019 года Preferred Networks объявила о переводе своей разработки с Chainer на PyTorch и он будет предоставлять исправления только после выпуска v7.[9]
Определить по запуску
Chainer был первым фреймворком глубокого обучения, который представил подход определения по запуску.[10][11] Традиционная процедура обучения сети состояла из двух этапов: определение фиксированных связей между математическими операциями (такими как умножение матриц и нелинейная активация) в сети, а затем выполнение фактических расчетов обучения. Это называется подходом определения и запуска или статического графа. Theano и TensorFlow являются одними из известных фреймворков, в которых используется этот подход. Напротив, в подходе определения по запуску или динамического графа соединение в сети не определяется при запуске обучения. Сеть определяется во время обучения по мере выполнения фактических расчетов.
Одним из преимуществ этого подхода является его интуитивность и гибкость.[12] Если сеть имеет сложные потоки управления, такие как условные и петли, в подходе определения и запуска необходимы специально разработанные операции для таких конструкций. С другой стороны, в подходе определения по запуску для описания такого потока могут использоваться собственные конструкции языка программирования, такие как операторы if и for. Эта гибкость особенно полезна для реализации повторяющиеся нейронные сети.[13][14]
Еще одно преимущество - простота отладка.[12] В подходе определения и запуска, если ошибка (например, числовая ошибка) произошла в обучающем вычислении, часто бывает трудно проверить ошибку, потому что код, написанный для определения сети, и фактическое место ошибки разделены . В подходе определения по запуску вы можете просто приостановить вычисление с помощью встроенной в язык отладчик и проверьте данные, которые передаются по вашему коду сети.
Функция Define-by-run приобрела популярность с момента появления Chainer и теперь реализована во многих других фреймворках, включая PyTorch.[15] и TensorFlow.[12]
Библиотеки расширений
Chainer имеет четыре библиотеки расширений: ChainerMN, ChainerRL, ChainerCV и ChainerUI. ChainerMN позволяет использовать Chainer на нескольких графических процессорах со значительно большей производительностью, чем другие структуры глубокого обучения.[1] Суперкомпьютер, на котором запущен Chainer на 1024 графических процессорах, обработал 90 эпох ImageNet набор данных в сети ResNet-50 за 15 минут, что в четыре раза быстрее, чем предыдущий рекорд Facebook.[16][17] ChainerRL добавляет современное глубокое обучение с подкреплением алгоритмов, а ChainerUI - это инструмент управления и визуализации.
Приложения
Chainer используется в качестве основы для Краски, сервис, который автоматически раскрашивание черно-белые, только линии, черновые чертежи с минимальным участием пользователя.[18][19]
Смотрите также
- Сравнение программного обеспечения для глубокого обучения
- Машинное обучение
- Искусственная нейронная сеть
Рекомендации
- ^ а б c d «Крупный в Японии AI-код 'Chainer' показывает, как Intel будет стрелять в графические процессоры». Реестр. 2017-04-07. Получено 2017-12-24.
- ^ а б «Глубокое обучение の フ レ ー ム ワ ー ク Chainer を 公開 し ま し た» (на японском языке). 2015-06-09. Получено 2017-12-24.
- ^ «Выпуск 7.7.0». 30 июля 2020 г.. Получено 31 июля 2020.
- ^ "Домашняя страница Chainer". Получено 2017-12-24.
- ^ «IBM хочет быть« красной шляпой »глубокого обучения». HPCwire. 2017-01-26. Получено 2017-09-08.
- ^ «Intel сотрудничает с предпочтительными сетями в Японии в области глубокого обучения». 2017-04-06. Получено 2017-12-24.
- ^ «Microsoft сотрудничает с Preferred Networks, чтобы внедрить технологию глубокого обучения Chainer в Azure - MSPoweruser». MSPoweruser. 2017-05-23. Получено 2017-09-08.
- ^ «20 лучших проектов с открытым исходным кодом для машинного обучения Python». KDnuggets. 2017-11-24.
- ^ «Preferred Networks переносит свою платформу глубокого обучения на PyTorch». Preferred Networks, Inc. 2019-12-05. Получено 2019-12-27.
- ^ Токуй, Сейя; и другие. (2015). «Chainer: фреймворк нового поколения с открытым исходным кодом для глубокого обучения». 29-я ежегодная конференция по системам обработки нейронной информации (NIPS). 5.
- ^ Симада, Наоки (14 сентября 2017 г.). Глубокое обучение с Chainer. Gijutsu-Hyohron. п. 61. ISBN 4774191868.
- ^ а б c «Стремительное выполнение: обязательный интерфейс для TensorFlow, определяемый каждым запуском». Блог Google Research.
- ^ «Глубокое обучение с помощью динамических вычислительных графиков (ICLR 2017)». Метаданные.
- ^ Хидо, Шохей (8 ноября 2016 г.). «Сложные нейронные сети, упрощенные Chainer». O'Reilly Media. Получено 26 июн 2018.
- ^ Перес, Карлос Э. (20 января 2017 г.). «PyTorch, динамические вычислительные графы и модульное глубокое обучение». Середина.
- ^ «Чрезвычайно большой мини-пакет SGD: обучение ResNet-50 на ImageNet за 15 минут» (pdf). Получено 2017-12-24.
- ^ Грин, Тристан (20 ноября 2017 г.). «Ботаны Facebook превзошли японцев в гонке по обучению ИИ». Следующая Сеть. Получено 24 ноября 2017.
- ^ Знай, теперь ты (2017-02-15). «Это программное обеспечение на основе нейронной сети бесплатно добавит цвета в ваши рисунки». Techly. Получено 2017-09-08.
- ^ «Приложение для рисования« Pixiv Sketch »и сервис автоматического раскрашивания PaintsChainer» объединились, чтобы предоставить новую функцию для автоматического раскрашивания иллюстраций! ». 2017-05-24. Получено 2017-12-24.