LeNet - LeNet

LeNet это сверточная нейронная сеть структура, предложенная Янн ЛеКун и другие. в 1989 году. В общем, LeNet относится к lenet-5 и является простым сверточная нейронная сеть. Сверточные нейронные сети - это своего рода нейронная сеть с прямой связью чьи искусственные нейроны могут реагировать на часть окружающих клеток в диапазоне покрытия и хорошо справляться с крупномасштабной обработкой изображений.

История развития

LeNet5 был одним из первых сверточные нейронные сети и способствовал развитию глубокое обучение. С 1988 года, после многих лет исследований и множества успешных итераций, новаторская работа получила название LeNet5.

Янн ЛеКун в 2018 году

В 1989 г. Янн ЛеКун и другие. в Bell Labs впервые применил алгоритм обратного распространения ошибки к практическим приложениям, и считал, что способность изучать обобщение сети может быть значительно улучшена путем предоставления ограничений из области задачи. Он объединил сверточную нейронную сеть, обученную алгоритмами обратного распространения, для чтения рукописных чисел и успешно применил ее для идентификации рукописных номеров почтовых индексов, предоставленных Почтовая служба США. Это был прототип того, что позже стало называться LeNet.[1]В том же году ЛеКун описал небольшую проблему распознавания рукописных цифр в другой статье и показал, что, хотя проблема линейно разделима, однослойные сети демонстрируют слабые возможности обобщения. При использовании инвариантных к сдвигу детекторов признаков в многослойной сети с ограничениями модель может работать очень хорошо. Он считал, что эти результаты доказали, что минимизация количества свободных параметров в нейронной сети может повысить способность нейронной сети к обобщению.[2]

В 1990 году в их статье снова описывалось применение сетей обратного распространения в распознавании рукописных цифр. Они выполнили только минимальную предварительную обработку данных, и модель была тщательно разработана для этой задачи и была сильно ограничена. Входные данные состояли из изображений, каждое из которых содержало номер, а результаты тестирования цифровых данных почтового индекса, предоставленных Почтовой службой США, показали, что модель имела коэффициент ошибок всего 1% и коэффициент отклонения около 9%.[3]

Их исследования продолжались в течение следующих восьми лет, и в 1998 году Ян Лекун, Леон Ботту, Йошуа Бенжио и Патрик Хаффнер рассмотрели различные методы распознавания рукописных символов на бумаге и использовали стандартные рукописные цифры для определения контрольных задач. Эти модели были сравнены, и результаты показали, что сеть превосходит все другие модели. Они также представили примеры практического применения нейронных сетей, такие как две системы для распознавания рукописных символов в Интернете и модели, которые могут читать миллионы чеков в день.[4]

Исследование имело большой успех и вызвало интерес ученых к изучению нейронных сетей. Хотя архитектура наиболее эффективных нейронных сетей сегодня отличается от архитектуры LeNet, сеть стала отправной точкой для большого количества архитектур нейронных сетей, а также послужила источником вдохновения для этой области.

График
1989Ян ЛеКун и др. предложил оригинальную форму LeNetLeCun, Y .; Boser, B .; Denker, J. S .; Хендерсон, Д .; Howard, R.E .; Хаббард, В. и Джекел, Л. Д. (1989). Обратное распространение применяется для распознавания рукописного почтового индекса. Нейронные вычисления, 1 (4): 541-551.[1]
1989Ян Лекун доказывает, что минимизация количества свободных параметров в нейронных сетях может повысить способность нейронных сетей к обобщению.ЛеКун, Ю. (1989). Стратегии обобщения и проектирования сети. Технический отчет CRG-TR-89-4, Департамент компьютерных наук, Университет Торонто.[2]
1990В их статье снова описывается применение сетей обратного распространения в распознавании рукописных цифр.LeCun, Y .; Boser, B .; Denker, J. S .; Хендерсон, Д .; Howard, R.E .; Хаббард, В. и Джекел, Л. Д. (1990). Распознавание рукописных цифр с помощью сети обратного распространения. Достижения в системах обработки нейронной информации 2 (NIPS * 89).[3]
1998Они рассмотрели различные методы, применяемые для распознавания рукописных символов, и сравнили их со стандартными тестами распознавания рукописных цифр. Результаты показывают, что сверточные нейронные сети превосходят все другие модели.LeCun, Y .; Bottou, L .; Бенжио, Ю. и Хаффнер, П. (1998). Применение градиентного обучения к распознаванию документов // Труды IEEE. 86 (11): 2278 - 2324.[4]

Структура[5] [6]

Как представитель ранней сверточной нейронной сети, LeNet обладает базовыми модулями сверточной нейронной сети, такими как сверточный слой, уровень объединения и уровень полного соединения, закладывая основу для будущего развития сверточной нейронной сети. Как показано на рисунке (входные данные изображения с 32 * 32 пикселями): lenet-5 состоит из семи слоев. Помимо ввода, любой другой слой может параметры поезда. На рисунке Cx представляет сверточный слой, Sx представляет слой подвыборки, Fx представляет полный уровень соединения, а x представляет индекс слоя.[1]

Слой C1 - это сверточный слой с шестью ядрами свертки 5x5 и размером отображения признаков 28x28, что может предотвратить выпадение информации входного изображения за границы ядра свертки.

Слой S2 - это уровень подвыборки / объединения, который выводит 6 графов признаков размером 14x14. Каждая ячейка в каждой карте функций связана с окрестностями 2x2 в соответствующей карте функций в C1.

Слой C3 представляет собой сверточный слой с 16 5-5 ядрами свертки. Входными данными первых шести карт характеристик C3 является каждое непрерывное подмножество трех карт характеристик в S2, входными данными следующих шести карт характеристик являются входные данные четырех непрерывных подмножеств, а входными данными следующих трех карт характеристик являются четыре прерывных подмножества. Наконец, входные данные для последнего графа характеристик поступают из всех графов характеристик S2.

Уровень S4 аналогичен слою S2, имеет размер 2x2 и выводит 16 графов 5x5 функций.

Слой C5 представляет собой сверточный слой со 120 ядрами свертки размером 5x5. Каждая ячейка соединена с окрестностью 5 * 5 на всех 16 графах характеристик S4. Здесь, поскольку размер графа функций S4 также составляет 5x5, выходной размер C5 равен 1 * 1. Итак, S4 и C5 полностью связаны. C5 помечен как сверточный слой, а не как полностью связанный слой, потому что, если вход lenet-5 станет больше, а его структура останется неизменной, его выходной размер будет больше 1x1, то есть не полностью подключенный слой.

Слой F6 полностью связан с C5, и выводятся 84 графика характеристик.

Функции

  • Каждый сверточный слой состоит из трех частей: свертки, объединения и нелинейной функции активации
  • Использование свертки для извлечения пространственных характеристик (изначально свертка называлась рецептивными полями)
  • Подвыборочный средний слой объединения
  • танх функция активации
  • Использование MLP в качестве последнего классификатора
  • Редкое соединение между слоями для упрощения вычислений.

Заявление

Распознавание изображений простых цифр - это самое классическое приложение LeNet, поскольку оно возникло из-за этого.

Когда Янн ЛеКун и др. подняли первоначальную форму LeNet в 1989 году. Обратное распространение, применяемое для распознавания рукописного почтового индекса[1] демонстрирует, как такие ограничения могут быть интегрированы в обратное распространение сеть через архитектуру сети. И он был успешно применен для распознавания рукописных цифр почтового индекса, предоставленных почтовой службой США.[1]

Анализ развития

LeNet5 означает появление CNN и определяет основные компоненты CNN.[4] Но в то время он не был популярен из-за отсутствия аппаратного оборудования, особенно графического процессора (Graphics Processing Unit, специализированного Электронная схема разработан, чтобы быстро манипулировать и изменять объем памяти ускорить создание изображений в кадровый буфер предназначен для вывода на устройство отображения ) и другой алгоритм, например SVM может достичь аналогичных эффектов или даже превзойти LeNet.

До успеха AlexNet в 2012 году, CNN стал лучшим выбором для приложений компьютерного зрения и многих различных типов CNN был поднят, например, R-CNN серии. Настоящее время, CNN модели сильно отличаются от Lenet, но все они разработаны на основе LeNet.

Рекомендации

  1. ^ а б c d е LeCun, Y .; Boser, B .; Denker, J. S .; Хендерсон, Д .; Howard, R.E .; Hubbard, W .; Джекель, Л. Д. (декабрь 1989 г.). «Обратное распространение, применяемое для распознавания рукописного почтового индекса». Нейронные вычисления. 1 (4): 541–551. Дои:10.1162 / neco.1989.1.4.541. ISSN  0899-7667.
  2. ^ а б Лекун, Янн (июнь 1989 г.). «Стратегии обобщения и проектирования сети» (PDF). Технический отчет CRG-TR-89-4. Департамент компьютерных наук Университета Торонто.
  3. ^ а б LeCun, Y .; Boser, B .; Denker, J. S .; Хендерсон, Д .; Howard, R.E .; Hubbard, W .; Джекер, Л. Д. (июнь 1990 г.). «Распознавание рукописных цифр с помощью сети обратного распространения» (PDF). Достижения в системах обработки нейронной информации 2: 396–404.
  4. ^ а б c Lecun, Y .; Bottou, L .; Bengio, Y .; Хаффнер, П. (1998). «Градиентное обучение применительно к распознаванию документов» (PDF). Труды IEEE. 86 (11): 2278–2324. Дои:10.1109/5.726791.
  5. ^ "卷积 神经 网络 之 LeNet - Brook_icv - 博客 园". www.cnblogs.com (на китайском). Получено 2019-11-16.
  6. ^ blog.csdn.net https://blog.csdn.net/happyorg/article/details/78274066. Получено 2019-11-16. Отсутствует или пусто | название = (помощь)