Теория термоядерного адаптивного резонанса - Fusion adaptive resonance theory
Эта статья поднимает множество проблем. Пожалуйста помоги Улучши это или обсудите эти вопросы на страница обсуждения. (Узнайте, как и когда удалить эти сообщения-шаблоны) (Узнайте, как и когда удалить этот шаблон сообщения)
|
Теория адаптивного резонанса Fusion (Fusion ART)[1][2][3] является обобщением самоорганизации нейронные сети известный как Теория адаптивного резонанса[4] для изучения категорий распознавания (или когнитивные коды ) по нескольким каналам шаблона.
Fusion ART объединяет ряд моделей нейронных сетей, поддерживает несколько парадигм обучения, в частности обучение без учителя, контролируемое обучение и обучение с подкреплением, и может применяться для базовые знания интеграция, представление памяти,[5] и моделирование познания высокого уровня.
Обзор
Модели Fusion ART являются естественным продолжением оригинальной теории адаптивного резонанса (ART).[4][6] модели, разработанные Стивен Гроссберг и Гейл А. Карпентер из одного поля шаблона в несколько каналов шаблона. В то время как исходные модели ART выполняют неконтролируемое обучение узлов распознавания в ответ на входящие шаблоны ввода, fusion ART изучает многоканальные сопоставления одновременно по каналам мультимодальных шаблонов в онлайн и добавочный манера.
Модель обучения
Fusion ART использует многоканальную архитектуру (как показано ниже), содержащую поле категории подключен к фиксированному количеству (K) каналы шаблона или поля ввода через двунаправленные условные пути. Модель объединяет ряд сетевых проектов, в первую очередь теорию адаптивного резонанса (ART), адаптивную ассоциативную карту резонанса (ARAM).[7] и Fusion Architecture для обучения и познания (FALCON),[8] разработаны за последние десятилетия для широкого спектра функций и приложений.
Учитывая набор мультимодальных шаблонов, каждый из которых представлен в канале шаблона, цикл кодирования шаблонов Fusion ART включает пять ключевых этапов, а именно активацию кода, конкуренцию кода, считывание активности, сопоставление шаблонов и обучение шаблонов, как описано ниже.
- Активация кода: Учитывая векторы входной активности , по одному для каждого поля ввода , функция выбора каждого узел j вычисляется на основе совокупного общего сходства между входными шаблонами и соответствующим весом векторов .
- Код соревнования: Процесс кодовой конкуренции следует, в соответствии с которым узел с наибольшим значением функции выбора идентифицируется. Победитель индексируется на J куда это максимум среди всех узлы. Это указывает на стратегию «победитель получает все».
- Показания активности: В течение отзыв памяти, избранный узел J выполняет считывание своих весовых векторов в поля ввода .
- Соответствие шаблонов: До того, как показания активности стабилизируются и узел J может использоваться для обучения, процесс сопоставления шаблонов проверяет, что весовые шаблоны узла J достаточно близки к их соответствующим входным образцам. В частности, резонанс возникает, если для каждого канала k, то функция соответствия выбранного узла J соответствует критерию его бдительности. Если любой из бдительность ограничения нарушаются, происходит сброс рассогласования, при котором значение функция выбора установлен в 0 на время представления ввода. Используя отслеживание матчей обрабатывать в начале каждой входной презентации параметр бдительности в каждом канале ск приравнивается к базовой бдительности. Когда происходит сброс рассогласования, бдительность всех каналов шаблона увеличивается одновременно до тех пор, пока один из них не станет немного больше, чем соответствующая функция согласования, вызывая сброс. Затем процесс поиска выбирает другой узел J в соответствии с пересмотренным критерием бдительности до достижения резонанса.
- Обучение по шаблону: Как только возникает резонанс, для каждого канала ск, весовой вектор изменяется в соответствии с правилом обучения, которое перемещает его в сторону входного шаблона. Когда незафиксированный узел выбирается для обучения, он становится преданный идее и новый незафиксированный узел добавляется в поле. Таким образом, Fusion ART динамически расширяет свою сетевую архитектуру в соответствии с входными шаблонами.
Виды фьюжн-АРТ
Описанная выше сетевая динамика может использоваться для поддержки множества обучающих операций. В следующих разделах мы покажем, как fusion ART можно использовать для решения множества традиционно различных учебных задач.
Оригинальные модели ART
Благодаря единому каналу рисунка архитектура fusion ART сводится к исходной модели ART. Используя выбранное значение бдительности $ rho $, модель ART непрерывно изучает набор узлов распознавания в ответ на входящий поток входных шаблонов. Каждый узел распознавания в поле учится кодировать шаблон шаблона, представляющий ключевые характеристики набора шаблонов. АРТ широко использовалась в контексте обучение без учителя для обнаружения группировок паттернов.
Ассоциативная карта адаптивного резонанса
К синхронизация кодируя шаблоны по нескольким каналам шаблонов, Fusion ART учится кодировать ассоциативные сопоставления в различных пространствах шаблонов. Конкретный пример слияния ART с двумя каналами шаблонов известен как адаптивная ассоциативная карта резонанса (ARAM), которая изучает многомерные контролируемые сопоставления из одного пространства шаблонов в другое пространство шаблонов. Система ARAM состоит из поля ввода , поле вывода , и поле категории . Учитывая набор векторов признаков, представленных на с соответствующими векторами классов, представленными на , ARAM изучает прогнозную модель (закодированную узлами распознавания в ), который связывает комбинации ключевых функций с соответствующими классами.
Нечеткое ARAM, основанное на нечетких операциях ART, успешно применялось для решения множества задач машинного обучения, включая персональное профилирование,[9] классификация документов,[10] персонализированное управление контентом,[11] и ДНК анализ экспрессии генов.[12] Во многих тестовых экспериментах ARAM продемонстрировал предсказательную производительность, превосходящую таковую многих современных систем машинного обучения, включая C4.5, нейронную сеть обратного распространения ошибки, K Ближайший сосед, и Машины опорных векторов.
Fusion ART со знанием предметной области
Во время обучения fusion ART формулирует категории распознавания входных шаблонов по нескольким каналам. Знания, которые Fusion ART обнаруживает во время обучения, совместимы с символическим представлением на основе правил. В частности, категории распознавания, изученные узлы категорий совместимы с классом правил IF-THEN, которые сопоставляют набор входных атрибутов (антецедентов) в одном канале шаблона с непересекающимся набором выходных атрибутов (последствия ) в другом канале. Благодаря этой совместимости в любой точке постепенное обучение инструкции в форме правил IF-THEN можно легко перевести в категории распознавания системы Fusion ART. Правила являются конъюнктивными в том смысле, что атрибуты в Если да и в предложении THEN есть И отношение. Дополнение fusion ART-сети знаниями предметной области с помощью явных инструкций способствует повышению эффективности обучения и точности прогнозирования.
Стратегия вставки правила fusion ART аналогична стратегии, используемой в Cascade ARTMAP, обобщении ARTMAP, которое выполняет вставку, уточнение и извлечение знаний предметной области.[13] Для прямой вставки знаний предложения IF и THEN каждой инструкции (правила) транслируются в пару векторов A и B соответственно. Полученные векторные пары затем используются в качестве обучающих шаблонов для вставки в сеть Fusion ART. Во время вставки правила параметры бдительности устанавливаются на 1 с, чтобы гарантировать, что каждое отдельное правило закодировано одним узлом категории.
Архитектура Fusion для обучения и познания (FALCON)
Обучение с подкреплением - это парадигма, в которой автономный система учится корректировать свое поведение на основе сигналов подкрепления, полученных из окружающей среды. Экземпляр Fusion ART, известный как FALCON (архитектура слияния для обучения и познания), изучает сопоставления одновременно через мультимодальные шаблоны ввода, включая состояния, действия и вознаграждения, в онлайн и добавочный манера. По сравнению с другими системами обучения с подкреплением на основе ART, FALCON представляет собой действительно интегрированное решение в том смысле, что отсутствует реализация отдельного модуля обучения с подкреплением или Q-значение стол. Используя конкурентное кодирование в качестве основного принципа вычислений, сетевая динамика охватывает несколько парадигм обучения, включая обучение без учителя, обучение с учителем, а также обучение с подкреплением.
FALCON использует трехканальную архитектуру, включающую поле категории и три поля паттернов, а именно сенсорное поле для представления текущих состояний моторное поле для представления действий и поле обратной связи для представления значений вознаграждения. Класс сетей FALCON, известный как TD-FALCON,[8] включает методы временной разницы (TD) для оценки и изучения функции ценности Q (с, а), что указывает на готовность совершить определенное действие а в данном состоянии s.
Общий смысл - действовать - учиться алгоритм для TD-FALCON. Учитывая текущее состояние s, сеть FALCON используется для прогнозирования ценности выполнения каждого доступного действия. а в наборе действий A на основе соответствующего вектора состояния и вектор действия . Затем функции значений обрабатываются стратегией выбора действия (также известной как политика) для выбора действия. После получения обратной связи (если есть) от среды после выполнения действия, формула TD используется для вычисления новой оценки Q-значения для выполнения выбранного действия в текущем состоянии. Новое значение Q затем используется в качестве обучающего сигнала (представленного как вектор вознаграждения R) для FALCON, чтобы узнать связь текущего состояния и выбранного действия с расчетным значением.
Рекомендации
- ^ Ю. Асфур, Г.А. Карпентер, С. Гроссберг и Г.В. Лешер. (1993) Fusion ARTMAP: адаптивная нечеткая сеть для многоканальной классификации. В материалах Третьей Международной конференции по промышленным нечетким системам управления и интеллектуальным системам (IFIS).
- ^ Р.Ф. Харрисон и Дж.М.Боргес. (1995) Fusion ARTMAP: разъяснение, реализация и разработки. Отчет об исследовании № 589, Департамент автоматического управления и системотехники, Университет Шеффилда.
- ^ Тан, А.-Х., Карпентер, Г.А., Гроссберг, С. (2007) Интеллект через взаимодействие: к единой теории обучения . В слушания, D. Liu et al. (Ред.): Международный симпозиум по нейронным сетям (ISNN'07), LNCS 4491, Часть I, стр. 1098-1107.
- ^ а б Карпентер, Г.А. И Гроссберг, С. (2003), Теория адаптивного резонанса В архиве 2006-05-19 в Wayback Machine, В Майкл А. Арбиб (Ред.), Справочник по теории мозга и нейронным сетям, второе издание (стр. 87-90). Кембридж, Массачусетс: MIT Press
- ^ Wang, W.-W. И Тан, А.-Х. (2016) Семантическое моделирование памяти и взаимодействие памяти в обучающихся агентах. IEEE Transactions по системам, человеку и кибернетике: системы, в прессе.
- ^ Гроссберг, С. (1987), Конкурсное обучение: от интерактивной активации к адаптивному резонансу, Когнитивная наука (публикация), 11, 23-63
- ^ Тан, А.-Х. (1995). «Адаптивная ассоциативная карта резонанса» (PDF). Нейронные сети. 8 (3): 437–446. Дои:10.1016 / 0893-6080 (94) 00092-з.
- ^ а б Tan, A.-H., Lu, N .; Сяо, Д. (2008). «Интеграция методов временной разницы и самоорганизующихся нейронных сетей для обучения с подкреплением с отложенной оценочной обратной связью» (PDF). IEEE-транзакции в нейронных сетях. 9 (2): 230–244.CS1 maint: несколько имен: список авторов (связь)
- ^ Tan, A.-H .; Вскоре Х.-С. (2000). Труды, Тихоокеанско-азиатская конференция по открытию знаний и интеллектуальному анализу данных (PAKDD'00), LNAI. 1805: 173–176. Отсутствует или пусто
| название =
(помощь) - ^ He, J .; Tan, A.-H .; Тан, К.-Л. (2003). «О методах машинного обучения для классификации китайских документов» (PDF). Прикладной интеллект. 18 (3): 311–322. Дои:10.1023 / А: 1023202221875.
- ^ Tan, A.-H .; Ong, H.-L .; Pan, H .; Ng, J .; Ли, К.-Х. (2004). «На пути к персонализированной веб-аналитике» (PDF). Знания и информационные системы. 6 (5): 595–616. Дои:10.1007 / s10115-003-0130-9.
- ^ Tan, A.-H .; Пан (2005). «Прогнозирующие нейронные сети для анализа данных экспрессии генов» (PDF). Нейронные сети. 18 (3): 297–306. Дои:10.1016 / j.neunet.2005.01.003. PMID 15896577.
- ^ Тан, А.-Х. (1997). «Каскад ARTMAP: интеграция нейронных вычислений и обработки символьных знаний» (PDF). IEEE-транзакции в нейронных сетях.