Взлететь (когнитивная архитектура) - Soar (cognitive architecture) - Wikipedia

Парить[1] это когнитивная архитектура,[2] первоначально созданный Джон Лэрд, Аллен Ньюэлл, и Пол Розенблум в Университет Карнеги Меллон. (Розенблум продолжал выполнять обязанности главного исследователя после переезда в Стэндфордский Университет, затем в Университет Южной Калифорнии Институт информационных наук.) поддерживается и развивается исследовательской группой Джона Лэрда в университет Мичигана.

Цель проекта Soar - разработать фиксированные вычислительные строительные блоки, необходимые для общего интеллектуальные агенты - агенты, которые могут выполнять широкий спектр задач, а также кодировать, использовать и изучать все типы знаний для реализации полного спектра когнитивных способностей, присущих людям, таких как принятие решений, решение проблем, планирование и понимание естественного языка. Это и теория того, что познание является вычислительной реализацией этой теории. С момента своего основания в 1983 году как Джона Лэрда диссертации, он широко использовался исследователями ИИ для создания интеллектуальных агентов и когнитивные модели различных аспектов человеческое поведение. Наиболее актуальным и полным описанием Soar является книга 2012 года, Когнитивная архитектура.[1]

Теория

Soar воплощает несколько гипотез о вычислительных структурах, лежащих в основе общий интеллект, многие из которых используются в других когнитивных архитектурах, в том числе ACT-R, который был создан Джон Р. Андерсон, и LIDA, который был создан Стэн Франклин. В последнее время упор на Soar делался на общий ИИ (функциональность и эффективность), тогда как акцент на ACT-R всегда делался на когнитивное моделирование (детальное моделирование познания человека).

Исходной теорией познания, лежащей в основе Soar, является гипотеза проблемного пространства, описанная в Аллен Ньюэлл книга, Единые теории познания.[2] и восходит к одной из первых созданных систем искусственного интеллекта, Newell, Саймон, и Шоу с Теоретик логики, впервые представленная в 1955 году. Гипотеза проблемного пространства утверждает, что любое целенаправленное поведение можно представить как поиск в пространстве возможных состояний ( проблемное пространство ) при попытке достичь цели. На каждом этапе выбирается один оператор, который затем применяется к текущему состоянию агента, что может привести к внутренним изменениям, таким как извлечение знаний из долговременной памяти или модификациям или внешним действиям в мире. (Название Soar происходит от этого базового цикла, состоящего из состояний, оператора и результата; однако он больше не рассматривается как акроним.) Гипотезе проблемного пространства присуще то, что любое поведение, даже сложное действие, такое как планирование, разложимо. в последовательность выбора и применения примитивных операторов, которые при отображении на поведение человека занимают ~ 50 мс.

Вторая гипотеза теории Соара заключается в том, что, хотя на каждом шаге можно выбрать только один оператор, вызывая последовательное узкое место, процессы выбора и применения реализуются посредством параллельных запусков правил, которые обеспечивают контекстно-зависимое извлечение процедурных знаний.

Третья гипотеза заключается в том, что если знания для выбора или применения оператора неполны или неопределенны, возникает тупик, и архитектура автоматически создает подсостояние. В подсостоянии рекурсивно используется тот же процесс решения проблемы, но с целью извлечения или открытия знаний, чтобы можно было продолжить принятие решений. Это может привести к стеку подсостояний, где традиционные методы решения проблем, такие как планирование или же иерархическая декомпозиция задач, естественно возникают. Когда результаты, созданные в подсостоянии, разрешают тупик, подсостояние и связанные с ним структуры удаляются. Общий подход называется универсальной подцелью.

Эти предположения приводят к архитектуре, поддерживающей три уровня обработки. На самом низком уровне идет восходящая, параллельная и автоматическая обработка. Следующий уровень - это совещательный уровень, где знания первого уровня используются для предложения, выбора и применения одного действия. Эти два уровня реализуют быстрое, квалифицированное поведение и примерно соответствуют Канемана Уровень обработки системы 1. Более сложное поведение возникает автоматически, когда знание является неполным или неопределенным, на третьем уровне обработки с использованием подсостояний, примерно соответствующих Системе 2.

Четвертая гипотеза Soar заключается в том, что основная структура является модульной, но не в терминах модулей, основанных на задачах или возможностях, таких как планирование или язык, а вместо этого как независимые от задач модули, включая: модуль принятия решений; модули памяти (краткосрочные пространственные / визуальные и рабочие воспоминания; долгосрочные процедурные, декларативные и эпизодические воспоминания), механизмы обучения, связанные со всеми долгосрочными воспоминаниями; а также перцептивные и двигательные модули. Существуют и другие предположения о конкретных свойствах этих воспоминаний, описанных ниже, в том числе о том, что все обучение происходит в интерактивном режиме и происходит постепенно.

Пятая гипотеза состоит в том, что элементы памяти (за исключением пространственной / визуальной памяти) представлены как символические реляционные структуры. Гипотеза о том, что символическая система необходимо для общего интеллект известен как система физических символов гипотеза. Важная эволюция в Soar заключается в том, что все символические структуры имеют связанные статистические метаданные (такие как информация о давности и частоте использования или ожидаемом будущем вознаграждении), которые влияют на извлечение, обслуживание и изучение символических структур.

Архитектура

Цикл обработки - процедура принятия решения

Основной цикл обработки Soar возникает из взаимодействия между процедурная память (его знания о том, как что-то делать) и рабочая память (представление текущей ситуации) для поддержки выбора и применения операторов. Информация в рабочей памяти представлена ​​в виде символьная структура графа, уходящие корнями в государственный. Знания в процедурной памяти представлены как если-то правила (наборы условий и действий), которые постоянно сопоставляются с содержимым рабочей памяти. Когда условия правила соответствуют структурам в рабочей памяти, оно пожары и выполняет свои действия. Это сочетание правил и рабочей памяти также называется производственная система. В отличие от большинства производственных систем, в Soar все соответствующие правила запускаются параллельно.

Вместо того, чтобы выбирать одно правило, которое является ключевым моментом при принятии решения, принятие решений Soar происходит путем выбора и применения операторы, которые предлагаются, оцениваются и применяются правилами. Оператор предлагается по правилам, которые проверяют текущее состояние и создают представление оператора в рабочей памяти, а также приемлемое предпочтение, что указывает на то, что оператора следует рассматривать для выбора и применения. Дополнительные правила соответствуют предложенному оператору и создают дополнительные предпочтения, которые сравнивают и оценивают его с другими предложенными операторами. Предпочтения анализируются процедурой принятия решения, которая выбирает предпочтительного оператора и устанавливает его в качестве текущего оператора в рабочей памяти. Затем срабатывают правила, соответствующие текущему оператору, чтобы применить его и внести изменения в рабочую память. Изменения в рабочей памяти могут быть простыми выводами, запросами на извлечение из долговременных семантических или эпизодических воспоминаний Соара, командами двигательной системе для выполнения действий в окружающей среде или взаимодействиями с пространственной визуальной системой (SVS), которая является рабочей памятью. интерфейс к восприятию. Эти изменения в рабочей памяти приводят к тому, что предлагаются и оцениваются новые операторы, за которыми следует выбор одного и его применения.

Обучение с подкреплением

Поднимите опоры обучение с подкреплением, который настраивает значения правил, которые создают числовые предпочтения для оценки операторов на основе вознаграждения. Чтобы обеспечить максимальную гибкость, в рабочей памяти есть структура, в которой создается вознаграждение.

Тупиковые ситуации, подсостояния и фрагменты

Если предпочтений для операторов недостаточно, чтобы указать выбор одного оператора, или правил для применения оператора недостаточно, возникает тупиковая ситуация. В ответ на тупик в рабочей памяти создается подсостояние, цель которого - разрешить тупик. Дополнительные процедурные знания могут затем предлагать и выбирать операторов в подсостоянии, чтобы получить больше знаний, и либо создавать предпочтения в исходном состоянии, либо изменять это состояние, чтобы разрешить тупиковую ситуацию. Подсостояния предоставляют средства для сложных рассуждений по запросу, включая иерархическую декомпозицию задач, планирование и доступ к декларативной долгосрочной памяти. Как только тупиковая ситуация разрешена, все структуры подсостояния удаляются, за исключением любых результатов. Механизм фрагментации Soar компилирует обработку в подсостоянии, которая привела к результатам, в правила. В будущем изученные правила автоматически срабатывают в аналогичных ситуациях, чтобы не возникало тупиковой ситуации, постепенно преобразуя сложные рассуждения в автоматическую / реактивную обработку. Недавно общая процедура универсальной подцели была расширена за счет механизма целенаправленного и автоматического увеличения базы знаний, который позволяет выходить из тупика путем рекомбинации инновационным и проблемно-ориентированным способом знаний, которыми обладает агент Soar. [3].

Символьный ввод и вывод

Символьный ввод и вывод происходит через структуры рабочей памяти, прикрепленные к верхнему состоянию, которые называются входной ссылкой и выходной ссылкой. Если структуры создаются на выходном канале в рабочей памяти, они преобразуются в команды для внешних действий (например, управления двигателем).

Пространственная визуальная система и ментальные образы

Для поддержки взаимодействия с системами зрения и несимволических рассуждений в Soar есть пространственная визуальная система (SVS). SVS внутренне представляет мир как граф сцены, набор объектов и подобъектов компонентов, каждый из которых имеет пространственные свойства, такие как форма, расположение, поза, относительное положение и масштаб. Агент Soar, использующий SVS, может создавать фильтры для автоматического извлечения функций и отношений из своего графа сцены, которые затем добавляются в рабочую память. Кроме того, агент Soar может добавлять структуры в SVS и использовать их для ментальных образов. Например, агент может создать гипотетический объект в SVS в заданном месте и запросить, не сталкивается ли он с какими-либо воспринимаемыми объектами.

Семантическая память

Семантическая память (SMEM) в Soar предназначен для очень большой долговременной памяти факто-подобных структур. Данные в SMEM представлены в виде ориентированных циклических графов. Структуры можно сохранять или извлекать с помощью правил, которые создают команды в зарезервированной области рабочей памяти. Полученные структуры добавляются в рабочую память.

Структуры SMEM имеют значения активации, которые представляют частоту или новизну использования каждой памяти, реализующие активация базового уровня Схема изначально разработана для ACT-R. Во время поиска извлекается структура в SMEM, которая соответствует запросу и имеет максимальную активацию. Soar также поддерживает активация распространения, где активация распространяется от структур SMEM, которые были извлечены в рабочую память, на другие долговременные воспоминания, с которыми они связаны.[4] Эти воспоминания, в свою очередь, распространяют активацию на воспоминания соседей с некоторым распадом. Активация распространения - это механизм, позволяющий текущему контексту влиять на извлечение из семантической памяти.

Эпизодическая память

Эпизодическая память (EPMEM) автоматически записывает снимки рабочей памяти во временном потоке. Предыдущие эпизоды можно загрузить в рабочую память с помощью запроса. Как только эпизод был извлечен, может быть извлечен следующий (или предыдущий) эпизод. Агент может использовать EPMEM для последовательного воспроизведения эпизодов из своего прошлого (что позволяет ему предсказать последствия действий), извлечения определенных воспоминаний или запроса эпизодов, обладающих определенными структурами памяти.

Учусь

Каждое из долговременных воспоминаний Соара связано с механизмами онлайн-обучения, которые создают новые структуры или изменяют метаданные на основе опыта агента. Например, Soar изучает новые правила для процедурной памяти с помощью процесса, называемого дробление и использует обучение с подкреплением для настройки правил, участвующих в выборе операторов.

Агент развития

Стандартный подход к разработке агента в Soar начинается с написания правил, которые загружаются в процедурную память, и инициализации семантической памяти с соответствующими декларативными знаниями. Процесс разработки агента подробно описан в официальном руководстве Soar, а также в нескольких учебных пособиях, которые доступны в исследовательской группе. интернет сайт.

Программного обеспечения

Расширение когнитивной архитектуры парения, Джон Лэрд, 2008.

Архитектура Soar поддерживается и расширяется исследовательской группой Джона Лэрда в Мичиганском университете. Текущая архитектура написана на комбинации C и C ++ и находится в свободном доступе (лицензия BSD) в исследовательской группе. интернет сайт.

Soar может взаимодействовать с внешними языковыми средами, включая C ++, Java, Tcl и Python, через язык разметки Soar (SML). SML - это основной механизм для создания экземпляров агентов Soar и взаимодействия с их ссылками ввода-вывода.

JSoar - это реализация Soar, написанная на Java. Он поддерживается SoarTech, компания, занимающаяся исследованиями и разработками в области ИИ. JSoar внимательно следит за реализацией архитектуры Мичиганского университета, хотя обычно не отражает последних разработок и изменений этой версии C / C ++.[5]

Приложения

Ниже приведен исторический список различных областей приложений, реализованных в Soar. В Soar реализовано более сотни систем, хотя подавляющее большинство из них представляют собой игрушечные задачи или головоломки.

Пазлы и игры

На протяжении всей своей истории Soar использовался для реализации широкого спектра классических головоломок и игр с ИИ, таких как Ханойская башня, Кувшин для воды, Крестики-нолики, Восемь головоломок, Миссионеры и каннибалы, а также вариации Блокирует мир. Одно из первых достижений Soar показало, что множество различных слабых методов естественным образом возникнет из знания задачи, которое было закодировано в нем, свойство, называемое, Универсальный слабый метод. [6]

Конфигурация компьютера

Первым крупномасштабным приложением Soar было R1-Soar, частичное повторное воплощение Пола Розенблума из R1 (XCON ) экспертная система Джон Макдермотт разработал для настройки компьютеров DEC. R1-Soar продемонстрировал способность Soar масштабироваться до задач среднего размера, использовать иерархическую декомпозицию и планирование задач, а также преобразовывать преднамеренное планирование и решение проблем в реактивное выполнение посредством разбиения на части.[7]

Понимание естественного языка

NL-Soar был понимание естественного языка Система, разработанная в Soar Джилл Фейн Леман, Риком Льюисом, Нэнси Грин, Дерилом Лонсдейлом и Грегом Нельсоном. Он включал возможности для понимания естественного языка, генерации и диалога с упором на инкрементный синтаксический анализ и генерацию в реальном времени. NL-Soar использовался в экспериментальной версии TacAir-Soar и в NTD-Soar.[8]

Моделируемые пилоты

Второе крупномасштабное приложение Soar включало разработку агентов для использования при обучении в крупномасштабном распределенном моделировании. Две основные системы для выполнения тактических воздушных миссий США были совместно разработаны в Мичиганском университете и Институте информационных наук (ISI) Университета Южной Калифорнии. Система Мичигана называлась TacAir-Soar и летела (в симуляции) с неподвижным крылом Военно-тактические миссии США (такие как поддержка с воздуха, удары, Шапки, дозаправка и ЮВА миссии). Система ISI получила название RWA-Soar и использовала винтокрылые (вертолетные) миссии. Некоторые из возможностей, включенных в TacAir-Soar и RWA-Soar, включают внимание, ситуационную осведомленность и адаптацию, планирование в реальном времени и динамическое перепланирование, а также сложную коммуникацию, координацию и сотрудничество между комбинациями агентов Soar и людей. Эти системы участвовали в DARPA С Синтетический театр войны (STOW-97) Продвинутая концептуальная демонстрация технологий (ACTD), которая в то время была крупнейшим выставлением синтетических агентов в совместном боевом пространстве за 48-часовой период и включала обучение действующего военнослужащего. Эти системы продемонстрировали жизнеспособность использования агентов ИИ для крупномасштабного обучения.[9]

ПАР

Одним из важных результатов проекта RWA-Soar стала разработка STEAM. Милинд Тамбе,[10] структура для гибкой командной работы, в которой агенты поддерживали модели своих товарищей по команде, используя структуру совместных намерений Cohen & Levesque.[11]

NTD-Soar

NTD-Soar был имитацией Директор по испытаниям НАСА (NTD), лицо, ответственное за координацию подготовки НАСА Космический шатл перед запуском. Это была интегрированная когнитивная модель, включающая множество различных сложных когнитивных способностей, включая обработка естественного языка, внимание и визуальный поиск, и решение проблем в широкой агентной модели.[12]

Виртуальные люди

Soar использовался для моделирования виртуальных людей, поддерживающих диалог лицом к лицу и сотрудничество в виртуальном мире, разработанном в Институте творческих технологий Университета Южной Калифорнии. Виртуальные люди обладают интегрированными возможностями восприятие, понимание естественного языка, эмоции, контроль тела и действие, среди прочего.[13]

Игровые ИИ и мобильные приложения

Агенты игрового ИИ были созданы с использованием Soar для таких игр, как Стар Крафт,[14] Quake II,[15] Спуск 3,[16] Нереальный Турнир,[17] и Шахтерское ремесло[нужна цитата ], поддерживающие возможности, такие как пространственное мышление, стратегия в реальном времени, и противник ожидание. Агенты искусственного интеллекта также были созданы для видеоигр, включая Infinite Марио[18] который использовал обучение с подкреплением, и Frogger II, Космические захватчики, и Fast Eddie, который использовал как обучение с подкреплением, так и мысленные образы.[19]

Soar может работать изначально на мобильные устройства. Мобильный заявление для игры Liar’s Dice был разработан для iOS который запускает архитектуру Soar прямо с телефона в качестве движка для искусственного интеллекта противника.[20]

Робототехника

С тех пор, как в 1991 году был реализован оригинальный Robo-Soar для управления манипулятором Puma, с помощью Soar было создано множество различных роботизированных приложений.[21] Они варьировались от управления мобильными роботами до службы гуманоидов. REEM роботы[22] роботы-мулы[23] и беспилотные подводные аппараты.[24]

Интерактивное обучение задачам

Текущее направление исследований и разработок в сообществе Soar - интерактивное обучение задач (ITL), автоматическое обучение новым задачам, особенностям среды, поведенческим ограничениям и другим характеристикам посредством естественного взаимодействия с инструктором.[25] Исследования в ITL были применены к настольным играм[26] и мультирумная навигация.[27]

Планирование

Вначале Merle-Soar продемонстрировал, как Soar может изучить сложную задачу планирования, смоделированную по образцу ведущего планировщика-человека на заводе по производству лобовых стекол, расположенном недалеко от Питтсбурга.[28]

Смотрите также

Рекомендации

  1. ^ а б Лэрд, Джон Э. (2012). Когнитивная архитектура Soar. MIT Press. ISBN  978-0262122962.
  2. ^ а б Ньюэлл, Аллен (декабрь 1990 г.). Единые теории познания. Издательство Гарвардского университета. ISBN  978-0674920996.
  3. ^ Лието, Антонио; Перроне, Федерико; Поццато, Джан Лука; Чиодино, Элеонора (2019). «Помимо подцелей: динамическая структура генерации знаний для творческого решения проблем в когнитивных архитектурах». Исследование когнитивных систем. 58: 305–316. Дои:10.1016 / j.cogsys.2019.08.005. HDL:2318/1726157.
  4. ^ Джонс, Стивен; и другие. (2016). «Эффективное вычисление активации распространения с помощью ленивого вычисления» (PDF). ICCM. Материалы 14-й Международной конференции по когнитивному моделированию: 182–187.
  5. ^ SoarTech: JSoar
  6. ^ Лэрд, Джон; Ньюэлл, Аллен (1983). «Универсальный слабый метод: сводка результатов». IJCAI. 2: 771–772.
  7. ^ Розенблум, Пол; Лэрд, Джон; Макдермотт, Джон (27 января 2009 г.). "R1-Soar: эксперимент в интеллектуальном программировании в архитектуре, решающей проблемы". IEEE Transactions по анализу шаблонов и машинному анализу. ПАМИ-7 (5): 561–569. Дои:10.1109 / TPAMI.1985.4767703. PMID  21869293.
  8. ^ Рубинофф, Роберт; Леман, Джилл (1994). «Генерация естественного языка в реальном времени в NL-Soar». INLG. Труды Седьмого международного семинара по генерации естественного языка: 199–206.
  9. ^ Джонс; и другие. (1999). «Автоматизированные интеллектуальные пилоты для моделирования боевого полета». AAAI. 20 (1).
  10. ^ Тамбе, Милинд (1997). «Агентские архитектуры для гибкой и практичной командной работы». AAAI. Материалы четырнадцатой национальной конференции по искусственному интеллекту и девятой конференции по инновационным приложениям искусственного интеллекта: 22–28.
  11. ^ Коэн, Филипп; Левеск, Гектор (1991). «Подтверждения и совместные действия». IJCAI. 2: 951–957.
  12. ^ Нельсон, G; Lehman, J; Джон, Б. (1994). «Интеграция когнитивных способностей в задачу в реальном времени». Материалы 16-й ежегодной конференции Общества когнитивных наук: 658–663.
  13. ^ ван Лент, Майк; и другие. (2001). "Репетиция миссии ИКТ" (PDF). Цитировать журнал требует | журнал = (помощь)
  14. ^ Тернер, Алекс (2013). «Soar-SC: платформа для исследований ИИ в StarCraft». Цитировать журнал требует | журнал = (помощь)
  15. ^ Лэрд, Джон (2001). Он знает, что вы собираетесь делать: добавление предвкушения к Quakebot. АГЕНТЫ. Труды Пятой Международной конференции по автономным агентам. С. 385–392. Дои:10.1145/375735.376343. ISBN  978-1581133264.
  16. ^ ван Лент, Майкл; Лэрд, Джон (1991). «Разработка движка искусственного интеллекта». Цитировать журнал требует | журнал = (помощь)
  17. ^ Рэй, Роберт; и другие. (Декабрь 2002 г.). «Интеллектуальные противники тренажеров виртуальной реальности». I / Itsec. Материалы конференции Interservice / Industry Training, Simulation and Education. CiteSeerX  10.1.1.549.2187.
  18. ^ Мохан, Шивали; Лэрд, Джон (2009). «Учимся играть в Марио». Технический отчет. CCA-TR-2009-03. CiteSeerX  10.1.1.387.5972.
  19. ^ Wintermute (сентябрь 2012 г.). «Образцы в когнитивной архитектуре: представление и управление на нескольких уровнях абстракции». Исследование когнитивных систем. 19-20: 1–29. CiteSeerX  10.1.1.387.5894. Дои:10.1016 / j.cogsys.2012.02.001.
  20. ^ Мичиганский университет (19 мая 2015 г.). "Игральные кости Мичиганского лжеца". GitHub. Получено 21 января 2017.
  21. ^ Лэрд, Джон; Ягер, Эрик; Хука, Майкл; Так, Кристофер (ноябрь 1991). «Robo-Soar: интеграция внешнего взаимодействия, планирования и обучения с использованием Soar». Робототехника и автономные системы. 8 (1–2): 113–129. CiteSeerX  10.1.1.726.7247. Дои:10.1016 / 0921-8890 (91) 90017-ф. HDL:2027.42/29045.
  22. ^ Пуигбо, Хорди-Исард; и другие. (2013). «Управление сервисным роботом общего назначения с помощью когнитивной архитектуры». AIC. 45. CiteSeerX  10.1.1.402.5541.
  23. ^ Талор, Глен; и другие. (Февраль 2014). «Мультимодальное взаимодействие для роботов-мулов». Soar Technology Inc.
  24. ^ «Тайна искусственного интеллекта». Управление военно-морских исследований. 11. Февраль 2013.
  25. ^ Лэрд, Джон (2014). «Отчет NSF: интерактивное обучение задач» (PDF). Цитировать журнал требует | журнал = (помощь)
  26. ^ Кирк, Джеймс; Лэрд, Джон (2016). «Изучение общих и эффективных представлений о новых играх с помощью интерактивных инструкций» (PDF). Продвинутые когнитивные системы. 4.
  27. ^ Майнингер, Аарон; Лэрд, Джон (2016). «Стратегии интерактивного обучения для работы со ссылками на невидимые или неизвестные объекты» (PDF). Продвинутые когнитивные системы.
  28. ^ Приетула, Майкл; Сюй, Вэнь-Линь; Steier, Дэвид; Ньюэлл (1993). «Применение архитектуры общего интеллекта для уменьшения усилий по планированию». Журнал ORSA по вычислительной технике. 5 (3): 304–320. Дои:10.1287 / ijoc.5.3.304.

Библиография

внешняя ссылка