Принцип максимума Понтрягина - Pontryagins maximum principle - Wikipedia

Принцип максимума Понтрягина используется в оптимальный контроль теории, чтобы найти наилучший возможный контроль для принятия динамическая система из одного состояния в другое, особенно при наличии ограничений для состояния или элементов управления вводом.[1] В нем говорится, что это необходимо для любого оптимального управления наряду с траекторией оптимального состояния для решения так называемой гамильтоновой системы, которая является двухточечной краевая задача, плюс максимальное условие Гамильтониан.[а] Этих необходимых условий становится достаточно при определенных условиях выпуклости на целевую функцию и функцию ограничения.[2][3]

Принцип максимума сформулировал в 1956 г. русский математик. Лев Понтрягин и его ученики,[4][5] и его первоначальное применение было для максимизации конечной скорости ракеты.[6] Результат был получен с использованием идей классической вариационное исчисление.[7] После небольшого возмущение оптимального управления рассматривается член первого порядка Тейлор расширение по возмущению; обращение возмущения к нулю приводит к вариационному неравенству, из которого следует принцип максимума.[8]

Считается важной вехой в теории оптимального управления,[1] значение принципа максимума состоит в том, что максимизировать гамильтониан намного проще, чем исходная бесконечномерная задача управления; а не максимизировать функциональное пространство, проблема преобразуется в точечно оптимизация.[9] Аналогичная логика приводит к Принцип оптимальности Беллмана, связанный подход к задачам оптимального управления, который утверждает, что оптимальная траектория остается оптимальной в промежуточные моменты времени.[10] Результирующий Уравнение Гамильтона – Якоби – Беллмана. обеспечивает необходимое и достаточное условие для оптимума и допускает простое расширение к стохастическим задачам оптимального управления, тогда как принцип максимума - нет.[8] Однако в отличие от уравнения Гамильтона – Якоби – Беллмана, которое должно выполняться для всего пространства состояний, принцип максимума Понтрягина потенциально более эффективен с точки зрения вычислений, поскольку условия, которые он задает, должны выполняться только для определенной траектории.[1]

Обозначение

В дальнейшем мы будем использовать следующие обозначения.

Формальная формулировка необходимых условий задачи минимизации.

Здесь показаны необходимые условия минимизации функционала. Брать быть государством динамическая система с вводом , так что

куда - множество допустимых управлений и - конечное (то есть конечное) время системы. Контроль должен быть выбран для всех минимизировать целевой функционал который определяется приложением и может быть абстрагирован как

К ограничениям на динамику системы можно добавить Лагранжиан введя изменяющиеся во времени Множитель Лагранжа вектор , элементы которой называются костями системы. Это мотивирует строительство Гамильтониан определены для всех к:

куда это транспонирование .

Принцип минимума Понтрягина утверждает, что оптимальная траектория состояния , оптимальное управление , и соответствующий вектор множителя Лагранжа должен минимизировать гамильтониан так что

за все время и для всех допустимых управляющих входов . Также должно быть, что

Кроме того, сопряженные уравнения

должен быть доволен. Если конечное состояние не является фиксированным (т.е. его дифференциальная вариация не равна нулю), также должно быть, чтобы конечные затраты были такими, что

Эти четыре условия в (1) - (4) являются необходимыми условиями для оптимального управления. Обратите внимание, что (4) применяется только тогда, когда бесплатно. Если он зафиксирован, то это условие не обязательно для оптимума.

Смотрите также

Примечания

  1. ^ Будет ли крайнее значение максимальным или минимальным, зависит как от проблемы, так и от соглашения о знаках, используемого для определения гамильтониана. Нормальное соглашение приводит к максимуму, следовательно, принцип максимума.

Рекомендации

  1. ^ а б c Росс, Исаак (2015). Учебник по принципу Понтрягина в оптимальном управлении. Сан-Франциско: коллегиальные издатели. ISBN  978-0-9843571-0-9. OCLC  625106088.CS1 maint: дата и год (связь)
  2. ^ Мангасарян, О. (1966). «Достаточные условия оптимального управления нелинейными системами». SIAM Journal on Control. 4 (1): 139–152. Дои:10.1137/0304013.
  3. ^ Камиен, Мортон И.; Шварц, Нэнси Л. (1971). «Достаточные условия в теории оптимального управления». Журнал экономической теории. 3 (2): 207–214. Дои:10.1016/0022-0531(71)90018-4.
  4. ^ Болтянский, В .; Мартини, H .; Солтан, В. (1998). «Принцип максимума - как он появился?». Геометрические методы и проблемы оптимизации. Нью-Йорк: Спрингер. С. 204–227. ISBN  0-7923-5454-0.
  5. ^ Гамкрелидзе, Р. В. (1999). «Открытие принципа максимума». Журнал динамических и управляющих систем. 5 (4): 437–451. Дои:10.1023 / А: 1021783020548. S2CID  122690986. Перепечатано в Болибрух, А.А.; и др., ред. (2006). Математические события двадцатого века. Берлин: Springer. С. 85–99. ISBN  3-540-23235-4.
  6. ^ Ссылки на первые опубликованные работы см. В Фуллер, А. Т. (1963). «Библиография принципа максимума Понтрягина». J. Электроника и управление. 15 (5): 513–517. Дои:10.1080/00207216308937602.
  7. ^ МакШейн, Э. Дж. (1989). "Расчет вариаций от начала до теории оптимального управления". SIAM J. Control Optim. 27 (5): 916–939. Дои:10.1137/0327049.
  8. ^ а б Yong, J .; Чжоу, X. Y. (1999). «Принцип максимума и стохастические гамильтоновы системы». Стохастические управления: гамильтоновы системы и уравнения HJB. Нью-Йорк: Спрингер. стр.101 –156. ISBN  0-387-98723-1.
  9. ^ Састри, Шанкар (29 марта 2009 г.). «Конспект лекции 8. Оптимальное управление и динамические игры» (PDF).
  10. ^ Чжоу, X. Y. (1990). «Принцип максимума, динамическое программирование и их связь в детерминированном управлении». Журнал теории оптимизации и приложений. 65 (2): 363–373. Дои:10.1007 / BF01102352. S2CID  122333807.

дальнейшее чтение

внешняя ссылка