Линейно-квадратичный регулятор - Linear–quadratic regulator
Теория оптимальный контроль занимается управлением динамическая система по минимальной цене. Случай, когда динамика системы описывается набором линейные дифференциальные уравнения а стоимость описывается квадратичный функция называется проблемой LQ. Один из основных результатов теории состоит в том, что решение дает линейно-квадратичный регулятор (LQR), регулятор с обратной связью, уравнения которого приведены ниже. LQR - важная часть решения LQG (линейно-квадратично-гауссовская) задача. Как и сама проблема LQR, проблема LQG является одной из самых фундаментальных проблем в теория управления.
Общее описание
Настройки (регулирующего) контроллера, управляющего машиной или процессом (например, самолетом или химическим реактором), находятся с помощью математического алгоритма, который минимизирует функция стоимости с весовыми коэффициентами, предоставленными человеком (инженером). Функция стоимости часто определяется как сумма отклонений ключевых измерений, таких как высота над уровнем моря или температура процесса, от их желаемых значений. Таким образом, алгоритм находит те настройки регулятора, которые минимизируют нежелательные отклонения. Величина самого управляющего воздействия также может быть включена в функцию затрат.
Алгоритм LQR сокращает объем работы, выполняемой инженером по системам управления для оптимизации контроллера. Однако инженеру по-прежнему необходимо указать параметры функции затрат и сравнить результаты с заданными целями проектирования. Часто это означает, что построение контроллера представляет собой итеративный процесс, в котором инженер оценивает «оптимальные» контроллеры, созданные посредством моделирования, а затем регулирует параметры, чтобы создать контроллер, более соответствующий целям проектирования.
Алгоритм LQR - это, по сути, автоматический способ поиска подходящего контроллер с обратной связью по состоянию. Таким образом, инженеры по управлению нередко предпочитают альтернативные методы, например полная обратная связь, также известное как размещение полюсов, при котором существует более четкая взаимосвязь между параметрами контроллера и его поведением. Сложность поиска правильных весовых коэффициентов ограничивает применение синтеза контроллеров на основе LQR.
Конечный горизонт, непрерывное время LQR
Для линейной системы с непрерывным временем, определенной на , описанный:
с квадратичной функцией стоимости, определяемой как:
закон управления с обратной связью, который минимизирует стоимость затрат:
куда дан кем-то:
и находится путем решения непрерывного времени Дифференциальное уравнение Риккати:
с граничным условием:
Условия первого порядка для Jмин находятся:
1) Уравнение состояния
2) Уравнение совместного состояния
3) Стационарное уравнение
4) Граничные условия
и
Бесконечный горизонт, непрерывное время LQR
Для линейной системы с непрерывным временем, описываемой:
с функцией стоимости, определенной как:
закон управления с обратной связью, который минимизирует стоимость затрат:
куда дан кем-то:
и находится путем решения непрерывного времени алгебраическое уравнение Риккати:
Это также можно записать как:
с
Конечный горизонт, дискретное время LQR
Для линейной системы с дискретным временем, описываемой:[1]
с индексом производительности, определяемым как:
оптимальная последовательность управления, минимизирующая показатель эффективности, определяется выражением:
куда:
и находится итеративно назад во времени с помощью динамического уравнения Риккати:
из конечного состояния . Обратите внимание, что не определено, так как доведен до конечного состояния к .
Бесконечный горизонт, дискретное время LQR
Для линейной системы с дискретным временем, описываемой:
с индексом производительности, определяемым как:
оптимальная последовательность управления, минимизирующая показатель эффективности, определяется выражением:
куда:
и является единственным положительно определенным решением дискретного времени алгебраическое уравнение Риккати (СМЕЙ):
- .
Это также можно записать как:
с:
- .
Обратите внимание, что одним из способов решения алгебраического уравнения Риккати является повторение динамического уравнения Риккати для случая конечного горизонта, пока оно не сходится.
Рекомендации
- ^ Чоу, Грегори С. (1986). Анализ и управление динамическими экономическими системами. Krieger Publ. Co. ISBN 0-89874-969-7.
- Квакернаак, Хьюберт и Сиван, Рафаэль (1972). Линейные оптимальные системы управления. Первое издание. Wiley-Interscience. ISBN 0-471-51110-2.
- Зонтаг, Эдуардо (1998). Математическая теория управления: детерминированные конечномерные системы. Второе издание. Springer. ISBN 0-387-98489-5.