Представление в пространстве состояний - State-space representation

В техника управления, а представление в пространстве состояний математическая модель физической системы как набор переменных входа, выхода и состояния, связанных между собой первым порядком дифференциальные уравнения или же разностные уравнения. Переменные состояния - это переменные, значения которых меняются с течением времени в зависимости от значений, которые они имеют в любой момент времени, и от внешних значений входных переменных. Значения выходных переменных зависят от значений переменных состояния.

"пространство состояний " это Евклидово пространство[нужна цитата ] в котором переменные на осях являются переменными состояния. Состояние системы можно представить в виде вектора в этом пространстве.

Чтобы абстрагироваться от количества входов, выходов и состояний, эти переменные выражаются как векторов. Кроме того, если динамическая система линейно, инвариантно во времени и конечномерно, то дифференциал и алгебраические уравнения может быть написано в матрица форма.[1][2]Метод пространства состояний характеризуется значительной алгебраизацией общих теория систем, что позволяет использовать векторно-матричные структуры Кронекера. Возможности этих структур могут быть эффективно применены к исследовательским системам с модуляцией или без нее.[3] Представление в пространстве состояний (также известное как "область времени подход ») обеспечивает удобный и компактный способ моделирования и анализа систем с несколькими входами и выходами. входы и выходы, иначе нам пришлось бы записывать Преобразования Лапласа закодировать всю информацию о системе. в отличие от частотная область В подходе использование представления в пространстве состояний не ограничивается системами с линейными компонентами и нулевыми начальными условиями.

Модель пространства состояний может применяться в таких предметах, как экономика.[4], статистика[5], информатика и электротехника[6], и нейробиология[7]. В эконометрика, например, модели пространства состояний могут использоваться для разложения Временные ряды в тренд и цикл, объединить отдельные индикаторы в составной индекс[8], определить поворотные точки бизнес-цикла и оценить ВВП с использованием скрытых и ненаблюдаемых временных рядов[9][10]. Многие приложения полагаются на Фильтр Калмана для получения оценок текущих неизвестных переменных состояния, используя их предыдущие наблюдения.[11][12]

Переменные состояния

внутренний переменные состояния - это наименьшее возможное подмножество системных переменных, которое может представлять все состояние системы в любой момент времени.[13] Минимальное количество переменных состояния, необходимых для представления данной системы, , обычно равна порядку определяющего дифференциального уравнения системы, но не обязательно. Если система представлена ​​в форме передаточной функции, минимальное количество переменных состояния равно порядку знаменателя передаточной функции после того, как оно было уменьшено до надлежащей дроби. Важно понимать, что преобразование реализации в пространстве состояний в форму передаточной функции может привести к потере некоторой внутренней информации о системе и может предоставить описание системы, которая является стабильной, когда реализация в пространстве состояний нестабильна в определенных точках. В электрических цепях количество переменных состояния часто, хотя и не всегда, совпадает с количеством элементов накопления энергии в цепи, таких как конденсаторы и индукторы. Определенные переменные состояния должны быть линейно независимыми, т.е. никакая переменная состояния не может быть записана как линейная комбинация других переменных состояния, иначе система не сможет быть решена.

Линейные системы

Блок-схема представления линейных уравнений в пространстве состояний

Наиболее общее представление линейной системы в пространстве состояний с входы, выходы и переменные состояния записываются в следующем виде:[14]

куда:

называется "вектором состояния", ;
называется "выходным вектором", ;
называется «входным (или управляющим) вектором», ;
это «матрица состояний (или системы)», ,
"входная матрица", ,
это "выходная матрица", ,
- это "матрица сквозных (или прогнозных)" (в случаях, когда модель системы не имеет прямого сквозного подключения, - нулевая матрица), ,
.

В этой общей формулировке все матрицы могут изменяться во времени (т.е. их элементы могут зависеть от времени); однако в общем LTI В этом случае матрицы будут инвариантными во времени. Временная переменная может быть непрерывным (например, ) или дискретные (например, ). В последнем случае переменная времени обычно используется вместо . Гибридные системы учитывают временные области, которые имеют как непрерывную, так и дискретную части. В зависимости от сделанных предположений представление модели в пространстве состояний может принимать следующие формы:

Тип системыМодель пространства состояний
Непрерывный инвариантный во времени
Непрерывный временной вариант
Явный дискретный инвариантный во времени
Явный дискретный временной вариант
Домен Лапласа из
непрерывный инвариантный во времени

Z-домен из
дискретный инвариантный во времени

Пример: случай LTI с непрерывным временем

Характеристики устойчивости и естественного отклика непрерывного времени Система LTI (т.е. линейные с матрицами, постоянными по времени) могут быть изучены из собственные значения матрицы . Устойчивость инвариантной во времени модели пространства состояний можно определить, глядя на функция передачи в факторизованном виде. Тогда это будет выглядеть примерно так:

Знаменатель передаточной функции равен характеристический многочлен найдено, взяв детерминант из ,

Корни этого многочлена ( собственные значения ) - передаточная функция системы полюса (т.е. особенности где величина передаточной функции не ограничена). Эти полюса можно использовать для анализа работоспособности системы. асимптотически устойчивый или же незначительно стабильный. Альтернативный подход к определению устойчивости, который не предполагает вычисления собственных значений, заключается в анализе системного Ляпуновская устойчивость.

Нули в числителе аналогичным образом можно использовать для определения того, является ли система минимальная фаза.

Система все еще может быть вход-выход стабильный (видеть BIBO стабильный ), хотя он внутренне нестабилен. Это может иметь место, если нестабильные полюса компенсируются нулями (т. Е. Если эти особенности в передаточной функции равны съемный ).

Управляемость

Условие управляемости состояния подразумевает, что можно - с помощью допустимых входов - управлять состояниями от любого начального значения к любому конечному значению в течение некоторого конечного временного окна. Непрерывная инвариантная во времени линейная модель в пространстве состояний - это управляемый если и только если

куда классифицировать - количество линейно независимых строк в матрице, где п - количество переменных состояния.

Наблюдаемость

Наблюдаемость - это мера того, насколько хорошо внутренние состояния системы могут быть выведены на основе информации о ее внешних выходах. Наблюдаемость и управляемость системы являются математическими двойниками (то есть, поскольку управляемость обеспечивает доступность входа, который переводит любое начальное состояние в любое желаемое конечное состояние, наблюдаемость обеспечивает, что знание выходной траектории дает достаточно информации для прогнозирования начального состояния системы. ).

Непрерывная инвариантная во времени линейная модель в пространстве состояний - это наблюдаемый если и только если

Функция передачи

"функция передачи "непрерывной инвариантной во времени линейной модели в пространстве состояний может быть получена следующим образом:

Во-первых, взяв Преобразование Лапласа из

дает

Далее мы упрощаем для , давая

и поэтому

Замена на в выходном уравнении

давая

Предполагая нулевые начальные условия и система с одним входом и одним выходом (SISO), то функция передачи определяется как соотношение вывода и ввода . Для система с несколькими входами и выходами (MIMO) Однако это соотношение не определено. Следовательно, при нулевых начальных условиях матрица передаточной функции происходит от

используя метод приравнивания коэффициентов, который дает

.

Как следствие, матрица размерности который содержит передаточные функции для каждой комбинации ввода-вывода. Из-за простоты этой матричной записи представление в пространстве состояний обычно используется для систем с множеством входов и множеством выходов. В Матрица системы Розенброка обеспечивает мост между представлением в пространстве состояний и его функция передачи.

Канонические реализации

Любая данная передаточная функция, которая строго правильно может быть легко перенесен в пространство состояний с помощью следующего подхода (этот пример для 4-мерной системы с одним входом и одним выходом):

Для данной передаточной функции разверните ее, чтобы отобразить все коэффициенты в числителе и знаменателе. Это должно привести к следующей форме:

Теперь коэффициенты можно вставить непосредственно в модель пространства состояний с помощью следующего подхода:

Эта реализация в пространстве состояний называется управляемая каноническая форма потому что результирующая модель гарантированно управляема (то есть, поскольку элемент управления входит в цепочку интеграторов, он имеет возможность перемещать каждое состояние).


Коэффициенты передаточной функции также можно использовать для построения канонической формы другого типа


Эта реализация в пространстве состояний называется наблюдаемая каноническая форма потому что результирующая модель гарантированно будет наблюдаемой (т. е. поскольку выходные данные выходят из цепочки интеграторов, каждое состояние влияет на выход).

Правильные передаточные функции

Функции передачи, которые только правильный (и нет строго правильно ) также может быть реализовано довольно легко. Хитрость здесь в том, чтобы разделить передаточную функцию на две части: строго правильную часть и постоянную.

Затем строго правильная передаточная функция может быть преобразована в каноническую реализацию в пространстве состояний с использованием методов, показанных выше. Реализация константы в пространстве состояний тривиально . Вместе мы получаем реализацию в пространстве состояний с матрицами А, B и C определяется строго правильной частью, а матрица D определяется константой.

Вот пример, чтобы немного прояснить ситуацию:

что дает следующую управляемую реализацию

Обратите внимание, как вывод также напрямую зависит от ввода. Это связано с константа в передаточной функции.

Обратная связь

Типичная модель в пространстве состояний с обратной связью

Распространенный метод обратной связи - умножение результата на матрицу K и установив это как вход в систему: .Поскольку значения K неограничены, значения могут быть легко инвертированы для негативный отзыв.Присутствие отрицательного знака (общепринятое обозначение) является чисто условным, и его отсутствие не влияет на конечный результат.

становится

решение выходного уравнения для и подстановка в уравнение состояния приводит к

Преимущество этого в том, что собственные значения из А можно контролировать, установив K соответственно через собственное разложение Это предполагает, что замкнутая система управляемый или что нестабильные собственные значения А можно сделать стабильным за счет соответствующего выбора K.

Пример

Для строго правильной системы D равно нулю. Другая довольно распространенная ситуация - когда все состояния являются выходами, т.е. у = Икс, что дает C = я, то Единичная матрица. Тогда это привело бы к более простым уравнениям

Это сокращает необходимое собственное разложение до .

Обратная связь с входом уставки (задания)

Обратная связь по выходу с заданным значением

Помимо обратной связи, вход, , можно добавить так, что .

становится

решение выходного уравнения для и подстановка в уравнение состояния приводит к

Одно довольно распространенное упрощение этой системы - удаление D, что сводит уравнения к

Пример движущегося объекта

Классическая линейная система - это система одномерного движения объекта (например, тележки).Законы движения Ньютона для объекта, движущегося горизонтально на плоскости и прикрепленного к стене пружиной:

куда

  • это позиция; скорость; это ускорение
  • это приложенная сила
  • коэффициент вязкого трения
  • жесткость пружины
  • это масса объекта

Тогда уравнение состояния станет

куда

  • представляет положение объекта
  • это скорость объекта
  • это ускорение объекта
  • выход это положение объекта

В управляемость тест тогда

который имеет полное звание для всех и . Это означает, что если известно начальное состояние системы (, , ), а если и константы, то есть пружина который может переместить тележку в любое другое положение в системе.

В наблюдаемость тест тогда

который также имеет полный ранг, следовательно, эта система и управляема, и наблюдаема.

Нелинейные системы

Более общую форму модели пространства состояний можно записать как две функции.

Первое - это уравнение состояния, а второе - выходное уравнение. представляет собой линейную комбинацию состояний и входов, тогда уравнения можно записать в матричной записи, как указано выше. аргумент функции может быть опущен, если система не принудительно (то есть у нее нет входов).

Пример маятника

Классическая нелинейная система - это простая не принудительная маятник

куда

  • угол маятника по отношению к направлению силы тяжести
  • - масса маятника (масса стержня маятника принимается равной нулю)
  • это ускорение свободного падения
  • коэффициент трения в точке поворота
  • - радиус маятника (до центра тяжести массы )

Тогда уравнения состояния имеют вид

куда

  • это угол маятника
  • - скорость вращения маятника
  • - вращательное ускорение маятника

Вместо этого уравнение состояния можно записать в общем виде

В равновесие /стационарные точки системы, когда и поэтому точки равновесия маятника - это те, которые удовлетворяют

для целых чисел п.

Смотрите также

Рекомендации

  1. ^ Каталин М. Хангос; Р. Лакнер и М. Герзсон (2001). Интеллектуальные системы управления: введение с примерами. Springer. п. 254. ISBN  978-1-4020-0134-5.
  2. ^ Каталин М. Хангос; Йожеф Бокор и Габор Седеркеньи (2004). Анализ и управление нелинейными технологическими системами. Springer. п. 25. ISBN  978-1-85233-600-4.
  3. ^ Васильев А.С .; Ушаков А.В. (2015). «Моделирование динамических систем с модуляцией с помощью векторно-матричного представления Кронекера». Научно-технический журнал информационных технологий, механики и оптики. 15 (5): 839–848. Дои:10.17586/2226-1494-2015-15-5-839-848.
  4. ^ Stock, J.H .; Уотсон, М.В. (2016), "Динамические факторные модели, факторно-расширенные векторные авторегрессии и структурные векторные авторегрессии в макроэкономике", Справочник по макроэкономике, Эльзевьер, 2, стр. 415–525, Дои:10.1016 / bs.hesmac.2016.04.002, ISBN  978-0-444-59487-7
  5. ^ Дурбин, Джеймс; Купман, Сием Ян (2012). Анализ временных рядов методами пространства состояний. Издательство Оксфордского университета. ISBN  978-0-19-964117-8. OCLC  794591362.
  6. ^ Русер Р. (1975). «Дискретная модель пространства состояний для линейной обработки изображений». IEEE Transactions по автоматическому контролю. 20 (1): 1–10. Дои:10.1109 / tac.1975.1100844. ISSN  0018-9286.
  7. ^ Смит, Энн С .; Браун, Эмери Н. (2003). "Оценка модели пространства состояний по наблюдениям точечного процесса". Нейронные вычисления. 15 (5): 965–991. Дои:10.1162/089976603765202622. ISSN  0899-7667. PMID  12803953. S2CID  10020032.
  8. ^ Джеймс Х. Сток и Марк У. Уотсон, 1989. «Новые индексы совпадающих и опережающих экономических индикаторов., "NBER Chapters, in: NBER Macroeconomics Annual 1989, Volume 4, pages 351-409, National Bureau of Economic Research, Inc.
  9. ^ Банбура, Марта; Модуньо, Микеле (12 ноября 2012 г.). «Оценка максимального правдоподобия факторных моделей на наборах данных с произвольной структурой отсутствующих данных». Журнал прикладной эконометрики. 29 (1): 133–160. Дои:10.1002 / jae.2306. ISSN  0883-7252. S2CID  14231301.
  10. ^ "Модели пространства состояний с марковскими переключениями и гиббсовской дискретизацией", Модели пространства состояний с переключением режимов, MIT Press, 2017, Дои:10.7551 / mitpress / 6444.003.0013, ISBN  978-0-262-27711-2
  11. ^ Кальман, Р. Э. (1960-03-01). «Новый подход к задачам линейной фильтрации и прогнозирования». Журнал фундаментальной инженерии. 82 (1): 35–45. Дои:10.1115/1.3662552. ISSN  0021-9223.
  12. ^ Харви, Эндрю С. (1990). Прогнозирование, структурные модели временных рядов и фильтр Калмана. Кембридж: Издательство Кембриджского университета. DOI: 10.1017 / CBO9781107049994
  13. ^ Найз, Норман С. (2010). Разработка систем управления (6-е изд.). John Wiley & Sons, Inc. ISBN  978-0-470-54756-4.
  14. ^ Броган, Уильям Л. (1974). Современная теория управления (1-е изд.). Quantum Publishers, Inc. стр. 172.

дальнейшее чтение

  • Antsaklis, P.J .; Мишель, А. Н. (2007). Учебник по линейным системам. Бирхаузер. ISBN  978-0-8176-4460-4.
  • Чен, Чи-Цзун (1999). Теория и дизайн линейных систем (3-е изд.). Издательство Оксфордского университета. ISBN  0-19-511777-8.
  • Халил, Хасан К. (2001). Нелинейные системы (3-е изд.). Прентис Холл. ISBN  0-13-067389-7.
  • Хинрихсен, Дидерих; Причард, Энтони Дж. (2005). Математическая теория систем I, моделирование, анализ в пространстве состояний, устойчивость и надежность. Springer. ISBN  978-3-540-44125-0.
  • Зонтаг, Эдуардо Д. (1999). Математическая теория управления: детерминированные конечномерные системы (PDF) (2-е изд.). Springer. ISBN  0-387-98489-5. Получено 28 июня, 2012.
  • Фридланд, Бернар (2005). Проектирование системы управления: введение в методы пространства состояний. Дувр. ISBN  0-486-44278-0.
  • Zadeh, Lotfi A .; Десоэр, Чарльз А. (1979). Теория линейных систем. Krieger Pub Co. ISBN  978-0-88275-809-1.
О приложениях моделей пространства состояний в эконометрике
  • Durbin, J .; Купман, С. (2001). Анализ временных рядов методами пространства состояний. Оксфорд, Великобритания: Издательство Оксфордского университета. ISBN  978-0-19-852354-3.

внешняя ссылка