Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

В теории управления , то линейно-квадратичной Gaussian ( LQG ) задача управления является одним из наиболее фундаментальных управления оптимальна проблем. Это касается линейных систем, управляемых аддитивным белым гауссовским шумом . Задача состоит в том, чтобы определить закон обратной связи по выходу, который является оптимальным в смысле минимизации ожидаемого значения критерия квадратичной стоимости . Предполагается, что выходные измерения искажены гауссовским шумом, и исходное состояние также считается гауссовским случайным вектором.

При этих предположениях оптимальная схема управления в классе линейных законов управления может быть получена с помощью аргумента пополнения квадратов. [1] Этот закон управления, который известен как контроллер LQG , уникален и представляет собой просто комбинацию фильтра Калмана (линейно-квадратичный оценщик состояния (LQE)) вместе с линейно-квадратичным регулятором (LQR). Принцип разделения гласит, что средство оценки состояния и обратная связь по состоянию могут быть разработаны независимо. LQG-управление применяется как к линейным системам, не зависящим от времени, так и к линейным системам, зависящим от времени., и представляет собой линейный закон управления с динамической обратной связью, который легко вычислить и реализовать: сам контроллер LQG является динамической системой, как и система, которой он управляет. Обе системы имеют одинаковое измерение состояния.

Более глубокое изложение принципа разделения состоит в том, что контроллер LQG по-прежнему оптимален в более широком классе, возможно, нелинейных контроллеров. То есть использование нелинейной схемы управления не улучшит ожидаемое значение функционала стоимости. Эта версия принципа разделения является частным случаем принципа разделения стохастического управления, который гласит, что даже когда источники шума процесса и выходного шума, возможно, являются негауссовыми мартингалами , пока динамика системы линейна, оптимальное управление разделяется на оценщик оптимального состояния (который больше не может быть фильтром Калмана) и регулятор LQR. [2] [3]

В классической настройке LQG реализация контроллера LQG может быть проблематичной, когда размерность состояния системы велика. Проблема LQG пониженный порядок (фиксированный порядок проблема LQG) преодолевает это путем фиксации априорного числа состояний контроллера LQG. Эту проблему решить сложнее, потому что она больше не отделима. Кроме того, решение больше не является уникальным. Несмотря на эти факты, доступны численные алгоритмы [4] [5] [6] [7] для решения связанных оптимальных проекционных уравнений [8] [9], которые составляют необходимые и достаточные условия для локально оптимального LQG-контроллера пониженного порядка. [4]

Оптимальность LQG не гарантирует автоматически хорошие свойства устойчивости. [10] Устойчивость системы с обратной связью должна проверяться отдельно после проектирования контроллера LQG. Для повышения устойчивости некоторые параметры системы можно считать стохастическими, а не детерминированными. Связанная с этим более сложная проблема управления приводит к аналогичному оптимальному регулятору, у которого отличаются только параметры регулятора. [5]

Можно вычислить ожидаемое значение функции стоимости для оптимального выигрыша, а также для любого другого набора стабильных выигрышей. [11]

Наконец, контроллер LQG также используется для управления возмущенными нелинейными системами. [12]

Математическое описание проблемы и решения [ править ]

Непрерывное время [ править ]

Рассмотрим линейную динамическую систему с непрерывным временем

где представляет собой вектор переменных состояния системы, вектор управляющих входов и вектор измеренных выходов, доступных для обратной связи. На систему влияют как аддитивный белый гауссовский системный шум, так и аддитивный белый гауссовский измерительный шум . В данной системе цель состоит в том, чтобы найти историю управляющих входов, которая в любой момент времени может линейно зависеть только от прошлых измерений , так что следующая функция стоимости минимизируется:

где обозначает ожидаемое значение . Конечное время (горизонт) может быть как конечным, так и бесконечным. Если горизонт стремится к бесконечности, первый член функции затрат становится незначительным и не имеет отношения к проблеме. Кроме того, чтобы сохранить конечные затраты, необходимо принять функцию затрат .

Контроллер LQG, который решает задачу управления LQG, определяется следующими уравнениями:

Матрица называется усилением Калмана ассоциированного фильтра Калмана , представленный первым уравнением. Каждый раз этот фильтр генерирует оценки состояния, используя прошлые измерения и входные данные. Усиления Калмана вычисляются из матриц , две матрицы интенсивности , связанной с белыми гауссовыми шумами и и , наконец . Эти пять матриц определяют коэффициент усиления Калмана через следующее связанное матричное дифференциальное уравнение Риккати:

Для данного решения коэффициент усиления Калмана равен

Матрица называется матрицей усиления обратной связи . Эта матрица определяется матрицами и следующей связанной матрицей дифференциального уравнения Риккати:

Для данного решения коэффициент обратной связи равен

Обратите внимание на сходство двух матричных дифференциальных уравнений Риккати: первое работает вперед во времени, а второе - назад во времени. Это сходство называется двойственностью . Первое матричное дифференциальное уравнение Риккати решает линейно-квадратичную задачу оценивания (LQE). Второе матричное дифференциальное уравнение Риккати решает задачу линейно-квадратичного регулятора (LQR). Эти задачи двойственны и вместе они решают линейно-квадратично-гауссову задачу управления (LQG). Таким образом, проблема LQG разделяется на проблемы LQE и LQR, которые можно решить независимо. Поэтому проблема LQG называется сепарабельной .

Когда и матрица интенсивности шума , не зависит от и когда стремится к бесконечности контроллер LQG становится стационарны динамической системой. В этом случае второе матричное дифференциальное уравнение Риккати может быть заменено соответствующим алгебраическим уравнением Риккати .

Дискретное время [ править ]

Поскольку задача управления LQG с дискретным временем аналогична задаче с непрерывным временем, приведенное ниже описание сосредоточено на математических уравнениях.

Уравнения линейной системы с дискретным временем:

Здесь представлен дискретный временной индекс и дискретные процессы гауссовского белого шума с ковариационными матрицами соответственно.

Минимизируемая квадратичная функция стоимости:

Контроллер LQG с дискретным временем

,

Прирост Калмана равен

где определяется следующей матрицей разностного уравнения Риккати, бегущей вперед во времени:

Матрица усиления обратной связи равна

где определяется следующей матрицей разностного уравнения Риккати, которое выполняется в обратном направлении во времени:

Если все матрицы в формулировке задачи инвариантны во времени и если горизонт стремится к бесконечности, контроллер LQG с дискретным временем становится инвариантным во времени. В этом случае матричные разностные уравнения Риккати могут быть заменены соответствующими алгебраическими уравнениями Риккати с дискретным временем . Они определяют инвариантный во времени линейно-квадратичный оценочный механизм и неизменный во времени линейно-квадратичный регулятор в дискретном времени. В этом случае необходимо учитывать конечные затраты вместо того , чтобы учитывать их .

См. Также [ править ]

  • Стохастический контроль
  • Контрпример Витсенхаузена

Ссылки [ править ]

  1. ^ Карл Йохан Астром (1970). Введение в теорию стохастического управления . 58 . Академическая пресса. ISBN 0-486-44531-3.
  2. Андерс Линдквист (1973). «Об управлении линейными стохастическими системами с обратной связью». SIAM Journal on Control . 11 (2): 323–343. DOI : 10.1137 / 0311025 ..
  3. Трифон Т. Георгиу и Андерс Линдквист (2013). «Принцип разделения в стохастическом управлении, Redux». IEEE Transactions по автоматическому контролю . 58 (10): 2481–2494. arXiv : 1103.3005 . DOI : 10.1109 / TAC.2013.2259207 .
  4. ^ a b Ван Виллигенбург LG; Де Конинг WL (2000). «Численные алгоритмы и вопросы, касающиеся уравнений оптимального проектирования с дискретным временем». Европейский журнал контроля . 6 (1): 93–100. DOI : 10.1016 / s0947-3580 (00) 70917-4 . Связанное программное обеспечение загружается из Matlab Central .
  5. ^ a b Ван Виллигенбург LG; Де Конинг В.Л. (1999). «Оптимальные компенсаторы пониженного порядка для нестационарных дискретных систем с детерминированными и белыми параметрами». Automatica . 35 : 129–138. DOI : 10.1016 / S0005-1098 (98) 00138-1 . Связанное программное обеспечение загружается из Matlab Central .
  6. ^ Zigic D .; Watson LT; Коллинз EG; Хаддад WM; Инь С. (1996). «Гомотопические методы решения оптимальных проекционных уравнений для модельной задачи H2 приведенного порядка». Международный журнал контроля . 56 (1): 173–191. DOI : 10.1080 / 00207179208934308 .
  7. ^ Коллинз младший EG; Хаддад WM; Инь С. (1996). «Гомотопический алгоритм для динамической компенсации пониженного порядка с использованием оптимальных проекционных уравнений Хайланда-Бернштейна». Журнал управления и динамики . 19 (2): 407–417. DOI : 10.2514 / 3.21633 .
  8. ^ Хайленд округ Колумбия; Бернштейн Д.С. (1984). «Оптимальные проекционные уравнения для динамической компенсации фиксированного порядка» (PDF) . IEEE Transactions по автоматическому контролю . АС-29 (11): 1034–1037. DOI : 10.1109 / TAC.1984.1103418 . ЛВП : 2027,42 / 57875 .
  9. ^ Бернштейн Д.С. Davis LD; Хайленд, округ Колумбия (1986). «Оптимальные проекционные уравнения для дискретного моделирования пониженного порядка оценки и управления» (PDF) . Журнал управления и динамики . 9 (3): 288–293. Bibcode : 1986JGCD .... 9..288B . DOI : 10.2514 / 3.20105 . ЛВП : 2027,42 / 57880 .
  10. ^ Грин, Майкл; Лаймбир, Дэвид Дж. Н. (1995). Линейное устойчивое управление . Энглвудские скалы: Прентис-холл. п. 27. ISBN 0-13-102278-4.
  11. ^ Мацакис, Димитрий (8 марта 2019). «Влияние стратегий пропорционального управления на поведение управляемых часов» . Метрология . 56 (2): 025007. DOI : 10,1088 / 1681-7575 / ab0614 .
  12. ^ Athans М. (1971). «Роль и использование стохастической линейно-квадратично-гауссовской задачи в проектировании систем управления». IEEE Transactions по автоматическому контролю . АС-16 (6): 529–552. DOI : 10.1109 / TAC.1971.1099818 .

Дальнейшее чтение [ править ]

  • Стенгель, Роберт Ф. (1994). Оптимальное управление и оценка . Нью-Йорк: Дувр. ISBN 0-486-68200-5.