Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Теория оптимального управления занимается управлением динамической системой с минимальными затратами. Случай, когда динамика системы описывается набором линейных дифференциальных уравнений, а стоимость описывается квадратичной функцией , называется проблемой LQ. Одним из основных результатов теории является то, что решение обеспечивается линейно-квадратичным регулятором ( LQR ), регулятором с обратной связью, уравнения которого приведены ниже. LQR является важной частью решения задачи LQG (линейно-квадратично-гауссовской) . Как и сама проблема LQR, проблема LQG является одной из самых фундаментальных проблем теории управления .

Общее описание [ править ]

Настройки (регулирующего) контроллера, управляющего машиной или процессом (например, самолетом или химическим реактором), находятся с помощью математического алгоритма, который минимизирует функцию затрат с весовыми коэффициентами, предоставленными человеком (инженером). Функция стоимости часто определяется как сумма отклонений ключевых измерений, таких как высота над уровнем моря или температура процесса, от их желаемых значений. Таким образом, алгоритм находит те настройки регулятора, которые минимизируют нежелательные отклонения. Величина самого управляющего воздействия также может быть включена в функцию затрат.

Алгоритм LQR сокращает объем работы, выполняемой инженером систем управления по оптимизации контроллера. Однако инженеру по-прежнему необходимо указать параметры функции стоимости и сравнить результаты с заданными целями проектирования. Часто это означает, что создание контроллера представляет собой итеративный процесс, в котором инженер оценивает «оптимальные» контроллеры, созданные путем моделирования, а затем регулирует параметры для создания контроллера, более соответствующего целям проектирования.

Алгоритм LQR - это, по сути, автоматический способ поиска подходящего контроллера с обратной связью по состоянию . Таким образом, инженеры по управлению нередко предпочитают альтернативные методы, такие как полная обратная связь по состоянию , также известная как размещение полюсов, при которых существует более четкая взаимосвязь между параметрами контроллера и его поведением. Сложность поиска правильных весовых коэффициентов ограничивает применение синтеза контроллеров на основе LQR.


LQR с конечным горизонтом и непрерывным временем [ править ]

Для линейной системы с непрерывным временем, определенной на , описываемой:

с квадратичной функцией стоимости, определяемой как:

закон управления с обратной связью, минимизирующий стоимость, имеет вид:

где определяется как:

и находится путем решения дифференциального уравнения Риккати с непрерывным временем :

с граничным условием:

Условия первого порядка для J min :

1) Уравнение состояния

2) Уравнение совместного состояния

3) Стационарное уравнение

4) Граничные условия

а также

LQR с бесконечным горизонтом и непрерывным временем [ править ]

Для линейной системы с непрерывным временем, описываемой:

с функцией стоимости, определяемой как:

закон управления с обратной связью, минимизирующий стоимость, имеет вид:

где определяется как:

и находится путем решения алгебраического уравнения Риккати с непрерывным временем :

Это также можно записать как:

с участием

Конечный горизонт, LQR в дискретном времени [ править ]

Для линейной системы с дискретным временем, описываемой: [1]

с индексом производительности, определяемым как:

оптимальная последовательность управления, минимизирующая показатель эффективности, определяется выражением:

где:

и находится итеративно назад во времени с помощью динамического уравнения Риккати:

из конечного состояния . Обратите внимание, что это не определено, так как приводится в конечное состояние с помощью .

LQR с бесконечным горизонтом и дискретным временем [ править ]

Для линейной системы с дискретным временем, описываемой:

с индексом производительности, определяемым как:

оптимальная последовательность управления, минимизирующая показатель эффективности, определяется выражением:

где:

и является единственным положительно определенным решением алгебраического уравнения Риккати с дискретным временем (DARE):

.

Это также можно записать как:

с участием:

.

Обратите внимание, что одним из способов решения алгебраического уравнения Риккати является повторение динамического уравнения Риккати для случая конечного горизонта, пока оно не сходится.

Ссылки [ править ]

  1. ^ Чоу, Грегори С. (1986). Анализ и управление динамическими экономическими системами . Krieger Publ. Co. ISBN 0-89874-969-7.
  • Квакернаак, Хьюберт и Сиван, Рафаэль (1972). Линейные оптимальные системы управления. Первое издание . Wiley-Interscience. ISBN 0-471-51110-2.
  • Зонтаг, Эдуардо (1998). Математическая теория управления: детерминированные конечномерные системы. Второе издание . Springer. ISBN 0-387-98489-5. CS1 maint: discouraged parameter (link)

Внешние ссылки [ править ]