Система управления на основе данных

Управляемые данными системы управления представляют собой широкое семейство систем управления , в которых идентификация модели процесса и / или конструкция контроллера полностью основываются на экспериментальных данных, собранных с завода. ^[1]

Во многих приложениях управления попытка написать математическую модель предприятия считается сложной задачей, требующей усилий и времени от инженеров-технологов и инженеров по управлению. Эта проблема решается с помощью методов, управляемых данными , которые позволяют подогнать модель системы к собранным экспериментальным данным, выбирая ее в конкретном классе моделей. Затем инженер по управлению может использовать эту модель для разработки подходящего контроллера для системы. Однако по-прежнему сложно найти простую, но надежную модель физической системы, которая включала бы только те динамические характеристики системы, которые представляют интерес для спецификаций управления. прямойметоды, управляемые данными, позволяют настраивать контроллер, принадлежащий к данному классу, без необходимости идентифицировать модель системы. Таким образом, можно просто взвесить интересующую динамику процесса внутри функции затрат на управление и исключить те динамики, которые не представляют интереса.

Обзор

Стандартный подход к проектированию систем управления организован в двух шагах:

Идентификация модели направлена на оценку номинальной модели системы. ${\ displaystyle {\ widehat {G}} = G \ left (q; {\ widehat {\ theta}} _ {N} \ right)}$ , где ${\ displaystyle q}$ - оператор единичной задержки (для представления передаточных функций с дискретным временем) и ${\ displaystyle {\ widehat {\ theta}} _ {N}}$ - вектор параметров ${\ displaystyle G}$ идентифицированы по набору ${\ displaystyle N}$ данные. Тогда проверка состоит в построении множества неопределенностей ${\ displaystyle \ Gamma}$ который содержит истинную систему ${\ displaystyle G_ {0}}$ на определенном уровне вероятности.
Дизайн контроллера направлен на поиск контроллера ${\ displaystyle C}$ достижение стабильности замкнутого контура и выполнение требуемых характеристик с ${\ displaystyle {\ widehat {G}}}$ .

Типичные цели идентификации системы : ${\ displaystyle {\ widehat {G}}}$ как можно ближе к ${\ displaystyle G_ {0}}$ , и иметь ${\ displaystyle \ Gamma}$ как можно меньше. Однако с точки зрения идентификации с точки зрения управления действительно имеет значение производительность, достигаемая контроллером, а не внутреннее качество модели.

Один из способов справиться с неопределенностью - спроектировать контроллер, который будет иметь приемлемую производительность со всеми моделями в ${\ displaystyle \ Gamma}$ , в том числе ${\ displaystyle G_ {0}}$ . Это основная идея, лежащая в основе процедуры проектирования надежного управления , которая направлена на построение описаний неопределенности процесса в частотной области. Однако, будучи основанным на предположениях наихудшего случая, а не на идее усреднения шума, этот подход обычно приводит к консервативным наборам неопределенностей. Скорее, методы, основанные на данных, имеют дело с неопределенностью, работая с экспериментальными данными и избегая чрезмерного консервативности.

Далее представлены основные классификации систем управления, основанных на данных.

Косвенные и прямые методы

Существует множество методов управления системами. Принципиальное различие заключается между косвенными и прямыми методами проектирования контроллеров. Первая группа методов все еще сохраняет стандартный двухэтапный подход, т.е. сначала идентифицируется модель, а затем настраивается контроллер на основе этой модели. Основная проблема при этом заключается в том, что контроллер рассчитывается на основе оценочной модели. ${\ displaystyle {\ widehat {G}}}$ (согласно принципу достоверности эквивалентности ), но на практике ${\ displaystyle {\ widehat {G}} \ neq G_ {0}}$ . Чтобы преодолеть эту проблему, идея последней группы методов состоит в том, чтобы отображать экспериментальные данные непосредственно на контроллер, без какой-либо модели, которую нужно идентифицировать между ними.

Итерационные и безитеративные методы

Еще одно важное различие - между итеративными и безитеративными (или одноразовыми ) методами. В первой группе необходимы повторные итерации для оценки параметров контроллера, во время которых задача оптимизации выполняется на основе результатов предыдущей итерации, и ожидается, что оценка будет становиться все более и более точной на каждой итерации. Этот подход также может быть реализован в интерактивном режиме (см. Ниже). В последней группе параметризация (оптимального) регулятора обеспечивается единственной оптимизационной задачей. Это особенно важно для тех систем, в которых итерации или повторения экспериментов по сбору данных ограничены или даже не разрешены (например, из-за экономических аспектов). В таких случаях следует выбрать метод проектирования, позволяющий поставить контроллер на одном наборе данных. Этот подход часто реализуется в автономном режиме (см. Ниже).

Он-лайн и оф-лайн методы

Поскольку в практических промышленных приложениях данные с разомкнутым или замкнутым циклом часто доступны постоянно, методы, управляемые данными онлайн , используют эти данные для улучшения качества идентифицированной модели и / или производительности контроллера каждый раз, когда появляется новая информация. собирается на заводе. Вместо этого автономные подходы работают с пакетом данных, который может собираться только один или несколько раз через регулярный (но довольно длинный) интервал времени.

Настройка итеративной обратной связи

Метод итеративной настройки с обратной связью (IFT) был введен в 1994 г. ^[2], начиная с наблюдения, что при идентификации для управления каждая итерация основана на (неправильном) принципе эквивалентности достоверности.

IFT - это безмодельный метод прямой итеративной оптимизации параметров контроллера с фиксированным порядком; такие параметры могут быть последовательно обновлены с использованием информации, поступающей из стандартной (замкнутой) работы системы.

Позволять ${\ displaystyle y ^ {d}}$ быть желаемым выходом для опорного сигнала ${\ displaystyle r}$ ; ошибка между достигнутым и желаемым ответом составляет ${\ Displaystyle {\ тильда {y}} (\ rho) = y (\ rho) -y ^ {d}}$ . Цель дизайна управления может быть сформулирована как минимизация целевой функции:

{\ Displaystyle J (\ rho) = {\ frac {1} {2N}} \ sum _ {t = 1} ^ {N} E \ left [{\ tilde {y}} (t, \ rho) ^ { 2} \ right].}

Для минимизации целевой функции может быть применен квазиньютоновский метод , то есть минимизация на основе градиента с использованием поиска по градиенту типа:

{\ displaystyle \ rho _ {i + 1} = \ rho _ {i} - \ gamma _ {i} R_ {i} ^ {- 1} {\ frac {d {\ widehat {J}}} {d \ rho}} (\ rho _ {i}).}

Значение ${\ displaystyle \ gamma _ {я}}$ размер шага, ${\ displaystyle R_ {i}}$ - подходящая положительно определенная матрица и ${\ displaystyle {\ frac {d {\ widehat {J}}} {d \ rho}}}$ аппроксимация градиента; истинное значение градиента определяется следующим образом:

{\ displaystyle {\ frac {dJ} {d \ rho}} (\ rho) = {\ frac {1} {N}} \ sum _ {t = 1} ^ {N} \ left [{\ tilde {y }} (t, \ rho) {\ frac {\ delta y} {\ delta \ rho}} (t, \ rho) \ right].}

Значение ${\ displaystyle {\ frac {\ delta y} {\ delta \ rho}} (t, \ rho)}$ получается с помощью следующей трехэтапной методики:

Нормальный эксперимент: Проведите эксперимент в замкнутой системе с ${\ Displaystyle C (\ rho)}$ как контролер и ${\ displaystyle r}$ в качестве ссылки; собрать N измерений выхода ${\ Displaystyle у (\ ро)}$ , обозначаемый как ${\ Displaystyle у ^ {(1)} (\ ро)}$ .
Градиентный эксперимент: Проведите эксперимент в замкнутой системе с ${\ Displaystyle C (\ rho)}$ как контроллер и 0 как ссылка ${\ displaystyle r}$ ; вводить сигнал ${\ Displaystyle ry ^ {(1)} (\ rho)}$ так что он суммируется с выходом управляющей переменной как ${\ Displaystyle C (\ rho)}$ , идущий в качестве входа в завод. Соберите результат, обозначенный как ${\ Displaystyle у ^ {(2)} (\ ро)}$ .
В качестве приближения градиента возьмем следующее: ${\ displaystyle {\ frac {\ delta {\ widehat {y}}} {\ delta \ rho}} (\ rho) = {\ frac {\ delta C} {\ delta \ rho}} (\ rho) y ^ {(2)} (\ rho)}$ .

Решающим фактором скорости сходимости алгоритма является выбор ${\ displaystyle R_ {i}}$ ; когда ${\ displaystyle {\ tilde {y}}}$ мала, хорошим выбором будет приближение, заданное направлением Гаусса – Ньютона:

{\ displaystyle R_ {i} = {\ frac {1} {N}} \ sum _ {t = 1} ^ {N} {\ frac {\ delta {\ widehat {y}}} {\ delta \ rho} } (\ rho _ {i}) {\ frac {\ delta {\ widehat {y}} ^ {T}} {\ delta \ rho}} (\ rho _ {i}).}

Безытерационная настройка на основе корреляции

Безытерационная настройка на основе корреляции (nCbT) - это безытерационный метод для управляемой данными настройки контроллера с фиксированной структурой. ^[3] Он предоставляет однократный метод прямого синтеза контроллера на основе одного набора данных.

Предположим, что ${\ displaystyle G}$ обозначает неизвестный стабильный с LTI завод SISO, ${\ displaystyle M}$ определяемая пользователем эталонная модель и ${\ displaystyle F}$ определяемая пользователем весовая функция. Контроллер фиксированного порядка LTI обозначается как ${\ Displaystyle К (\ rho) = \ бета ^ {T} \ rho}$ , где ${\ displaystyle \ rho \ in \ mathbb {R} ^ {n}}$ , а также ${\ displaystyle \ beta}$ - вектор базисных функций LTI. Ну наконец то, ${\ displaystyle K ^ {*}}$ идеальный LTI-контроллер любой конструкции, гарантирующий работу с обратной связью ${\ displaystyle M}$ применительно к ${\ displaystyle G}$ .

Цель состоит в том, чтобы минимизировать следующую целевую функцию:

{\ Displaystyle J (\ rho) = \ left \ | F {\ bigg (} {\ frac {K ^ {*} GK (\ rho) G} {(1 + K ^ {*} G) ^ {2} }} {\ bigg)} \ right \ | _ {2} ^ {2}.}

${\ Displaystyle J (\ rho)}$ является выпуклой аппроксимацией целевой функции, полученной из эталонной задачи модели, предполагая, что ${\ displaystyle {\ frac {1} {(1 + K (\ rho) G)}} \ приблизительно {\ frac {1} {(1 + K ^ {*} G)}}}$ .

Когда ${\ displaystyle G}$ является стабильной и минимально-фазовой, приближенная эталонная задача модели эквивалентна минимизации нормы ${\ Displaystyle \ varepsilon (т)}$ в схеме на рисунке.

Идея состоит в том, что, когда G стабильна и имеет минимальную фазу, приближенная эталонная задача модели эквивалентна минимизации нормы

{\ displaystyle \ varepsilon}

.

Входной сигнал ${\ Displaystyle г (т)}$ должен быть постоянно возбуждающим входным сигналом и ${\ Displaystyle v (т)}$ быть сгенерированным стабильным механизмом генерации данных. Таким образом, в эксперименте с разомкнутым контуром два сигнала не коррелируют; следовательно, идеальная ошибка ${\ Displaystyle \ varepsilon (т, \ rho ^ {*})}$ не коррелирует с ${\ Displaystyle г (т)}$ . Таким образом, цель контроля состоит в том, чтобы найти ${\ displaystyle \ rho}$ такой, что ${\ Displaystyle г (т)}$ а также ${\ Displaystyle \ varepsilon (т, \ rho ^ {*})}$ некоррелированы.

Вектор инструментальных переменных ${\ Displaystyle \ zeta (т)}$ определяется как:

{\ displaystyle \ zeta (t) = [r_ {W} (t + \ ell _ {1}), r_ {W} (t + \ ell _ {1} -1), \ ldots, r_ {W} (t) , \ ldots, r_ {W} (t- \ ell _ {1})] ^ {T}}

где ${\ displaystyle \ ell _ {1}}$ достаточно большой и ${\ Displaystyle r_ {W} (t) = Wr (t)}$ , где ${\ displaystyle W}$ это подходящий фильтр.

Корреляционная функция:

{\ displaystyle f_ {N, \ ell _ {1}} (\ rho) = {\ frac {1} {N}} \ sum _ {t = 1} ^ {N} \ zeta (t) \ varepsilon (t , \ rho)}

и проблема оптимизации становится:

{\ displaystyle {\ widehat {\ rho}} = {\ underset {\ rho \ in D_ {k}} {\ operatorname {arg \, min}}} J_ {N, \ ell _ {1}} (\ rho ) = {\ underset {\ rho \ in D_ {k}} {\ operatorname {arg \, min}}} f_ {N, \ ell _ {1}} ^ {T} f_ {N, \ ell _ {1 }}.}

Обозначая ${\ displaystyle \ phi _ {r} (\ omega)}$ спектр ${\ Displaystyle г (т)}$ , можно показать, что при некоторых предположениях, если ${\ displaystyle W}$ выбрано как:

{\ Displaystyle W (е ^ {- j \ omega}) = {\ гидроразрыва {F (e ^ {- j \ omega}) (1-M (e ^ {- j \ omega}))} {\ phi _ {r} (\ omega)}}}

тогда имеет место следующее:

{\ displaystyle \ lim _ {N, \ ell _ {1} \ to \ infty, \ ell _ {1} / N \ to \ infty} {\ widehat {\ rho}} = \ rho ^ {*}.}

Ограничение стабильности

Нет гарантии, что контроллер ${\ displaystyle K}$ что сводит к минимуму ${\ displaystyle J_ {N, \ ell _ {1}}}$ стабильно. Неустойчивость может возникнуть в следующих случаях:

Если ${\ displaystyle G}$ не минимальная фаза, ${\ displaystyle K ^ {*}}$ может привести к сокращению в правой половине комплексной плоскости.
Если ${\ displaystyle K ^ {*}}$ (даже если стабилизация) недостижима, ${\ Displaystyle К (\ rho)}$ может не стабилизировать.
Из-за шума измерения, даже если ${\ Displaystyle К ^ {*} = К (\ rho)}$ стабилизируется, по оценкам данных ${\ Displaystyle {\ widehat {K}} (\ rho)}$ не может быть так.

Рассмотрим стабилизирующий контроллер ${\ displaystyle K_ {s}}$ и передаточная функция с обратной связью ${\ displaystyle M_ {s} = {\ frac {K_ {s} G} {1 + K_ {s} G}}}$ . Определять:

{\ Displaystyle \ Дельта (\ rho): = M_ {s} -K (\ rho) G (1-M_ {s})}

{\ displaystyle \ delta (\ rho): = \ left \ | \ Delta (\ rho) \ right \ | _ {\ infty}.}

Теорема

Контроллер ${\ Displaystyle К (\ rho)}$ стабилизирует растение ${\ displaystyle G}$ если

${\ displaystyle \ Delta (\ rho)}$ стабильно
${\ Displaystyle \ существует \ дельта _ {N} \ in (0,1)}$ ул ${\ displaystyle \ delta (\ rho) \ leq \ delta _ {N}.}$

Условие 1. применяется, когда:

${\ Displaystyle К (\ rho)}$ стабильно
${\ Displaystyle К (\ rho)}$ содержит интегратор (отменен).

Эталонный проект модели с ограничением устойчивости принимает следующий вид:

{\ displaystyle \ rho _ {s} = {\ underset {\ rho \ in D_ {k}} {\ operatorname {arg \, min}}} J (\ rho)}

{\ displaystyle {\ text {st}} \ delta (\ rho) \ leq \ delta _ {N}.}

Выпуклая оценка управляемых данными из ${\ Displaystyle \ дельта (\ ро)}$ можно получить с помощью дискретного преобразования Фурье .

Определите следующее:

{\ displaystyle {\ begin {align} & {\ widehat {R}} _ {r} (\ tau) = {\ frac {1} {N}} \ sum _ {t = 1} ^ {N} r ( t- \ tau) r (t) {\ text {for}} \ tau = - \ ell _ {2}, \ ldots, \ ell _ {2} \\ [4pt] & {\ widehat {R}} _ {r \ varepsilon} (\ tau) = {\ frac {1} {N}} \ sum _ {t = 1} ^ {N} r (t- \ tau) \ varepsilon (t, \ rho) {\ text {for}} \ tau = - \ ell _ {2}, \ ldots, \ ell _ {2}. \ end {align}}}

Для стабильных минимальных фазовых объектов задается следующая задача оптимизации, управляемая выпуклыми данными :

{\ displaystyle {\ begin {align} {\ widehat {\ rho}} & = {\ underset {\ rho \ in D_ {k}} {\ operatorname {arg \, min}}} J_ {N, \ ell _ {1}} (\ rho) \\ [3pt] & {\ text {st}} \\ [3pt] & {\ bigg |} \ sum _ {\ tau = - \ ell _ {2}} ^ {\ ell _ {2}} {\ widehat {R}} _ {r \ varepsilon} (\ tau, \ rho) e ^ {- j \ tau \ omega _ {k}} {\ bigg |} \ leq \ delta _ {N} {\ bigg |} \ sum _ {\ tau = - \ ell _ {2}} ^ {\ ell _ {2}} {\ widehat {R}} _ {r} (\ tau, \ rho) e ^ {- j \ tau \ omega _ {k}} {\ bigg |} \\ [4pt] \ omega _ {k} & = {\ frac {2 \ pi k} {2 \ ell _ {2} + 1}}, \ qquad k = 0, \ ldots, \ ell _ {2} +1. \ End {align}}}

Настройка обратной связи виртуального эталона

Настройка с обратной связью по виртуальному эталону (VRFT) - это безытерационный метод для управляемой данными настройки контроллера с фиксированной структурой. Он предоставляет однократный метод прямого синтеза контроллера на основе одного набора данных.

VRFT был впервые предложен в ^[4], а затем распространен на системы LPV. ^[5] VRFT также основывается на идеях, изложенных в ^[6] как ${\ displaystyle VRD ^ {2}}$ .

Основная идея - определить желаемую модель замкнутого цикла. ${\ displaystyle M}$ и использовать его обратную динамику для получения виртуальной ссылки ${\ Displaystyle r_ {v} (т)}$ от измеренного выходного сигнала ${\ Displaystyle у (т)}$ .

Основная идея состоит в том, чтобы определить желаемую модель замкнутого контура M и использовать ее обратную динамику для получения виртуального эталона из измеренного выходного сигнала y.

Виртуальные сигналы ${\ displaystyle r_ {v} (t) = M ^ {- 1} y (t)}$ а также ${\ displaystyle e_ {v} (t) = r_ {v} (t) -y (t).}$