Управляемые данными системы управления представляют собой широкое семейство систем управления , в которых идентификация модели процесса и / или конструкция контроллера полностью основываются на экспериментальных данных, собранных с завода. [1]
Во многих приложениях управления попытка написать математическую модель предприятия считается сложной задачей, требующей усилий и времени от инженеров-технологов и инженеров по управлению. Эта проблема решается с помощью методов, управляемых данными , которые позволяют подогнать модель системы к собранным экспериментальным данным, выбирая ее в конкретном классе моделей. Затем инженер по управлению может использовать эту модель для разработки подходящего контроллера для системы. Однако по-прежнему сложно найти простую, но надежную модель физической системы, которая включала бы только те динамические характеристики системы, которые представляют интерес для спецификаций управления. прямойметоды, управляемые данными, позволяют настраивать контроллер, принадлежащий к данному классу, без необходимости идентифицировать модель системы. Таким образом, можно просто взвесить интересующую динамику процесса внутри функции затрат на управление и исключить те динамики, которые не представляют интереса.
Обзор
Стандартный подход к проектированию систем управления организован в двух шагах:
- Идентификация модели направлена на оценку номинальной модели системы. , где - оператор единичной задержки (для представления передаточных функций с дискретным временем) и - вектор параметров идентифицированы по набору данные. Тогда проверка состоит в построении множества неопределенностей который содержит истинную систему на определенном уровне вероятности.
- Дизайн контроллера направлен на поиск контроллера достижение стабильности замкнутого контура и выполнение требуемых характеристик с .
Типичные цели идентификации системы : как можно ближе к , и иметь как можно меньше. Однако с точки зрения идентификации с точки зрения управления действительно имеет значение производительность, достигаемая контроллером, а не внутреннее качество модели.
Один из способов справиться с неопределенностью - спроектировать контроллер, который будет иметь приемлемую производительность со всеми моделями в , в том числе . Это основная идея, лежащая в основе процедуры проектирования надежного управления , которая направлена на построение описаний неопределенности процесса в частотной области. Однако, будучи основанным на предположениях наихудшего случая, а не на идее усреднения шума, этот подход обычно приводит к консервативным наборам неопределенностей. Скорее, методы, основанные на данных, имеют дело с неопределенностью, работая с экспериментальными данными и избегая чрезмерного консервативности.
Далее представлены основные классификации систем управления, основанных на данных.
Косвенные и прямые методы
Существует множество методов управления системами. Принципиальное различие заключается между косвенными и прямыми методами проектирования контроллеров. Первая группа методов все еще сохраняет стандартный двухэтапный подход, т.е. сначала идентифицируется модель, а затем настраивается контроллер на основе этой модели. Основная проблема при этом заключается в том, что контроллер рассчитывается на основе оценочной модели.(согласно принципу достоверности эквивалентности ), но на практике. Чтобы преодолеть эту проблему, идея последней группы методов состоит в том, чтобы отображать экспериментальные данные непосредственно на контроллер, без какой-либо модели, которую нужно идентифицировать между ними.
Итерационные и безитеративные методы
Еще одно важное различие - между итеративными и безитеративными (или одноразовыми ) методами. В первой группе необходимы повторные итерации для оценки параметров контроллера, во время которых задача оптимизации выполняется на основе результатов предыдущей итерации, и ожидается, что оценка будет становиться все более и более точной на каждой итерации. Этот подход также может быть реализован в интерактивном режиме (см. Ниже). В последней группе параметризация (оптимального) регулятора обеспечивается единственной оптимизационной задачей. Это особенно важно для тех систем, в которых итерации или повторения экспериментов по сбору данных ограничены или даже не разрешены (например, из-за экономических аспектов). В таких случаях следует выбрать метод проектирования, позволяющий поставить контроллер на одном наборе данных. Этот подход часто реализуется в автономном режиме (см. Ниже).
Он-лайн и оф-лайн методы
Поскольку в практических промышленных приложениях данные с разомкнутым или замкнутым циклом часто доступны постоянно, методы, управляемые данными онлайн , используют эти данные для улучшения качества идентифицированной модели и / или производительности контроллера каждый раз, когда появляется новая информация. собирается на заводе. Вместо этого автономные подходы работают с пакетом данных, который может собираться только один или несколько раз через регулярный (но довольно длинный) интервал времени.
Настройка итеративной обратной связи
Метод итеративной настройки с обратной связью (IFT) был введен в 1994 г. [2], начиная с наблюдения, что при идентификации для управления каждая итерация основана на (неправильном) принципе эквивалентности достоверности.
IFT - это безмодельный метод прямой итеративной оптимизации параметров контроллера с фиксированным порядком; такие параметры могут быть последовательно обновлены с использованием информации, поступающей из стандартной (замкнутой) работы системы.
Позволять быть желаемым выходом для опорного сигнала ; ошибка между достигнутым и желаемым ответом составляет. Цель дизайна управления может быть сформулирована как минимизация целевой функции:
Для минимизации целевой функции может быть применен квазиньютоновский метод , то есть минимизация на основе градиента с использованием поиска по градиенту типа:
Значение размер шага, - подходящая положительно определенная матрица и аппроксимация градиента; истинное значение градиента определяется следующим образом:
Значение получается с помощью следующей трехэтапной методики:
- Нормальный эксперимент: Проведите эксперимент в замкнутой системе с как контролер и в качестве ссылки; собрать N измерений выхода, обозначаемый как .
- Градиентный эксперимент: Проведите эксперимент в замкнутой системе с как контроллер и 0 как ссылка ; вводить сигнал так что он суммируется с выходом управляющей переменной как , идущий в качестве входа в завод. Соберите результат, обозначенный как.
- В качестве приближения градиента возьмем следующее: .
Решающим фактором скорости сходимости алгоритма является выбор ; когда мала, хорошим выбором будет приближение, заданное направлением Гаусса – Ньютона:
Безытерационная настройка на основе корреляции
Безытерационная настройка на основе корреляции (nCbT) - это безытерационный метод для управляемой данными настройки контроллера с фиксированной структурой. [3] Он предоставляет однократный метод прямого синтеза контроллера на основе одного набора данных.
Предположим, что обозначает неизвестный стабильный с LTI завод SISO, определяемая пользователем эталонная модель и определяемая пользователем весовая функция. Контроллер фиксированного порядка LTI обозначается как, где , а также - вектор базисных функций LTI. Ну наконец то, идеальный LTI-контроллер любой конструкции, гарантирующий работу с обратной связью применительно к .
Цель состоит в том, чтобы минимизировать следующую целевую функцию:
является выпуклой аппроксимацией целевой функции, полученной из эталонной задачи модели, предполагая, что .
Когда является стабильной и минимально-фазовой, приближенная эталонная задача модели эквивалентна минимизации нормы в схеме на рисунке.
Входной сигнал должен быть постоянно возбуждающим входным сигналом и быть сгенерированным стабильным механизмом генерации данных. Таким образом, в эксперименте с разомкнутым контуром два сигнала не коррелируют; следовательно, идеальная ошибка не коррелирует с . Таким образом, цель контроля состоит в том, чтобы найти такой, что а также некоррелированы.
Вектор инструментальных переменных определяется как:
где достаточно большой и , где это подходящий фильтр.
Корреляционная функция:
и проблема оптимизации становится:
Обозначая спектр , можно показать, что при некоторых предположениях, если выбрано как:
тогда имеет место следующее:
Ограничение стабильности
Нет гарантии, что контроллер что сводит к минимуму стабильно. Неустойчивость может возникнуть в следующих случаях:
- Если не минимальная фаза, может привести к сокращению в правой половине комплексной плоскости.
- Если (даже если стабилизация) недостижима, может не стабилизировать.
- Из-за шума измерения, даже если стабилизируется, по оценкам данных не может быть так.
Рассмотрим стабилизирующий контроллер и передаточная функция с обратной связью . Определять:
- Теорема
- Контроллер стабилизирует растение если
- стабильно
- ул
Условие 1. применяется, когда:
- стабильно
- содержит интегратор (отменен).
Эталонный проект модели с ограничением устойчивости принимает следующий вид:
Выпуклая оценка управляемых данными изможно получить с помощью дискретного преобразования Фурье .
Определите следующее:
Для стабильных минимальных фазовых объектов задается следующая задача оптимизации, управляемая выпуклыми данными :
Настройка обратной связи виртуального эталона
Настройка с обратной связью по виртуальному эталону (VRFT) - это безытерационный метод для управляемой данными настройки контроллера с фиксированной структурой. Он предоставляет однократный метод прямого синтеза контроллера на основе одного набора данных.
VRFT был впервые предложен в [4], а затем распространен на системы LPV. [5] VRFT также основывается на идеях, изложенных в [6] как.
Основная идея - определить желаемую модель замкнутого цикла. и использовать его обратную динамику для получения виртуальной ссылки от измеренного выходного сигнала .
Виртуальные сигналы а также
Оптимальный регулятор получается из бесшумных данных путем решения следующей задачи оптимизации:
где функция оптимизации задается следующим образом:
Рекомендации
- ^ Bazanella А.С., Campestrini, Л., Экхард, D. (2012). Дизайн контроллера, управляемого данными:подход. Springer, ISBN 978-94-007-2300-9 , 208 страниц.
- ^ Hjalmarsson, Х. , Gevers, М., Гуннарссон, С., & Lequin, О. (1998). Настройка итеративной обратной связи: теория и приложения. Системы управления IEEE, 18 (4), 26–41.
- ^ van Heusden, K., Karimi, A. и Bonvin, D. (2011), Управляемая данными эталонная модель управления с асимптотически гарантированной стабильностью. Int. J. Adapt. Процесс управляющего сигнала., 25: 331–351. DOI : 10.1002 / acs.1212
- ^ Кампи, Марко К., Андреа Леккини и Серджио М. Савареси. «Настройка виртуальной эталонной обратной связи: прямой метод разработки контроллеров обратной связи». Automatica 38.8 (2002): 1337–1346.
- ^ Formentin, С., Пига Д., Тота, Р., & Savaresi, С. М. (2016). Прямое обучение контроллеров LPV по данным. Автоматика, 65, 98–110.
- ^ Гуардабасси, Гвидо О. и Серхио М. Савареси. «Приближенная линеаризация с обратной связью нелинейных систем с дискретным временем с использованием прямого виртуального ввода». Письма о системах и управлении 32.2 (1997): 63–74.