Из Википедии, бесплатной энциклопедии
  (Перенаправлено из оценки состояния )
Перейти к навигации Перейти к поиску

В теории управления , А статус наблюдатель или оценка состояния представляет собой система , которая обеспечивает оценку внутреннего состояния данной реальной системы, из измерений входных и выходных реальной системы. Обычно он реализуется на компьютере и служит основой для многих практических приложений.

Знание состояния системы необходимо для решения многих задач теории управления ; например, стабилизация системы с помощью обратной связи по состоянию . В большинстве практических случаев физическое состояние системы не может быть определено прямым наблюдением. Вместо этого через выходные сигналы системы наблюдаются косвенные эффекты внутреннего состояния. Простым примером является транспорт в туннеле: скорости и скорости, с которыми транспортные средства входят в туннель и покидают его, можно непосредственно наблюдать, но точное состояние внутри туннеля можно только оценить. Если система является наблюдаемой , можно полностью восстановить состояние системы по ее выходным измерениям с помощью наблюдателя состояния.

Типичная модель наблюдателя [ править ]

Блок-схема Luenberger Observer. Вход усиления наблюдателя L равен .

Линейные, скользящие режимы и кубические наблюдатели являются одними из нескольких структур наблюдателей, используемых для оценки состояния линейных систем. Структура линейного наблюдателя описана в следующих разделах.

Случай дискретного времени [ править ]

Предполагается, что состояние линейной, неизменной во времени физической системы с дискретным временем удовлетворяет

где, во время , это состояние завода; это его входы; и его выходы. Эти уравнения просто говорят, что текущие выходы предприятия и его будущее состояние определяются исключительно его текущими состояниями и текущими входами. (Хотя эти уравнения выражаются в терминах дискретных временных шагов, очень похожие уравнения справедливы для непрерывных систем). Если эта система является наблюдаемой, то выходной сигнал объекта, может использоваться для управления состоянием наблюдателя состояния.

Модель наблюдателя физической системы затем обычно выводится из приведенных выше уравнений. Могут быть включены дополнительные условия, чтобы гарантировать, что при получении последовательных измеренных значений входов и выходов объекта состояние модели сходится с состоянием объекта. В частности, выходные данные наблюдателя могут быть вычтены из выходных данных объекта, а затем умножены на матрицу ; затем это добавляется к уравнениям состояния наблюдателя, чтобы получить так называемый наблюдатель Люенбергера , определяемый уравнениями ниже. Обратите внимание, что переменные наблюдателя состояния обычно обозначаются «шляпой»: и чтобы отличить их от переменных уравнений, которым удовлетворяет физическая система.

Наблюдатель называется асимптотически устойчивым, если ошибка наблюдателя сходится к нулю при . Для наблюдателя Люенбергера ошибка наблюдателя удовлетворяет . Следовательно, наблюдатель Люенбергера для этой системы с дискретным временем является асимптотически устойчивым, когда матрица имеет все собственные значения внутри единичной окружности.

Для целей управления выход системы наблюдателя возвращается на вход наблюдателя и объекта через матрицу коэффициентов усиления .

Уравнения наблюдателя становятся:

или, проще говоря,

Благодаря принципу разделения мы знаем, что можем выбирать и независимо, без ущерба для общей стабильности систем. Как правило, полюса наблюдателя обычно выбираются так, чтобы они сходились в 10 раз быстрее, чем полюса системы .

Случай непрерывного времени [ править ]

Предыдущий пример был для наблюдателя, реализованного в системе LTI с дискретным временем. Однако процесс аналогичен для случая непрерывного времени; выгоды наблюдателей выбраны , чтобы сделать непрерывное время динамики ошибок сходится к нулю асимптотический (то есть, когда есть матрица Гурвицы ).

Для линейной системы с непрерывным временем

где наблюдатель похож на случай дискретного времени, описанный выше:

.

Ошибка наблюдателя удовлетворяет уравнению

.

Собственные значения матрицы могут быть выбраны произвольно путем соответствующего выбора коэффициента усиления наблюдателя, когда пара является наблюдаемой, т. Е. Выполняется условие наблюдаемости . В частности, это может быть сделано Гурвицем, поэтому ошибка наблюдателя при .

Пикинг и другие методы наблюдателя [ править ]

Когда усиление наблюдателя велико, линейный наблюдатель Люенбергера очень быстро сходится к состояниям системы. Однако высокое усиление наблюдателя приводит к явлению обострения, при котором начальная ошибка оценки может быть недопустимо большой (т. Е. Непрактичной или небезопасной для использования). [1] Как следствие, доступны нелинейные методы наблюдения с высоким коэффициентом усиления, которые быстро сходятся без явления пика. Например, управление скользящим режимом можно использовать для разработки наблюдателя, который сводит ошибку одного оцененного состояния к нулю за конечное время даже при наличии ошибки измерения; в других состояниях есть ошибка, которая ведет себя аналогично ошибке наблюдателя Люенбергера после того, как пик спадал. Наблюдатели в скользящем режиме также обладают привлекательными свойствами устойчивости к шуму, аналогичными характеристикамФильтр Калмана . [2] [3] Другой подход заключается в применении нескольких наблюдателей, что значительно улучшает переходные процессы и снижает выбросы наблюдателя. Многократный наблюдатель может быть адаптирован к любой системе, где применяется High Gain Observer. [4]

Государственные наблюдатели для нелинейных систем [ править ]

Наблюдатели с высоким коэффициентом усиления, скользящий режим и расширенные наблюдатели являются наиболее распространенными наблюдателями для нелинейных систем. Чтобы проиллюстрировать применение наблюдателей скользящего режима для нелинейных систем, сначала рассмотрим нелинейную систему без входа:

где . Также предположим, что есть измеримый выход, заданный

Существует несколько не приближенных подходов к конструированию наблюдателя. Два наблюдателя, приведенные ниже, также применимы к случаю, когда система имеет вход. Это,

Линеаризуемая динамика ошибок [ править ]

Одно предложение Кренера и Исидори [5], а также Кренера и Репдека [6] может быть применено в ситуации, когда существует линеаризующее преобразование (т. Е. Диффеоморфизм , подобный тому, который используется при линеаризации обратной связи ), такой что в новых переменных уравнения системы читать

Наблюдатель Люенбергера тогда разработан как

.

Ошибка наблюдателя для преобразованной переменной удовлетворяет тому же уравнению, что и в классическом линейном случае.

.

Как показали Готье, Хаммури и Осман [7] и Хаммури и Киннарт [8], если существует преобразование, такое, что система может быть преобразована в форму

тогда наблюдатель оформлен как

,

где - изменяющееся во времени усиление наблюдателя.

Чиккарелла, Далла Мора и Джермани [9] получили более продвинутые и общие результаты, устраняя необходимость в нелинейном преобразовании и доказывая глобальную асимптотическую сходимость оцениваемого состояния к истинному состоянию, используя только простые предположения о регулярности.

Наблюдатель в скользящем режиме [ править ]

Как обсуждалось выше для линейного случая, явление пика, присутствующее в наблюдателях Люенбергера, оправдывает использование наблюдателя в скользящем режиме . Наблюдатель скользящего режима использует нелинейную обратную связь с высоким коэффициентом усиления для передачи оцененных состояний на гиперповерхность, где нет разницы между оцененным выходным сигналом и измеренным выходным сигналом. Нелинейное усиление, используемое в наблюдателе, обычно реализуется с помощью масштабированной функции переключения, такой как сигнал (т. Е. Сигнал) оцененной - измеренной выходной ошибки. Следовательно, из-за этой обратной связи с высоким коэффициентом усиления векторное поле наблюдателя имеет складку, так что траектории наблюдателя скользят по кривой, где расчетный выходной сигнал точно совпадает с измеренным выходным сигналом. Итак, если системанаблюдаемые по его выходным данным, все состояния наблюдателя будут переведены в фактические состояния системы. Кроме того, при использовании знака ошибки для управления наблюдателем скользящего режима траектории наблюдателя становятся нечувствительными ко многим видам шума. Следовательно, некоторые наблюдатели скользящего режима имеют привлекательные свойства, аналогичные фильтру Калмана, но с более простой реализацией. [2] [3]

Как предположил Дракунов [10] , наблюдатель скользящего режима также может быть разработан для класса нелинейных систем. Такой наблюдатель может быть записан в терминах исходной оценки переменной и имеет вид

где:

  • Вектор расширяет скалярную функцию сигнума к измерениям. Это,
для вектора .
  • Вектор имеет компоненты, которые являются выходной функцией и ее повторяющимися производными Ли. В частности,
где - i- я производная Ли выходной функции вдоль векторного поля (т. е. вдоль траекторий нелинейной системы). В частном случае , когда система не имеет входа или имеет относительную степень по п , представляет собой совокупность выходных и его производные. Поскольку инверсия якобиевой линеаризации из должны существовать для этого наблюдателя , чтобы быть хорошо определена, преобразование гарантировано будет локальный диффеоморфизмом .
  • Диагональная матрица доходов такова , что
где для каждого элемента и достаточно большого размера, чтобы обеспечить достижимость скользящего режима.
  • Вектор наблюдателя таков, что
где здесь - нормальная сигнум-функция, определенная для скаляров, и обозначает «оператор эквивалентного значения» разрывной функции в скользящем режиме.

Кратко эту идею можно пояснить следующим образом. Согласно теории скользящих режимов, для описания поведения системы после запуска скользящего режима функция должна быть заменена эквивалентными значениями (см. Эквивалентное управление в теории скользящих режимов ). На практике он переключается (дребезжит) с высокой частотой, при этом медленная составляющая равна эквивалентному значению. Применяя соответствующий фильтр нижних частот, чтобы избавиться от высокочастотной составляющей, можно получить значение эквивалентного элемента управления, которое содержит больше информации о состоянии оцениваемой системы. Описанный выше наблюдатель использует этот метод несколько раз для получения идеального состояния нелинейной системы за конечное время.

Модифицированная ошибка наблюдения может быть записана в преобразованных состояниях . В частности,

и другие

Так:

  1. При условии , что первая строка динамики ошибки , будет удовлетворять достаточным условиям для перехода в скользящий режим за конечное время.
  2. Вдоль поверхности соответствующий эквивалент управления будет равен , и так . Следовательно, до тех пор, пока вторая строка динамики ошибки , за конечное время перейдет в скользящий режим.
  3. По поверхности соответствующий эквивалентный контроль будет равен . Следовательно, до тех пор , как , то й ряд динамики ошибок , войдет в скользящем режиме в конечное время.

Таким образом, для достаточно большого выигрыша все оцененные наблюдателем состояния достигают фактических состояний за конечное время. Фактически, увеличение позволяет достичь сходимости за любое желаемое конечное время при условии, что каждая функция может быть ограничена с уверенностью. Следовательно, требование, чтобы отображение было диффеоморфизмом (т. Е. Чтобы его якобианская линеаризация была обратимой), утверждает, что сходимость оцененного выхода подразумевает сходимость оцененного состояния. То есть требование является условием наблюдаемости.

В случае наблюдателя скользящего режима для системы с входом необходимы дополнительные условия, чтобы ошибка наблюдения не зависела от входа. Например, что

не зависит от времени. Тогда наблюдатель

Multi Observer [ править ]

Множественный наблюдатель расширяет структуру High Gain Observer от одного до нескольких наблюдателей, при этом многие модели работают одновременно. Он состоит из двух уровней: первый состоит из нескольких наблюдателей с высоким коэффициентом усиления с разными состояниями оценки, а второй определяет веса важности наблюдателей первого уровня. Алгоритм прост в реализации и не содержит рискованных операций вроде дифференцирования. [4] Идея множественных моделей ранее применялась для получения информации в адаптивном управлении. [11]

  • Схема с несколькими наблюдателями

Предположим, что количество наблюдателей с высоким коэффициентом усиления равно n + 1.

где - индекс наблюдателя. Наблюдатели первого уровня имеют одинаковое усиление, но различаются в зависимости от начального состояния . Во втором слое все из наблюдателей объединены в один , чтобы получить вектор оценки состояния одного

где весовые коэффициенты. Эти факторы изменяются, чтобы обеспечить оценку на втором уровне и улучшить процесс наблюдения.

Предположим, что

а также

где - некоторый вектор, зависящий от ошибки наблюдателя .

Некоторые преобразования сводятся к задаче линейной регрессии

Эта формула дает возможность оценить . Чтобы построить многообразие, нам необходимо сопоставление между ними и обеспечение, которое можно вычислить, полагаясь на измеримые сигналы. Первым делом необходимо устранить явление парковки из- за ошибки наблюдателя.

.

Вычислите производную по времени, чтобы найти отображение m, которое определяется как

где - некоторая постоянная времени. Обратите внимание, что реле как на обоих, так и на его интегралах, поэтому оно легко доступно в системе управления. Далее определяется оценочным законом; и тем самым доказывает, что многообразие измеримо. Во втором слое для вводится оценка коэффициентов. Ошибка сопоставления указывается как

где . Если коэффициенты равны , то ошибка отображения. Теперь можно рассчитать из приведенного выше уравнения, и, следовательно, явление обострения уменьшено благодаря свойствам коллектора. Созданное отображение дает большую гибкость в процессе оценки. Даже можно оценить значение во втором слое и вычислить состояние . [4]

Ограничивающие наблюдатели [ править ]

Ограничивающие [12] или интервальные наблюдатели [13] [14] представляют собой класс наблюдателей, которые обеспечивают две оценки состояния одновременно: одна из оценок обеспечивает верхнюю границу реального значения состояния, тогда как вторая дает оценку нижняя граница. Тогда известно, что реальная стоимость государства всегда находится в пределах этих двух оценок.

Эти оценки очень важны в практических приложениях [15] [16], поскольку они позволяют каждый раз знать точность оценки.

Математически можно использовать два наблюдателя Люенбергера, если они правильно выбраны, используя, например, положительные свойства системы : [17] один для верхней границы (который гарантирует, что при отсутствии шума и неопределенности сходится к нулю сверху ) , и нижняя граница (которая гарантирует, что сходится к нулю снизу). То есть всегда

См. Также [ править ]

  • Оценка подвижного горизонта
  • Фильтр Калмана
  • Расширенный фильтр Калмана
  • Положительные системы

Ссылки [ править ]

Встроенные ссылки
  1. ^ Халил, HK (2002), Нелинейные системы (3-е изд.), Верхняя река Сэдл, Нью-Джерси: Прентис Холл , ISBN 978-0-13-067389-3 CS1 maint: discouraged parameter (link)
  2. ^ а б Уткин, Вадим; Гульднер, Юрген; Ши, Цзинсинь (1999), Управление скользящим режимом в электромеханических системах , Филадельфия, Пенсильвания: Taylor & Francis, Inc., ISBN 978-0-7484-0116-1
  3. ^ a b Дракунов, С.В. (1983), "Адаптивный квазиоптимальный фильтр с разрывными параметрами", Автоматизация и дистанционное управление , 44 (9): 1167–1175
  4. ^ a b c Bernat, J .; Stepien, S. (2015), "Multi моделирование как новая оценка схемы для High Gain наблюдателей", Международный журнал по контролю , 88 (6): 1209-1222, Bibcode : 2015IJC .... 88.1209B , DOI : 10,1080 / +00207179,2014 .1000380 , S2CID 8599596 
  5. ^ Кренер, AJ; Isidori, Альберто (1983), "Линеаризация выходным инъекцией и нелинейными наблюдателями", система управления и контроля Letters , 3 : 47-52, DOI : 10,1016 / 0167-6911 (83) 90037-3
  6. ^ Кренер, AJ; Respondek, W. (1985), "Нелинейные наблюдатели с динамикой линеаризуема ошибок", SIAM журнал по контролю и оптимизации , 23 (2): 197-216, DOI : 10,1137 / 0323016
  7. ^ Готье, JP; Hammouri, H .; Осман, С. (1992), "Простой наблюдатель для приложений нелинейных систем к биореакторам", IEEE Transactions on Automatic Control , 37 (6): 875–880, doi : 10.1109 / 9.256352
  8. ^ Hammouri, H .; Kinnaert, M. (1996), "Новая процедура для изменяющейся во время Линеаризации до вывода Injection", системы управления и контроля Letters , 28 (3): 151-157, DOI : 10,1016 / 0167-6911 (96) 00022-9
  9. ^ Ciccarella, G .; Далла Мора, М .; Германцы, A. (1993), "А Luenberger, как наблюдатель нелинейных систем", Международный журнал по контролю , 57 (3): 537-556, DOI : 10,1080 / 00207179308934406
  10. ^ Drakunov, С. В. (1992), "Скользящие-Mode Наблюдателям на основе эквивалентного метода управления" , Труды 31 - й IEEE конференции по Решению и контроля (CDC) (Тусон, штат Аризона, 16-18 декабря): 2368-2370 , DOI : 10.1109 / CDC.1992.371368 , ISBN 978-0-7803-0872-5, S2CID  120072463
  11. ^ Нарендра, KS; Хан, З. (август 2012 г.). «Новый подход к адаптивному управлению с использованием нескольких моделей». Международный журнал адаптивного управления и обработки сигналов . 26 (8): 778–799. DOI : 10.1002 / acs.2269 . ISSN 1099-1115 . 
  12. ^ http://www.nt.ntnu.no/users/skoge/prost/proceedings/ecc03/pdfs/437.pdf
  13. ^ http://www.nt.ntnu.no/users/skoge/prost/proceedings/cdc-2008/data/papers/1446.pdf
  14. ^ https://hal.archives-ouvertes.fr/hal-01276439/
  15. ^ http://www.iaeng.org/publication/WCE2010/WCE2010_pp656-661.pdf
  16. ^ Хадж-Садок, MZ; Gouzé, JL (2001). «Оценка неопределенных моделей процессов активного ила с интервальными наблюдателями». Журнал управления процессами . 11 (3): 299–310. DOI : 10.1016 / S0959-1524 (99) 00074-8 .
  17. ^ Айт Рами М., Tadeo Ф., Helmke, У. (2011), «Положительные наблюдатели линейных положительных систем, аих последствия», Международный журнал по контролю 84
Общие ссылки
  • Зонтаг, Эдуардо (1998), Математическая теория управления: детерминированные конечномерные системы. Второе издание , Springer, ISBN 978-0-387-98489-6 CS1 maint: discouraged parameter (link)