Идентификация нелинейной системы

Идентификация системы представляет собой способ идентификации или измерения математической модели в виде системы из измерений входов и выходов системы. Приложения системной идентификации включают любую систему, в которой можно измерить входы и выходы, и включают в себя промышленные процессы , системы управления , экономические данные , биологию и науки о жизни , медицину , социальные системы и многое другое.

Нелинейная система определяется как любая система , которая не является линейной, то есть любая система , которая не удовлетворяет принципу суперпозиции . Это отрицательное определение имеет тенденцию затемнять, что существует очень много разных типов нелинейных систем. Исторически системная идентификация для нелинейных систем ^[1]^[2] развивалась путем сосредоточения внимания на конкретных классах систем и в целом может быть разделена на пять основных подходов, каждый из которых определяется классом модели:

Модели серии Volterra ,
Блочно-структурированные модели,
Модели нейронных сетей ,
Модели NARMAX и
Модели пространства состояний .

Для идентификации системы необходимо выполнить четыре шага: сбор данных, постулат модели, идентификация параметров и проверка модели. Сбор данных считается первой и важной частью терминологии идентификации, используемой в качестве исходных данных для модели, которая будет подготовлена позже. Он состоит из выбора подходящего набора данных, предварительной обработки и обработки. Он включает в себя реализацию известных алгоритмов вместе с транскрипцией полетных лент, хранением данных и управлением данными, калибровкой, обработкой, анализом и представлением. Более того, проверка модели необходима, чтобы получить уверенность в конкретной модели или отвергнуть ее. В частности, оценка параметров и проверка модели являются неотъемлемыми частями идентификации системы. Валидация относится к процессу подтверждения концептуальной модели и демонстрации адекватного соответствия между результатами вычислений модели и фактическими данными. ^[3]

Методы серии Вольтерра

В ранних работах преобладали методы, основанные на рядах Вольтерра , которые в случае дискретного времени можно выразить как

{\ displaystyle {\ begin {align} y (k) & = h_ {0} + \ sum \ limits _ {m_ {1} = 1} ^ {M} h_ {1} (m_ {1}) u (k -m_ {1}) + \ sum \ limits _ {m_ {1} = 1} ^ {M} \ sum \ limits _ {m_ {2} = 1} ^ {M} h_ {2} (m_ {1} , m_ {2}) u (k-m_ {1}) u (k-m_ {2}) \\ & {} \ quad {} + \ sum \ limits _ {m_ {1} = 1} ^ {M } \ sum \ limits _ {m_ {2} = 1} ^ {M} \ sum \ limits _ {m_ {3} = 1} ^ {M} h_ {3} (m_ {1}, m_ {2}, m_ {3}) u (k-m_ {1}) u (k-m_ {2}) u (k-m_ {3}) + \ cdots \ end {align}}}

где u ( k ), y ( k ); k = 1, 2, 3, ... - измеренные вход и выход соответственно и ${\ displaystyle h _ {\ ell} (m_ {1}, \ ldots, m _ {\ ell})}$ является л - го порядка вольтерров ядра, или л - го порядка нелинейной импульсной характеристикой. Ряд Вольтерра является расширением линейного интеграла свертки . Большинство более ранних алгоритмов идентификации предполагали, что присутствуют только первые два, линейное и квадратичное, ядра Вольтерра и использовали специальные входные данные, такие как гауссовский белый шум и методы корреляции, для идентификации двух ядер Вольтерра. В большинстве этих методов входные данные должны быть гауссовскими и белыми, что является серьезным ограничением для многих реальных процессов. Позднее эти результаты были расширены, чтобы включить первые три ядра Volterra, чтобы можно было вводить различные данные, и другие связанные разработки, включая серию Винера . Винер, Ли, Бозе и его коллеги из Массачусетского технологического института разработали очень важную работу, включая знаменитый метод Ли и Шетцена. ^[4]^[5] Хотя эти методы все еще активно изучаются сегодня, существует несколько основных ограничений. К ним относятся необходимость знать количество членов ряда Вольтерра априори, использование специальных входных данных и большое количество оценок, которые необходимо идентифицировать. Например, для системы, в которой ядро Вольтерра первого порядка описывается, скажем, 30 выборками, 30x30 точек потребуется для ядра второго порядка, 30x30x30 для третьего порядка и так далее, и, следовательно, количество данных, необходимых для получения хороших оценок, становится равным. чрезмерно большой. ^[6] Эти числа можно уменьшить, используя определенные симметрии, но требования по-прежнему являются чрезмерными, независимо от того, какой алгоритм используется для идентификации.

Блочно-структурированные системы

Из-за проблем идентификации моделей Вольтерра были исследованы другие формы моделей в качестве основы для идентификации нелинейных систем. Были введены или повторно представлены различные формы блочных нелинейных моделей. ^[6]^[7] Модель Хаммерштейна состоит из статического однозначного нелинейного элемента, за которым следует линейный динамический элемент. ^[8] Модель Винера является обратной этой комбинации, так что линейный элемент находится перед статической нелинейной характеристикой. ^[9] Модель Винера-Хаммерштейна состоит из статического нелинейного элемента, зажатого между двумя динамическими линейными элементами, и доступны несколько других форм модели. Модель Хаммерштейна-Винера состоит из линейного динамического блока, зажатого между двумя статическими нелинейными блоками. ^[10] Модель Урысона ^[11]^[12] отличается от других блочных моделей, она не состоит из последовательных линейных и нелинейных блоков, но описывает как динамические, так и статические нелинейности в выражении ядра оператора. ^[13] Все эти модели могут быть представлены серией Вольтерра, но в этом случае ядра Вольтерры в каждом случае принимают особую форму. Идентификация состоит из методов на основе корреляции и оценки параметров. Методы корреляции используют определенные свойства этих систем, что означает, что если используются определенные входные данные, часто белый гауссовский шум, отдельные элементы могут быть идентифицированы по одному. Это приводит к управляемым требованиям к данным, и отдельные блоки иногда могут быть связаны с компонентами в исследуемой системе.

Более поздние результаты основаны на оценке параметров и решениях на основе нейронных сетей. Было представлено много результатов, и эти системы продолжают глубоко изучаться. Одна из проблем заключается в том, что эти методы применимы только к очень специальной форме модели в каждом случае, и обычно эта форма модели должна быть известна до идентификации.

Нейронные сети

Искусственные нейронные сети пытаются имитировать сеть нейронов в мозгу, где вычисления выполняются с помощью большого количества простых элементов обработки. Типичная нейронная сеть состоит из ряда простых процессоров, связанных между собой, образуя сложную сеть. Слои таких модулей организованы таким образом, что данные вводятся на входном уровне и проходят через один или несколько промежуточных слоев, прежде чем достигнут выходного уровня. При обучении с учителем сеть обучается, оперируя разницей между фактическим и желаемым выходом сети, ошибкой прогнозирования, чтобы изменить силу соединения между узлами. Путем итерации веса изменяются до тех пор, пока ошибка вывода не достигнет приемлемого уровня. Этот процесс называется машинным обучением, потому что сеть регулирует веса так, чтобы воспроизводился выходной паттерн. Нейронные сети были тщательно изучены, и есть много отличных учебников, посвященных этой теме в целом, ^[1]^[14] и более специализированных учебников, в которых упор делается на управление и системные приложения. ^[1]^[15] Существует два основных типа задач, которые можно изучать с помощью нейронных сетей: статические задачи и динамические задачи. Статические задачи включают распознавание образов , классификацию и аппроксимацию . Динамические проблемы связаны с запаздывающими переменными и больше подходят для идентификации системы и связанных приложений. В зависимости от архитектуры сети задача обучения может быть либо нелинейной по параметрам, которая включает оптимизацию, либо линейной по параметрам, которая может быть решена с использованием классических подходов. Алгоритмы обучения можно разделить на контролируемое, неконтролируемое обучение или обучение с подкреплением. Нейронные сети обладают превосходными аппроксимирующими свойствами, но они обычно основаны на стандартных результатах аппроксимации функций с использованием, например, теоремы Вейерштрасса, которая одинаково хорошо применима к многочленам, рациональным функциям и другим хорошо известным моделям. Нейронные сети широко применяются для решения проблем идентификации систем, которые связаны с нелинейными и динамическими отношениями. Однако классические нейронные сети - это чисто статические аппроксимирующие машины. Внутри сети динамики нет. Следовательно, при подгонке динамических моделей вся динамика возникает за счет распределения запаздывающих входов и выходов на входном уровне сети. Затем процедура обучения создает наилучшее статическое приближение, которое связывает переменные с запаздыванием, назначенные входным узлам, с выходными. Существуют более сложные сетевые архитектуры, в том числе рекуррентные сети ^[1], которые создают динамику, вводя во входные узлы возрастающие порядки запаздывающих переменных. Но в этих случаях очень легко переопределить запаздывания, и это может привести к переобучению и плохим свойствам обобщения. У нейронных сетей есть несколько преимуществ; они концептуально просты, легки в обучении и использовании, имеют отличные аппроксимирующие свойства, важна концепция локальной и параллельной обработки, которая обеспечивает целостность и отказоустойчивое поведение. Самая большая критика классических моделей нейронных сетей заключается в том, что созданные модели полностью непрозрачны и обычно не могут быть записаны или проанализированы. Поэтому очень сложно узнать, что к чему, проанализировать модель или вычислить динамические характеристики на основе модели. Некоторые из этих моментов актуальны не для всех приложений, но они предназначены для динамического моделирования.

Методы NARMAX

П onlinear в токоррекция г egressive м внимание переходит на модель с verage е х ogenous входов (NARMAX модели) может представлять собой широкий класс нелинейных систем, ^[2] и определяется как

{\ Displaystyle {\ begin {align} y (k) & = F [y (k-1), y (k-2), \ ldots, y (k-n_ {y}), u (kd), u (kd-1), \ ldots, u (kd-n_ {u}), \\ & {} \ quad e (k-1), e (k-2), \ ldots, e (k-n_ {e })] + e (k) \ end {align}}}

где y ( k ), u ( k ) и e ( k ) - выходные, входные и шумовые последовательности системы соответственно; ${\ displaystyle n_ {y}}$ , ${\ displaystyle n_ {u}}$ , а также ${\ displaystyle n_ {e}}$ - максимальные лаги для вывода, ввода и шума системы; F [•] - некоторая нелинейная функция, d - временная задержка, обычно установленная на d = 1. Модель, по сути, представляет собой расширение прошлых входов, выходов и шумов. Поскольку шум моделируется явно, несмещенные оценки модели системы могут быть получены в присутствии ненаблюдаемого высококоррелированного и нелинейного шума. Volterra, блочно-структурированные модели и многие архитектуры нейронных сетей можно рассматривать как подмножества модели NARMAX. С момента появления NARMAX, доказав, какой класс нелинейных систем может быть представлена этой моделью, на основе этого описания были получены многие результаты и алгоритмы. Большая часть ранних работ была основана на полиномиальных расширениях модели NARMAX. Сегодня это все еще самые популярные методы, но для представления сильно нелинейных и очень сложных нелинейных систем были введены другие более сложные формы, основанные на вейвлетах и других расширениях. Значительная часть нелинейных систем может быть представлена моделью NARMAX, включая системы с экзотическими поведениями, такими как хаос , бифуркации и субгармоники . Хотя NARMAX начинался как название модели, теперь он превратился в философию идентификации нелинейных систем. ^[2] Подход NARMAX состоит из нескольких шагов:

Обнаружение структуры: какие термины присутствуют в модели
Оценка параметров: определение коэффициентов модели
Проверка модели: является ли модель объективной и правильной
Прогноз: каков результат в будущем
Анализ: каковы динамические свойства системы

Обнаружение структуры составляет наиболее фундаментальную часть NARMAX. Например, модель NARMAX, которая состоит из одного члена с запаздыванием на входе и одного члена с запаздыванием на выходе, трех слагаемых с запаздывающим шумом, расширенных как кубический полином, будет состоять из восьмидесяти двух возможных членов-кандидатов. Такое количество возможных членов возникает из-за того, что расширение по определению включает все возможные комбинации в рамках кубического расширения. Наивный подход к оценке модели, включающей все эти термины, с последующим отсечением приведет к численным и вычислительным проблемам, и этого следует всегда избегать. Однако в модели часто важны лишь несколько членов. Поэтому критически важно обнаружение структуры, которое направлено на выбор терминов по одному. Этих целей можно легко достичь, используя алгоритм ортогональных наименьших квадратов ^[2] и его производные для выбора членов модели NARMAX по одному. Эти идеи также можно адаптировать для распознавания образов и выбора признаков и предоставить альтернативу анализу главных компонентов, но с тем преимуществом, что признаки раскрываются как базовые функции, которые легко связаны с исходной проблемой.
Методы NARMAX предназначены не только для поиска наилучшей аппроксимирующей модели. Идентификацию системы можно разделить на две цели. Первый включает аппроксимацию, где ключевой целью является разработка модели, которая аппроксимирует набор данных, чтобы можно было делать хорошие прогнозы. Есть много приложений, в которых уместен этот подход, например, для прогнозирования погодных рядов, курсов акций, речи, отслеживания целей, классификации шаблонов и т. Д. В таких приложениях форма модели не так важна. Цель состоит в том, чтобы найти схему аппроксимации, которая дает минимальные ошибки предсказания. Вторая цель идентификации системы, которая включает первую цель как подмножество, включает в себя гораздо больше, чем просто поиск модели для достижения наилучших среднеквадратичных ошибок. Эта вторая цель - причина разработки философии NARMAX, которая связана с идеей поиска простейшей структуры модели. Цель здесь - разработать модели, воспроизводящие динамические характеристики базовой системы, найти простейшую возможную модель и, если возможно, связать ее с компонентами и поведением изучаемой системы. Таким образом, основная цель этого второго подхода к идентификации состоит в том, чтобы выявить и выявить правило, которое представляет систему. Эти цели имеют отношение к моделированию моделирования и проектированию систем управления, но все в большей степени относятся к приложениям в медицине, неврологии и науках о жизни. Здесь цель состоит в том, чтобы идентифицировать модели, часто нелинейные, которые можно использовать для понимания основных механизмов работы и поведения этих систем, чтобы мы могли манипулировать ими и использовать их. Методы NARMAX также были разработаны в частотной и пространственно-временной областях.

Стохастические нелинейные модели

В общем случае может случиться так, что некоторое внешнее неопределенное возмущение проходит через нелинейную динамику и влияет на выходы. Класс моделей, который является достаточно общим, чтобы уловить эту ситуацию, - это класс стохастических нелинейных моделей в пространстве состояний . Модель в пространстве состояний обычно получается с использованием основных законов ^[16], таких как механические, электрические или термодинамические физические законы, а параметры, которые необходимо идентифицировать, обычно имеют некоторый физический смысл или значение.

Модель пространства состояний с дискретным временем может быть определена с помощью разностных уравнений:

{\ displaystyle {\ begin {align} x_ {t + 1} & = f (x_ {t}, u_ {t}, w_ {t}; \ theta), \\ y_ {t} & = g (x_ { t}, u_ {t}, v_ {t}; \ theta), \ quad t = 1,2, \ dots \ end {align}}}

в котором ${\ displaystyle t}$ положительное целое число, относящееся ко времени. Функции ${\ displaystyle f}$ а также ${\ displaystyle g}$ - общие нелинейные функции. Первое уравнение известно как уравнение состояния, а второе - как уравнение выхода. Все сигналы моделируются с использованием случайных процессов . Процесс ${\ displaystyle x_ {t}}$ называется государственным процессом, ${\ displaystyle w_ {t}}$ а также ${\ displaystyle v_ {t}}$ обычно считаются независимыми и взаимно независимыми, так что ${\ displaystyle w_ {t} \ sim p (w; \ theta), \; v_ {t} \ sim p (v; \ theta)}$ . Параметр ${\ displaystyle \ theta}$ обычно является конечномерным (реальным) параметром, подлежащим оценке (с использованием экспериментальных данных). Обратите внимание, что процесс состояния не обязательно должен быть физическим сигналом, и обычно он не наблюдается (не измеряется). Набор данных представлен как набор пар ввода-вывода. ${\ Displaystyle (у_ {т}, и_ {т})}$ для ${\ Displaystyle т = 1, \ точки, N}$ для некоторого конечного положительного целого значения ${\ displaystyle N}$ .

К сожалению, из-за нелинейного преобразования ненаблюдаемых случайных величин функция правдоподобия выходных данных аналитически неразрешима; он дается в виде многомерного интеграла маргинализации. Следовательно, обычно используемые методы оценки параметров, такие как метод максимального правдоподобия или метод ошибки прогнозирования, основанные на оптимальном предсказателе на один шаг вперед ^[16] , аналитически трудноразрешимы. В последнее время алгоритмы, основанные на последовательных методах Монте-Карло , используются для аппроксимации условного среднего выходных значений или, в сочетании с алгоритмом ожидания-максимизации , для аппроксимации оценки максимального правдоподобия. ^[17] Эти методы, хотя и асимптотически оптимальны, требуют вычислений, и их использование ограничено конкретными случаями, когда можно избежать фундаментальных ограничений используемых фильтров частиц. Альтернативным решением является применение метода ошибки предсказания с использованием неоптимального предсказателя. ^[18]^[19]^[20] Можно показать, что полученная оценка является строго согласованной и асимптотически нормальной и может быть оценена с использованием относительно простых алгоритмов. ^[21]^[20]

Смотрите также

Модель серого ящика
Статистическая модель

дальнейшее чтение

Леннарт Юнг: Идентификация системы - теория для пользователя, 2-е изд., PTR Prentice Hall, Upper Saddle River, NJ, 1999.
Р. Пинтелон, Дж. Шукенс, Идентификация системы: подход в частотной области, IEEE Press, Нью-Йорк, 2001. ISBN 978-0-7803-6000-6
Т. Седерстрём, П. Стойка, Идентификация системы, Prentice Hall, Upper Saddle River, NJ, 1989. ISBN 0-13-881236-5
Р. К. Пирсон: Динамические модели с дискретным временем . Издательство Оксфордского университета, 1999.
П. Мармарелис, В. Мармарелис, В. Анализ физиологических систем , Пленум, 1978.
К. Уорден, Г. Р. Томлинсон, Нелинейность в структурной динамике, Издательство Института Физики, 2001.

[Nelles-1] Неллес О. "Идентификация нелинейных систем: от классических подходов к нейронным сетям". Springer Verlag, 2001 г.

[SAB1-2] Биллингс С.А. "Нелинейная идентификация систем: методы NARMAX во временной, частотной и пространственно-временной областях". Вайли, 2013

[3] Nesaei, Sepehr; Раиси, Камран (01.12.2011). Das, Vinu V .; Арива, Эзенду; Рахайу, Шарифа Бахия (ред.). Рассмотрение обработки данных и проверка модели при идентификации системы летательного аппарата . Конспект лекций Института компьютерных наук, социальной информатики и телекоммуникационной техники. Springer Berlin Heidelberg. С. 269–274. DOI : 10.1007 / 978-3-642-32573-1_46 . ISBN 978-3-642-32572-4.

[4] Schetzen М. "Теории Вольтерра и Винера нелинейных систем". Wiley, 1980 год.

[5] Rugh WJ "Теория нелинейных систем - подход Вольтерра Винера". Издательство Университета Джона Хопкинса, 1981

[SAB2-6] Биллингс С.А. « Идентификация нелинейных систем: обзор ». IEE Proceedings Part D 127 (6), 272–285,1980

[7] Хабер Р., Кевички Л. "Подход к моделированию нелинейной идентификации системы - вход и выход". Том I и II, Kluwer, 1980

[8] Хаммерштейн (Acta Math 1930) занимался не системным анализом, а краевыми задачами и собственными значениями нелинейных операторов.

[9] Этот термин широко используется, но он довольно неточен, поскольку Винер никогда не использовал эту простую модель. Его модель была дана сразу после стр. 50 в обзоре Биллингса 1980 г., о котором говорится в ссылках ниже.

[10] A.Wills, T.Schön, L.Ljung, B.Ninness, идентификация моделей Хаммерштейн-Винера, АВТОМАТИКА 29 (2013), 70-81

[11] М.Полуэктов и А.Поляр. Моделирование нелинейных систем управления с помощью дискретного оператора урысона . 2018. Отправлено arXiv: 1802.01700.

[12] A.Polar. http://ezcodesample.com/urysohn/urysohn.html

[13] М.Полуэктов и А.Поляр. Адаптивный фильтр Урысона . 2019.

[14] Хайкин С. "Нейронные сети: всеобъемлющий фундамент". Макмиллан, 1999 г.

[15] Warwick K, Ирвин GW, Хант KJ "Нейронные сети для управления и систем". Питер Перегринус, 1992

[:0-16] а б Леннарт., Льюнг (1999). Системная идентификация: теория для пользователя (2-е изд.). Река Аппер Сэдл, штат Нью-Джерси: Prentice Hall PTR. ISBN 978-0136566953. OCLC 38884169 .

[17] Schön, Thomas B .; Линдстен, Фредрик; Далин, Йохан; Вогберг, Йохан; Naesseth, Christian A .; Свенссон, Андреас; Дай, Лян (2015). «Последовательные методы Монте-Карло для идентификации систем **. Работа поддержана проектами« Обучение сложных динамических систем »(номер контракта: 637-2014-466) и« Вероятностное моделирование динамических систем »(номер контракта: 621-2013-5524), оба финансируется Шведским исследовательским советом ". IFAC-PapersOnLine . 48 (28): 775–786. arXiv : 1503.06058 . DOI : 10.1016 / j.ifacol.2015.12.224 .

[18] М. Абдалмоати, «Изучение стохастических нелинейных динамических систем с использованием нестационарных линейных предикторов» , докторская диссертация, Стокгольм, Швеция, 2017. Urn: nbn: se: kth: diva-218100

[19] Абдалмоати, Мохамед Рашид; Хьялмарссон, Хокан (2017). "Имитационная псевдодерматическая идентификация нелинейных моделей по максимуму правдоподобия" . IFAC-PapersOnLine . 50 (1): 14058–14063. DOI : 10.1016 / j.ifacol.2017.08.1841 .

[:1-20] а б Абдалмоати, Мохамед (2019). «Идентификация стохастических нелинейных динамических моделей с использованием оценивающих функций» . Примадонна .

[21] Абдалмоати, Мохамед Рашид-Хилми; Хьялмарссон, Хокан (2019). «Линейные методы прогнозирования ошибок для стохастических нелинейных моделей» . Automatica . 105 : 49–63. DOI : 10.1016 / j.automatica.2019.03.006 .

[1]