Управление машинным обучением

Управление машинным обучением (MLC) - это подраздел машинного обучения , интеллектуального управления и теории управления, которое решает задачи оптимального управления с помощью методов машинного обучения . Ключевые приложения - сложные нелинейные системы, для которых методы линейной теории управления неприменимы.

Типы проблем и задач [ править ]

Обычно встречаются четыре типа проблем.

Идентификация параметра управления: MLC преобразуется в идентификацию параметра ^[1], если структура закона управления указана, но параметры неизвестны. Одним из примеров является генетический алгоритм для оптимизации коэффициентов ПИД-регулятора ^[2] или оптимального управления с дискретным временем. ^[3]
Дизайн управления как задача регрессии первого типа: MLC аппроксимирует общее нелинейное отображение сигналов датчиков в команды срабатывания, если сигналы датчиков и оптимальная команда срабатывания известны для каждого состояния. Одним из примеров является вычисление обратной связи датчика по известной обратной связи полного состояния . Для этой задачи обычно используется нейронная сеть . ^[4]
Дизайн управления как задача регрессии второго типа: MLC может также определять произвольные нелинейные законы управления, которые минимизируют функцию затрат объекта. В этом случае не нужно знать ни модель, ни структуру закона управления, ни команду срабатывания оптимизатора. Оптимизация основана только на характеристиках управления (функция затрат), измеренных на предприятии. Генетическое программирование - мощный метод регрессии для этой цели. ^[5]
Контроль обучения с подкреплением: закон контроля может постоянно обновляться в зависимости от измеренных изменений производительности (вознаграждений) с использованием обучения с подкреплением . ^[6]

MLC включает в себя, например, управление нейронной сетью, управление на основе генетических алгоритмов, управление генетическим программированием, управление обучением с подкреплением и имеет методологические пересечения с другими элементами управления, управляемыми данными, такими как искусственный интеллект и управление роботами .

Приложения [ править ]

MLC успешно применяется для решения многих задач нелинейного управления, исследуя неизвестные и часто неожиданные механизмы срабатывания. Примеры приложений включают

Контроль высоты спутников. ^[7]
Тепловой контроль здания. ^[8]
Контроль турбулентности с обратной связью. ^[2]^[9]
Дистанционно управляемый подводный аппарат. ^[10]
Многие другие инженерные приложения MLC резюмированы в обзорной статье PJ Fleming & RC Purshouse (2002). ^[11]

Что касается всех общих нелинейных методов, MLC не имеет гарантированной сходимости, оптимальности или устойчивости для ряда рабочих условий.

Ссылки [ править ]

^ Томас Бэк и Ханс-Пауль Швефель (весна 1993) «Обзор эволюционных алгоритмов для оптимизации параметров» , Журнал эволюционных вычислений (MIT Press) , vol. 1, вып. 1. С. 1-23.
^ ^a ^b Н. Бенар, Ж. Понс-Пратс, Ж. Перьо, Ж. Бугеда, Ж.-П. Боннет и Э. Моро, (2015) «Генетический алгоритм с несколькими входами для экспериментальной оптимизации повторного присоединения после обратного шага с поверхностным плазменным приводом» , статья AIAA 2015-2957 на 46-й конференции AIAA по плазменной динамике и лазерам, Даллас, Техас , США, стр. 1-23.
^ Збигнев Майклвикс, Цезари З. Janikow & Яцек Б. Кравчик (июль 1992) «Модифицированный генетический алгоритм для задач оптимального управления» , [Компьютеры и математики с приложениями], т. 23, № 12, с. 83-94.
^ К. Ли, Дж. Ким, Д. Бэбкок и Р. Гудман (1997) "Применение нейронных сетей к управлению турбулентностью для уменьшения сопротивления" , Physics of Fluids , vol. 6, вып. 9. С. 1740-1747.
^ DC Dracopoulos & S. Kent (декабрь 1997) "Генетическое программирование для прогнозирования и управления" , Neural Computing & Applications (Springer), vol. 6, вып. 4. С. 214-228.
^ Эндрю Г. Барто (декабрь 1994) "Контроль обучения с подкреплением" , Current Opinion in Neurobiology , vol. 6, вып. 4. С. 888–893.
^ Димитрис. К. Дракопулос и Антония. Дж. Джонс (1994) Нейрогенетический адаптивный контроль отношения , Neural Computing & Applications (Springer), vol. 2, вып. 4. С. 183-204.
^ Джонатан А. Райт, Heather A. Loosemore & Raziyeh Farmani (2002) «Оптимизация построения теплового проектирования и управления с помощью многокритериальной генетического алгоритма [Энергетика и строительство], том. 34, вып. 9, стр. 959-972 .
^ Стивен Дж. Брантон и Бернд Р. Ноак (2015) Контроль турбулентности с замкнутым контуром: прогресс и проблемы , Обзоры прикладной механики , т. 67, нет. 5, статья 050801, с. 1-48.
↑ J. Javadi-Moghaddam, & A. Bagheri (2010 «Адаптивная нейро-нечеткая система управления генетическим алгоритмом на основе скользящего режима для подводного корабля с дистанционным управлением» , Expert Systems with Applications , vol. 37 no. 1, pp. 647- 660.
^ Питер Дж. Флеминг, RC Purshouse (2002 "Эволюционные алгоритмы в разработке систем управления: обзор" Практика инженерного управления , том 10, № 11, стр. 1223-1241

Дальнейшее чтение [ править ]

Димитрис С. Дракопулос (август 1997 г.) "Эволюционные алгоритмы обучения для нейроадаптивного управления" , Springer. ISBN 978-3-540-76161-7 .
Томас Дурьез , Стивен Л. Брантон и Бернд Р. Ноак (ноябрь 2016 г.) «Управление машинным обучением - укрощение нелинейной динамики и турбулентности» , Springer. ISBN 978-3-319-40624-4 .

[Baeck1993-1] Томас Бэк и Ханс-Пауль Швефель (весна 1993) «Обзор эволюционных алгоритмов для оптимизации параметров» , Журнал эволюционных вычислений (MIT Press) , vol. 1, вып. 1. С. 1-23.

[Benard2015aiaa-2] Н. Бенар, Ж. Понс-Пратс, Ж. Перьо, Ж. Бугеда, Ж.-П. Боннет и Э. Моро, (2015) «Генетический алгоритм с несколькими входами для экспериментальной оптимизации повторного присоединения после обратного шага с поверхностным плазменным приводом» , статья AIAA 2015-2957 на 46-й конференции AIAA по плазменной динамике и лазерам, Даллас, Техас , США, стр. 1-23.

[3] Збигнев Майклвикс, Цезари З. Janikow & Яцек Б. Кравчик (июль 1992) «Модифицированный генетический алгоритм для задач оптимального управления» , [Компьютеры и математики с приложениями], т. 23, № 12, с. 83-94.

[4] К. Ли, Дж. Ким, Д. Бэбкок и Р. Гудман (1997) "Применение нейронных сетей к управлению турбулентностью для уменьшения сопротивления" , Physics of Fluids , vol. 6, вып. 9. С. 1740-1747.

[5] DC Dracopoulos & S. Kent (декабрь 1997) "Генетическое программирование для прогнозирования и управления" , Neural Computing & Applications (Springer), vol. 6, вып. 4. С. 214-228.

[6] Эндрю Г. Барто (декабрь 1994) "Контроль обучения с подкреплением" , Current Opinion in Neurobiology , vol. 6, вып. 4. С. 888–893.

[7] Димитрис. К. Дракопулос и Антония. Дж. Джонс (1994) Нейрогенетический адаптивный контроль отношения , Neural Computing & Applications (Springer), vol. 2, вып. 4. С. 183-204.

[8] Джонатан А. Райт, Heather A. Loosemore & Raziyeh Farmani (2002) «Оптимизация построения теплового проектирования и управления с помощью многокритериальной генетического алгоритма [Энергетика и строительство], том. 34, вып. 9, стр. 959-972 .

[9] Стивен Дж. Брантон и Бернд Р. Ноак (2015) Контроль турбулентности с замкнутым контуром: прогресс и проблемы , Обзоры прикладной механики , т. 67, нет. 5, статья 050801, с. 1-48.

[10] J. Javadi-Moghaddam, & A. Bagheri (2010 «Адаптивная нейро-нечеткая система управления генетическим алгоритмом на основе скользящего режима для подводного корабля с дистанционным управлением» , Expert Systems with Applications , vol. 37 no. 1, pp. 647- 660.

[11] Питер Дж. Флеминг, RC Purshouse (2002 "Эволюционные алгоритмы в разработке систем управления: обзор" Практика инженерного управления , том 10, № 11, стр. 1223-1241

[1],