Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Управление машинным обучением (MLC) - это подраздел машинного обучения , интеллектуального управления и теории управления, которое решает задачи оптимального управления с помощью методов машинного обучения . Ключевые приложения - сложные нелинейные системы, для которых методы линейной теории управления неприменимы.

Типы проблем и задач [ править ]

Обычно встречаются четыре типа проблем.

  • Идентификация параметра управления: MLC преобразуется в идентификацию параметра [1], если структура закона управления указана, но параметры неизвестны. Одним из примеров является генетический алгоритм для оптимизации коэффициентов ПИД-регулятора [2] или оптимального управления с дискретным временем. [3]
  • Дизайн управления как задача регрессии первого типа: MLC аппроксимирует общее нелинейное отображение сигналов датчиков в команды срабатывания, если сигналы датчиков и оптимальная команда срабатывания известны для каждого состояния. Одним из примеров является вычисление обратной связи датчика по известной обратной связи полного состояния . Для этой задачи обычно используется нейронная сеть . [4]
  • Дизайн управления как задача регрессии второго типа: MLC может также определять произвольные нелинейные законы управления, которые минимизируют функцию затрат объекта. В этом случае не нужно знать ни модель, ни структуру закона управления, ни команду срабатывания оптимизатора. Оптимизация основана только на характеристиках управления (функция затрат), измеренных на предприятии. Генетическое программирование - мощный метод регрессии для этой цели. [5]
  • Контроль обучения с подкреплением: закон контроля может постоянно обновляться в зависимости от измеренных изменений производительности (вознаграждений) с использованием обучения с подкреплением . [6]

MLC включает в себя, например, управление нейронной сетью, управление на основе генетических алгоритмов, управление генетическим программированием, управление обучением с подкреплением и имеет методологические пересечения с другими элементами управления, управляемыми данными, такими как искусственный интеллект и управление роботами .

Приложения [ править ]

MLC успешно применяется для решения многих задач нелинейного управления, исследуя неизвестные и часто неожиданные механизмы срабатывания. Примеры приложений включают

  • Контроль высоты спутников. [7]
  • Тепловой контроль здания. [8]
  • Контроль турбулентности с обратной связью. [2] [9]
  • Дистанционно управляемый подводный аппарат. [10]
  • Многие другие инженерные приложения MLC резюмированы в обзорной статье PJ Fleming & RC Purshouse (2002). [11]

Что касается всех общих нелинейных методов, MLC не имеет гарантированной сходимости, оптимальности или устойчивости для ряда рабочих условий.

Ссылки [ править ]

  1. ^ Томас Бэк и Ханс-Пауль Швефель (весна 1993) «Обзор эволюционных алгоритмов для оптимизации параметров» , Журнал эволюционных вычислений (MIT Press) , vol. 1, вып. 1. С. 1-23.
  2. ^ a b Н. Бенар, Ж. Понс-Пратс, Ж. Перьо, Ж. Бугеда, Ж.-П. Боннет и Э. Моро, (2015) «Генетический алгоритм с несколькими входами для экспериментальной оптимизации повторного присоединения после обратного шага с поверхностным плазменным приводом» , статья AIAA 2015-2957 на 46-й конференции AIAA по плазменной динамике и лазерам, Даллас, Техас , США, стр. 1-23.
  3. ^ Збигнев Майклвикс, Цезари З. Janikow & Яцек Б. Кравчик (июль 1992) «Модифицированный генетический алгоритм для задач оптимального управления» , [Компьютеры и математики с приложениями], т. 23, № 12, с. 83-94.
  4. ^ К. Ли, Дж. Ким, Д. Бэбкок и Р. Гудман (1997) "Применение нейронных сетей к управлению турбулентностью для уменьшения сопротивления" , Physics of Fluids , vol. 6, вып. 9. С. 1740-1747.
  5. ^ DC Dracopoulos & S. Kent (декабрь 1997) "Генетическое программирование для прогнозирования и управления" , Neural Computing & Applications (Springer), vol. 6, вып. 4. С. 214-228.
  6. ^ Эндрю Г. Барто (декабрь 1994) "Контроль обучения с подкреплением" , Current Opinion in Neurobiology , vol. 6, вып. 4. С. 888–893.
  7. ^ Димитрис. К. Дракопулос и Антония. Дж. Джонс (1994) Нейрогенетический адаптивный контроль отношения , Neural Computing & Applications (Springer), vol. 2, вып. 4. С. 183-204.
  8. ^ Джонатан А. Райт, Heather A. Loosemore & Raziyeh Farmani (2002) «Оптимизация построения теплового проектирования и управления с помощью многокритериальной генетического алгоритма [Энергетика и строительство], том. 34, вып. 9, стр. 959-972 .
  9. ^ Стивен Дж. Брантон и Бернд Р. Ноак (2015) Контроль турбулентности с замкнутым контуром: прогресс и проблемы , Обзоры прикладной механики , т. 67, нет. 5, статья 050801, с. 1-48.
  10. J. Javadi-Moghaddam, & A. Bagheri (2010 «Адаптивная нейро-нечеткая система управления генетическим алгоритмом на основе скользящего режима для подводного корабля с дистанционным управлением» , Expert Systems with Applications , vol. 37 no. 1, pp. 647- 660.
  11. ^ Питер Дж. Флеминг, RC Purshouse (2002 "Эволюционные алгоритмы в разработке систем управления: обзор" Практика инженерного управления , том 10, № 11, стр. 1223-1241

Дальнейшее чтение [ править ]

  • Димитрис С. Дракопулос (август 1997 г.) "Эволюционные алгоритмы обучения для нейроадаптивного управления" , Springer. ISBN  978-3-540-76161-7 .
  • Томас Дурьез , Стивен Л. Брантон и Бернд Р. Ноак (ноябрь 2016 г.) «Управление машинным обучением - укрощение нелинейной динамики и турбулентности» , Springer. ISBN 978-3-319-40624-4 .