Эта статья включает в себя список литературы , связанной литературы или внешних ссылок , но ее источники остаются неясными, поскольку в ней отсутствуют встроенные цитаты . ( Март 2015 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения ) |
Стратегии естественной эволюции ( NES ) - это семейство алгоритмов численной оптимизации для задач черного ящика . Сходные по духу со стратегиями эволюции , они итеративно обновляют (непрерывные) параметры поискового распределения , следуя естественному градиенту в сторону более высокой ожидаемой пригодности.
Метод [ править ]
Общая процедура заключается в следующем: параметризованное распределение поиска используется для создания пакета точек поиска, и функция пригодности оценивается в каждой такой точке. Параметры распределения (которые включают параметры стратегии ) позволяют алгоритму адаптивно фиксировать (локальную) структуру функции приспособленности. Например, в случае гауссова распределения оно включает среднее значение и ковариационную матрицу . На основе выборок NES оценивает градиент поиска по параметрам в сторону более высокой ожидаемой пригодности. Затем NES выполняет шаг градиентного подъема по естественному градиенту., метод второго порядка, который, в отличие от простого градиента, перенормирует обновление относительно неопределенности. Этот шаг имеет решающее значение, поскольку он предотвращает колебания, преждевременное схождение и нежелательные эффекты, возникающие из-за заданной параметризации. Весь процесс повторяется до тех пор, пока не будет выполнен критерий остановки.
Все члены семейства NES работают по одним и тем же принципам. Они различаются типом распределения вероятностей и используемым методом градиентной аппроксимации . Для разных пространств поиска требуются разные распределения поиска; например, при низкой размерности может быть очень полезно моделировать полную матрицу ковариаций. С другой стороны, для больших измерений более масштабируемой альтернативой является ограничение ковариации только диагональю . Кроме того, многомодальные пространства поиска могут выиграть от более тяжелых распределений (таких как Коши, в отличие от гауссовского). Последнее различие возникает между распределениями, где мы можем аналитически вычислить естественный градиент, и более общими распределениями, где нам нужно оценить его по выборкам.
Поиск градиентов [ править ]
Обозначим через параметры поискового распределения и функцию пригодности, вычисленную в . Затем NES преследует цель максимизировать ожидаемую пригодность при поисковом распределении.
через градиентный подъем . Градиент можно переписать как
то есть, ожидаемое значение из времен лог-производные в . На практике можно использовать приближение Монте-Карло на основе конечного числа выборок.
- .
Наконец, параметры поискового распределения могут обновляться итеративно.
Естественный градиентный подъем [ править ]
Вместо использования простого стохастического градиента для обновлений NES следует естественному градиенту , который, как было показано, обладает многочисленными преимуществами по сравнению с обычным ( ванильным ) градиентом, например:
- направление градиента не зависит от параметризации поискового распределения
- величины обновлений автоматически корректируются в зависимости от неопределенности, что, в свою очередь, ускоряет конвергенцию на плато и гребнях.
Таким образом, обновление NES
- ,
где - информационная матрица Фишера . Матрицу Фишера иногда можно вычислить точно, в противном случае она оценивается по выборкам с повторным использованием логарифмических производных .
Формирование фитнеса [ править ]
NES использует формирование пригодности на основе рангов , чтобы сделать алгоритм более устойчивым и инвариантным относительно монотонно возрастающих преобразований функции приспособленности. Для этого приспособленность населения преобразуется в набор ценностей полезности . Позвольте обозначить i- го лучшего человека. Заменяя пригодность на полезность, оценка градиента становится
- .
Выбор функции полезности - свободный параметр алгоритма.
Псевдокод [ править ]
ввод :1 повтор 2 для do // λ - размер популяции 3 рисовать образец 4 оценить фитнес 5 вычислить логарифмические производные 6 конец 7 назначьте коммунальные услуги // в зависимости от ранга 8 оценить градиент 9 оценка // или вычислить точно 10 параметров обновления // η - скорость обучения11 до тех пор, пока не будет выполнен критерий остановки
См. Также [ править ]
- Эволюционные вычисления
- Стратегия эволюции адаптации ковариационной матрицы (CMA-ES)
Библиография [ править ]
- Д. Виерстра, Т. Шауль, Дж. Петерс и Дж. Шмидхубер (2008). Стратегии естественной эволюции . Конгресс IEEE по эволюционным вычислениям (CEC).
- Ю. Сан, Д. Виерстра, Т. Шауль и Дж. Шмидхубер (2009). Стохастический поиск с использованием естественного градиента . Международная конференция по машинному обучению (ICML).
- Т. Гласмахерс, Т. Шауль, Ю. Сан, Д. Виерстра и Дж. Шмидхубер (2010). Экспоненциальные стратегии естественной эволюции . Конференция по генетическим и эволюционным вычислениям (GECCO).
- Т. Шауль, Т. Гласмахерс и Дж. Шмидхубер (2011). Большие размеры и тяжелые хвосты для стратегий естественной эволюции . Конференция по генетическим и эволюционным вычислениям (GECCO).
- Т. Шауль (2012). Стратегии естественной эволюции сходятся на сферных функциях . Конференция по генетическим и эволюционным вычислениям (GECCO).
Внешние ссылки [ править ]
- Коллекция реализаций NES на разных языках