Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

В стесненном оптимизации , поле математики , A барьерная функция является непрерывной функцией , значение которой на точку возрастает до бесконечности, что и точка приближается к границе допустимой области задачи оптимизации. [1] [2] Такие функции используются для замены ограничений неравенства штрафным членом в целевой функции, с которым легче справиться.

Двумя наиболее распространенными типами барьерных функций являются обратные барьерные функции и логарифмические барьерные функции. Возобновление интереса к логарифмическим барьерным функциям было мотивировано их связью с методами прямодвойственных внутренних точек .

Мотивация [ править ]

Рассмотрим следующую задачу оптимизации с ограничениями:

минимизировать f ( x )
при условии xb

где b - некоторая постоянная. Если кто-то хочет удалить ограничение неравенства, проблема может быть переформулирована как

минимизировать f ( x ) + c ( x ) ,
где c ( x ) = ∞, если x < b , и ноль в противном случае.

Эта проблема эквивалентна первой. Это избавляет от неравенства, но вводит проблему, заключающуюся в том, что функция штрафа c и, следовательно, целевая функция f ( x ) + c ( x ) , являются прерывистыми , что не позволяет использовать исчисление для ее решения.

Барьерная функция теперь представляет собой непрерывное приближение g к c, которое стремится к бесконечности, когда x приближается к b сверху. С помощью такой функции формулируется новая задача оптимизации, а именно.

минимизировать f ( x ) + μ g ( x )

где μ > 0 - свободный параметр. Эта проблема не эквивалентна исходной, но по мере приближения μ к нулю она становится все лучшим приближением. [3]

Логарифмическая барьерная функция [ править ]

Для логарифмических барьерных функций определяется как когда, так и иначе (в одном измерении. См. Ниже определение в более высоких измерениях). Это по существу зависит от того факта, что стремится к отрицательной бесконечности, как стремится к 0.

Это вводит градиент в оптимизируемую функцию, который поддерживает менее экстремальные значения (в данном случае значения ниже, чем ), в то же время оказывая относительно небольшое влияние на функцию вдали от этих крайних значений .

Логарифмические барьерные функции могут иметь преимущество перед менее затратными в вычислительном отношении обратными барьерными функциями в зависимости от оптимизируемой функции.

Высшие измерения [ править ]

Расширение до более высоких измерений просто при условии, что каждое измерение является независимым. Для каждой переменной, значение которой должно быть строго меньше , добавьте .

Формальное определение [ править ]

Свернуть при условии

Допустим строго выполнимо:

Определить логарифмический барьер

См. Также [ править ]

Ссылки [ править ]

  1. Нестеров, Юрий (2018). Лекции по выпуклой оптимизации (2-е изд.). Чам, Швейцария: Springer. п. 56. ISBN 978-3-319-91577-7.
  2. ^ Нокедаль, Хорхе; Райт, Стивен (2006). Численная оптимизация (2-е изд.). Нью-Йорк, штат Нью-Йорк: Спрингер. п. 566. ISBN. 0-387-30303-0.
  3. ^ Вандербей, Роберт Дж. (2001). Линейное программирование: основы и расширения . Kluwer. С. 277–279.

Внешние ссылки [ править ]