В математике , А гладкая максимум из индексированного семейства х 1 , ..., х п чисел является гладким приближением к максимальной функции означая параметрическое семейство функций , такие , что для каждой & alpha ; , функция является гладкой, и семейство сходится к максимальной функции как . Аналогично определяется понятие гладкого минимума . Во многих случаях одно семейство аппроксимирует оба: максимум, когда параметр стремится к положительной бесконечности, минимум, когда параметр стремится к отрицательной бесконечности; в символах, каки как . Этот термин также можно свободно использовать для конкретной гладкой функции, которая ведет себя аналогично максимуму, не обязательно являясь частью параметризованного семейства.
Для больших положительных значений параметра следующая формулировка представляет собой гладкую дифференцируемую аппроксимацию функции максимума. Для отрицательных значений параметра, больших по модулю, он приближается к минимуму.
обладает следующими свойствами:
- в виде
- это среднее арифметическое его входов
- в виде
Градиент тесно связан с softmax и определяется выражением
Это делает функцию softmax полезной для методов оптимизации, использующих градиентный спуск .
Еще один плавный максимум - LogSumExp :
Это также можно нормализовать, если все неотрицательные значения, давая функцию с доменом и диапазоном :
Этот термин корректирует тот факт, что путем удаления всех экспонент, кроме одной, и если все они равны нулю.
Еще один гладкий максимум - это p-норма :
который сходится к as .
Преимущество p-нормы в том, что это норма . Таким образом, он «масштабно инвариантен» (однороден): и удовлетворяет треугольному неравенству.
Использование в численных методах [ править ]
| Этот раздел пуст. Вы можете помочь, добавив к нему . ( Февраль 2015 г. ) |
Другие варианты функции сглаживания [ править ]
Где параметр.
М. Ланге, Д. Цюльке, О. Хольц и Т. Виллманн, «Приложения lp-норм и их гладкие аппроксимации для градиентного векторного квантования обучения», в Proc. ESANN , апрель 2014 г., стр. 271-276. ( https://www.elen.ucl.ac.be/Proceedings/esann/esannpdf/es2014-153.pdf )