В машинном обучении , на радиальной базисной функции ядра , или RBF ядра , является популярной функцией ядра используется в различных kernelized алгоритмов обучения. В частности, он обычно используется в машинной классификации опорных векторов . [1]
Ядро RBF на двух выборках x и x ' , представленных как векторы признаков в некотором входном пространстве , определяется как [2]
может быть распознан как квадрат евклидова расстояния между двумя векторами признаков. - свободный параметр. Эквивалентное определение включает параметр :
Поскольку значение ядра RBF уменьшается с расстоянием и колеблется от нуля (в пределе) до единицы (когда x = x ' ), оно имеет готовую интерпретацию как меру подобия . [2] Пространство признаков ядра имеет бесконечное количество измерений; для , его расширение: [3]
Приближения [ править ]
Поскольку машины опорных векторов и другие модели, использующие трюк с ядром , плохо масштабируются для большого количества обучающих выборок или большого количества функций во входном пространстве, было введено несколько приближений к ядру RBF (и аналогичным ядрам). [4] Обычно они принимают форму функции z, которая отображает один вектор в вектор более высокой размерности, аппроксимируя ядро:
где - неявное отображение, встроенное в ядро RBF.
Один из способов построения такого z - это случайная выборка из преобразования Фурье ядра. [5] Другой подход использует метод NYSTROM для аппроксимации eigendecomposition из матрицы Грама K , используя только случайную выборку из обучающего набора. [6]
См. Также [ править ]
- Функция Гаусса
- Ядро (статистика)
- Полиномиальное ядро
- Радиальная базисная функция
- Сеть радиальных базисных функций
- Obst Kernel сеть
Ссылки [ править ]
- ^ Чанг, Инь-Вэнь; Се, Чо-Джуй; Чанг, Кай-Вэй; Ринггаард, Майкл; Лин, Чи-Джен (2010). «Обучение и тестирование полиномиальных отображений данных низкой степени с помощью линейной SVM» . Журнал исследований в области машинного обучения . 11 : 1471–1490.
- ^ Б Жан-Филипп Vert, Кодзи Цуда и Бернхард Скекопф (2004). «Учебник по ядерным методам». Ядерные методы в вычислительной биологии .
- ^ Shashua Амнон (2009). «Введение в машинное обучение: заметки 67577». arXiv : 0904.3664v1 [ cs.LG ].
- ^ Андреас Мюллер (2012). Аппроксимация ядра для эффективных SVM (и другие методы извлечения признаков) .
- ^ Али Рахими и Бенджамин Рехт (2007). «Случайные функции для крупномасштабных ядерных машин» . Системы обработки нейронной информации .
- ^ CKI Уильямс и М. Сигер (2001). «Использование метода Нистрома для ускорения ядерных машин» . Достижения в системах обработки нейронной информации .CS1 maint: uses authors parameter (link)