Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В машинном обучении , на радиальной базисной функции ядра , или RBF ядра , является популярной функцией ядра используется в различных kernelized алгоритмов обучения. В частности, он обычно используется в машинной классификации опорных векторов . [1]

Ядро RBF на двух выборках x и x ' , представленных как векторы признаков в некотором входном пространстве , определяется как [2]

может быть распознан как квадрат евклидова расстояния между двумя векторами признаков. - свободный параметр. Эквивалентное определение включает параметр :

Поскольку значение ядра RBF уменьшается с расстоянием и колеблется от нуля (в пределе) до единицы (когда x = x ' ), оно имеет готовую интерпретацию как меру подобия . [2] Пространство признаков ядра имеет бесконечное количество измерений; для , его расширение: [3]

Приближения [ править ]

Поскольку машины опорных векторов и другие модели, использующие трюк с ядром , плохо масштабируются для большого количества обучающих выборок или большого количества функций во входном пространстве, было введено несколько приближений к ядру RBF (и аналогичным ядрам). [4] Обычно они принимают форму функции z, которая отображает один вектор в вектор более высокой размерности, аппроксимируя ядро:

где - неявное отображение, встроенное в ядро ​​RBF.

Один из способов построения такого z - это случайная выборка из преобразования Фурье ядра. [5] Другой подход использует метод NYSTROM для аппроксимации eigendecomposition из матрицы Грама K , используя только случайную выборку из обучающего набора. [6]

См. Также [ править ]

Ссылки [ править ]

  1. ^ Чанг, Инь-Вэнь; Се, Чо-Джуй; Чанг, Кай-Вэй; Ринггаард, Майкл; Лин, Чи-Джен (2010). «Обучение и тестирование полиномиальных отображений данных низкой степени с помощью линейной SVM» . Журнал исследований в области машинного обучения . 11 : 1471–1490.
  2. ^ Б Жан-Филипп Vert, Кодзи Цуда и Бернхард Скекопф (2004). «Учебник по ядерным методам». Ядерные методы в вычислительной биологии .
  3. ^ Shashua Амнон (2009). «Введение в машинное обучение: заметки 67577». arXiv : 0904.3664v1 [ cs.LG ].
  4. ^ Андреас Мюллер (2012). Аппроксимация ядра для эффективных SVM (и другие методы извлечения признаков) .
  5. ^ Али Рахими и Бенджамин Рехт (2007). «Случайные функции для крупномасштабных ядерных машин» . Системы обработки нейронной информации .
  6. ^ CKI Уильямс и М. Сигер (2001). «Использование метода Нистрома для ускорения ядерных машин» . Достижения в системах обработки нейронной информации .CS1 maint: uses authors parameter (link)