Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В статистике , ядро Фишер дискриминантный анализ (УПКИ) , [1] , также известный как обобщенный дискриминантный анализ [2] и ядро дискриминантного анализа , [3] является kernelized вариантом линейного дискриминантного анализа (LDA). Он назван в честь Рональда Фишера . Используя трюк с ядром , LDA неявно выполняется в новом пространстве функций, что позволяет изучать нелинейные отображения.

Линейный дискриминантный анализ [ править ]

Интуитивно идея LDA состоит в том, чтобы найти проекцию, в которой разделение классов максимально. Учитывая два набора помеченных данных, и , определите средство класса и как

где - количество примеров класса . Цель линейного дискриминантного анализа состоит в том, чтобы дать большое разделение средних классов, при этом сохраняя при этом небольшую внутриклассовую дисперсию. [4] Это формулируется как максимизация следующего соотношения:

где - матрица ковариации между классами и - матрица общей ковариации внутри класса:

Максимум указанного отношения достигается при

как может быть показано методом множителей Лагранжа (набросок доказательства):

Максимизация эквивалентна максимизации

при условии

Это, в свою очередь, эквивалентно максимизации , где - множитель Лагранжа.

По максимуму производные по и должны быть равны нулю. Принимая урожайность

которому тривиально удовлетворяют и

Уловка ядра с LDA [ править ]

Чтобы расширить LDA до нелинейных отображений, данные, заданные в виде точек, могут быть отображены в новое пространство функций с помощью некоторой функции. В этом новом пространстве функций функция, которую необходимо максимизировать, это [1]

куда

и

Далее обратите внимание на то, что . Явное вычисление сопоставлений с последующим выполнением LDA может быть дорогостоящим с вычислительной точки зрения, а во многих случаях трудноразрешимым. Например, может быть бесконечно размерным. Таким образом, вместо того , чтобы явно картографирования данных , данные может быть неявно встроены переписав алгоритм в терминах точечных продуктов и используя трюк ядра , в котором скалярное произведение в новом художественном пространстве заменяется функцией ядра .

LDA можно переформулировать в терминах скалярных произведений, сначала отметив, что это будет расширение формы [5]

Тогда обратите внимание, что

куда

Тогда числитель можно записать как:

Аналогично знаменатель можно записать как

с компонентом, определенным как единичная матрица, и матрица со всеми элементами, равными . Это тождество можно получить, начав с выражения для и используя расширение и определения и

Используя эти уравнения для числителя и знаменателя , уравнение для может быть переписано как

Тогда дифференцирование и установка равным нулю дает

Поскольку только направление и, следовательно, направление вопросов, вышеупомянутое может быть решено как

Обратите внимание, что на практике это обычно единственное число, поэтому к нему добавляется кратное число [1]

Учитывая решение для , проекция новой точки данных дается как [1]

Мультиклассовый KFD [ править ]

Распространение на случаи, когда существует более двух классов, относительно просто. [2] [6] [7] Позвольте быть количество классов. Затем мультиклассовый KFD включает в себя проектирование данных в -мерное пространство с использованием дискриминантных функций.

Это можно записать в матричных обозначениях

где - столбцы . [6] Кроме того, ковариационная матрица между классами теперь

где - среднее значение всех данных в новом пространстве функций. Ковариационная матрица внутри класса:

Решение теперь получается максимизацией

Снова можно использовать трюк с ядром, и цель мультиклассового KFD становится [7]

где и

Они определены как в предыдущем разделе и определены как

затем можно вычислить, найдя ведущие собственные векторы . [7] Кроме того, проекция новых входных данных, дается формулой [7]

где составляющая дается выражением .

Классификация с использованием KFD [ править ]

Как в двухклассовом, так и в многоклассовом KFD, метка класса нового входа может быть присвоена как [7]

где - прогнозируемое среднее значение для класса, а - функция расстояния.

Приложения [ править ]

Дискриминантный анализ ядра используется во множестве приложений. К ним относятся:

  • Распознавание лиц [3] [8] [9] и обнаружение [10] [11]
  • Распознавание рукописных цифр [1] [12]
  • Распознавание отпечатков пальцев [13]
  • Классификация злокачественных и доброкачественных кластерных микрокальцификатов [14]
  • Классификация семян [2]
  • Поиски бозона Хиггса в ЦЕРНе [15]

См. Также [ править ]

  • Факторный анализ
  • Анализ основных компонентов ядра
  • Уловка ядра
  • Линейный дискриминантный анализ

Ссылки [ править ]

  1. ^ a b c d e Мика, S; Rätsch, G .; Вестон, Дж .; Schölkopf, B .; Мюллер, KR (1999). Дискриминантный анализ Фишера с ядрами . Нейронные сети для обработки сигналов . IX . С. 41–48. CiteSeerX  10.1.1.35.9904 . DOI : 10.1109 / NNSP.1999.788121 . ISBN 978-0-7803-5673-3.
  2. ^ a b c Baudat, G .; Ануар, Ф. (2000). «Обобщенный дискриминантный анализ с использованием ядерного подхода». Нейронные вычисления . 12 (10): 2385–2404. CiteSeerX 10.1.1.412.760 . DOI : 10.1162 / 089976600300014980 . PMID 11032039 .  
  3. ^ a b Li, Y .; Gong, S .; Лидделл, Х. (2003). «Распознавание траекторий лиц с использованием дискриминантного анализа ядра». Вычисления изображений и зрения . 21 (13–14): 1077–1086. CiteSeerX 10.1.1.2.63 15 . DOI : 10.1016 / j.imavis.2003.08.010 . 
  4. Перейти ↑ Bishop, CM (2006). Распознавание образов и машинное обучение . Нью-Йорк, штат Нью-Йорк: Спрингер.
  5. ^ Scholkopf, B; Herbrich, R .; Смола, А. (2001). Обобщенная теорема о представителе . Вычислительная теория обучения . Конспект лекций по информатике. 2111 . С. 416–426. CiteSeerX 10.1.1.42.8617 . DOI : 10.1007 / 3-540-44581-1_27 . ISBN  978-3-540-42343-0.
  6. ^ а б Дуда, Р .; Hart, P .; Аист, Д. (2001). Классификация паттернов . Нью-Йорк, штат Нью-Йорк: Wiley.
  7. ^ a b c d e Zhang, J .; Ма, К.К. (2004). «Дискриминант Фишера ядра для классификации текстур». Cite journal requires |journal= (help)
  8. ^ Лю, Q .; Lu, H .; Ма, С. (2004). «Улучшение ядра дискриминантного анализа Фишера для распознавания лиц». IEEE Transactions on Circuits and Systems for Video Technology . 14 (1): 42–49. DOI : 10.1109 / tcsvt.2003.818352 .
  9. ^ Лю, Q .; Huang, R .; Lu, H .; Ма, С. (2002). «Распознавание лиц с использованием дискриминантного анализа Фишера на основе ядра». Международная конференция IEEE по автоматическому распознаванию лиц и жестов .
  10. ^ Курита, Т .; Тагучи, Т. (2002). Модификация дискриминантного анализа Фишера на основе ядра для обнаружения лиц . Международная конференция IEEE по автоматическому распознаванию лиц и жестов . С. 300–305. CiteSeerX 10.1.1.100.3568 . DOI : 10.1109 / AFGR.2002.1004170 . ISBN  978-0-7695-1602-8.
  11. ^ Feng, Y .; Ши, П. (2004). «Обнаружение лиц на основе дискриминантного анализа ядра Фишера». Международная конференция IEEE по автоматическому распознаванию лиц и жестов .
  12. ^ Ян, J .; Frangi, AF; Ян, JY; Занг, Д., Джин, З. (2005). «KPCA plus LDA: полная дискриминантная структура ядра Fisher для извлечения и распознавания признаков». IEEE Transactions по анализу шаблонов и машинному анализу . 27 (2): 230–244. CiteSeerX 10.1.1.330.1179 . DOI : 10.1109 / tpami.2005.33 . PMID 15688560 .  CS1 maint: multiple names: authors list (link)
  13. ^ Wang, Y .; Руан, К. (2006). «Дискриминантный анализ ядра Фишера для распознавания отпечатков пальцев». Международная конференция по распознаванию образов .
  14. ^ Wei, L .; Ян, Й .; Nishikawa, RM; Цзян, Ю. (2005). «Исследование нескольких методов машинного обучения для классификации злокачественных и доброкачественных кластерных микрокальцификаций». IEEE Transactions по медицинской визуализации . 24 (3): 371–380. DOI : 10.1109 / tmi.2004.842457 .
  15. ^ Мальмгрен, Т. (1997). «Программа итеративного нелинейного дискриминантного анализа: IDA 1.0». Компьютерная физика . 106 (3): 230–236. DOI : 10.1016 / S0010-4655 (97) 00100-8 .

Внешние ссылки [ править ]

  • Дискриминантный анализ ядра в C # - код C # для выполнения KFD.
  • Matlab Toolbox для уменьшения размерности - включает метод для выполнения KFD.
  • Распознавание рукописного текста с использованием дискриминантного анализа ядра - код C #, демонстрирующий распознавание рукописных цифр с использованием KFD.