В статистике , ядро Фишер дискриминантный анализ (УПКИ) , [1] , также известный как обобщенный дискриминантный анализ [2] и ядро дискриминантного анализа , [3] является kernelized вариантом линейного дискриминантного анализа (LDA). Он назван в честь Рональда Фишера . Используя трюк с ядром , LDA неявно выполняется в новом пространстве функций, что позволяет изучать нелинейные отображения.
Интуитивно идея LDA состоит в том, чтобы найти проекцию, в которой разделение классов максимально. Учитывая два набора помеченных данных, и , определите средство класса и как
где - количество примеров класса . Цель линейного дискриминантного анализа состоит в том, чтобы дать большое разделение средних классов, при этом сохраняя при этом небольшую внутриклассовую дисперсию. [4] Это формулируется как максимизация следующего соотношения:
где - матрица ковариации между классами и - матрица общей ковариации внутри класса:
Максимум указанного отношения достигается при
как может быть показано методом множителей Лагранжа (набросок доказательства):
Максимизация эквивалентна максимизации
при условии
Это, в свою очередь, эквивалентно максимизации , где - множитель Лагранжа.
По максимуму производные по и должны быть равны нулю. Принимая урожайность
Чтобы расширить LDA до нелинейных отображений, данные, заданные в виде точек, могут быть отображены в новое пространство функций с помощью некоторой функции. В этом новом пространстве функций функция, которую необходимо максимизировать, это [1]
куда
и
Далее обратите внимание на то, что . Явное вычисление сопоставлений с последующим выполнением LDA может быть дорогостоящим с вычислительной точки зрения, а во многих случаях трудноразрешимым. Например, может быть бесконечно размерным. Таким образом, вместо того , чтобы явно картографирования данных , данные может быть неявно встроены переписав алгоритм в терминах точечных продуктов и используя трюк ядра , в котором скалярное произведение в новом художественном пространстве заменяется функцией ядра .
LDA можно переформулировать в терминах скалярных произведений, сначала отметив, что это будет расширение формы [5]
Тогда обратите внимание, что
куда
Тогда числитель можно записать как:
Аналогично знаменатель можно записать как
с компонентом, определенным как единичная матрица, и матрица со всеми элементами, равными . Это тождество можно получить, начав с выражения для и используя расширение и определения и
Используя эти уравнения для числителя и знаменателя , уравнение для может быть переписано как
Тогда дифференцирование и установка равным нулю дает
Поскольку только направление и, следовательно, направление вопросов, вышеупомянутое может быть решено как
Обратите внимание, что на практике это обычно единственное число, поэтому к нему добавляется кратное число [1]
Учитывая решение для , проекция новой точки данных дается как [1]
Распространение на случаи, когда существует более двух классов, относительно просто. [2] [6] [7] Позвольте быть количество классов. Затем мультиклассовый KFD включает в себя проектирование данных в -мерное пространство с использованием дискриминантных функций.
Это можно записать в матричных обозначениях
где - столбцы . [6] Кроме того, ковариационная матрица между классами теперь
где - среднее значение всех данных в новом пространстве функций. Ковариационная матрица внутри класса:
Решение теперь получается максимизацией
Снова можно использовать трюк с ядром, и цель мультиклассового KFD становится [7]
где и
Они определены как в предыдущем разделе и определены как
затем можно вычислить, найдя ведущие собственные векторы . [7] Кроме того, проекция новых входных данных, дается формулой [7]
Классификация злокачественных и доброкачественных кластерных микрокальцификатов [14]
Классификация семян [2]
Поиски бозона Хиггса в ЦЕРНе [15]
См. Также [ править ]
Факторный анализ
Анализ основных компонентов ядра
Уловка ядра
Линейный дискриминантный анализ
Ссылки [ править ]
^ a b c d e Мика, S; Rätsch, G .; Вестон, Дж .; Schölkopf, B .; Мюллер, KR (1999). Дискриминантный анализ Фишера с ядрами . Нейронные сети для обработки сигналов . IX . С. 41–48. CiteSeerX 10.1.1.35.9904 . DOI : 10.1109 / NNSP.1999.788121 . ISBN 978-0-7803-5673-3.
^ a b c Baudat, G .; Ануар, Ф. (2000). «Обобщенный дискриминантный анализ с использованием ядерного подхода». Нейронные вычисления . 12 (10): 2385–2404. CiteSeerX 10.1.1.412.760 . DOI : 10.1162 / 089976600300014980 . PMID 11032039 .
^ a b Li, Y .; Gong, S .; Лидделл, Х. (2003). «Распознавание траекторий лиц с использованием дискриминантного анализа ядра». Вычисления изображений и зрения . 21 (13–14): 1077–1086. CiteSeerX 10.1.1.2.63 15 . DOI : 10.1016 / j.imavis.2003.08.010 .
Перейти ↑ Bishop, CM (2006). Распознавание образов и машинное обучение . Нью-Йорк, штат Нью-Йорк: Спрингер.
^ Scholkopf, B; Herbrich, R .; Смола, А. (2001). Обобщенная теорема о представителе . Вычислительная теория обучения . Конспект лекций по информатике. 2111 . С. 416–426. CiteSeerX 10.1.1.42.8617 . DOI : 10.1007 / 3-540-44581-1_27 . ISBN 978-3-540-42343-0.
^ а б Дуда, Р .; Hart, P .; Аист, Д. (2001). Классификация паттернов . Нью-Йорк, штат Нью-Йорк: Wiley.
^ a b c d e Zhang, J .; Ма, К.К. (2004). «Дискриминант Фишера ядра для классификации текстур».Cite journal requires |journal= (help)
^ Лю, Q .; Lu, H .; Ма, С. (2004). «Улучшение ядра дискриминантного анализа Фишера для распознавания лиц». IEEE Transactions on Circuits and Systems for Video Technology . 14 (1): 42–49. DOI : 10.1109 / tcsvt.2003.818352 .
^ Лю, Q .; Huang, R .; Lu, H .; Ма, С. (2002). «Распознавание лиц с использованием дискриминантного анализа Фишера на основе ядра». Международная конференция IEEE по автоматическому распознаванию лиц и жестов .
^ Курита, Т .; Тагучи, Т. (2002). Модификация дискриминантного анализа Фишера на основе ядра для обнаружения лиц . Международная конференция IEEE по автоматическому распознаванию лиц и жестов . С. 300–305. CiteSeerX 10.1.1.100.3568 . DOI : 10.1109 / AFGR.2002.1004170 . ISBN 978-0-7695-1602-8.
^ Feng, Y .; Ши, П. (2004). «Обнаружение лиц на основе дискриминантного анализа ядра Фишера». Международная конференция IEEE по автоматическому распознаванию лиц и жестов .
^ Ян, J .; Frangi, AF; Ян, JY; Занг, Д., Джин, З. (2005). «KPCA plus LDA: полная дискриминантная структура ядра Fisher для извлечения и распознавания признаков». IEEE Transactions по анализу шаблонов и машинному анализу . 27 (2): 230–244. CiteSeerX 10.1.1.330.1179 . DOI : 10.1109 / tpami.2005.33 . PMID 15688560 .CS1 maint: multiple names: authors list (link)
^ Wang, Y .; Руан, К. (2006). «Дискриминантный анализ ядра Фишера для распознавания отпечатков пальцев». Международная конференция по распознаванию образов .
^ Wei, L .; Ян, Й .; Nishikawa, RM; Цзян, Ю. (2005). «Исследование нескольких методов машинного обучения для классификации злокачественных и доброкачественных кластерных микрокальцификаций». IEEE Transactions по медицинской визуализации . 24 (3): 371–380. DOI : 10.1109 / tmi.2004.842457 .
^ Мальмгрен, Т. (1997). «Программа итеративного нелинейного дискриминантного анализа: IDA 1.0». Компьютерная физика . 106 (3): 230–236. DOI : 10.1016 / S0010-4655 (97) 00100-8 .
Внешние ссылки [ править ]
Дискриминантный анализ ядра в C # - код C # для выполнения KFD.
Matlab Toolbox для уменьшения размерности - включает метод для выполнения KFD.
Распознавание рукописного текста с использованием дискриминантного анализа ядра - код C #, демонстрирующий распознавание рукописных цифр с использованием KFD.