Картирование Саммона

Отображение Саммона или проекция Саммона - это алгоритм, который отображает многомерное пространство в пространство более низкой размерности (см. Многомерное масштабирование ), пытаясь сохранить структуру межточечных расстояний в многомерном пространстве в проекции более низкого измерения. Он особенно подходит для использования в исследовательском анализе данных . Этот метод был предложен Джоном В. Сэммоном в 1969 году. ^[1] Он считается нелинейным подходом, поскольку отображение не может быть представлено как линейная комбинация исходных переменных, насколько это возможно в таких методах, как анализ главных компонентов , который также делает его сложнее использовать для классификационных приложений. ^[2]

Обозначим расстояние между i- м и j- м объектами в исходном пространстве через ${\ displaystyle \ scriptstyle d_ {ij} ^ {*}}$ , а расстояние между их проекциями на ${\ displaystyle \ scriptstyle d_ {ij} ^ {}}$ . Отображение Саммона направлено на минимизацию следующей функции ошибок, которую часто называют стрессом Саммона или ошибкой Саммона :

{\ displaystyle E = {\ frac {1} {\ sum \ limits _ {i }>

Минимизация может выполняться либо с помощью градиентного спуска , как предлагалось изначально, либо другими способами, обычно с использованием итерационных методов. Количество итераций необходимо определять экспериментально, и не всегда можно гарантировать сходимость решений. Многие реализации предпочитают использовать первые основные компоненты в качестве начальной конфигурации. ^[3]

Отображение Саммона было одним из самых успешных методов нелинейного метрического многомерного масштабирования с момента его появления в 1969 году, но усилия были сосредоточены на улучшении алгоритма, а не на форме функции напряжения. Производительность отображения Саммона была улучшена за счет расширения его функции напряжения с использованием левой дивергенции Брегмана ^[4] и правой дивергенции Брегмана. ^[5]

Внешние ссылки

HiSee - визуализатор с открытым исходным кодом для многомерных данных
Программа на основе AC # с кодом на CodeProject .
Код Matlab и введение в метод

Эта статья о статистике незавершена . Вы можете помочь Википедии, расширив ее .

[1] Sammon JW (1969). «Нелинейное отображение для анализа структуры данных» (PDF) . Транзакции IEEE на компьютерах . 18 (5): 401, 402 (отсутствует в PDF), 403–409. DOI : 10.1109 / tc.1969.222678 .

[2] Лернер, Б; Хьюго Гутерман, Майер Аладжем, Ицхак Динштейн, Ицхак Ромем (1998). «О классификации образцов с нелинейным отображением Саммона - экспериментальное исследование». Распознавание образов . 31 (4): 371–381. DOI : 10.1016 / S0031-3203 (97) 00064-2 .CS1 maint: несколько имен: список авторов ( ссылка )

[3] Лернер, Б; Х. Гутерман, М. Аладжем и И. Динштейн (2000). «Об инициализации нелинейного отображения Саммона». Анализ шаблонов и приложения . 3 (2): 61–68. CiteSeerX 10.1.1.579.8935 . DOI : 10.1007 / s100440050006 .CS1 maint: несколько имен: список авторов ( ссылка )

[4] Дж. Сан, М. Кроу, К. Файф (май 2011 г.). «Расширение метрического многомерного шкалирования с расходимостями Брегмана». Распознавание образов . 44 (5): 1137–1154. DOI : 10.1016 / j.patcog.2010.11.013 .CS1 maint: несколько имен: список авторов ( ссылка )

[5] Дж. Сан, К. Файф, М. Кроу (2011). «Расширение отображения Саммона с расхождениями Брегмана». Информационные науки . 187 : 72–92. DOI : 10.1016 / j.ins.2011.10.013 .CS1 maint: несколько имен: список авторов ( ссылка )

[1]

Картирование Саммона

Рекомендации

Внешние ссылки