Отображение Саммона или проекция Саммона - это алгоритм, который отображает многомерное пространство в пространство более низкой размерности (см. Многомерное масштабирование ), пытаясь сохранить структуру межточечных расстояний в многомерном пространстве в проекции более низкого измерения. Он особенно подходит для использования в исследовательском анализе данных . Этот метод был предложен Джоном В. Сэммоном в 1969 году. [1] Он считается нелинейным подходом, поскольку отображение не может быть представлено как линейная комбинация исходных переменных, насколько это возможно в таких методах, как анализ главных компонентов , который также делает его сложнее использовать для классификационных приложений. [2]
Обозначим расстояние между i- м и j- м объектами в исходном пространстве через, а расстояние между их проекциями на . Отображение Саммона направлено на минимизацию следующей функции ошибок, которую часто называют стрессом Саммона или ошибкой Саммона :
Минимизация может выполняться либо с помощью градиентного спуска , как предлагалось изначально, либо другими способами, обычно с использованием итерационных методов. Количество итераций необходимо определять экспериментально, и не всегда можно гарантировать сходимость решений. Многие реализации предпочитают использовать первые основные компоненты в качестве начальной конфигурации. [3]
Отображение Саммона было одним из самых успешных методов нелинейного метрического многомерного масштабирования с момента его появления в 1969 году, но усилия были сосредоточены на улучшении алгоритма, а не на форме функции напряжения. Производительность отображения Саммона была улучшена за счет расширения его функции напряжения с использованием левой дивергенции Брегмана [4] и правой дивергенции Брегмана. [5]
Рекомендации
- ^ Sammon JW (1969). «Нелинейное отображение для анализа структуры данных» (PDF) . Транзакции IEEE на компьютерах . 18 (5): 401, 402 (отсутствует в PDF), 403–409. DOI : 10.1109 / tc.1969.222678 .
- ^ Лернер, Б; Хьюго Гутерман, Майер Аладжем, Ицхак Динштейн, Ицхак Ромем (1998). «О классификации образцов с нелинейным отображением Саммона - экспериментальное исследование». Распознавание образов . 31 (4): 371–381. DOI : 10.1016 / S0031-3203 (97) 00064-2 .CS1 maint: несколько имен: список авторов ( ссылка )
- ^ Лернер, Б; Х. Гутерман, М. Аладжем и И. Динштейн (2000). «Об инициализации нелинейного отображения Саммона». Анализ шаблонов и приложения . 3 (2): 61–68. CiteSeerX 10.1.1.579.8935 . DOI : 10.1007 / s100440050006 .CS1 maint: несколько имен: список авторов ( ссылка )
- ^ Дж. Сан, М. Кроу, К. Файф (май 2011 г.). «Расширение метрического многомерного шкалирования с расходимостями Брегмана». Распознавание образов . 44 (5): 1137–1154. DOI : 10.1016 / j.patcog.2010.11.013 .CS1 maint: несколько имен: список авторов ( ссылка )
- ^ Дж. Сан, К. Файф, М. Кроу (2011). «Расширение отображения Саммона с расхождениями Брегмана». Информационные науки . 187 : 72–92. DOI : 10.1016 / j.ins.2011.10.013 .CS1 maint: несколько имен: список авторов ( ссылка )
Внешние ссылки
- HiSee - визуализатор с открытым исходным кодом для многомерных данных
- Программа на основе AC # с кодом на CodeProject .
- Код Matlab и введение в метод