Полуопределенное вложение

Развертывание максимальной дисперсии (MVU) , также известное как полуопределенное встраивание (SDE), представляет собой алгоритм в компьютерных науках, который использует полуопределенное программирование для выполнения нелинейного уменьшения размерности многомерных векторных входных данных. ^[1]^[2]^[3]

Это мотивировано наблюдением, что анализ главных компонентов ядра (kPCA) не снижает размерность данных ^[4], поскольку он использует трюк ядра для нелинейного отображения исходных данных во внутреннее пространство продукта .

Алгоритм

MVU создает отображение из входных векторов большой размерности в некоторое евклидово векторное пространство низкой размерности в следующих шагах: ^[5]

Создается граф соседства . Каждый вход связан со своими k-ближайшими входными векторами (согласно метрике евклидова расстояния), а все k-ближайшие соседи связаны друг с другом. Если данные отобраны достаточно хорошо, результирующий график является дискретной аппроксимацией лежащего в основе многообразия.
Граф окрестности «разворачивается» с помощью полуопределенного программирования. Вместо того, чтобы изучать выходные векторы напрямую, полуопределенное программирование направлено на поиск внутренней матрицы произведения, которая максимизирует попарные расстояния между любыми двумя входами, которые не связаны в графе соседства, сохраняя при этом расстояния до ближайших соседей.
В конечном итоге низкоразмерное вложение достигается путем применения многомерного масштабирования к выученной матрице внутреннего продукта.

Шаги применения полуопределенного программирования с последующим шагом уменьшения линейной размерности для восстановления низкоразмерного вложения в евклидово пространство были впервые предложены Линиалом , Лондоном и Рабиновичем. ^[6]

Формулировка оптимизации

Позволять ${\ Displaystyle X \, \!}$ быть исходным вводом и ${\ Displaystyle Y \, \!}$ быть вложением. Если ${\ displaystyle i, j \, \!}$ являются двумя соседями, то необходимо выполнить ограничение локальной изометрии: ^[7]^[8]^[9]

{\ displaystyle | X_ {i} -X_ {j} | ^ {2} = | Y_ {i} -Y_ {j} | ^ {2} \, \!}

Позволять ${\ Displaystyle G, K \, \!}$ быть матрицы Грама из ${\ Displaystyle X \, \!}$ а также ${\ Displaystyle Y \, \!}$ (например: ${\ Displaystyle G_ {ij} = X_ {i} \ cdot X_ {j}, K_ {ij} = Y_ {i} \ cdot Y_ {j} \, \!}$ ). Мы можем выразить указанное выше ограничение для каждой соседней точки ${\ displaystyle i, j \, \!}$ с точки зрения ${\ Displaystyle G, K \, \!}$ : ^[10]^[11]

{\ displaystyle G_ {ii} + G_ {jj} -G_ {ij} -G_ {ji} = K_ {ii} + K_ {jj} -K_ {ij} -K_ {ji} \, \!}

Кроме того, мы также хотим ограничить вложение ${\ Displaystyle Y \, \!}$ центрировать в начале координат: ^[12]^[13]^[14]

${\ displaystyle 0 = | \ sum _ {i} Y_ {i} | ^ {2} \ Leftrightarrow (\ sum _ {i} Y_ {i}) \ cdot (\ sum _ {i} Y_ {i}) \ Leftrightarrow \ sum _ {i, j} Y_ {i} \ cdot Y_ {j} \ Leftrightarrow \ sum _ {i, j} K_ {ij}}$

Как описано выше, за исключением того, что расстояния между соседними точками сохраняются, алгоритм стремится максимизировать попарное расстояние каждой пары точек. Максимизируемая целевая функция: ^[15]^[16]^[17]

${\ displaystyle T (Y) = {\ dfrac {1} {2N}} \ sum _ {i, j} | Y_ {i} -Y_ {j} | ^ {2}}$

Интуитивно максимизация функции, описанной выше, эквивалентна оттягиванию точек как можно дальше друг от друга и, следовательно, «развертыванию» многообразия. Ограничение локальной изометрии ^[18]

Позволять ${\ displaystyle \ tau = max \ {\ eta _ {ij} | Y_ {i} -Y_ {j} | ^ {2} \} \, \!}$ где ${\ displaystyle \ eta _ {ij}: = {\ begin {cases} 1 & {\ mbox {if}} \ i {\ mbox {является соседом}} j \\ 0 & {\ mbox {else}}. \ конец {case}}}$

предотвращает расхождение целевой функции (уход в бесконечность).

Поскольку на графике N точек, расстояние между любыми двумя точками ${\ displaystyle | Y_ {i} -Y_ {j} | ^ {2} \ leq N \ tau \, \!}$ . Затем мы можем оценить целевую функцию следующим образом: ^[19]^[20]

{\ displaystyle T (Y) = {\ dfrac {1} {2N}} \ sum _ {i, j} | Y_ {i} -Y_ {j} | ^ {2} \ leq {\ dfrac {1} { 2N}} \ sum _ {i, j} (N \ tau) ^ {2} = {\ dfrac {N ^ {3} \ tau ^ {2}} {2}} \, \!}

Целевая функция может быть переписана чисто в виде матрицы Грама: ^[21]^[22]^[23]

{\ displaystyle {\ begin {align} T (Y) & {} = {\ dfrac {1} {2N}} \ sum _ {i, j} | Y_ {i} -Y_ {j} | ^ {2} \\ & {} = {\ dfrac {1} {2N}} \ sum _ {i, j} (Y_ {i} ^ {2} + Y_ {j} ^ {2} -Y_ {i} \ cdot Y_ {j} -Y_ {j} \ cdot Y_ {i}) \\ & {} = {\ dfrac {1} {2N}} (\ sum _ {i, j} Y_ {i} ^ {2} + \ сумма _ {i, j} Y_ {j} ^ {2} - \ sum _ {i, j} Y_ {i} \ cdot Y_ {j} - \ sum _ {i, j} Y_ {j} \ cdot Y_ {i}) \\ & {} = {\ dfrac {1} {2N}} (\ sum _ {i, j} Y_ {i} ^ {2} + \ sum _ {i, j} Y_ {j} ^ {2} -0-0) \\ & {} = {\ dfrac {1} {N}} (\ sum _ {i} Y_ {i} ^ {2}) = {\ dfrac {1} {N }} (Tr (K)) \\\ конец {выровнено}} \, \!}

Наконец, оптимизацию можно сформулировать так: ^[24]^[25]^[26]

${\ displaystyle {\ begin {align} & {\ text {Maximize}} && Tr (\ mathbf {K}) \\ & {\ text {subject to}} && \ mathbf {K} \ successq 0, \ sum _ { ij} \ mathbf {K} _ {ij} = 0 \\ & {\ text {and}} && G_ {ii} + G_ {jj} -G_ {ij} -G_ {ji} = K_ {ii} + K_ { jj} -K_ {ij} -K_ {ji}, \ forall i, j {\ mbox {where}} \ eta _ {ij} = 1, \ end {align}}}$

После матрицы Грама ${\ Displaystyle К \, \!}$ изучается полуопределенным программированием, вывод ${\ Displaystyle Y \, \!}$ можно получить с помощью разложения Холецкого .

В частности, матрицу Грама можно записать как ${\ displaystyle K_ {ij} = \ sum _ {\ alpha = 1} ^ {N} (\ lambda _ {\ alpha} V _ {\ alpha i} V _ {\ alpha j}) \, \!}$ где ${\ Displaystyle V _ {\ альфа я} \, \!}$ это i-й элемент собственного вектора ${\ Displaystyle V _ {\ alpha} \, \!}$ собственного значения ${\ displaystyle \ lambda _ {\ alpha} \, \!}$ . ^[27]^[28]

Отсюда следует, что ${\ Displaystyle \ альфа \, \!}$ -й элемент вывода ${\ displaystyle Y_ {i} \, \!}$ является ${\ displaystyle {\ sqrt {\ lambda _ {\ alpha}}} V _ {\ alpha i} \, \!}$ . ^[29]^[30]

Смотрите также

Заметки

^ Вайнбергер, Ша и Саул 2004a
^ Вайнбергер и Сол 2004b
^ Вайнбергер и Сол 2006
^ Лоуренс 2012 , стр. 1612
Перейти ↑ Weinberger, Sha and Saul 2004a , page 7.
^ Linial, Лондон и Рабинович 1995
^ Вайнбергер, Ша и Саул 2004a , страница 3, уравнение 8
^ Вайнбергер и Сол 2004b , страница 3, уравнение 2
^ Вайнбергер и Саул 2006 , стр. 4, уравнение 2
^ Вайнбергер, Ша и Саул 2004a , страница 3, уравнение 9
^ Вайнбергер и Сол 2004b , страница 3, уравнение 3
^ Вайнбергер, Ша и Саул 2004a , страница 3, уравнение 6
^ Вайнбергер и Саул 2004b , страница 3, уравнение 5
^ Вайнбергер и Сол 2006 , стр.5, уравнение 8
^ Вайнбергер, Ша и Саул 2004a , страница 4, уравнение 10
^ Вайнбергер и Сол 2004b , страница 4, уравнение 6
^ Вайнбергер и Саул 2006 , стр. 5, уравнение 4
^ Вайнбергер и Сол 2004b , страница 4, уравнение 7
^ Вайнбергер и Саул 2004b , страница 4, уравнение 8
^ Вайнбергер и Сол 2006 , стр.5, уравнение 6
^ Вайнбергер, Ша и Саул 2004a , страница 4, уравнение 11
^ Weinberger and Saul 2004b , страница 4, уравнение 9
^ Вайнбергер и Саул 2006 , стр. 6, уравнения с 10 по 13
↑ Weinberger, Sha and Saul 2004a , страница 4, раздел 3.3
^ Weinberger and Saul 2004b , страница 4, уравнение 9
^ Вайнбергер и Саул 2006 , стр. 6, уравнения с 10 по 13
^ Вайнбергер и Сол 2004b , страница 4, уравнение 10
^ Вайнбергер и Сол 2006 , стр.7, уравнения 14
^ Вайнбергер и Сол 2004b , страница 4, уравнение 11
^ Вайнбергер и Сол 2006 , стр.7, уравнения 15

Дополнительный материал

Код Килиана К. Вайнбергера MVU Matlab

[1] Вайнбергер, Ша и Саул 2004a

[2] Вайнбергер и Сол 2004b

[3] Вайнбергер и Сол 2006

[4] Лоуренс 2012 , стр. 1612

[5] Перейти ↑ Weinberger, Sha and Saul 2004a , page 7.

[6] Linial, Лондон и Рабинович 1995

[7] Вайнбергер, Ша и Саул 2004a , страница 3, уравнение 8

[8] Вайнбергер и Сол 2004b , страница 3, уравнение 2

[9] Вайнбергер и Саул 2006 , стр. 4, уравнение 2

[10] Вайнбергер, Ша и Саул 2004a , страница 3, уравнение 9

[11] Вайнбергер и Сол 2004b , страница 3, уравнение 3

[12] Вайнбергер, Ша и Саул 2004a , страница 3, уравнение 6

[13] Вайнбергер и Саул 2004b , страница 3, уравнение 5

[14] Вайнбергер и Сол 2006 , стр.5, уравнение 8

[15] Вайнбергер, Ша и Саул 2004a , страница 4, уравнение 10

[16] Вайнбергер и Сол 2004b , страница 4, уравнение 6

[17] Вайнбергер и Саул 2006 , стр. 5, уравнение 4

[18] Вайнбергер и Сол 2004b , страница 4, уравнение 7

[19] Вайнбергер и Саул 2004b , страница 4, уравнение 8

[20] Вайнбергер и Сол 2006 , стр.5, уравнение 6

[21] Вайнбергер, Ша и Саул 2004a , страница 4, уравнение 11

[22] Weinberger and Saul 2004b , страница 4, уравнение 9

[23] Вайнбергер и Саул 2006 , стр. 6, уравнения с 10 по 13

[24] Weinberger, Sha and Saul 2004a , страница 4, раздел 3.3

[25] Weinberger and Saul 2004b , страница 4, уравнение 9

[26] Вайнбергер и Саул 2006 , стр. 6, уравнения с 10 по 13

[27] Вайнбергер и Сол 2004b , страница 4, уравнение 10

[28] Вайнбергер и Сол 2006 , стр.7, уравнения 14

[29] Вайнбергер и Сол 2004b , страница 4, уравнение 11

[30] Вайнбергер и Сол 2006 , стр.7, уравнения 15

[1]