Разложение тензорного ранга

В полилинейной алгебре , то разложение тензора ранга или каноническое полиадическое разложение (CPD) является одним обобщением матрицы сингулярного разложения (SVD) для тензоров , которые нашли применение в статистике , обработки сигналов , компьютерное зрения , компьютерной графики , психометрии , лингвистики и хемометрия . Разложение по тензорным рангам было введено Хичкоком в 1927 году ^[1] и позже переоткрыто несколько раз, особенно в психометрике. ^[2]^[3] По этой причине разложение тензорного ранга часто называют CANDECOMP,^[2] PARAFAC,^[3] или CANDECOMP / PARAFAC (CP).

Другое популярное обобщение матрицы SVD известно как разложение по сингулярным числам высшего порядка .

Обозначение

Скалярная переменная обозначается строчными курсивными буквами, ${\ displaystyle a}$ а постоянный скаляр обозначается заглавной курсивной буквой, ${\ displaystyle A}$ .

Индексы обозначаются комбинацией строчных и прописных курсивных букв, ${\ displaystyle 1 \ leq i \ leq I}$ . Множественные индексы, с которыми можно столкнуться при обращении к множественным модам тензора, удобно обозначать как ${\ displaystyle 1 \ leq i_ {m} \ leq I_ {m}}$ где ${\ Displaystyle 1 \ Leq M \ Leq M}$ .

Вектор обозначается строчными полужирными буквами Times Roman, ${\ Displaystyle \ mathbf {а}}$ а матрица обозначается жирным шрифтом в верхнем регистре ${\ displaystyle \ mathbf {A}}$ .

Тензор высшего порядка обозначается каллиграфическими буквами, ${\ displaystyle {\ mathcal {A}}}$ . Элемент ${\ displaystyle M}$ тензор порядка ${\ displaystyle {\ mathcal {A}} \ in \ mathbb {C} ^ {I_ {1} \ times I_ {2} \ times \ dots I_ {m} \ times \ dots I_ {M}}}$ обозначается ${\ displaystyle a_ {i_ {1}, i_ {2}, \ dots, i_ {m}, \ dots i_ {M}}}$ или же ${\ displaystyle {\ mathcal {A}} _ {i_ {1}, i_ {2}, \ dots, i_ {m}, \ dots i_ {M}}}$ .

Определение

Тензор - это полилинейное преобразование, которое отображает набор векторных пространств в другое векторное пространство. Тензор данных - это набор многомерных наблюдений, организованных в M-образный массив.

Рассмотрим тензор данных ${\ displaystyle F ^ {I_ {1} \ times I_ {2} \ times \ ldots \ times I_ {M}} \ cong F ^ {I_ {1}} \ otimes F ^ {I_ {2}} \ otimes \ ldots \ otimes F ^ {I_ {M}}}$ , где ${\ displaystyle F}$ это либо реальное поле ${\ Displaystyle \ mathbb {R}}$ или сложное поле ${\ Displaystyle \ mathbb {C}}$ . Каждые (заказ- ${\ displaystyle M}$ , относится к количеству мод) тензор в этом пространстве может быть представлен достаточно большим ${\ displaystyle r}$ как линейная комбинация ${\ displaystyle r}$ тензоры ранга 1:

{\ displaystyle {\ mathcal {A}} = \ sum _ {i = 1} ^ {r} \ lambda _ {r} \ mathbf {a} _ {1, i} \ otimes \ mathbf {a} _ {2 , i} \ dots \ otimes \ mathbf {a} _ {m, i} \ otimes \ cdots \ otimes \ mathbf {a} _ {M, i},}

где ${\ displaystyle \ lambda _ {i} \ in F}$ а также ${\ displaystyle \ mathbf {a} _ {m, i} \ in F ^ {I_ {m}}}$ где ${\ Displaystyle 1 \ Leq M \ Leq M}$ . Когда количество сроков ${\ displaystyle r}$ минимально в приведенном выше выражении, то ${\ displaystyle r}$ называется рангом тензора, а разложение часто называют разложением (тензорного) ранга , минимальным CP-разложением или каноническим полиадическим разложением (CPD) . Напротив, если количество членов не минимально, то указанное выше разложение часто называют ${\ displaystyle r}$ -членная декомпозиция , CANDECOMP / PARAFAC или полиадическая декомпозиция .

Тензорный ранг

В отличие от случая матриц, ранг тензора в настоящее время недостаточно изучен. Известно, что задача вычисления ранга тензора NP-сложна . ^[4] Единственный известный хорошо понятный случай состоит из тензоров в ${\ displaystyle F ^ {I_ {m}} \ время F ^ {I_ {n}} \ время F ^ {2}}$ , ранг которого может быть получен из нормальной формы Кронекера - Вейерштрасса пучка линейных матриц, который представляет тензор. ^[5] Существует простой алгоритм с полиномиальным временем для подтверждения того, что тензор имеет ранг 1, а именно разложение по сингулярным значениям высшего порядка .

Ранг тензора нулей условно равен нулю. Ранг тензора ${\ displaystyle \ mathbf {a} _ {1} \ otimes \ cdots \ otimes \ mathbf {a} _ {M}}$ один, при условии, что ${\ displaystyle \ mathbf {a} _ {m} \ in F ^ {I_ {m}} \ setminus \ {0 \}}$ .

Полевая зависимость

Ранг тензора зависит от поля, по которому тензор разлагается. Известно, что некоторые вещественные тензоры могут допускать комплексное разложение, ранг которого строго меньше ранга действительного разложения того же тензора. В качестве примера ^[6] рассмотрим следующий вещественный тензор

{\ displaystyle {\ mathcal {A}} = \ mathbf {x} _ {1} \ otimes \ mathbf {x} _ {2} \ otimes \ mathbf {x} _ {3} + \ mathbf {x} _ { 1} \ otimes \ mathbf {y} _ {2} \ otimes \ mathbf {y} _ {3} - \ mathbf {y} _ {1} \ otimes \ mathbf {x} _ {2} \ otimes \ mathbf { y} _ {3} + \ mathbf {y} _ {1} \ otimes \ mathbf {y} _ {2} \ otimes \ mathbf {x} _ {3},}

где ${\ displaystyle \ mathbf {x} _ {i}, \ mathbf {y} _ {j} \ in \ mathbb {R} ^ {2}}$ . Известно, что ранг этого тензора по действительным числам равен 3, в то время как его комплексный ранг равен только 2, потому что он является суммой комплексного тензора ранга 1 с его комплексно сопряженным элементом , а именно

{\ displaystyle {\ mathcal {A}} = {\ frac {1} {2}} ({\ bar {\ mathbf {z}}} _ {1} \ otimes \ mathbf {z} _ {2} \ otimes {\ bar {\ mathbf {z}}} _ {3} + \ mathbf {z} _ {1} \ otimes {\ bar {\ mathbf {z}}} _ {2} \ otimes \ mathbf {z} _ {3}),}

где ${\ Displaystyle \ mathbf {z} _ {k} = \ mathbf {x} _ {k} + я \ mathbf {y} _ {k}}$ .

Напротив, ранг реальных матриц никогда не будет уменьшаться при расширении поля до ${\ Displaystyle \ mathbb {C}}$ : ранг действительной матрицы и ранг комплексной матрицы совпадают для действительных матриц.

Общий ранг

Общий ранг ${\ Displaystyle г (I_ {1}, \ ldots, I_ {M})}$ определяется как наименьший ранг ${\ displaystyle r}$ такое, что замыкание в топологии Зарисского множества тензоров ранга не выше ${\ displaystyle r}$ это все пространство ${\ displaystyle F ^ {I_ {1}} \ otimes \ cdots \ otimes F ^ {I_ {M}}}$ . В случае комплексных тензоров тензоры ранга не выше ${\ Displaystyle г (I_ {1}, \ ldots, I_ {M})}$ образуют плотный набор ${\ displaystyle S}$ : каждый тензор в вышеупомянутом пространстве либо имеет ранг меньше, чем общий ранг, либо это предел в евклидовой топологии последовательности тензоров из ${\ displaystyle S}$ . В случае вещественных тензоров набор тензоров ранга не выше ${\ Displaystyle г (I_ {1}, \ ldots, I_ {M})}$ только образует открытое множество положительной меры в евклидовой топологии. Могут существовать евклидово открытые множества тензоров ранга строго выше общего ранга. Все ранги, появляющиеся на открытых множествах в евклидовой топологии, называются типичными рангами . Наименьший типичный ранг называется общим рангом; это определение применимо как к комплексным, так и к действительным тензорам. Общий ранг тензорных пространств был первоначально изучен в 1983 году Фолькером Штрассеном . ^[7]

В качестве иллюстрации приведенных выше концепций известно, что как 2, так и 3 являются типичными рангами ${\ Displaystyle \ mathbb {R} ^ {2} \ otimes \ mathbb {R} ^ {2} \ otimes \ mathbb {R} ^ {2}}$ в то время как общий ранг ${\ displaystyle \ mathbb {C} ^ {2} \ otimes \ mathbb {C} ^ {2} \ otimes \ mathbb {C} ^ {2}}$ равно 2. Практически это означает, что вещественный тензор, выбранный случайным образом (из непрерывной вероятностной меры на пространстве тензоров), имеет размер ${\ Displaystyle 2 \ раз 2 \ раз 2}$ будет тензором ранга 1 с вероятностью ноль, тензором ранга 2 с положительной вероятностью и тензором ранга 3 с положительной вероятностью. С другой стороны, случайно выбранный комплексный тензор того же размера будет тензором ранга 1 с вероятностью ноль, тензором ранга 2 с вероятностью один и тензором ранга 3 с вероятностью ноль. Известно даже, что типичный вещественный тензор ранга 3 в ${\ Displaystyle \ mathbb {R} ^ {2} \ otimes \ mathbb {R} ^ {2} \ otimes \ mathbb {R} ^ {2}}$ будет иметь комплексный ранг, равный 2.

Общий ранг тензорных пространств зависит от различия между сбалансированными и несбалансированными тензорными пространствами. Тензорное пространство ${\ displaystyle F ^ {I_ {1}} \ otimes \ cdots \ otimes F ^ {I_ {M}}}$ , где ${\ Displaystyle I_ {1} \ geq I_ {2} \ geq \ cdots \ geq I_ {M}}$ , называется несбалансированным, когда

{\ displaystyle I_ {1}> 1+ \ prod _ {m = 2} ^ {M} I_ {m} - \ sum _ {m = 2} ^ {M} (I_ {m} -1),}

в противном случае он называется сбалансированным .

Несбалансированные тензорные пространства

Когда первый множитель очень велик по сравнению с другими множителями в тензорном произведении, тогда тензорное пространство по существу ведет себя как матричное пространство. Общий ранг тензоров, живущих в несбалансированных тензорных пространствах, как известно, равен

{\ displaystyle r (I_ {1}, \ ldots, I_ {M}) = \ min \ left \ {I_ {1}, \ prod _ {m = 2} ^ {M} I_ {m} \ right \} }

почти везде . Точнее, ранг каждого тензора в несбалансированном тензорном пространстве ${\ Displaystyle F ^ {I_ {1} \ times \ cdots \ times I_ {M}} \ setminus Z}$ , где ${\ displaystyle Z}$ - некоторое неопределенное замкнутое множество в топологии Зарисского, равняется указанному выше значению. ^[8]

Сбалансированные тензорные пространства

Ожидаемый общий ранг тензоров , живущих в сбалансированном пространстве тензоров равно

{\ displaystyle r_ {E} (I_ {1}, \ ldots, I_ {M}) = \ left \ lceil {\ frac {\ Pi} {\ Sigma +1}} \ right \ rceil}

почти всюду для комплексных тензоров и на евклидово-открытом множестве для вещественных тензоров, где

{\ displaystyle \ Pi = \ prod _ {m = 1} ^ {M} I_ {m} \ quad {\ text {and}} \ quad \ Sigma = \ sum _ {m = 1} ^ {M} (I_ {m} -1).}

Точнее, ранг каждого тензора в ${\ Displaystyle \ mathbb {C} ^ {I_ {1} \ times \ cdots \ times I_ {M}} \ setminus Z}$ , где ${\ displaystyle Z}$ - некоторое неопределенное замкнутое множество в топологии Зарисского , как ожидается, будет равно указанному выше значению. ^[9] Для вещественных тензоров ${\ displaystyle r_ {E} (I_ {1}, \ ldots, I_ {M})}$ - наименьший ранг, который, как ожидается, встречается на множестве положительной евклидовой меры. Значение ${\ displaystyle r_ {E} (I_ {1}, \ ldots, I_ {M})}$ часто называют ожидаемым общим рангом тензорного пространства ${\ Displaystyle F ^ {I_ {1} \ times \ cdots \ times I_ {M}}}$ потому что это верно только предположительно. Известно, что истинный общий ранг всегда удовлетворяет

{\ displaystyle r (I_ {1}, \ ldots, I_ {M}) \ geq r_ {E} (I_ {1}, \ ldots, I_ {M}).}

Гипотеза Або – Оттавиани – Петерсона ^[9] утверждает, что равенство ожидается, т. Е. ${\ displaystyle r (I_ {1}, \ ldots, I_ {M}) = r_ {E} (I_ {1}, \ ldots, I_ {M})}$ , со следующими исключительными случаями:

${\ displaystyle F ^ {4 \ times 4 \ times 3}}$
${\ Displaystyle F ^ {(2m + 1) \ times (2m + 1) \ times 3} {\ text {with}} m = 1,2, \ ldots}$
${\ displaystyle F ^ {(m + 1) \ times (m + 1) \ times 2 \ times 2} {\ text {with}} m = 2,3, \ ldots}$

В каждом из этих исключительных случаев общий ранг, как известно, равен ${\ displaystyle r (I_ {1}, \ ldots, I_ {m}, \ ldots, I_ {M}) = r_ {E} (I_ {1}, \ ldots, I_ {M}) + 1}$ . Отметим, что в то время как набор тензоров ранга 3 в ${\ Displaystyle F ^ {2 \ раз 2 \ раз 2 \ раз 2}}$ является дефектным (13, а не ожидаемым 14), общий ранг в этом пространстве все еще является ожидаемым, 4.

Гипотеза АОП полностью доказана в ряде частных случаев. Ликтейг еще в 1985 году показал, что ${\ Displaystyle г (п, п, п) = г_ {Е} (п, п, п)}$ , при условии, что ${\ Displaystyle п \ neq 3}$ . ^[10] В 2011 году большой прорыв был сделан Каталисано, Герамита и Джимильяно, которые доказали, что ожидаемая размерность множества рангов ${\ displaystyle s}$ тензоры формата ${\ Displaystyle 2 \ раз 2 \ раз \ cdots \ раз 2}$ является ожидаемым, за исключением тензоров ранга 3 в четырехфакторном случае, но ожидаемый ранг в этом случае по-прежнему равен 4. Как следствие, ${\ Displaystyle г (2,2, \ ldots, 2) = r_ {E} (2,2, \ ldots, 2)}$ для всех бинарных тензоров. ^[11]

Максимальный ранг

Максимальный ранг , который может быть принят любой из тензоров в пространстве тензоров неизвестно в целом; отсутствует даже предположение об этом максимальном ранге. В настоящее время лучшая общая верхняя оценка утверждает, что максимальный ранг ${\ displaystyle r _ {\ mbox {max}} (I_ {1}, \ ldots, I_ {M})}$ из ${\ displaystyle F ^ {I_ {1}} \ otimes \ cdots \ otimes F ^ {I_ {M}}}$ , где ${\ Displaystyle I_ {1} \ geq I_ {2} \ geq \ cdots \ geq I_ {M}}$ , удовлетворяет

{\ displaystyle r _ {\ mbox {max}} (I_ {1}, \ ldots, I_ {M}) \ leq \ min \ left \ {\ prod _ {m = 2} ^ {M} I_ {m}, 2 \ cdot r (I_ {1}, \ ldots, I_ {M}) \ right \},}

где ${\ Displaystyle г (I_ {1}, \ ldots, I_ {M})}$ является ( как минимум) общий ранг из ${\ displaystyle F ^ {I_ {1}} \ otimes \ cdots \ otimes F ^ {I_ {M}}}$ . ^[12] Как известно, указанное выше неравенство может быть строгим. Например, общий ранг тензоров в ${\ Displaystyle \ mathbb {R} ^ {2 \ times 2 \ times 2}}$ равно двум, так что приведенная выше оценка дает ${\ Displaystyle г _ {\ mbox {макс}} (2,2,2) \ leq 4}$ , а известно, что максимальный ранг равен 3. ^[6]

Пограничный ранг

Ранг- ${\ displaystyle s}$ тензор ${\ displaystyle {\ mathcal {A}}}$ называется граничным тензором, если существует последовательность тензоров ранга не выше ${\ displaystyle r$ чей предел ${\ displaystyle {\ mathcal {A}}}$ . Если ${\ displaystyle r}$ это наименьшее значение , для которого такая последовательность сходится существует, то она называется граница ранга из ${\ displaystyle {\ mathcal {A}}}$ . Для тензоров порядка 2, т. Е. Матриц, ранг и граничный ранг всегда совпадают, однако для тензоров порядка ${\ displaystyle \ geq 3}$ они могут отличаться. Тензоры границ были впервые изучены в контексте алгоритмов быстрого приближенного умножения матриц Бини, Лотти и Романи в 1980 году ^[13].

Классическим примером тензора границы является тензор ранга 3

{\ displaystyle {\ mathcal {A}} = \ mathbf {u} \ otimes \ mathbf {u} \ otimes \ mathbf {v} + \ mathbf {u} \ otimes \ mathbf {v} \ otimes \ mathbf {u} + \ mathbf {v} \ otimes \ mathbf {u} \ otimes \ mathbf {u}, \ quad {\ text {with}} \ | \ mathbf {u} \ | = \ | \ mathbf {v} \ | = 1 {\ text {and}} \ langle \ mathbf {u}, \ mathbf {v} \ rangle \ neq 1.}

Его можно сколь угодно хорошо аппроксимировать следующей последовательностью тензоров ранга 2

{\ displaystyle {\ begin {align} {\ mathcal {A}} _ {m} & = m (\ mathbf {u} + {\ frac {1} {m}} \ mathbf {v}) \ otimes (\ mathbf {u} + {\ frac {1} {m}} \ mathbf {v}) \ otimes (\ mathbf {u} + {\ frac {1} {m}} \ mathbf {v}) -m \ mathbf {u} \ otimes \ mathbf {u} \ otimes \ mathbf {u} \\ & = \ mathbf {u} \ otimes \ mathbf {u} \ otimes \ mathbf {v} + \ mathbf {u} \ otimes \ mathbf {v} \ otimes \ mathbf {u} + \ mathbf {v} \ otimes \ mathbf {u} \ otimes \ mathbf {u} + {\ frac {1} {m}} (\ mathbf {u} \ otimes \ mathbf {v} \ otimes \ mathbf {v} + \ mathbf {v} \ otimes \ mathbf {u} \ otimes \ mathbf {v} + \ mathbf {v} \ otimes \ mathbf {v} \ otimes \ mathbf {u }) + {\ frac {1} {m ^ {2}}} \ mathbf {v} \ otimes \ mathbf {v} \ otimes \ mathbf {v} \ end {align}}}

в виде ${\ displaystyle m \ to \ infty}$ . Следовательно, его граничный ранг равен 2, что строго меньше его ранга. Когда два вектора ортогональны, этот пример также известен как состояние W .

Характеристики

Идентифицируемость

Из определения чистого тензора следует, что ${\ displaystyle {\ mathcal {A}} = \ mathbf {a} _ {1} \ otimes \ mathbf {a} _ {2} \ otimes \ cdots \ otimes \ mathbf {a} _ {M} = \ mathbf { b} _ {1} \ otimes \ mathbf {b} _ {2} \ otimes \ cdots \ otimes \ mathbf {b} _ {M}}$ тогда и только тогда, когда существует ${\ displaystyle \ lambda _ {k}}$ такой, что ${\ displaystyle \ lambda _ {1} \ lambda _ {2} \ cdots \ lambda _ {M} = 1}$ а также ${\ displaystyle \ mathbf {a} ^ {m} = \ lambda _ {m} \ mathbf {b} _ {m}}$ для всех м . По этой причине параметры ${\ displaystyle \ {\ mathbf {a} _ {m} \} _ {m = 1} ^ {M}}$ тензора ранга 1 ${\ displaystyle {\ mathcal {A}}}$ называются идентифицируемыми или по существу уникальными. Ранг- ${\ displaystyle r}$ тензор ${\ displaystyle {\ mathcal {A}} \ in F ^ {I_ {1}} \ otimes F ^ {I_ {2}} \ otimes \ cdots \ otimes F ^ {I_ {M}}}$ называется идентифицируемым, если каждое его разложение тензорного ранга является суммой одного и того же набора ${\ displaystyle r}$ различные тензоры ${\ displaystyle \ {{\ mathcal {A}} _ {1}, {\ mathcal {A}} _ {2}, \ ldots, {\ mathcal {A}} _ {r} \}}$ где ${\ Displaystyle {\ mathcal {A}} _ {я}}$ имеют ранг 1. Опознаваемый ранг - ${\ displaystyle r}$ таким образом, имеет только одно существенно уникальное разложение

{\ displaystyle {\ mathcal {A}} = \ sum _ {i = 1} ^ {r} {\ mathcal {A}} _ {i},}

и все

{\ displaystyle r!}

разложения тензорного ранга

{\ displaystyle {\ mathcal {A}}}

можно получить перестановкой порядка слагаемых. Заметим, что в разложении тензорного ранга все

{\ Displaystyle {\ mathcal {A}} _ {я}}

различны, иначе ранг

{\ displaystyle {\ mathcal {A}}}

было бы самое большее

{\ displaystyle r-1}

.

Общая идентифицируемость

Тензоры порядка 2 в ${\ displaystyle F ^ {I_ {1}} \ otimes F ^ {I_ {2}} \ simeq F ^ {I_ {1} \ times I_ {2}}}$ , т.е. матрицы, не идентифицируются для ${\ displaystyle r> 1}$ . По существу это следует из наблюдения

{\ displaystyle {\ mathcal {A}} = \ sum _ {i = 1} ^ {r} \ mathbf {a} _ {i} \ otimes \ mathbf {b} _ {i} = \ sum _ {i = 1} ^ {r} \ mathbf {a} _ {i} \ mathbf {b} _ {i} ^ {T} = AB ^ {T} = (AX ^ {- 1}) (BX ^ {T}) ^ {T} = \ sum _ {i = 1} ^ {r} \ mathbf {c} _ {i} \ mathbf {d} _ {i} ^ {T} = \ sum _ {i = 1} ^ { r} \ mathbf {c} _ {i} \ otimes \ mathbf {d} _ {i},}

где

{\ Displaystyle X \ in \ mathrm {GL} _ {r} (F)}

обратимый

{\ Displaystyle г \ раз г}

матрица

{\ Displaystyle А = [\ mathbf {а} _ {я}] _ {я = 1} ^ {г}}

,

{\ displaystyle B = [\ mathbf {b} _ {i}] _ {i = 1} ^ {r}}

,

{\ displaystyle AX ^ {- 1} = [\ mathbf {c} _ {i}] _ {i = 1} ^ {r}}

а также

{\ displaystyle BX ^ {T} = [\ mathbf {d} _ {i}] _ {i = 1} ^ {r}}

. Можно показать ^[14], что для каждого

{\ displaystyle X \ in \ mathrm {GL} _ {n} (F) \ setminus Z}

, где

{\ displaystyle Z}

является замкнутым множеством в топологии Зарисского, разложение в правой части представляет собой сумму другого набора тензоров ранга 1, чем разложение в левой части, что влечет за собой эти тензоры порядка 2 ранга

{\ displaystyle r> 1}

в целом не идентифицируются.

Ситуация полностью меняется для тензоров высших порядков в ${\ displaystyle F ^ {I_ {1}} \ otimes F ^ {I_ {2}} \ otimes \ cdots \ otimes F ^ {I_ {M}}}$ с участием ${\ displaystyle M> 2}$ и все ${\ displaystyle I_ {m} \ geq 2}$ . Для простоты обозначений, без ограничения общности предположим, что множители упорядочены так, что ${\ Displaystyle I_ {1} \ geq I_ {2} \ geq \ cdots \ geq I_ {M} \ geq 2}$ . Позволять ${\ displaystyle S_ {r} \ subset F ^ {I_ {1}} \ otimes \ cdots F ^ {I_ {m}} \ otimes \ cdots \ otimes F ^ {I_ {M}}}$ обозначим множество тензоров ранга, ограниченного ${\ displaystyle r}$ . Затем следующее утверждение было доказано с помощью компьютерного доказательства для всех пространств размерности ${\ displaystyle \ Pi <15000}$ , ^[15] и предполагается, что это справедливо в целом: ^[15]^[16]^[17]

Существует замкнутое множество ${\ displaystyle Z_ {r}}$ в топологии Зарисского такая, что каждый тензор ${\ Displaystyle {\ mathcal {A}} \ в S_ {r} \ setminus Z_ {r}}$ идентифицируемый ( ${\ displaystyle S_ {r}}$ в этом случае называется обобщенно идентифицируемым ), если не выполняется один из следующих исключительных случаев:

Ранг слишком велик: ${\ displaystyle r> r_ {E} (I_ {1}, I_ {2}, \ ldots, I_ {M})}$ ;
Пространство несбалансировано идентифицируемостью, т. Е. ${\ textstyle I_ {1}> \ prod _ {m = 2} ^ {M} i_ {m} - \ sum _ {m = 2} ^ {M} (I_ {m} -1)}$ , и ранг слишком велик: ${\ textstyle r \ geq \ prod _ {m = 2} ^ {M} I_ {m} - \ sum _ {m = 2} ^ {M} (I_ {m} -1)}$ ;
Пространство - дефектный корпус ${\ displaystyle F ^ {4} \ otimes F ^ {4} \ otimes F ^ {3}}$ и ранг ${\ displaystyle r = 5}$ ;
Пространство - дефектный корпус ${\ displaystyle F ^ {n} \ otimes F ^ {n} \ otimes F ^ {2} \ otimes F ^ {2}}$ , где ${\ Displaystyle п \ geq 2}$ , а ранг ${\ displaystyle r = 2n-1}$ ;
Пространство ${\ displaystyle F ^ {4} \ otimes F ^ {4} \ otimes F ^ {4}}$ и ранг ${\ displaystyle r = 6}$ ;
Пространство ${\ displaystyle F ^ {6} \ otimes F ^ {6} \ otimes F ^ {3}}$ и ранг ${\ displaystyle r = 8}$ ; или же
Пространство ${\ displaystyle F ^ {2} \ otimes F ^ {2} \ otimes F ^ {2} \ otimes F ^ {2} \ otimes F ^ {2}}$ и ранг ${\ displaystyle r = 5}$ .
Пространство идеальное, т.е. ${\ textstyle r_ {E} (I_ {1}, I_ {2}, \ ldots, I_ {M}) = {\ frac {\ Pi} {\ Sigma +1}}}$ является целым числом, а ранг равен ${\ textstyle r = r_ {E} (I_ {1}, I_ {2}, \ ldots, I_ {M})}$ .

В этих исключительных случаях общее (а также минимальное) количество комплексных разложений равно

оказался ${\ displaystyle \ infty}$ в первых 4 случаях;
в случае 5 оказалось два; ^[18]
ожидается, что ^[19] будет шесть в случае 6;
в случае 7 оказалось два; ^[20] и
Ожидается, что ^[19] будет не менее двух в случае 8, за исключением двух идентифицируемых случаев ${\ displaystyle F ^ {5} \ otimes F ^ {4} \ otimes F ^ {3}}$ а также ${\ displaystyle F ^ {3} \ otimes F ^ {2} \ otimes F ^ {2} \ otimes F ^ {2}}$ .

Таким образом, общий тензор порядка ${\ displaystyle M> 2}$ и ранг ${\ textstyle г <{\ гидроразрыва {\ Pi} {\ Sigma +1}}}$ то, что не является идентифицируемым - предполагается, что несбалансированный будет идентифицируемым (по модулю исключительных случаев в небольших помещениях).

Некорректность задачи стандартного приближения

Задача аппроксимации ранга требует ранга ${\ displaystyle r}$ наиболее близкое (в обычной евклидовой топологии) разложение к некоторому рангу ${\ displaystyle s}$ тензор ${\ displaystyle {\ mathcal {A}}}$ , где ${\ displaystyle r$ . То есть пытаются решить

{\ displaystyle \ min _ {\ mathbf {a} _ {i} ^ {m} \ in F ^ {I_ {m}}} \ | {\ mathcal {A}} - \ sum _ {i = 1} ^ {r} \ mathbf {a} _ {i} ^ {1} \ otimes \ mathbf {a} _ {i} ^ {2} \ otimes \ cdots \ otimes \ mathbf {a} _ {i} ^ {M} \ | _ {F},}

где ${\ Displaystyle \ | \ cdot \ | _ {F}}$ - норма Фробениуса .

В статье де Сильвы и Лима 2008 г. ^[6] было показано, что указанная выше стандартная задача аппроксимации может быть некорректной . Решение вышеупомянутой проблемы может иногда не существовать, потому что набор, по которому выполняется оптимизация, не закрыт. Таким образом, минимизатор может не существовать, даже если существует инфимум. В частности, известно, что некоторые так называемые граничные тензоры могут быть сколь угодно хорошо аппроксимированы последовательностью тензоров ранга не более ${\ displaystyle r}$ , хотя предел последовательности сходится к тензору ранга строго выше, чем ${\ displaystyle r}$ . Тензор 3-го ранга

{\ displaystyle {\ mathcal {A}} = \ mathbf {u} \ otimes \ mathbf {u} \ otimes \ mathbf {v} + \ mathbf {u} \ otimes \ mathbf {v} \ otimes \ mathbf {u} + \ mathbf {v} \ otimes \ mathbf {u} \ otimes \ mathbf {u}, \ quad {\ text {with}} \ | \ mathbf {u} \ | = \ | \ mathbf {v} \ | = 1 {\ text {и}} \ langle \ mathbf {u}, \ mathbf {v} \ rangle \ neq 1}

можно сколь угодно хорошо аппроксимировать следующей последовательностью тензоров ранга 2

{\ displaystyle {\ mathcal {A}} _ {n} = n (\ mathbf {u} + {\ frac {1} {n}} \ mathbf {v}) \ otimes (\ mathbf {u} + {\ frac {1} {n}} \ mathbf {v}) \ otimes (\ mathbf {u} + {\ frac {1} {n}} \ mathbf {v}) -n \ mathbf {u} \ otimes \ mathbf {u} \ otimes \ mathbf {u}}

в виде ${\ Displaystyle п \ к \ infty}$ . Этот пример четко иллюстрирует общий принцип, согласно которому последовательность рангов - ${\ displaystyle r}$ тензоры, сходящиеся к тензору строго более высокого ранга, должны допускать по крайней мере два отдельных члена ранга 1, нормы которых становятся неограниченными. Формулируется формально, когда последовательность

{\ displaystyle {\ mathcal {A}} _ {n} = \ sum _ {i = 1} ^ {r} \ mathbf {a} _ {i, n} ^ {1} \ otimes \ mathbf {a} _ {i, n} ^ {2} \ otimes \ cdots \ otimes \ mathbf {a} _ {i, n} ^ {M}}

имеет свойство, что ${\ displaystyle {\ mathcal {A}} _ {n} \ to {\ mathcal {A}}}$ (в евклидовой топологии) как ${\ Displaystyle п \ к \ infty}$ , то должно существовать хотя бы ${\ Displaystyle 1 \ Leq я \ NEQ J \ Leq г}$ такой, что

{\ displaystyle \ | \ mathbf {a} _ {i, n} ^ {1} \ otimes \ mathbf {a} _ {i, n} ^ {2} \ otimes \ cdots \ otimes \ mathbf {a} _ { i, n} ^ {M} \ | _ {F} \ to \ infty {\ text {and}} \ | \ mathbf {a} _ {j, n} ^ {1} \ otimes \ mathbf {a} _ {j, n} ^ {2} \ otimes \ cdots \ otimes \ mathbf {a} _ {j, n} ^ {M} \ | _ {F} \ to \ infty}

в виде ${\ Displaystyle п \ к \ infty}$ . Это явление часто встречается при попытке аппроксимировать тензор с помощью алгоритмов численной оптимизации. Иногда это называют проблемой расходящихся компонентов . Кроме того, было показано, что случайный тензор низкого ранга над вещественными числами может не допускать приближения ранга 2 с положительной вероятностью, что привело к пониманию того, что проблема некорректности является важным фактором при использовании разложения по тензорному рангу.

Обычное частичное решение проблемы некорректности состоит в наложении дополнительного ограничения неравенства, которое ограничивает норму отдельных членов ранга 1 некоторой константой. Другие ограничения, которые приводят к замкнутому набору и, следовательно, к корректной задаче оптимизации, включают наложение положительности или ограниченного внутреннего продукта, строго меньшего, чем единица, между членами ранга 1, появляющимися в искомой декомпозиции.

Расчет CPD

Чередующиеся алгоритмы:

альтернативный метод наименьших квадратов (ALS)
чередующаяся послойная диагонализация (ASD)

Прямые алгоритмы:

карандашные алгоритмы ^[21]^[22]^[23]^[24]^[25]^[26]^[27]
моментные алгоритмы ^[28]

Общие алгоритмы оптимизации:

одновременная диагонализация (SD)
одновременное обобщенное разложение Шура (SGSD)
Левенберг-Марквардт (LM)
нелинейный сопряженный градиент (NCG)
ограниченная память BFGS (L-BFGS)

Общие алгоритмы решения полиномиальной системы:

продолжение гомотопии ^[29]

Приложения

В машинном обучении CP-декомпозиция является центральным ингредиентом в обучении вероятностных моделей скрытых переменных с помощью техники согласования моментов. Например, рассмотрим многовидовую модель ^[30], которая представляет собой вероятностную модель скрытых переменных. В этой модели создание выборок постулируется следующим образом: существует скрытая случайная величина, которая не наблюдается напрямую, при условии, что существует несколько условно независимых случайных величин, известных как различные «представления» скрытой переменной. Для простоты предположим, что есть три симметричных вида. ${\ displaystyle x}$ из ${\ displaystyle k}$ -состояние категориальная скрытая переменная ${\ displaystyle h}$ . Тогда эмпирический третий момент этой модели скрытых переменных можно записать как: ${\ displaystyle T = \ sum _ {i = 1} ^ {k} Pr (h = i) E [x | h = i] ^ {\ otimes 3}}$ .

В таких приложениях, как тематическое моделирование , это можно интерпретировать как совместное появление слов в документе. Тогда собственные значения этого тензора эмпирического момента можно интерпретировать как вероятность выбора конкретной темы и каждого столбца фактор-матрицы. ${\ Displaystyle Е [х | ч = к]}$ соответствует вероятностям слов в лексике в соответствующей теме.

Смотрите также

Скрытый анализ класса
Мультилинейное подпространственное обучение
Разложение по сингулярным числам
Разложение Таккера
Разложение по сингулярным числам высшего порядка
Тензорная декомпозиция

дальнейшее чтение

Колда, Тамара Г .; Бадер, Бретт В. (2009). «Тензорные декомпозиции и приложения». SIAM Ред . 51 (3): 455–500. CiteSeerX 10.1.1.153.2059 . DOI : 10.1137 / 07070111X .
Ландсберг, Джозеф М. (2012). Тензоры: геометрия и приложения . AMS.

Внешние ссылки

Учебное пособие по PARAFAC
Параллельный факторный анализ (PARAFAC)
FactoMineR (бесплатное программное обеспечение для многомерного анализа данных, связанное с R )

[1] FL Хичкок (1927). «Выражение тензора или полиадики как суммы произведений». Журнал математики и физики . 6 : 164–189.

[cc1970-2] а б Кэрролл, JD ; Чанг, Дж. (1970). «Анализ индивидуальных различий в многомерном масштабировании с помощью n- стороннего обобщения разложения Эккарта – Юнга». Психометрика . 35 (3): 283–319. DOI : 10.1007 / BF02310791 .

[h1970-3] а б Харшман, Ричард А. (1970). «Основы процедуры PARAFAC: модели и условия для« пояснительного »многомодального факторного анализа» (PDF) . Рабочие документы UCLA по фонетике . 16 : 84. № 10,085. Архивировано из оригинального (PDF) 10 октября 2004 года.

[4] Хиллар, CJ ; Лим, Л. (2013). «Большинство тензорных задач NP-Hard». Журнал ACM . 60 (6): 1–39. arXiv : 0911.1393 . DOI : 10.1145 / 2512329 .

[5] Ландсберг, JM (2012). Тензоры: геометрия и приложения . AMS.

[dSL2008-6] а б в де Сильва, В .; Лим, Л. (2008). «Тензорный ранг и некорректность задачи наилучшего приближения низкого ранга». Журнал SIAM по матричному анализу и приложениям . 30 (3): 1084–1127. arXiv : math / 0607647 . DOI : 10.1137 / 06066518x .

[7] Штрассен, В. (1983). «Ранг и оптимальное вычисление типовых тензоров» . Линейная алгебра и ее приложения . 52/53: 645–685. DOI : 10.1016 / 0024-3795 (83) 80041-X .

[8] Каталисано, М.В .; Герамита, А.В .; Джимильяно, А. (2002). «Ряды тензоров, секущие разновидности разновидностей Сегре и жирные точки» . Линейная алгебра и ее приложения . 355 : 263–285. DOI : 10.1016 / s0024-3795 (02) 00352-X .

[aop2009-9] а б Або, Х .; Оттавиани, Г .; Петерсон, К. (2009). «Индукция для секущих разновидностей разновидностей Сегре». Труды Американского математического общества . 361 (2): 767–792. arXiv : math / 0607191 . DOI : 10,1090 / s0002-9947-08-04725-9 .

[10] Ликтейг, Томас (1985). «Типичный тензорный ранг» . Линейная алгебра и ее приложения . 69 : 95–120. DOI : 10.1016 / 0024-3795 (85) 90070-9 .

[11] Каталисано, М.В .; Герамита, А.В .; Джимильяно, А. (2011). "Секущие разновидности ${\ Displaystyle \ mathbb {P}}$ ¹ × ··· × ${\ Displaystyle \ mathbb {P}}$ ¹ ( n раз) не являются дефектными для n ≥ 5 ". Журнал алгебраической геометрии . 20 (2): 295–327. Doi : 10.1090 / s1056-3911-10-00537-0 .

[12] Блехкерман, Г .; Тейтлер, З. (2014). «По высшим, типовым и родовым рангам». Mathematische Annalen . В прессе. (3–4): 1–11. arXiv : 1402.2371 . DOI : 10.1007 / s00208-014-1150-3 .

[13] Бини, Д .; Lotti, G .; Романи, Ф. (1980). «Приближенные решения вычислительной задачи билинейной формы». Журнал СИАМ по научным вычислениям . 9 (4): 692–697. DOI : 10.1137 / 0209053 .

[14] Харрис, Джо (1992). Алгебраическая геометрия SpringerLink . Тексты для выпускников по математике. 133 . DOI : 10.1007 / 978-1-4757-2189-8 . ISBN 978-1-4419-3099-6.

[:6-15] а б Chiantini, L .; Оттавиани, G .; Ванневенховен, Н. (01.01.2014). "Алгоритм универсальной и специфической идентифицируемости низкого ранга сложных тензоров". Журнал SIAM по матричному анализу и приложениям . 35 (4): 1265–1287. arXiv : 1403.4157 . DOI : 10.1137 / 140961389 . ISSN 0895-4798 .

[16] Боччи, Криштиану; Кьянтини, Лука; Оттавиани, Джорджио (2014-12-01). «Уточненные методы идентифицируемости тензоров». Annali di Matematica Pura ed Applicata . 193 (6): 1691–1702. arXiv : 1303,6915 . DOI : 10.1007 / s10231-013-0352-8 . ISSN 0373-3114 .

[17] Chiantini, L .; Оттавиани, G .; Ванневенховен, Н. (01.01.2017). «Эффективные критерии специфической идентифицируемости тензоров и форм». Журнал SIAM по матричному анализу и приложениям . 38 (2): 656–681. arXiv : 1609.00123 . DOI : 10.1137 / 16m1090132 . ISSN 0895-4798 .

[18] Chiantini, L .; Оттавиани, Г. (01.01.2012). «Об универсальной идентифицируемости 3-тензоров малого ранга». Журнал SIAM по матричному анализу и приложениям . 33 (3): 1018–1037. arXiv : 1103.2696 . DOI : 10.1137 / 110829180 . ISSN 0895-4798 .

[:7-19] а б Hauenstein, JD; Oeding, L .; Оттавиани, G .; Сомме, AJ (2016). «Гомотопические методы тензорной декомпозиции и идеальной идентифицируемости». J. Reine Angew. Математика . arXiv : 1501,00090 . DOI : 10,1515 / Крелль-2016-0067 .

[20] Боччи, Криштиану; Кьянтини, Лука (2013). «Об идентифицируемости бинарных продуктов Segre» . Журнал алгебраической геометрии . 22 (1): 1–11. arXiv : 1105,3643 . DOI : 10,1090 / s1056-3911-2011-00592-4 . ISSN 1056-3911 .

[21] Доманов, Игнат; Латхаувер, Ливен Де (январь 2014 г.). "Каноническая полиадическая декомпозиция тензоров третьего порядка: редукция к обобщенной декомпозиции собственных значений". Журнал SIAM по матричному анализу и приложениям . 35 (2): 636–660. arXiv : 1312.2848 . DOI : 10.1137 / 130916084 . ISSN 0895-4798 .

[22] Доманов, Игнат; Де Латхаувер, Ливен (январь 2017 г.). «Каноническое полиадическое разложение тензоров третьего порядка: ослабленные условия единственности и алгебраический алгоритм». Линейная алгебра и ее приложения . 513 : 342–375. arXiv : 1501.07251 . DOI : 10.1016 / j.laa.2016.10.019 . ISSN 0024-3795 .

[23] Faber, Nicolaas (Klaas) M .; Ферре, Жанна; Боке, Рикар (январь 2001 г.). «Метод аннигиляции обобщенного ранга с итеративным перевесом». Хемометрика и интеллектуальные лабораторные системы . 55 (1–2): 67–90. DOI : 10.1016 / s0169-7439 (00) 00117-9 . ISSN 0169-7439 .

[24] Leurgans, SE ; Росс, RT; Абель, РБ (октябрь 1993 г.). «Разложение для трехкомпонентных массивов». Журнал SIAM по матричному анализу и приложениям . 14 (4): 1064–1083. DOI : 10.1137 / 0614071 . ISSN 0895-4798 .

[25] Лорбер, Авраам. (Октябрь 1985 г.). «Особенности количественного определения химического состава из двумерного массива данных методом рангового анализа факторов аннигиляции». Аналитическая химия . 57 (12): 2395–2397. DOI : 10.1021 / ac00289a052 . ISSN 0003-2700 .

[26] Санчес, Эухенио; Ковальски, Брюс Р. (январь 1990 г.). «Тензорное разрешение: прямое трехлинейное разложение». Журнал хемометрики . 4 (1): 29–45. DOI : 10.1002 / cem.1180040105 . ISSN 0886-9383 .

[27] Сэндс, Ричард; Янг, Форрест В. (март 1980 г.). «Компонентные модели для трехсторонних данных: альтернативный алгоритм наименьших квадратов с функциями оптимального масштабирования». Психометрика . 45 (1): 39–67. DOI : 10.1007 / bf02293598 . ISSN 0033-3123 .

[28] Бернарди, А .; Brachat, J .; Comon, P .; Моррен, Б. (май 2013 г.). «Общее тензорное разложение, матрицы моментов и приложения». Журнал символических вычислений . 52 : 51–71. arXiv : 1105.1229 . DOI : 10.1016 / j.jsc.2012.05.012 . ISSN 0747-7171 .

[29] Бернарди, Алессандра; Daleo, Noah S .; Hauenstein, Jonathan D .; Моррен, Бернар (декабрь 2017 г.). «Тензорное разложение и продолжение гомотопии». Дифференциальная геометрия и ее приложения . 55 : 78–105. arXiv : 1512.04312 . DOI : 10.1016 / j.difgeo.2017.07.009 . ISSN 0926-2245 .

[anandkumar2014tensor-30] Анандкумар, Анимашри; Ге, Ронг; Сюй, Даниэль; Какаде, Шам М; Телгарский, Матус (2014). «Тензорные разложения для изучения моделей со скрытыми переменными». Журнал исследований в области машинного обучения . 15 (1): 2773–2832.

[1]