Обратное преобразование Мура – Пенроуза

В математике , и в частности в линейной алгебре , обратное преобразование Мура – Пенроуза ${\ displaystyle A ^ {+}}$ из матрицы ${\ displaystyle A}$ является наиболее широко известным обобщением на обратной матрицы . ^[1]^[2]^[3]^[4] Он был описан независимо друг от друга EH Мура ^[5] в 1920 году, Арне Бжерхаммар ^[6] в 1951 году, и Роджер Пенроуз ^[7] в 1955 г. Ранее Фредгольм был введен понятие псевдообратного интегрального оператора в 1903 году. При обращении к матрице термин псевдообратный , без дальнейшего уточнения, часто используется для обозначения обратного Мура – Пенроуза. Термин обобщенная обратная иногда используется как синоним псевдообратного.

Обычно псевдообратное выражение используется для вычисления "наилучшего соответствия" ( методом наименьших квадратов ) решения системы линейных уравнений , не имеющей решения (см. Ниже в разделе "Приложения" ). Другое использование - найти решение с минимальной ( евклидовой ) нормой для системы линейных уравнений с несколькими решениями. Псевдообратная матрица упрощает формулировку и доказательство результатов линейной алгебры.

Псевдообратная матрица определена и уникальна для всех матриц, элементы которых являются действительными или комплексными числами. Его можно вычислить с помощью разложения по сингулярным числам .

Обозначение

В нижеследующем обсуждении приняты следующие условные обозначения.

${\ displaystyle \ mathbb {k}}$ будет обозначать одно из полей действительных или комплексных чисел, обозначаемых ${\ Displaystyle \ mathbb {R}}$ , ${\ displaystyle \ mathbb {C}}$ , соответственно. Векторное пространство ${\ Displaystyle м \ раз п}$ матрицы над ${\ displaystyle \ mathbb {k}}$ обозначается ${\ Displaystyle \ mathbb {к} ^ {м \ раз п}}$ .
Для ${\ Displaystyle А \ в \ mathbb {к} ^ {м \ раз п}}$ , ${\ Displaystyle А ^ {\textf {T}}}$ а также ${\ displaystyle A ^ {*}}$ обозначают транспонирование и эрмитово транспонирование (также называемое сопряженным транспонированием ) соответственно. Если ${\ Displaystyle \ mathbb {к} = \ mathbb {R}}$ , тогда ${\ Displaystyle А ^ {*} = А ^ {\textf {T}}}$ .
Для ${\ Displaystyle А \ в \ mathbb {к} ^ {м \ раз п}}$ , ${\ displaystyle \ operatorname {ran} (A)}$ (что означает " диапазон ") обозначает пространство столбца (изображение) ${\ displaystyle A}$ (пространство, покрытое векторами-столбцами ${\ displaystyle A}$ ) а также ${\ Displaystyle \ ker (А)}$ обозначает ядро (пустое пространство) ${\ displaystyle A}$ .
Наконец, для любого положительного целого числа ${\ displaystyle n}$ , ${\ Displaystyle I_ {п} \ в \ mathbb {k} ^ {п \ раз п}}$ обозначает ${\ Displaystyle п \ раз п}$ единичная матрица .

Определение

Для ${\ Displaystyle А \ в \ mathbb {к} ^ {м \ раз п}}$ псевдообратная к $A$ определяется как матрица ${\ Displaystyle A ^ {+} \ in \ mathbb {k} ^ {п \ раз m}}$ удовлетворяет всем следующим четырем критериям, известным как условия Мура – Пенроуза: ^[7]^[8]

${\ displaystyle AA ^ {+} A}$ ${\ Displaystyle = \; А}$
${\ displaystyle AA ^ {+}}$ не обязательно должна быть общей единичной матрицей, но она отображает все векторы-столбцы матрицы $A$ на себя;
${\ displaystyle A ^ {+} AA ^ {+}}$ ${\ Displaystyle = \; А ^ {+}}$
${\ displaystyle A ^ {+}}$ действует как слабый инверс ;
${\ displaystyle \ left (AA ^ {+} \ right) ^ {*}}$ ${\ Displaystyle = \; AA ^ {+}}$
${\ displaystyle AA ^ {+}}$ это эрмитова ;
${\ Displaystyle \ влево (А ^ {+} А \ вправо) ^ {*}}$ ${\ Displaystyle = \; А ^ {+} А}$
${\ displaystyle A ^ {+} A}$ тоже эрмитский.

${\ displaystyle A ^ {+}}$ существует для любой матрицы $A$ , но, когда последняя имеет полный ранг (т. е. ранг матрицы $A$ равен ${\ Displaystyle \ мин \ {м, п \}}$ ), тогда ${\ displaystyle A ^ {+}}$ можно выразить в виде простой алгебраической формулы.

В частности, когда ${\ displaystyle A}$ имеет линейно независимые столбцы (и, следовательно, матрица ${\ displaystyle A ^ {*} A}$ обратима), ${\ displaystyle A ^ {+}}$ можно вычислить как

{\ displaystyle A ^ {+} = \ left (A ^ {*} A \ right) ^ {- 1} A ^ {*}.}

Этот конкретный псевдообратный вариант представляет собой левый обратный , поскольку в этом случае ${\ displaystyle A ^ {+} A = I}$ .

Когда $A$ имеет линейно независимые строки (матрица ${\ displaystyle AA ^ {*}}$ обратима), ${\ displaystyle A ^ {+}}$ можно вычислить как

{\ displaystyle A ^ {+} = A ^ {*} \ left (AA ^ {*} \ right) ^ {- 1}.}

Это прямо обратное , так как ${\ displaystyle AA ^ {+} = I}$ .

Характеристики

Существование и уникальность

Псевдообратная матрица существует и единственна: для любой матрицы ${\ displaystyle A}$ , имеется ровно одна матрица ${\ displaystyle A ^ {+}}$ , который удовлетворяет четырем свойствам определения. ^[8]

Матрица, удовлетворяющая первому условию определения, называется обобщенной обратной. Если матрица также удовлетворяет второму определению, она называется обобщенно рефлексивной обратной . Обобщенные инверсии существуют всегда, но в общем случае не уникальны. Уникальность - следствие двух последних условий.

Основные свойства

Если ${\ displaystyle A}$ есть настоящие записи, значит, тоже ${\ displaystyle A ^ {+}}$ .
Если ${\ displaystyle A}$ является обратимым , его Псевдообратным является обратным. Это, ${\ Displaystyle А ^ {+} = А ^ {- 1}}$ . ^[9]^{: 243}
Псевдообратной нулевой матрицы является ее транспонирование.
Псевдообратная псевдообратная матрица - это исходная матрица: ${\ Displaystyle \ влево (А ^ {+} \ вправо) ^ {+} = А}$ . ^[9]^{: 245}
Псевдообращение коммутирует с транспонированием, комплексным сопряжением и выполнением сопряженного транспонирования: ^[9]^{: 245}
${\ displaystyle \ left (A ^ {\textf {T}} \ right) ^ {+} = \ left (A ^ {+} \ right) ^ {\textf {T}}}$ , ${\ displaystyle \ left ({\ overline {A}} \ right) ^ {+} = {\ overline {A ^ {+}}}}$ , ${\ displaystyle \ left (A ^ {*} \ right) ^ {+} = \ left (A ^ {+} \ right) ^ {*}}$ .
Псевдообратная скалярная величина, кратная ${\ displaystyle A}$ является обратным кратным ${\ displaystyle A ^ {+}}$ :
${\ Displaystyle \ влево (\ альфа А \ вправо) ^ {+} = \ альфа ^ {- 1} А ^ {+}}$ для ${\ displaystyle \ alpha \ neq 0}$ .

Идентичности

Следующие идентификаторы могут использоваться для отмены определенных подвыражений или раскрытия выражений, содержащих псевдообратные символы. Доказательства этих свойств можно найти на подстранице доказательств .

{\ displaystyle {\ begin {alignat} {3} A ^ {+} = {} & A ^ {+} && A ^ {+ *} && A ^ {*} \\ = {} & A ^ {*} && A ^ {+ *} && A ^ {+}, \\ A = {} & A ^ {+ *} && A ^ {*} && A \\ = {} & A && A ^ {*} && A ^ {+ *}, \\ A ^ {*} = {} & A ^ {*} && A && A ^ {+} \\ = {} & A ^ {+} && A && A ^ {*}. \ End {alignat}}}

Приведение к эрмитовскому регистру

Вычисление псевдообратного преобразования сводится к его построению в эрмитовом случае. Это возможно благодаря эквивалентности:

{\ displaystyle A ^ {+} = \ left (A ^ {*} A \ right) ^ {+} A ^ {*},}

{\ Displaystyle A ^ {+} = A ^ {*} \ left (AA ^ {*} \ right) ^ {+},}

в виде ${\ displaystyle A ^ {*} A}$ а также ${\ displaystyle AA ^ {*}}$ эрмитские.

Продукты

Предполагать ${\ displaystyle A \ in \ mathbb {k} ^ {m \ times n}, \ B \ in \ mathbb {k} ^ {n \ times p}}$ . Тогда следующие варианты эквивалентны: ^[10]

${\ displaystyle (AB) ^ {+} = B ^ {+} A ^ {+}}$
${\ textstyle {\ begin {align} A ^ {+} ABB ^ {*} A ^ {*} & = BB ^ {*} A ^ {*}, \\ BB ^ {+} A ^ {*} AB & = A ^ {*} AB. \ End {выровнено}}}$
${\ displaystyle {\ begin {align} \ left (A ^ {+} ABB ^ {*} \ right) ^ {*} & = A ^ {+} ABB ^ {*}, \\\ left (A ^ { *} ABB ^ {+} \ right) ^ {*} & = A ^ {*} ABB ^ {+}. \ End {align}}}$
${\ displaystyle A ^ {+} ABB ^ {*} A ^ {*} ABB ^ {+} = BB ^ {*} A ^ {*} A}$
${\ displaystyle {\ begin {align} A ^ {+} AB & = B (AB) ^ {+} AB, \\ BB ^ {+} A ^ {*} & = A ^ {*} AB (AB) ^ {+}. \ end {выровнено}}}$

Ниже приведены достаточные условия для ${\ displaystyle (AB) ^ {+} = B ^ {+} A ^ {+}}$ :

${\ displaystyle A}$ имеет ортонормированные столбцы (тогда ${\ Displaystyle A ^ {*} A = A ^ {+} A = I_ {n}}$ ), или же
${\ displaystyle B}$ имеет ортонормированные строки (тогда ${\ displaystyle BB ^ {*} = BB ^ {+} = I_ {n}}$ ), или же
${\ displaystyle A}$ имеет линейно независимые столбцы (тогда ${\ displaystyle A ^ {+} A = I}$ ) а также ${\ displaystyle B}$ имеет линейно независимые строки (тогда ${\ displaystyle BB ^ {+} = I}$ ), или же
${\ displaystyle B = A ^ {*}}$ , или же
${\ displaystyle B = A ^ {+}}$ .

Следующее является необходимым условием для ${\ displaystyle (AB) ^ {+} = B ^ {+} A ^ {+}}$ :

${\ Displaystyle (A ^ {+} A) (BB ^ {+}) = (BB ^ {+}) (A ^ {+} A)}$

Последнее достаточное условие дает равенства

{\ displaystyle {\ begin {align} \ left (AA ^ {*} \ right) ^ {+} & = A ^ {+ *} A ^ {+}, \\\ left (A ^ {*} A \ справа) ^ {+} & = A ^ {+} A ^ {+ *}. \ end {align}}}

NB: равенство ${\ displaystyle (AB) ^ {+} = B ^ {+} A ^ {+}}$ не держит в целом. См. Контрпример:

{\ displaystyle {\ Biggl (} {\ begin {pmatrix} 1 & 1 \\ 0 & 0 \ end {pmatrix}} {\ begin {pmatrix} 0 & 0 \\ 1 & 1 \ end {pmatrix}} {\ Biggr)} ^ {+} = {\ begin {pmatrix} 1 & 1 \\ 0 & 0 \ end {pmatrix}} ^ {+} = {\ begin {pmatrix} {\ tfrac {1} {2}} & 0 \\ {\ tfrac {1} {2}} & 0 \ end {pmatrix}} \ quad \ neq \ quad {\ begin {pmatrix} {\ tfrac {1} {4}} & 0 \\ {\ tfrac {1} {4}} & 0 \ end {pmatrix}} = {\ begin {pmatrix} 0 & {\ tfrac {1} {2}} \\ 0 & {\ tfrac {1} {2}} \ end {pmatrix}} {\ begin {pmatrix} {\ tfrac {1} {2 }} & 0 \\ {\ tfrac {1} {2}} & 0 \ end {pmatrix}} = {\ begin {pmatrix} 0 & 0 \\ 1 & 1 \ end {pmatrix}} ^ {+} {\ begin {pmatrix} 1 & 1 \\ 0 & 0 \ конец {pmatrix}} ^ {+}}

Проекторы

${\ Displaystyle P = AA ^ {+}}$ а также ${\ Displaystyle Q = A ^ {+} A}$ являются операторами ортогонального проектирования , то есть, они являются эрмитовы ( ${\ Displaystyle P = P ^ {*}}$ , ${\ Displaystyle Q = Q ^ {*}}$ ) и идемпотентный ( ${\ Displaystyle P ^ {2} = P}$ а также ${\ displaystyle Q ^ {2} = Q}$ ). Следующее имеет место:

${\ Displaystyle PA = AQ = A}$ а также ${\ Displaystyle A ^ {+} P = QA ^ {+} = A ^ {+}}$
${\ displaystyle P}$ является ортогональным проектором на диапазон от ${\ displaystyle A}$ (что равно ортогональному дополнению ядра ${\ displaystyle A ^ {*}}$ ).
${\ displaystyle Q}$ ортогональный проектор на диапазон ${\ displaystyle A ^ {*}}$ (что равно ортогональному дополнению ядра ${\ displaystyle A}$ ).
${\ Displaystyle (IQ) = \ влево (IA ^ {+} A \ вправо)}$ ортогональный проектор на ядро ${\ displaystyle A}$ .
${\ Displaystyle (IP) = \ влево (I-AA ^ {+} \ вправо)}$ ортогональный проектор на ядро ${\ displaystyle A ^ {*}}$ . ^[8]

Последние два свойства подразумевают следующие тождества:

${\ Displaystyle A \, \ \ влево (IA ^ {+} A \ right) = \ left (I-AA ^ {+} \ right) A \ \ = 0}$
${\ displaystyle A ^ {*} \ left (I-AA ^ {+} \ right) = \ left (IA ^ {+} A \ right) A ^ {*} = 0}$

Другое свойство следующее: если ${\ Displaystyle А \ в \ mathbb {к} ^ {п \ раз п}}$ эрмитово и идемпотентно (истинно тогда и только тогда, когда оно представляет собой ортогональную проекцию), то для любой матрицы ${\ displaystyle B \ in \ mathbb {k} ^ {m \ times n}}$ выполняется следующее уравнение: ^[11]

{\ Displaystyle А (БА) ^ {+} = (БА) ^ {+}}

Это можно доказать, задав матрицы ${\ displaystyle C = BA}$ , ${\ Displaystyle D = А (ВА) ^ {+}}$ , и проверяя, что ${\ displaystyle D}$ действительно является псевдообратной для ${\ displaystyle C}$ путем проверки того, что определяющие свойства псевдообратной верны, когда ${\ displaystyle A}$ эрмитово и идемпотентно.

Из последнего свойства следует, что если ${\ Displaystyle А \ в \ mathbb {к} ^ {п \ раз п}}$ эрмитово и идемпотентно для любой матрицы ${\ displaystyle B \ in \ mathbb {k} ^ {n \ times m}}$

{\ Displaystyle (AB) ^ {+} A = (AB) ^ {+}}

Наконец, если ${\ displaystyle A}$ является ортогональной проекционной матрицей, то ее псевдообратная матрица тривиально совпадает с самой матрицей, т. е. ${\ Displaystyle А ^ {+} = А}$ .

Геометрическая конструкция

Если рассматривать матрицу как линейную карту ${\ Displaystyle A: \ mathbb {k} ^ {n} \ to \ mathbb {k} ^ {m}}$ над полем ${\ displaystyle \ mathbb {k}}$ тогда ${\ Displaystyle A ^ {+}: \ mathbb {k} ^ {m} \ to \ mathbb {k} ^ {n}}$ можно разложить следующим образом. Мы пишем ${\ displaystyle \ oplus}$ на прямую сумму , ${\ displaystyle \ perp}$ для ортогонального дополнения , ${\ displaystyle \ ker}$ для ядра карты и ${\ displaystyle \ operatorname {ran}}$ для изображения карты. Заметь ${\ displaystyle \ mathbb {k} ^ {n} = \ left (\ ker A \ right) ^ {\ perp} \ oplus \ ker A}$ а также ${\ displaystyle \ mathbb {k} ^ {m} = \ operatorname {ran} A \ oplus \ left (\ operatorname {ran} A \ right) ^ {\ perp}}$ . Ограничение ${\ displaystyle A: \ left (\ ker A \ right) ^ {\ perp} \ to \ operatorname {ran} A}$ тогда является изоморфизмом. Это означает, что ${\ displaystyle A ^ {+}}$ на ${\ displaystyle \ operatorname {ran} A}$ является обратным к этому изоморфизму и равен нулю на ${\ displaystyle \ left (\ operatorname {ran} A \ right) ^ {\ perp}.}$

Другими словами: найти ${\ displaystyle A ^ {+} b}$ для данного ${\ displaystyle b}$ в ${\ Displaystyle \ mathbb {к} ^ {м}}$ , первый проект ${\ displaystyle b}$ перпендикулярно диапазону ${\ displaystyle A}$ , найти точку ${\ displaystyle p (b)}$ В диапазоне. Затем сформируйте ${\ displaystyle A ^ {- 1} (\ {p (b) \})}$ , то есть найти эти векторы в ${\ Displaystyle \ mathbb {к} ^ {п}}$ что ${\ displaystyle A}$ отправляет в ${\ displaystyle p (b)}$ . Это будет аффинное подпространство в ${\ Displaystyle \ mathbb {к} ^ {п}}$ параллельно ядру ${\ displaystyle A}$ . Элемент этого подпространства, имеющий наименьшую длину (то есть ближайший к началу координат), является ответом ${\ displaystyle A ^ {+} b}$ мы ищем. Его можно найти, взяв произвольный член ${\ displaystyle A ^ {- 1} (\ {p (b) \})}$ и проецируя его ортогонально на ортогональное дополнение ядра ${\ displaystyle A}$ .

Это описание тесно связано с решением минимальной нормы линейной системы .

Подпространства

{\ displaystyle {\ begin {align} \ ker \ left (A ^ {+} \ right) & = \ ker \ left (A ^ {*} \ right) \\\ operatorname {ran} \ left (A ^ { +} \ right) & = \ operatorname {ran} \ left (A ^ {*} \ right) \ end {align}}}

Ограничить отношения

Псевдообратные ограничения:

{\ displaystyle A ^ {+} = \ lim _ {\ delta \ searchrow 0} \ left (A ^ {*} A + \ delta I \ right) ^ {- 1} A ^ {*} = \ lim _ {\ delta \ searchrow 0} A ^ {*} \ left (AA ^ {*} + \ delta I \ right) ^ {- 1}}

(см. Тихоновская регуляризация ). Эти ограничения существуют, даже если

{\ displaystyle \ left (AA ^ {*} \ right) ^ {- 1}}

или же

{\ Displaystyle \ влево (А ^ {*} А \ вправо) ^ {- 1}}

не существует. ^[8]^{: 263}

Непрерывность

В отличие от обычного обращения матриц, процесс взятия псевдообратных матриц не является непрерывным : если последовательность ${\ Displaystyle \ влево (A_ {п} \ вправо)}$ сходится к матрице ${\ displaystyle A}$ (в максимальной норме или , скажем, в норме Фробениуса ), то ${\ Displaystyle (А_ {п}) ^ {+}}$ не нужно сходиться к ${\ displaystyle A ^ {+}}$ . Однако если все матрицы ${\ displaystyle A_ {n}}$ иметь тот же ранг, что и ${\ displaystyle A}$ , ${\ Displaystyle (А_ {п}) ^ {+}}$ сведется к ${\ displaystyle A ^ {+}}$ . ^[12]

Производная

Производная вещественнозначной псевдообратной матрицы, которая имеет постоянный ранг в точке ${\ displaystyle x}$ можно вычислить через производную исходной матрицы: ^[13]

{\ displaystyle {\ frac {\ mathrm {d}} {\ mathrm {d} x}} A ^ {+} (x) = - A ^ {+} \ left ({\ frac {\ mathrm {d}}) {\ mathrm {d} x}} A \ right) A ^ {+} ~ + ~ A ^ {+} A ^ {+ {\textf {T}}} \ left ({\ frac {\ mathrm {d} } {\ mathrm {d} x}} A ^ {\textf {T}} \ right) \ left (I-AA ^ {+} \ right) ~ + ~ \ left (IA ^ {+} A \ right) \ left ({\ frac {\ text {d}} {{\ text {d}} x}} A ^ {\textf {T}} \ right) A ^ {+ {\textf {T}}} A ^ {+}}

Примеры

Поскольку для обратимых матриц псевдообратная матрица равна обычной обратной, ниже рассматриваются только примеры необратимых матриц.

Для ${\ displaystyle A = {\ begin {pmatrix} 0 & 0 \\ 0 & 0 \ end {pmatrix}},}$ псевдообратная ${\ displaystyle A ^ {+} = {\ begin {pmatrix} 0 & 0 \\ 0 & 0 \ end {pmatrix}}.}$ (Обычно псевдообратной нулевой матрицей является ее транспонирование.) Уникальность этой псевдообратной матрицы видна из требования ${\ displaystyle A ^ {+} = A ^ {+} AA ^ {+}}$ , поскольку умножение на нулевую матрицу всегда дает нулевую матрицу.
Для ${\ displaystyle A = {\ begin {pmatrix} 1 & 0 \\ 1 & 0 \ end {pmatrix}},}$ псевдообратная ${\ displaystyle A ^ {+} = {\ begin {pmatrix} {\ frac {1} {2}} & {\ frac {1} {2}} \\ 0 & 0 \ end {pmatrix}}.}$
Действительно, ${\ Displaystyle A \, A ^ {+} = {\ begin {pmatrix} {\ frac {1} {2}} & {\ frac {1} {2}} \\ {\ frac {1} {2} } & {\ frac {1} {2}} \ end {pmatrix}},}$ и поэтому ${\ displaystyle A \, A ^ {+} A = {\ begin {pmatrix} 1 & 0 \\ 1 & 0 \ end {pmatrix}} = A.}$
По аналогии, ${\ displaystyle A ^ {+} A = {\ begin {pmatrix} 1 & 0 \\ 0 & 0 \ end {pmatrix}},}$ и поэтому ${\ displaystyle A ^ {+} A \, A ^ {+} = {\ begin {pmatrix} {\ frac {1} {2}} & {\ frac {1} {2}} \\ 0 & 0 \ end { pmatrix}} = A ^ {+}.}$
Для ${\ displaystyle A = {\ begin {pmatrix} 1 & 0 \\ - 1 & 0 \ end {pmatrix}},}$ ${\ displaystyle A ^ {+} = {\ begin {pmatrix} {\ frac {1} {2}} & - {\ frac {1} {2}} \\ 0 & 0 \ end {pmatrix}}.}$
Для ${\ displaystyle A = {\ begin {pmatrix} 1 & 0 \\ 2 & 0 \ end {pmatrix}},}$ ${\ displaystyle A ^ {+} = {\ begin {pmatrix} {\ frac {1} {5}} & {\ frac {2} {5}} \\ 0 & 0 \ end {pmatrix}}.}$ (Знаменатели ${\ displaystyle 5 = 1 ^ {2} + 2 ^ {2}}$ .)
Для ${\ displaystyle A = {\ begin {pmatrix} 1 & 1 \\ 1 & 1 \ end {pmatrix}},}$ ${\ displaystyle A ^ {+} = {\ begin {pmatrix} {\ frac {1} {4}} & {\ frac {1} {4}} \\ {\ frac {1} {4}} & { \ frac {1} {4}} \ end {pmatrix}}.}$
Для ${\ displaystyle A = {\ begin {pmatrix} 1 & 0 \\ 0 & 1 \\ 0 & 1 \ end {pmatrix}},}$ псевдообратная ${\ displaystyle A ^ {+} = {\ begin {pmatrix} 1 & 0 & 0 \\ 0 & {\ frac {1} {2}} & {\ frac {1} {2}} \ end {pmatrix}}.}$ Для этой матрицы существует левая обратная, поэтому она равна ${\ displaystyle A ^ {+}}$ , действительно, ${\ displaystyle A ^ {+} A = {\ begin {pmatrix} 1 & 0 \\ 0 & 1 \ end {pmatrix}}.}$

Особые случаи

Скаляры

Также возможно определить псевдообратную форму для скаляров и векторов. Это равносильно обращению с ними как с матрицами. Псевдообратная к скаляру ${\ displaystyle x}$ равно нулю, если ${\ displaystyle x}$ равен нулю, и величина, обратная ${\ displaystyle x}$ иначе:

{\ displaystyle x ^ {+} = {\ begin {cases} 0, & {\ mbox {if}} x = 0; \\ x ^ {- 1}, & {\ mbox {else}}. \ end { случаи}}}

Векторы

Псевдообратный нулевой вектор (полностью нулевой) - это транспонированный нулевой вектор. Псевдообратное значение ненулевого вектора - это сопряженный транспонированный вектор, деленный на его квадрат величины:

{\ displaystyle {\ vec {x}} ^ {+} = {\ begin {case} {\ vec {0}} ^ {\textf {T}}, & {\ mbox {if}} {\ vec {x }} = {\ vec {0}}; \\ {\ dfrac {{\ vec {x}} ^ {*}} {{\ vec {x}} ^ {*} {\ vec {x}}}} , & {\ mbox {else}}. \ end {case}}}

Линейно независимые столбцы

Если столбцы в ${\ displaystyle A}$ являются линейно независимыми (так , что ${\ Displaystyle м \ geq п}$ ), тогда ${\ displaystyle A ^ {*} A}$ обратимо. В этом случае явная формула: ^[14]

{\ displaystyle A ^ {+} = \ left (A ^ {*} A \ right) ^ {- 1} A ^ {*}}

.

Следует, что ${\ displaystyle A ^ {+}}$ тогда является левым обратным к ${\ displaystyle A}$ : ${\ displaystyle A ^ {+} A = I_ {n}}$ .

Линейно независимые строки

Если строки из ${\ displaystyle A}$ линейно независимы (так что ${\ Displaystyle м \ leq п}$ ), тогда ${\ displaystyle AA ^ {*}}$ обратимо. В этом случае явная формула:

{\ displaystyle A ^ {+} = A ^ {*} \ left (AA ^ {*} \ right) ^ {- 1}}

.

Следует, что ${\ displaystyle A ^ {+}}$ это правая инверсия ${\ displaystyle A}$ : ${\ displaystyle AA ^ {+} = I_ {m}}$ .

Ортонормированные столбцы или строки

Это частный случай либо полного ранга столбца, либо полного ранга строки (описанного выше). Если ${\ displaystyle A}$ имеет ортонормированные столбцы ( ${\ displaystyle A ^ {*} A = I_ {n}}$ ) или ортонормированные строки ( ${\ displaystyle AA ^ {*} = I_ {m}}$ ), тогда:

{\ displaystyle A ^ {+} = A ^ {*}.}

Нормальные матрицы

Если ${\ displaystyle A}$ - нормальная матрица ; то есть коммутирует со своим сопряженным транспонированием; тогда его псевдообратное значение может быть вычислено путем его диагонализации, отображения всех ненулевых собственных значений в их обратные и отображения нулевых собственных значений в ноль. Следствие состоит в том, что ${\ displaystyle A}$ коммутация с его транспонированием подразумевает, что он коммутирует со своим псевдообратным.

Ортогональные проекционные матрицы

Это частный случай нормальной матрицы с собственными значениями 0 и 1. Если ${\ displaystyle A}$ ортогональная проекционная матрица, т. е. ${\ Displaystyle А = А ^ {*}}$ а также ${\ displaystyle A ^ {2} = A}$ , то псевдообратная матрица тривиально совпадает с самой матрицей:

{\ displaystyle A ^ {+} = A.}

Циркулянтные матрицы

Для циркулянтной матрицы ${\ displaystyle C}$ , разложение по сингулярным числам задается преобразованием Фурье , то есть сингулярные значения являются коэффициентами Фурье. Позволять ${\ Displaystyle {\ mathcal {F}}}$ быть дискретным преобразованием Фурье матрицы (ДПФ) , то ^[15]

{\ displaystyle {\ begin {align} C & = {\ mathcal {F}} \ cdot \ Sigma \ cdot {\ mathcal {F}} ^ {*} \\ C ^ {+} & = {\ mathcal {F} } \ cdot \ Sigma ^ {+} \ cdot {\ mathcal {F}} ^ {*} \ конец {выровнено}}}

Строительство

Разложение по рангу

Позволять ${\ Displaystyle г \ Leq \ мин (т, п)}$ обозначим ранг в ${\ Displaystyle А \ в \ mathbb {к} ^ {м \ раз п}}$ . потом ${\ displaystyle A}$ можно (ранг) разложить как ${\ displaystyle A = BC}$ где ${\ displaystyle B \ in \ mathbb {k} ^ {m \ times r}}$ а также ${\ Displaystyle С \ ин \ mathbb {к} ^ {г \ раз п}}$ имеют ранг ${\ displaystyle r}$ . потом ${\ Displaystyle A ^ {+} = C ^ {+} B ^ {+} = C ^ {*} \ left (CC ^ {*} \ right) ^ {- 1} \ left (B ^ {*} B \ right) ^ {- 1} B ^ {*}}$ .

QR-метод

Для ${\ Displaystyle \ mathbb {к} \ in \ {\ mathbb {R}, \ mathbb {C} \}}$ вычисление продукта ${\ displaystyle AA ^ {*}}$ или же ${\ displaystyle A ^ {*} A}$ а их обратные значения на практике часто являются источником ошибок округления числовых значений и вычислительных затрат. Альтернативный подход с использованием QR - разложение по ${\ displaystyle A}$ может использоваться вместо этого.

Рассмотрим случай, когда ${\ displaystyle A}$ имеет полный ранг столбца, так что ${\ displaystyle A ^ {+} = \ left (A ^ {*} A \ right) ^ {- 1} A ^ {*}}$ . Тогда разложение Холецкого ${\ Displaystyle A ^ {*} A = R ^ {*} R}$ , где ${\ displaystyle R}$ - верхняя треугольная матрица , может использоваться. Умножение на обратное затем легко выполняется путем решения системы с несколькими правыми частями,

{\ Displaystyle A ^ {+} = \ left (A ^ {*} A \ right) ^ {- 1} A ^ {*} \ quad \ Leftrightarrow \ quad \ left (A ^ {*} A \ right) A ^ {+} = A ^ {*} \ quad \ Leftrightarrow \ quad R ^ {*} RA ^ {+} = A ^ {*}}

которая может быть решена прямой заменой с последующей обратной заменой .

Разложение Холецкого можно вычислить без формирования ${\ displaystyle A ^ {*} A}$ явно, с помощью альтернативно с помощью QR - разложения в ${\ displaystyle A = QR}$ , где ${\ displaystyle Q}$ имеет ортонормированные столбцы, ${\ displaystyle Q ^ {*} Q = I}$ , а также ${\ displaystyle R}$ верхнетреугольный. потом

{\ Displaystyle A ^ {*} A \, = \, (QR) ^ {*} (QR) \, = \, R ^ {*} Q ^ {*} QR \, = \, R ^ {*} Р,}

так ${\ displaystyle R}$ фактор Холецкого ${\ displaystyle A ^ {*} A}$ .

Случай полного ранга строки рассматривается аналогично с использованием формулы ${\ displaystyle A ^ {+} = A ^ {*} \ left (AA ^ {*} \ right) ^ {- 1}}$ и используя аналогичный аргумент, поменяв ролями ${\ displaystyle A}$ а также ${\ displaystyle A ^ {*}}$ .

Разложение по сингулярным числам (SVD)

Простым и точным в вычислительном отношении способом вычислить псевдообратное значение является использование разложения по сингулярным числам . ^[14]^[8]^[16] Если ${\ Displaystyle A = U \ Sigma V ^ {*}}$ является сингулярным разложением ${\ displaystyle A}$ , тогда ${\ Displaystyle A ^ {+} = V \ Sigma ^ {+} U ^ {*}}$ . Для прямоугольной диагональной матрицы, такой как ${\ displaystyle \ Sigma}$ , мы получаем псевдообратную величину, взяв величину, обратную каждому ненулевому элементу на диагонали, оставляя нули на месте, а затем транспонируя матрицу. При численных вычислениях ненулевыми считаются только элементы, превышающие некоторый небольшой допуск, а остальные заменяются нулями. Например, в функциях pinv MATLAB , GNU Octave или NumPy допуск принимается равным $t$ $= ε\cdotmax ($ $m$ $,$ $n$ $) \cdotmax (Σ)$ , где ε - машинный эпсилон .

В стоимости вычислений этого метода преобладает стоимость вычисления SVD, которая в несколько раз выше, чем умножение матрицы на матрицу, даже если используется современная реализация (например, LAPACK ).

Вышеупомянутая процедура показывает, почему взятие псевдообратной матрицы не является непрерывной операцией: если исходная матрица ${\ displaystyle A}$ имеет сингулярное значение 0 (диагональный элемент матрицы ${\ displaystyle \ Sigma}$ выше), затем изменив ${\ displaystyle A}$ немного может превратить этот ноль в крошечное положительное число, тем самым резко влияя на псевдообратную матрицу, поскольку теперь мы должны взять обратную величину крошечного числа.

Блочные матрицы

Оптимизированные подходы существуют для вычисления псевдообратной матрицы блочно-структурированных матриц.

Итерационный метод Бен-Исраэля и Коэна

Другой метод вычисления псевдообратной формулы (см. Инверсию Дразина ) использует рекурсию

{\ displaystyle A_ {i + 1} = 2A_ {i} -A_ {i} AA_ {i},}

что иногда называют последовательностью сверхмощности. Эта рекурсия дает последовательность, квадратично сходящуюся к псевдообратной к ${\ displaystyle A}$ если он запущен с подходящим ${\ displaystyle A_ {0}}$ удовлетворение ${\ displaystyle A_ {0} A = \ left (A_ {0} A \ right) ^ {*}}$ . Выбор ${\ Displaystyle A_ {0} = \ альфа A ^ {*}}$ (где ${\ Displaystyle 0 <\ альфа <2 / \ sigma _ {1} ^ {2} (А)}$ , с участием ${\ Displaystyle \ sigma _ {1} (А)}$ обозначает наибольшее сингулярное значение ${\ displaystyle A}$ ) ^[17] утверждалось, что он не может конкурировать с методом, использующим SVD, упомянутым выше, потому что даже для умеренно плохо обусловленных матриц требуется много времени, прежде чем ${\ displaystyle A_ {i}}$ входит в область квадратичной сходимости. ^[18] Однако, если начать с ${\ displaystyle A_ {0}}$ уже близко к обратному преобразованию Мура – Пенроуза и ${\ displaystyle A_ {0} A = \ left (A_ {0} A \ right) ^ {*}}$ , Например ${\ displaystyle A_ {0}: = \ left (A ^ {*} A + \ delta I \ right) ^ {- 1} A ^ {*}}$ , сходимость быстрая (квадратичная).

Обновление псевдообратной

Для случаев, когда ${\ displaystyle A}$ имеет полный ранг строки или столбца и обратную матрицу корреляции ( ${\ displaystyle AA ^ {*}}$ для ${\ displaystyle A}$ с полным рангом строки или ${\ displaystyle A ^ {*} A}$ для полного ранга столбца), псевдообратная для матриц, связанных с ${\ displaystyle A}$ можно вычислить, применив формулу Шермана – Моррисона – Вудбери для обновления обратной корреляционной матрицы, что может потребовать меньше усилий. В частности, если связанная матрица отличается от исходной только измененной, добавленной или удаленной строкой или столбцом, существуют дополнительные алгоритмы, которые используют взаимосвязь. ^[19]^[20]

Точно так же можно обновить коэффициент Холецкого при добавлении строки или столбца без явного создания обратной корреляционной матрицы. Однако обновление псевдообратной матрицы в общем случае недостаточного ранга намного сложнее. ^[21]^[22]

Программные библиотеки

Качественные реализации SVD, QR и обратной подстановки доступны в стандартных библиотеках , таких как LAPACK . Написание собственной реализации SVD - это крупный проект в области программирования, требующий значительного опыта работы с числами . Однако в особых обстоятельствах, таких как параллельные вычисления или встроенные вычисления , альтернативные реализации с помощью QR или даже использование явного обратного могут быть предпочтительны, и пользовательские реализации могут быть неизбежны.

Пакет Python NumPy обеспечивает псевдообратное вычисление через свои функции matrix.Iи linalg.pinv; он pinvиспользует алгоритм на основе SVD. SciPy добавляет функцию, scipy.linalg.pinvкоторая использует решатель наименьших квадратов.

Пакет MASS для R обеспечивает вычисление обратной ginvфункции Мура – Пенроуза через функцию. ^[23]ginv функция вычисляет Псевдообращение , используя разложение по сингулярным значениям , представленную svdфункции в пакете базового R. Альтернативой является использование pinvфункции, доступной в пакете pracma.

Язык программирования Octave обеспечивает псевдообратное обращение через стандартную функцию пакета pinvи pseudo_inverse()метод.

В Julia (язык программирования) пакет LinearAlgebra стандартной библиотеки обеспечивает реализацию обратного преобразования Мура-Пенроуза, pinv()реализованного посредством разложения по сингулярным числам. ^[24]

Приложения

Линейный метод наименьших квадратов

Псевдообратная матрица дает решение системы линейных уравнений методом наименьших квадратов . ^[25] Для ${\ Displaystyle А \ в \ mathbb {к} ^ {м \ раз п}}$ , заданной системой линейных уравнений

{\ displaystyle Ax = b,}

в общем, вектор ${\ displaystyle x}$ это решает, что система может не существовать, или, если она существует, она не может быть уникальной. Псевдообратная матрица решает проблему наименьших квадратов следующим образом:

${\ displaystyle \ forall x \ in \ mathbb {k} ^ {n}}$ , у нас есть ${\ displaystyle \ left \ | Ax-b \ right \ | _ {2} \ geq \ left \ | Az-b \ right \ | _ {2}}$ где ${\ displaystyle z = A ^ {+} b}$ а также ${\ Displaystyle \ | \ cdot \ | _ {2}}$ обозначает евклидову норму . Это слабое неравенство выполняется с равенством тогда и только тогда, когда ${\ displaystyle x = A ^ {+} b + \ left (IA ^ {+} A \ right) w}$ для любого вектора ${\ displaystyle w}$ ; это обеспечивает бесконечное количество решений по минимизации, если только ${\ displaystyle A}$ имеет полный ранг столбца, и в этом случае ${\ Displaystyle \ влево (IA ^ {+} А \ вправо)}$ - нулевая матрица. ^[26] Решение с минимальной евклидовой нормой: ${\ displaystyle z.}$ ^[26]

Этот результат легко распространяется на системы с несколькими правыми частями, когда евклидова норма заменяется нормой Фробениуса. Позволять ${\ displaystyle B \ in \ mathbb {k} ^ {m \ times p}}$ .

${\ displaystyle \ forall X \ in \ mathbb {k} ^ {n \ times p}}$ , у нас есть ${\ Displaystyle \ | AX-B \ | _ {\ mathrm {F}} \ geq \ | AZ-B \ | _ {\ mathrm {F}}}$ где ${\ displaystyle Z = A ^ {+} B}$ а также ${\ Displaystyle \ | \ cdot \ | _ {\ mathrm {F}}}$ обозначает норму Фробениуса .

Получение всех решений линейной системы

Если линейная система

{\ displaystyle Ax = b}

имеет любые решения, все они даются ^[27]

{\ displaystyle x = A ^ {+} b + \ left [IA ^ {+} A \ right] w}

для произвольного вектора ${\ displaystyle w}$ . Решение (я) существует тогда и только тогда, когда ${\ displaystyle AA ^ {+} b = b}$ . ^[27] Если верно последнее, то решение единственно тогда и только тогда, когда ${\ displaystyle A}$ имеет полный ранг столбца, и в этом случае ${\ displaystyle \ left [IA ^ {+} A \ right]}$ - нулевая матрица. Если решения существуют, но ${\ displaystyle A}$ не имеет полного столбца ранга, то мы имеем неопределенную систему , все бесконечные решения которой даются этим последним уравнением.

Решение с минимальной нормой линейной системы

Для линейных систем $Ax=b,$ with non-unique solutions (such as under-determined systems), the pseudoinverse may be used to construct the solution of minimum Euclidean norm $\|x\|_{2}$ among all solutions.

If $Ax=b$ is satisfiable, the vector $z=A^{+}b$ is a solution, and satisfies $\|z\|_{2}\leq \|x\|_{2}$ for all solutions.

This result is easily extended to systems with multiple right-hand sides, when the Euclidean norm is replaced by the Frobenius norm. Let $B\in \mathbb {k} ^{m\times p}$ .

If $AX=B$ is satisfiable, the matrix $Z=A^{+}B$ is a solution, and satisfies $\|Z\|_{\mathrm {F} }\leq \|X\|_{\mathrm {F} }$ for all solutions.

Condition number

Using the pseudoinverse and a matrix norm, one can define a condition number for any matrix:

{\mbox{cond}}(A)=\|A\|\left\|A^{+}\right\|.

A large condition number implies that the problem of finding least-squares solutions to the corresponding system of linear equations is ill-conditioned in the sense that small errors in the entries of $A$ can lead to huge errors in the entries of the solution.^[28]

Обобщения

Besides for matrices over real and complex numbers, the conditions hold for matrices over biquaternions, also called "complex quaternions".^[29]

In order to solve more general least-squares problems, one can define Moore–Penrose inverses for all continuous linear operators $A:H_{1}\rightarrow H_{2}$ between two Hilbert spaces $H_{1}$ and $H_{2}$ , using the same four conditions as in our definition above. It turns out that not every continuous linear operator has a continuous linear pseudoinverse in this sense.^[28] Those that do are precisely the ones whose range is closed in $H_{2}$ .

A notion of pseudoinverse exists for matrices over an arbitrary field equipped with an arbitrary involutive automorphism. In this more general setting, a given matrix doesn't always have a pseudoinverse. The necessary and sufficient condition for a pseudoinverse to exist is that $\operatorname {rank} (A)=\operatorname {rank} \left(A^{*}A\right)=\operatorname {rank} \left(AA^{*}\right)$ where $A^{*}$ denotes the result of applying the involution operation to the transpose of $A$ . When it does exist, it is unique.^[30] Example: Consider the field of complex numbers equipped with the identity involution (as opposed to the involution considered elsewhere in the article); do there exist matrices that fail to have pseudoinverses in this sense? Consider the matrix $A={\begin{bmatrix}1&i\end{bmatrix}}^{\textsf {T}}$ . Observe that $\operatorname {rank} \left(AA^{\textsf {T}}\right)=1$ while $\operatorname {rank} \left(A^{\textsf {T}}A\right)=0$ . So this matrix doesn't have a pseudoinverse in this sense.

In abstract algebra, a Moore–Penrose inverse may be defined on a *-regular semigroup. This abstract definition coincides with the one in linear algebra.

Смотрите также

Proofs involving the Moore–Penrose inverse
Drazin inverse
Hat matrix
Inverse element
Linear least squares (mathematics)
Pseudo-determinant
Von Neumann regular ring

Заметки

^ Ben-Israel & Greville 2003, p. 7.
^ Campbell & Meyer, Jr. 1991, p. 10.
^ Nakamura 1991, p. 42.
^ Rao & Mitra 1971, p. 50–51.
^ Moore, E. H. (1920). "On the reciprocal of the general algebraic matrix". Bulletin of the American Mathematical Society. 26 (9): 394–95. doi:10.1090/S0002-9904-1920-03322-7.
^ Bjerhammar, Arne (1951). "Application of calculus of matrices to method of least squares; with special references to geodetic calculations". Trans. Roy. Inst. Tech. Stockholm. 49.
^ a b Penrose, Roger (1955). "A generalized inverse for matrices". Proceedings of the Cambridge Philosophical Society. 51 (3): 406–13. Bibcode:1955PCPS...51..406P. doi:10.1017/S0305004100030401.
^ a b c d e Golub, Gene H.; Charles F. Van Loan (1996). Matrix computations (3rd ed.). Baltimore: Johns Hopkins. pp. 257–258. ISBN 978-0-8018-5414-9.
^ a b c Stoer, Josef; Bulirsch, Roland (2002). Introduction to Numerical Analysis (3rd ed.). Berlin, New York: Springer-Verlag. ISBN 978-0-387-95452-3..
^ Greville, T. N. E. (1966-10-01). "Note on the Generalized Inverse of a Matrix Product". SIAM Review. 8 (4): 518–521. doi:10.1137/1008107. ISSN 0036-1445.
^ Maciejewski, Anthony A.; Klein, Charles A. (1985). "Obstacle Avoidance for Kinematically Redundant Manipulators in Dynamically Varying Environments". International Journal of Robotics Research. 4 (3): 109–117. doi:10.1177/027836498500400308. hdl:10217/536. S2CID 17660144.
^ Rakočević, Vladimir (1997). "On continuity of the Moore–Penrose and Drazin inverses" (PDF). Matematički Vesnik. 49: 163–72.
^ Golub, G. H.; Pereyra, V. (April 1973). "The Differentiation of Pseudo-Inverses and Nonlinear Least Squares Problems Whose Variables Separate". SIAM Journal on Numerical Analysis. 10 (2): 413–32. Bibcode:1973SJNA...10..413G. doi:10.1137/0710036. JSTOR 2156365.
^ a b Ben-Israel & Greville 2003.
^ Stallings, W. T.; Boullion, T. L. (1972). "The Pseudoinverse of an r-Circulant Matrix". Proceedings of the American Mathematical Society. 34 (2): 385–88. doi:10.2307/2038377. JSTOR 2038377.
^ Linear Systems & Pseudo-Inverse
^ Ben-Israel, Adi; Cohen, Dan (1966). "On Iterative Computation of Generalized Inverses and Associated Projections". SIAM Journal on Numerical Analysis. 3 (3): 410–19. Bibcode:1966SJNA....3..410B. doi:10.1137/0703035. JSTOR 2949637.pdf
^ Söderström, Torsten; Stewart, G. W. (1974). "On the Numerical Properties of an Iterative Method for Computing the Moore–Penrose Generalized Inverse". SIAM Journal on Numerical Analysis. 11 (1): 61–74. Bibcode:1974SJNA...11...61S. doi:10.1137/0711008. JSTOR 2156431.
^ Gramß, Tino (1992). Worterkennung mit einem künstlichen neuronalen Netzwerk (PhD dissertation). Georg-August-Universität zu Göttingen. OCLC 841706164.
^ Emtiyaz, Mohammad (February 27, 2008). "Updating Inverse of a Matrix When a Column is Added/Removed" (PDF). Cite journal requires |journal= (help)
^ Meyer, Jr., Carl D. (1973). "Generalized inverses and ranks of block matrices". SIAM J. Appl. Math. 25 (4): 597–602. doi:10.1137/0125057.
^ Meyer, Jr., Carl D. (1973). "Generalized inversion of modified matrices". SIAM J. Appl. Math. 24 (3): 315–23. doi:10.1137/0124033.
^ "R: Generalized Inverse of a Matrix".
^ "LinearAlgebra.pinv".
^ Penrose, Roger (1956). "On best approximate solution of linear matrix equations". Proceedings of the Cambridge Philosophical Society. 52 (1): 17–19. Bibcode:1956PCPS...52...17P. doi:10.1017/S0305004100030929.
^ a b Planitz, M. (October 1979). "Inconsistent systems of linear equations". Mathematical Gazette. 63 (425): 181–85. doi:10.2307/3617890. JSTOR 3617890.
^ a b James, M. (June 1978). "The generalised inverse". Mathematical Gazette. 62 (420): 109–14. doi:10.1017/S0025557200086460.
^ a b Hagen, Roland; Roch, Steffen; Silbermann, Bernd (2001). "Section 2.1.2". C*-algebras and Numerical Analysis. CRC Press.
^ Tian, Yongge (2000). "Matrix Theory over the Complex Quaternion Algebra". p.8, Theorem 3.5. arXiv:math/0004005.
^ Pearl, Martin H. (1968-10-01). "Generalized inverses of matrices with entries taken from an arbitrary field". Linear Algebra and Its Applications. 1 (4): 571–587. doi:10.1016/0024-3795(68)90028-1. ISSN 0024-3795.

Внешние ссылки

Pseudoinverse on PlanetMath
Interactive program & tutorial of Moore–Penrose Pseudoinverse
"Moore–Penrose inverse". PlanetMath.
Weisstein, Eric W. "Pseudoinverse". MathWorld.
Weisstein, Eric W. "Moore–Penrose Inverse". MathWorld.
The Moore–Penrose Pseudoinverse. A Tutorial Review of the Theory
Online Moore-Penrose Inverse calculator

[FOOTNOTEBen-IsraelGreville20037-1] Ben-Israel & Greville 2003, p. 7.

[FOOTNOTECampbellMeyer,_Jr.199110-2] Campbell & Meyer, Jr. 1991, p. 10.

[FOOTNOTENakamura199142-3] Nakamura 1991, p. 42.

[FOOTNOTERaoMitra197150–51-4] Rao & Mitra 1971, p. 50–51.

[Moore1920-5] Moore, E. H. (1920). "On the reciprocal of the general algebraic matrix". Bulletin of the American Mathematical Society. 26 (9): 394–95. doi:10.1090/S0002-9904-1920-03322-7.

[Bjerhammar1951-6] Bjerhammar, Arne (1951). "Application of calculus of matrices to method of least squares; with special references to geodetic calculations". Trans. Roy. Inst. Tech. Stockholm. 49.

[Penrose1955-7] Penrose, Roger (1955). "A generalized inverse for matrices". Proceedings of the Cambridge Philosophical Society. 51 (3): 406–13. Bibcode:1955PCPS...51..406P. doi:10.1017/S0305004100030401.

[GvL1996-8] Golub, Gene H.; Charles F. Van Loan (1996). Matrix computations (3rd ed.). Baltimore: Johns Hopkins. pp. 257–258. ISBN 978-0-8018-5414-9.

[SB2002-9] Stoer, Josef; Bulirsch, Roland (2002). Introduction to Numerical Analysis (3rd ed.). Berlin, New York: Springer-Verlag. ISBN 978-0-387-95452-3..

[10] Greville, T. N. E. (1966-10-01). "Note on the Generalized Inverse of a Matrix Product". SIAM Review. 8 (4): 518–521. doi:10.1137/1008107. ISSN 0036-1445.

[11] Maciejewski, Anthony A.; Klein, Charles A. (1985). "Obstacle Avoidance for Kinematically Redundant Manipulators in Dynamically Varying Environments". International Journal of Robotics Research. 4 (3): 109–117. doi:10.1177/027836498500400308. hdl:10217/536. S2CID 17660144.

[rakocevic1997-12] Rakočević, Vladimir (1997). "On continuity of the Moore–Penrose and Drazin inverses" (PDF). Matematički Vesnik. 49: 163–72.

[13] Golub, G. H.; Pereyra, V. (April 1973). "The Differentiation of Pseudo-Inverses and Nonlinear Least Squares Problems Whose Variables Separate". SIAM Journal on Numerical Analysis. 10 (2): 413–32. Bibcode:1973SJNA...10..413G. doi:10.1137/0710036. JSTOR 2156365.

[FOOTNOTEBen-IsraelGreville2003-14] Ben-Israel & Greville 2003.

[Stallings1972-15] Stallings, W. T.; Boullion, T. L. (1972). "The Pseudoinverse of an r-Circulant Matrix". Proceedings of the American Mathematical Society. 34 (2): 385–88. doi:10.2307/2038377. JSTOR 2038377.

[SLEandPI-16] Linear Systems & Pseudo-Inverse

[17] Ben-Israel, Adi; Cohen, Dan (1966). "On Iterative Computation of Generalized Inverses and Associated Projections". SIAM Journal on Numerical Analysis. 3 (3): 410–19. Bibcode:1966SJNA....3..410B. doi:10.1137/0703035. JSTOR 2949637.pdf

[18] Söderström, Torsten; Stewart, G. W. (1974). "On the Numerical Properties of an Iterative Method for Computing the Moore–Penrose Generalized Inverse". SIAM Journal on Numerical Analysis. 11 (1): 61–74. Bibcode:1974SJNA...11...61S. doi:10.1137/0711008. JSTOR 2156431.

[G1992-19] Gramß, Tino (1992). Worterkennung mit einem künstlichen neuronalen Netzwerk (PhD dissertation). Georg-August-Universität zu Göttingen. OCLC 841706164.

[EMTIYAZ2008-20] Emtiyaz, Mohammad (February 27, 2008). "Updating Inverse of a Matrix When a Column is Added/Removed" (PDF). Cite journal requires |journal= (help)

[21] Meyer, Jr., Carl D. (1973). "Generalized inverses and ranks of block matrices". SIAM J. Appl. Math. 25 (4): 597–602. doi:10.1137/0125057.

[22] Meyer, Jr., Carl D. (1973). "Generalized inversion of modified matrices". SIAM J. Appl. Math. 24 (3): 315–23. doi:10.1137/0124033.

[23] "R: Generalized Inverse of a Matrix".

[24] "LinearAlgebra.pinv".

[Penrose1956-25] Penrose, Roger (1956). "On best approximate solution of linear matrix equations". Proceedings of the Cambridge Philosophical Society. 52 (1): 17–19. Bibcode:1956PCPS...52...17P. doi:10.1017/S0305004100030929.

[Planitz-26] Planitz, M. (October 1979). "Inconsistent systems of linear equations". Mathematical Gazette. 63 (425): 181–85. doi:10.2307/3617890. JSTOR 3617890.

[James-27] James, M. (June 1978). "The generalised inverse". Mathematical Gazette. 62 (420): 109–14. doi:10.1017/S0025557200086460.

[hagen-28] Hagen, Roland; Roch, Steffen; Silbermann, Bernd (2001). "Section 2.1.2". C*-algebras and Numerical Analysis. CRC Press.

[29] Tian, Yongge (2000). "Matrix Theory over the Complex Quaternion Algebra". p.8, Theorem 3.5. arXiv:math/0004005.

[30] Pearl, Martin H. (1968-10-01). "Generalized inverses of matrices with entries taken from an arbitrary field". Linear Algebra and Its Applications. 1 (4): 571–587. doi:10.1016/0024-3795(68)90028-1. ISSN 0024-3795.

[1]

Обратное преобразование Мура – ​​Пенроуза