Обратимая матрица

В линейной алгебре , п матрицы с размерностью п квадратной матрицы называется обратимым (также неособым или невырожденным ), если существует п матрица с размерностью п квадратной матрица $B$ таким образом, что

{\ Displaystyle \ mathbf {AB} = \ mathbf {BA} = \ mathbf {I} _ {п} \}

где $я п$ обозначает в н матрице с размерностью п единичной матрицы , а умножение используется обычное умножение матриц . Если это так, то матрица $B$ однозначно определяется $A$ , и называется (мультипликативный) обратный из $А$ , обозначаемый $A -1$ . ^[1]^[2] Матрица инверсии является процесс нахождения матрицы $B$ , которая удовлетворяет уравнению перед для данной обратимой матрицы $А$ .

Квадратная матрица, не обратимы называется сингулярным или вырожденным . Квадратная матрица сингулярна тогда и только тогда, когда ее определитель равен нулю. ^[3] Сингулярные матрицы встречаются редко в том смысле, что если элементы квадратной матрицы выбираются случайным образом из любой конечной области числовой прямой или комплексной плоскости, вероятность того, что матрица является сингулярной, равна 0, то есть «почти никогда» не будет. быть единичным. Non-квадратные матрицы ( т матрицу с размерностью п матриц , для которых м ≠ п ) не имеет обратного. Однако в некоторых случаях такая матрица может иметь левую обратную или правую обратную . Если является т матрицу с размерностью п и ранга из $А$ равна $п$ ( $п$ $\leq$ $м$ ), то имеет левый обратный, An в $н$ матрицу с размерностью $м$ матрицы $B$ таким образом, что $BA$ $=$ $I$ $н$ . Если $A$ имеет ранг $m$ ( $m$ $\leq$ $n$ ), то у него есть правая обратная матрица $B$ размером $n на$ $m,$ такая что $AB$ $=$ $I$ $m$ .

Хотя наиболее распространенным случаем является матрица над действительными или комплексными числами, все эти определения могут быть даны для матриц над любым кольцом . Однако в случае коммутативности кольца условием обратимости квадратной матрицы является то, что ее определитель обратим в кольце, что в общем случае является более строгим требованием, чем ненулевое значение. Для некоммутативного кольца обычный определитель не определен. Условия существования левообратных или правообратных более сложны, так как понятие ранга не существует над кольцами.

Набор обратимых матриц размера $n \times n$ вместе с операцией умножения матриц (и элементами из кольца R ) образуют группу , общую линейную группу степени n , обозначаемую $GL n (R)$ . ^[1]

Характеристики

Теорема об обратимой матрице

Пусть A будет квадратной матрицей n на n над полем K (например, полем R действительных чисел). Следующие утверждения эквивалентны (т. Е. Либо все они истинны, либо полностью ложны для любой данной матрицы): ^[4]

A обратимо, то есть A имеет обратный, невырожденный или невырожденный.

Является строкой-эквивалентно к N матрицы с размерностью п единичной матрицы I _н .

Является колонным эквивалентны к N матрицы с размерностью п единичной матрицы I _н .

A имеет n опорных позиций .

det A ≠ 0 . В общем случае квадратная матрица над коммутативным кольцом обратима тогда и только тогда, когда ее определитель является единицей в этом кольце.

А имеет полный ранг; то есть ранг A = n .

Уравнение Ax = 0 имеет только тривиальное решение x = 0 .

Ядро из А тривиально, то есть, он содержит только вектор нуль в качестве элемента, кег ( ) = { 0 }.

Уравнение Ax = b имеет ровно одно решение для каждого b в K ⁿ .

Столбцы А являются линейно независимыми .

Столбцы A образуют K ⁿ .

Col A = K ⁿ .

Столбцы А образуют базис в K ^н .

Отображение линейного преобразования x в Ax является биекцией из K ⁿ в K ⁿ .

Существует матрица B размером n x n такая, что AB = I _n = BA .

Транспонированная ^Т является обратимой матрицей (следовательно , ряды А являются линейно независимыми , пролет К ^п , и образуют основу из К ^п ).

Число 0 не является собственным значением из A .

Матрица A может быть выражена как конечное произведение элементарных матриц .

Матрица A имеет левую обратную (то есть существует B такая, что BA = I ) или правую обратную (то есть существует C такая, что AC = I ), и в этом случае существуют как левая, так и правая инверсия, и В = С = А ^-1 .

Прочие свойства

Кроме того, для обратимой матрицы A выполняются следующие свойства :

( А ^-1 ) ^-1 = А ;
( k A ) ⁻¹ = k ⁻¹A ⁻¹ для ненулевого скаляра k ;
( Ax ) ⁺ = x ⁺A ^−1, если A имеет ортонормированные столбцы, где ⁺ обозначает обратное преобразование Мура – Пенроуза, а x - вектор;
( A ^T ) ⁻¹ = ( A ⁻¹ ) ^T ;
Для любого обратимого N матрицы с размерностью п матриц A и B , ( AB ) ^-1 = B ^-1A ^-1 . В более общем смысле , если А ₁ , ..., _к обратимым п матрица с размерностью N матрицы, то ( ₁₂ ⋯ _к_-1_к ) ^-1 =⁻¹
_кА⁻¹
_{к −1}⋯ А⁻¹
₂А⁻¹
₁;
det A ⁻¹ = (det A ) ⁻¹ .

Строки обратной матрицы V матриц U являются ортонормированными к колонкам U (и наоборот перестановка строк для столбцов). Чтобы увидеть это, предположим, что UV = VU = I, где строки V обозначены как ${\ Displaystyle v_ {я} ^ {\ mathrm {T}}}$ а столбцы U как ${\ displaystyle u_ {j}}$ для ${\ Displaystyle 1 \ Leq я, J \ Leq п}$ . Тогда ясно, что евклидов скалярное произведение любых двух ${\ displaystyle v_ {i} ^ {\ mathrm {T}} u_ {j} = \ delta _ {i, j}}$ . Это свойство также может быть полезно при построении обратной квадратной матрицы в некоторых случаях, когда известен набор ортогональных векторов (но не обязательно ортонормированных векторов) столбцам U. В этом случае, можно применить итерационный процесс Грама-Шмидт к этому исходному набору для определения строк обратной V .

Матрица, которая является своей собственной обратной (т. Е. Матрица A такая, что A = A ⁻¹ и A ² = I ), называется инволютивной матрицей .

По отношению к его адъюгату

Adjugate матрицы ${\ displaystyle A}$ можно использовать, чтобы найти обратное ${\ displaystyle A}$ следующим образом:

Если ${\ displaystyle A}$ обратимая матрица, то

{\ displaystyle A ^ {- 1} = {\ frac {1} {\ det (A)}} \ operatorname {adj} (A).}

По отношению к единичной матрице

Из ассоциативности умножения матриц следует, что если

{\ Displaystyle \ mathbf {AB} = \ mathbf {I} \}

для конечных квадратных матриц A и B , то также

{\ Displaystyle \ mathbf {BA} = \ mathbf {I} \}

^[5]

Плотность

Над поля действительных чисел, множества особых п матрицы с размерностью п матриц, рассматриваемым как подмножество R ^{п × п} , является множество нуля , то есть, имеет лебегову меру нуля . Это верно, потому что особые матрицы являются корнями детерминантной функции. Это непрерывная функция, поскольку она является полиномом от элементов матрицы. Таким образом , на языке теории меры , почти все п матрицы с размерностью п матрицы обратимы.

Кроме того, п матрицы с размерностью п обратимых матрицами являются плотным открытым множеством в топологическом пространстве из всех N матрицы с размерностью п матриц. Эквивалентно, множество особых матриц закрыто , и нигде не плотно в пространстве п матрицы с размерностью п матриц.

Однако на практике можно встретить необратимые матрицы. И при численных расчетах матрицы, которые являются обратимыми, но близкими к необратимым, все еще могут быть проблематичными; такие матрицы называются плохо обусловленными .

Примеры

Рассмотрим следующую матрицу 2 на 2:

{\ displaystyle \ mathbf {A} = {\ begin {pmatrix} -1 & {\ tfrac {3} {2}} \\ 1 & -1 \ end {pmatrix}}.}

Матрица ${\ displaystyle \ mathbf {A}}$ обратимо. Чтобы проверить это, можно вычислить, что ${\ textstyle \ det \ mathbf {A} = - {\ frac {1} {2}}}$ , которая не равна нулю.

В качестве примера необратимой или сингулярной матрицы рассмотрим матрицу

{\ displaystyle \ mathbf {B} = {\ begin {pmatrix} -1 & {\ tfrac {3} {2}} \\ {\ tfrac {2} {3}} & - 1 \ end {pmatrix}}.}

Определитель ${\ displaystyle \ mathbf {B}}$ равен 0, что является необходимым и достаточным условием необратимости матрицы.

Методы обращения матриц

Гауссово исключение

Исключение Гаусса – Жордана - это алгоритм, который можно использовать для определения, является ли данная матрица обратимой, и для нахождения обратной. Альтернативой является разложение LU , которое генерирует верхние и нижние треугольные матрицы, которые легче инвертировать.

Метод Ньютона

Обобщение метода Ньютона, используемого для мультипликативного обратного алгоритма, может быть удобным, если удобно найти подходящее начальное начальное число:

{\ displaystyle X_ {k + 1} = 2X_ {k} -X_ {k} AX_ {k}.}

Виктор Пэн и Джон Рейф проделали работу, которая включает способы создания начального семени. ^[6]^[7] Журнал Byte резюмировал один из их подходов. ^[8]

Метод Ньютона особенно полезен при работе с семействами связанных матриц, которые ведут себя достаточно похоже на последовательность, созданную для гомотопии выше: иногда хорошей отправной точкой для уточнения приближения для новой обратной матрицы может быть уже полученная обратная матрица предыдущей, которая почти соответствует текущая матрица, например, пара последовательностей обратных матриц, используемая для получения квадратного корня матрицы с помощью итерации Денмана – Биверса ; для этого может потребоваться более одного прохода итерации в каждой новой матрице, если они не достаточно близко друг к другу, чтобы хватило только одного. Метод Ньютона также полезен для «доработки» поправок к алгоритму Гаусса – Джордана, который был загрязнен небольшими ошибками из-за несовершенной компьютерной арифметики .

Метод Кэли – Гамильтона

Теорема Кэли – Гамильтона допускает обратное ${\ displaystyle A}$ быть выраженным в терминах ${\ Displaystyle \ Det (А)}$ , следы и силы ${\ displaystyle A}$ : ^[9]

{\ displaystyle \ mathbf {A} ^ {- 1} = {\ frac {1} {\ det (\ mathbf {A})}} \ sum _ {s = 0} ^ {n-1} \ mathbf {A } ^ {s} \ sum _ {k_ {1}, k_ {2}, \ ldots, k_ {n-1}} \ prod _ {l = 1} ^ {n-1} {\ frac {(-1 ) ^ {k_ {l} +1}} {l ^ {k_ {l}} k_ {l}!}} \ operatorname {tr} \ left (\ mathbf {A} ^ {l} \ right) ^ {k_ {l}},}

где ${\ displaystyle n}$ это измерение ${\ displaystyle A}$ , а также ${\ displaystyle \ operatorname {tr} (A)}$ это след матрицы ${\ displaystyle A}$ дается суммой главной диагонали. Сумма принимается ${\ displaystyle s}$ и наборы всех ${\ displaystyle k_ {l} \ geq 0}$ удовлетворяющий линейному диофантову уравнению

{\ displaystyle s + \ sum _ {l = 1} ^ {n-1} lk_ {l} = n-1.}

Формулу можно переписать в терминах полных многочленов Белла от аргументов ${\ displaystyle t_ {l} = - (l-1)! \ operatorname {tr} \ left (A ^ {l} \ right)}$ в виде

{\ displaystyle \ mathbf {A} ^ {- 1} = {\ frac {1} {\ det (\ mathbf {A})}} \ sum _ {s = 1} ^ {n} \ mathbf {A} ^ {s-1} {\ frac {(-1) ^ {n-1}} {(ns)!}} B_ {ns} (t_ {1}, t_ {2}, \ ldots, t_ {ns}) .}

Собственное разложение

Если матрица может быть eigendecomposed, и если ни один из его собственных значений равны нулю, то не обратим и обратный дается

{\ Displaystyle \ mathbf {A} ^ {- 1} = \ mathbf {Q} \ mathbf {\ Lambda} ^ {- 1} \ mathbf {Q} ^ {- 1},}

где ${\ displaystyle \ mathbf {Q}}$ квадратная ( N × N ) матрица, i -й столбец которой является собственным вектором ${\ displaystyle q_ {i}}$ из ${\ displaystyle \ mathbf {A}}$ , а также ${\ displaystyle \ mathbf {\ Lambda}}$ - диагональная матрица , диагональные элементы которой являются соответствующими собственными значениями, т. е. ${\ displaystyle \ Lambda _ {ii} = \ lambda _ {i}}$ . Если ${\ displaystyle \ mathbf {A}}$ симметрично, ${\ displaystyle \ mathbf {Q}}$ гарантированно будет ортогональной матрицей , поэтому ${\ Displaystyle \ mathbf {Q} ^ {- 1} = \ mathbf {Q} ^ {\ mathrm {T}}}$ . Кроме того, поскольку ${\ displaystyle \ mathbf {\ Lambda}}$ - диагональная матрица, обратная к ней легко вычисляется:

{\ displaystyle \ left [\ Lambda ^ {- 1} \ right] _ {ii} = {\ frac {1} {\ lambda _ {i}}}.}

Разложение Холецкого

Если матрица является положительно определена , то его обратная можно получить как

{\ displaystyle \ mathbf {A} ^ {- 1} = \ left (\ mathbf {L} ^ {*} \ right) ^ {- 1} \ mathbf {L} ^ {- 1},}

где L является нижним треугольным Холецким разложением на А , а L * обозначает сопряженные транспонированную L .

Аналитическое решение

Запись транспонированной матрицы кофакторов , известной как сопряженная матрица , также может быть эффективным способом вычисления обратного значения малых матриц, но этот рекурсивный метод неэффективен для больших матриц. Чтобы определить обратное, вычисляем матрицу сомножителей:

{\ displaystyle \ mathbf {A} ^ {- 1} = {1 \ over {\ begin {vmatrix} \ mathbf {A} \ end {vmatrix}}} \ mathbf {C} ^ {\ mathrm {T}} = {1 \ over {\ begin {vmatrix} \ mathbf {A} \ end {vmatrix}}} {\ begin {pmatrix} \ mathbf {C} _ {11} & \ mathbf {C} _ {21} & \ cdots & \ mathbf {C} _ {n1} \\\ mathbf {C} _ {12} & \ mathbf {C} _ {22} & \ cdots & \ mathbf {C} _ {n2} \\\ vdots & \ vdots & \ ddots & \ vdots \\\ mathbf {C} _ {1n} & \ mathbf {C} _ {2n} & \ cdots & \ mathbf {C} _ {nn} \\\ end {pmatrix}}}

чтобы

{\ displaystyle \ left (\ mathbf {A} ^ {- 1} \ right) _ {ij} = {1 \ over {\ begin {vmatrix} \ mathbf {A} \ end {vmatrix}}} \ left (\ mathbf {C} ^ {\ mathrm {T}} \ right) _ {ij} = {1 \ over {\ begin {vmatrix} \ mathbf {A} \ end {vmatrix}}} \ left (\ mathbf {C} _ {ji} \ right)}

где | А | является фактором , определяющим из А , С является матрица кофакторов , и С ^Т представляет собой матрицу транспонирование .

Инверсия матриц 2 × 2

Уравнение кофактора перечисленных выше , дает следующий результат для 2 × 2 матриц. Инверсия этих матриц может быть произведена следующим образом: ^[10]

{\ displaystyle \ mathbf {A} ^ {- 1} = {\ begin {bmatrix} a & b \\ c & d \\\ end {bmatrix}} ^ {- 1} = {\ frac {1} {\ det \ mathbf { A}}} {\ begin {bmatrix} \, \, \, d & \! \! - b \\ - c & \, a \\\ end {bmatrix}} = {\ frac {1} {ad-bc} } {\ begin {bmatrix} \, \, \, d & \! \! - b \\ - c & \, a \\\ end {bmatrix}}.}.

Это возможно, потому что 1 / ( ad - bc ) является обратной величиной определителя рассматриваемой матрицы, и та же стратегия может быть использована для других размеров матриц.

Метод Кэли – Гамильтона дает

{\ displaystyle \ mathbf {A} ^ {- 1} = {\ frac {1} {\ det \ mathbf {A}}} \ left [\ left (\ operatorname {tr} \ mathbf {A} \ right) \ mathbf {I} - \ mathbf {A} \ right].}

Инверсия матриц 3 × 3

Вычислительно эффективная инверсия матрицы 3 × 3 дается выражением

{\ displaystyle \ mathbf {A} ^ {- 1} = {\ begin {bmatrix} a & b & c \\ d & e & f \\ g & h & i \\\ end {bmatrix}} ^ {- 1} = {\ frac {1} {\ det (\ mathbf {A})}} {\ begin {bmatrix} \, A & \, B & \, C \\\, D & \, E & \, F \\\, G & \, H & \, I \\\ конец {bmatrix}} ^ {\ mathrm {T}} = {\ frac {1} {\ det (\ mathbf {A})}} {\ begin {bmatrix} \, A & \, D & \, G \\\, B & \, E & \, H \\\, C & \, F & \, I \\\ end {bmatrix}}}

(где скаляр A не следует путать с матрицей A ).

Если определитель не равен нулю, матрица обратима, а элементы промежуточной матрицы в правой части выше заданы формулой

{\ displaystyle {\ begin {alignat} {6} A & = {} & (ei-fh), & \ quad & D & = {} & - (bi-ch), & \ quad & G & = {} & (bf-ce ), \\ B & = {} & - (di-fg), & \ quad & E & = {} & (ai-cg), & \ quad & H & = {} & - (af-cd), \\ C & = { } & (dh-eg), & \ quad & F & = {} & - (ah-bg), & \ quad & I & = {} & (ae-bd). \\\ end {alignat}}}

Определитель A можно вычислить, применив правило Сарруса следующим образом:

{\ Displaystyle \ Det (\ mathbf {A}) = aA + bB + cC.}

Разложение Кэли – Гамильтона дает

{\ displaystyle \ mathbf {A} ^ {- 1} = {\ frac {1} {\ det (\ mathbf {A})}} \ left ({\ frac {1} {2}} \ left [(\ имя оператора {tr} \ mathbf {A}) ^ {2} - \ operatorname {tr} \ mathbf {A} ^ {2} \ right] \ mathbf {I} - \ mathbf {A} \ имя оператора {tr} \ mathbf {A} + \ mathbf {A} ^ {2} \ right).}

Общее обратное 3 × 3 может быть кратко выражено в терминах перекрестного произведения и тройного произведения . Если матрица ${\ displaystyle \ mathbf {A} = {\ begin {bmatrix} \ mathbf {x} _ {0} & \ mathbf {x} _ {1} & \ mathbf {x} _ {2} \ end {bmatrix}} }$ (состоящий из трех векторов-столбцов, ${\ displaystyle \ mathbf {x} _ {0}}$ , ${\ displaystyle \ mathbf {x} _ {1}}$ , а также ${\ displaystyle \ mathbf {x} _ {2}}$ ) обратима, обратная ему дается формулой

{\ displaystyle \ mathbf {A} ^ {- 1} = {\ frac {1} {\ det (\ mathbf {A})}} {\ begin {bmatrix} {(\ mathbf {x_ {1}} \ раз \ mathbf {x_ {2}})} ^ {\ mathrm {T}} \\ {(\ mathbf {x_ {2}} \ times \ mathbf {x_ {0}})} ^ {\ mathrm {T}} \\ {(\ mathbf {x_ {0}} \ times \ mathbf {x_ {1}})} ^ {\ mathrm {T}} \ end {bmatrix}}.}

Определитель A, ${\ Displaystyle \ Det (\ mathbf {A})}$ , равна тройному произведению ${\ displaystyle \ mathbf {x_ {0}}}$ , ${\ displaystyle \ mathbf {x_ {1}}}$ , а также ${\ Displaystyle \ mathbf {x_ {2}}}$ - объем параллелепипеда, образованный строками или столбцами:

{\ displaystyle \ det (\ mathbf {A}) = \ mathbf {x} _ {0} \ cdot (\ mathbf {x} _ {1} \ times \ mathbf {x} _ {2}).}

Правильность формулы можно проверить, используя свойства перекрестного и тройного произведения, а также отметив, что для групп всегда совпадают левые и правые инверсии. Интуитивно из-за перекрестных произведений каждая строка ${\ displaystyle \ mathbf {A} ^ {- 1}}$ ортогонален двум несоответствующим столбцам матрицы ${\ displaystyle \ mathbf {A}}$ (в результате чего недиагональные члены ${\ Displaystyle \ mathbf {I} = \ mathbf {A} ^ {- 1} \ mathbf {A}}$ быть нулевым). Деление на

{\ Displaystyle \ Det (\ mathbf {A}) = \ mathbf {x} _ {0} \ cdot (\ mathbf {x} _ {1} \ times \ mathbf {x} _ {2})}

вызывает диагональные элементы ${\ Displaystyle \ mathbf {I} = \ mathbf {A} ^ {- 1} \ mathbf {A}}$ быть единством. Например, первая диагональ:

{\ displaystyle 1 = {\ frac {1} {\ mathbf {x_ {0}} \ cdot (\ mathbf {x} _ {1} \ times \ mathbf {x} _ {2})}} \ mathbf {x_ {0}} \ cdot (\ mathbf {x} _ {1} \ times \ mathbf {x} _ {2}).}

Инверсия матриц 4 × 4

С увеличением размерности выражения для обратной величины A усложняются. При n = 4 метод Кэли – Гамильтона приводит к выражению, которое все еще остается приемлемым:

{\ displaystyle \ mathbf {A} ^ {- 1} = {\ frac {1} {\ det (\ mathbf {A})}} \ left ({\ frac {1} {6}} \ left [(\ имя оператора {tr} \ mathbf {A}) ^ {3} -3 \ имя оператора {tr} \ mathbf {A} \ имя оператора {tr} \ mathbf {A} ^ {2} +2 \ имя оператора {tr} \ mathbf { A} ^ {3} \ right] \ mathbf {I} - {\ frac {1} {2}} \ mathbf {A} \ left [(\ operatorname {tr} \ mathbf {A}) ^ {2} - \ operatorname {tr} \ mathbf {A} ^ {2} \ right] + \ mathbf {A} ^ {2} \ operatorname {tr} \ mathbf {A} - \ mathbf {A} ^ {3} \ right) .}

Блочная инверсия

Матрицы также можно инвертировать поблочно , используя следующую формулу аналитического обращения:

{\ displaystyle {\ begin {bmatrix} \ mathbf {A} & \ mathbf {B} \\\ mathbf {C} & \ mathbf {D} \ end {bmatrix}} ^ {- 1} = {\ begin {bmatrix } \ mathbf {A} ^ {- 1} + \ mathbf {A} ^ {- 1} \ mathbf {B} \ left (\ mathbf {D} - \ mathbf {CA} ^ {- 1} \ mathbf {B } \ right) ^ {- 1} \ mathbf {CA} ^ {- 1} & - \ mathbf {A} ^ {- 1} \ mathbf {B} \ left (\ mathbf {D} - \ mathbf {CA} ^ {- 1} \ mathbf {B} \ right) ^ {- 1} \\ - \ left (\ mathbf {D} - \ mathbf {CA} ^ {- 1} \ mathbf {B} \ right) ^ { -1} \ mathbf {CA} ^ {- 1} & \ left (\ mathbf {D} - \ mathbf {CA} ^ {- 1} \ mathbf {B} \ right) ^ {- 1} \ end {bmatrix }},}

( 1 )

где A , B , C и D - матричные субблоки произвольного размера. ( A должен быть квадратным, чтобы его можно было инвертировать. Кроме того, A и $D - CA -1 B$ должны быть невырожденными. ^[11] ) Эта стратегия особенно выгодна, если A диагональна, а $D - CA -1 B$ ( алгоритм Шура дополнение к A ) является маленькой матрицей, так как это единственные матрицы, требующие инверсии.

Этот метод был изобретен несколько раз заново, и он принадлежит Гансу Больцу (1923), ^{[ необходима цитата ],} который использовал его для обращения геодезических матриц, и Тадеушу Банахевичу (1937), который обобщил его и доказал его правильность.

Теорема о нулевом значении говорит, что нулевое значение A равно нулю субблока в правом нижнем углу обратной матрицы, а нулевое значение B равно нулю субблока в верхнем правом углу обратной матрицы.

Процедура инверсии, которая привела к уравнению ( 1 ), выполняла операции матричного блока, которые сначала работали с C и D. Вместо этого, если сначала оперировать A и B , и при условии, что D и $A - BD -1 C$ неособые, ^[12] результат будет

{\ displaystyle {\ begin {bmatrix} \ mathbf {A} & \ mathbf {B} \\\ mathbf {C} & \ mathbf {D} \ end {bmatrix}} ^ {- 1} = {\ begin {bmatrix } \ left (\ mathbf {A} - \ mathbf {BD} ^ {- 1} \ mathbf {C} \ right) ^ {- 1} & - \ left (\ mathbf {A} - \ mathbf {BD} ^ {-1} \ mathbf {C} \ right) ^ {- 1} \ mathbf {BD} ^ {- 1} \\ - \ mathbf {D} ^ {- 1} \ mathbf {C} \ left (\ mathbf {A} - \ mathbf {BD} ^ {- 1} \ mathbf {C} \ right) ^ {- 1} & \ quad \ mathbf {D} ^ {- 1} + \ mathbf {D} ^ {- 1 } \ mathbf {C} \ left (\ mathbf {A} - \ mathbf {BD} ^ {- 1} \ mathbf {C} \ right) ^ {- 1} \ mathbf {BD} ^ {- 1} \ end {bmatrix}}.}

( 2 )

Приравнивание уравнений ( 1 ) и ( 2 ) приводит к

{\ displaystyle {\ begin {align} \ left (\ mathbf {A} - \ mathbf {BD} ^ {- 1} \ mathbf {C} \ right) ^ {- 1} & = \ mathbf {A} ^ { -1} + \ mathbf {A} ^ {- 1} \ mathbf {B} \ left (\ mathbf {D} - \ mathbf {CA} ^ {- 1} \ mathbf {B} \ right) ^ {- 1 } \ mathbf {CA} ^ {- 1} \\\ left (\ mathbf {A} - \ mathbf {BD} ^ {- 1} \ mathbf {C} \ right) ^ {- 1} \ mathbf {BD} ^ {- 1} & = \ mathbf {A} ^ {- 1} \ mathbf {B} \ left (\ mathbf {D} - \ mathbf {CA} ^ {- 1} \ mathbf {B} \ right) ^ {-1} \\\ mathbf {D} ^ {- 1} \ mathbf {C} \ left (\ mathbf {A} - \ mathbf {BD} ^ {- 1} \ mathbf {C} \ right) ^ { -1} & = \ left (\ mathbf {D} - \ mathbf {CA} ^ {- 1} \ mathbf {B} \ right) ^ {- 1} \ mathbf {CA} ^ {- 1} \\\ mathbf {D} ^ {- 1} + \ mathbf {D} ^ {- 1} \ mathbf {C} \ left (\ mathbf {A} - \ mathbf {BD} ^ {- 1} \ mathbf {C} \ справа) ^ {- 1} \ mathbf {BD} ^ {- 1} & = \ left (\ mathbf {D} - \ mathbf {CA} ^ {- 1} \ mathbf {B} \ right) ^ {- 1 } \ конец {выровнено}}}

( 3 )

где уравнение ( 3 ) представляет собой матричное тождество Вудбери , что эквивалентно биномиальной обратной теореме .

Если A и D оба обратимы, то две вышеупомянутые инверсии блочной матрицы могут быть объединены, чтобы обеспечить простую факторизацию

{\ displaystyle {\ begin {bmatrix} \ mathbf {A} & \ mathbf {B} \\\ mathbf {C} & \ mathbf {D} \ end {bmatrix}} ^ {- 1} = {\ begin {bmatrix } \ left (\ mathbf {A} - \ mathbf {B} \ mathbf {D} ^ {- 1} \ mathbf {C} \ right) ^ {- 1} & \ mathbf {0} \\\ mathbf {0 } & \ left (\ mathbf {D} - \ mathbf {C} \ mathbf {A} ^ {- 1} \ mathbf {B} \ right) ^ {- 1} \ end {bmatrix}} {\ begin {bmatrix } \ mathbf {I} & - \ mathbf {B} \ mathbf {D} ^ {- 1} \\ - \ mathbf {C} \ mathbf {A} ^ {- 1} & \ mathbf {I} \ end { bmatrix}}.}

( 2 )

Согласно тождеству Вайнштейна – Ароншайна одна из двух матриц в блочно-диагональной матрице обратима в точности тогда, когда другая обратима.

Поскольку для поблочного обращения матрицы размера $n \times n$ требуется инверсия двух матриц половинного размера и 6 умножений между двумя матрицами половинного размера, можно показать, что алгоритм разделяй и властвуй, который использует поблочное обращение для инвертирования матрицы, работает с тем же временная сложность как алгоритм умножения матриц, который используется внутри компании. ^[13] Исследование сложности матричного умножения показывает, что существуют алгоритмы матричного умножения со сложностью $O (n 2.3727)$ операций, в то время как наилучшая доказанная нижняя граница - $Ω (n 2 log n)$ . ^[14]

Эта формула значительно упрощается, когда верхняя правая блочная матрица ${\ displaystyle B}$ - нулевая матрица. Эта формулировка полезна, когда матрицы ${\ displaystyle A}$ а также ${\ displaystyle D}$ имеют относительно простые обратные формулы (или псевдообратные в случае, когда блоки не все квадратные. В этом частном случае формула обращения блочной матрицы, изложенная выше в полной общности, становится

{\ displaystyle {\ begin {bmatrix} \ mathbf {A} & \ mathbf {0} \\\ mathbf {C} & \ mathbf {D} \ end {bmatrix}} ^ {- 1} = {\ begin {bmatrix } \ mathbf {A} ^ {- 1} & \ mathbf {0} \\ - \ mathbf {D} ^ {- 1} \ mathbf {CA} ^ {- 1} & \ mathbf {D} ^ {- 1 } \ end {bmatrix}}.}

По серии Neumann

Если матрица A обладает свойством, что

{\ Displaystyle \ lim _ {п \ к \ infty} (\ mathbf {I} - \ mathbf {A}) ^ {n} = 0}

тогда A невырожден, и его обратное может быть выражено рядом Неймана : ^[15]

{\ displaystyle \ mathbf {A} ^ {- 1} = \ sum _ {n = 0} ^ {\ infty} (\ mathbf {I} - \ mathbf {A}) ^ {n}.}

Усечение суммы приводит к «приблизительному» обратному результату, который может быть полезен в качестве предобуславливателя . Обратите внимание, что усеченный ряд можно ускорить экспоненциально, если учесть, что ряд Неймана представляет собой геометрическую сумму . Таким образом, он удовлетворяет

{\ Displaystyle \ сумма _ {п = 0} ^ {2 ^ {L} -1} (\ mathbf {I} - \ mathbf {A}) ^ {n} = \ prod _ {l = 0} ^ {L -1} \ left (\ mathbf {I} + (\ mathbf {I} - \ mathbf {A}) ^ {2 ^ {l}} \ right)}

.

Поэтому только ${\ displaystyle 2L-2}$ умножения матриц необходимы для вычисления ${\ displaystyle 2 ^ {L}}$ условия суммы.

В более общем смысле, если A находится «рядом» с обратимой матрицей X в том смысле, что

{\ displaystyle \ lim _ {n \ to \ infty} \ left (\ mathbf {I} - \ mathbf {X} ^ {- 1} \ mathbf {A} \ right) ^ {n} = 0 \ mathrm {~ ~ или ~~} \ lim _ {n \ to \ infty} \ left (\ mathbf {I} - \ mathbf {A} \ mathbf {X} ^ {- 1} \ right) ^ {n} = 0}

то A невырожден и обратный ему равен

{\ displaystyle \ mathbf {A} ^ {- 1} = \ sum _ {n = 0} ^ {\ infty} \ left (\ mathbf {X} ^ {- 1} (\ mathbf {X} - \ mathbf { A}) \ right) ^ {n} \ mathbf {X} ^ {- 1} ~.}

Если также верно, что A - X имеет ранг 1, то это упрощается до

{\ displaystyle \ mathbf {A} ^ {- 1} = \ mathbf {X} ^ {- 1} - {\ frac {\ mathbf {X} ^ {- 1} (\ mathbf {A} - \ mathbf {X }) \ mathbf {X} ^ {- 1}} {1+ \ operatorname {tr} \ left (\ mathbf {X} ^ {- 1} (\ mathbf {A} - \ mathbf {X}) \ right) }} ~.}

p -адическое приближение

Если A - матрица с целыми или рациональными коэффициентами, и мы ищем решение в рациональных числах произвольной точности , то метод p -адической аппроксимации сходится к точному решению в ${\ Displaystyle О \ влево (п ^ {4} \ log ^ {2} п \ вправо)}$ , предполагая стандартный ${\ Displaystyle О \ влево (п ^ {3} \ вправо)}$ используется матричное умножение. ^[16] Метод основан на решении n линейных систем с помощью метода p -адической аппроксимации Диксона (каждая в ${\ Displaystyle О (п ^ {3} \ журнал ^ {2} п)}$ ) и доступен как таковой в программном обеспечении, специализирующемся на матричных операциях произвольной точности, например, в IML. ^[17]

Метод взаимных базисных векторов

Учитывая ${\ Displaystyle п \ раз п}$ квадратная матрица ${\ Displaystyle \ mathbf {X} = \ влево [х ^ {ij} \ вправо]}$ , ${\ Displaystyle 1 \ Leq я, J \ Leq п}$ , с участием ${\ displaystyle n}$ строки интерпретируются как ${\ displaystyle n}$ векторов ${\ displaystyle \ mathbf {x} _ {i} = x ^ {ij} \ mathbf {e} _ {j}}$ ( Предполагается суммирование Эйнштейна ), где ${\ displaystyle \ mathbf {e} _ {j}}$ являются стандартной ортонормированный базис в евклидовом пространстве ${\ Displaystyle \ mathbb {R} ^ {п}}$ ( ${\ displaystyle \ mathbf {e} _ {i} = \ mathbf {e} ^ {i}, \ mathbf {e} _ {i} \ cdot \ mathbf {e} ^ {j} = \ delta _ {i} ^ {j}}$ ), затем, используя алгебру Клиффорда (или геометрическую алгебру ), мы вычисляем обратные (иногда называемые двойственными ) векторами-столбцами ${\ displaystyle \ mathbf {x} ^ {i} = x_ {ji} \ mathbf {e} ^ {j} = (- 1) ^ {i-1} (\ mathbf {x} _ {1} \ клин \ cdots \ wedge () _ {i} \ wedge \ cdots \ wedge \ mathbf {x} _ {n}) \ cdot (\ mathbf {x} _ {1} \ wedge \ \ mathbf {x} _ {2} \ клин \ cdots \ клин \ mathbf {x} _ {n}) ^ {- 1}}$ как столбцы обратной матрицы ${\ Displaystyle \ mathbf {X} ^ {- 1} = [x_ {ji}]}$ . Обратите внимание, что место " ${\ displaystyle () _ {я}}$ " указывает, что " ${\ Displaystyle \ mathbf {х} _ {я}}$ "удалено с этого места в приведенном выше выражении для ${\ Displaystyle \ mathbf {х} ^ {я}}$ . Тогда у нас есть ${\ displaystyle \ mathbf {X} \ mathbf {X} ^ {- 1} = \ left [\ mathbf {x} _ {i} \ cdot \ mathbf {x} ^ {j} \ right] = \ left [\ дельта _ {i} ^ {j} \ right] = \ mathbf {I} _ {n}}$ , где ${\ displaystyle \ delta _ {я} ^ {j}}$ - дельта Кронекера . У нас также есть ${\ Displaystyle \ mathbf {X} ^ {- 1} \ mathbf {X} = \ left [\ left (\ mathbf {e} _ {i} \ cdot \ mathbf {x} ^ {k} \ right) \ left (\ mathbf {e} ^ {j} \ cdot \ mathbf {x} _ {k} \ right) \ right] = \ left [\ mathbf {e} _ {i} \ cdot \ mathbf {e} ^ {j } \ right] = \ left [\ delta _ {i} ^ {j} \ right] = \ mathbf {I} _ {n}}$ , как требуется. Если векторы ${\ Displaystyle \ mathbf {х} _ {я}}$ не являются линейно независимыми, то ${\ displaystyle (\ mathbf {x} _ {1} \ wedge \ mathbf {x} _ {2} \ wedge \ cdots \ wedge \ mathbf {x} _ {n}) = 0}$ и матрица ${\ displaystyle \ mathbf {X}}$ не обратима (не имеет обратного).

Производная обратной матрицы

Предположим, что обратимая матрица A зависит от параметра t . Тогда производная, обратная к A по t, равна ^[18]

{\ displaystyle {\ frac {\ mathrm {d} \ mathbf {A} ^ {- 1}} {\ mathrm {d} t}} = - \ mathbf {A} ^ {- 1} {\ frac {\ mathrm {d} \ mathbf {A}} {\ mathrm {d} t}} \ mathbf {A} ^ {- 1}.}

Чтобы вывести указанное выше выражение для производной обратной матрицы A , можно дифференцировать определение матрицы, обратной ${\ Displaystyle \ mathbf {A} ^ {- 1} \ mathbf {A} = \ mathbf {I}}$ а затем решите для обратного к A :

{\ displaystyle {\ frac {\ mathrm {d} \ mathbf {A} ^ {- 1} \ mathbf {A}} {\ mathrm {d} t}} = {\ frac {\ mathrm {d} \ mathbf { A} ^ {- 1}} {\ mathrm {d} t}} \ mathbf {A} + \ mathbf {A} ^ {- 1} {\ frac {\ mathrm {d} \ mathbf {A}} {\ mathrm {d} t}} = {\ frac {\ mathrm {d} \ mathbf {I}} {\ mathrm {d} t}} = \ mathbf {0}.}

Вычитание ${\ displaystyle \ mathbf {A} ^ {- 1} {\ frac {\ mathrm {d} \ mathbf {A}} {\ mathrm {d} t}}}$ с обеих сторон вышеуказанного и умножая справа на ${\ displaystyle \ mathbf {A} ^ {- 1}}$ дает правильное выражение для производной обратного:

{\ displaystyle {\ frac {\ mathrm {d} \ mathbf {A} ^ {- 1}} {\ mathrm {d} t}} = - \ mathbf {A} ^ {- 1} {\ frac {\ mathrm {d} \ mathbf {A}} {\ mathrm {d} t}} \ mathbf {A} ^ {- 1}.}

Аналогично, если ${\ Displaystyle \ varepsilon}$ это небольшое число, тогда

{\ displaystyle \ left (\ mathbf {A} + \ varepsilon \ mathbf {X} \ right) ^ {- 1} = \ mathbf {A} ^ {- 1} - \ varepsilon \ mathbf {A} ^ {- 1 } \ mathbf {X} \ mathbf {A} ^ {- 1} + {\ mathcal {O}} (\ varepsilon ^ {2}) \ ,.}

В более общем смысле, если

{\ displaystyle {\ frac {\ mathrm {d} f (\ mathbf {A})} {\ mathrm {d} t}} = \ sum _ {i} g_ {i} (\ mathbf {A}) {\ гидроразрыв {\ mathrm {d} \ mathbf {A}} {\ mathrm {d} t}} h_ {i} (\ mathbf {A}),}

тогда,

{\ Displaystyle е (\ mathbf {A} + \ varepsilon \ mathbf {X}) = f (\ mathbf {A}) + \ varepsilon \ sum _ {i} g_ {i} (\ mathbf {A}) \ mathbf {X} h_ {i} (\ mathbf {A}) + {\ mathcal {O}} \ left (\ varepsilon ^ {2} \ right).}

Учитывая положительное целое число ${\ displaystyle n}$ ,

{\ displaystyle {\ begin {align} {\ frac {\ mathrm {d} \ mathbf {A} ^ {n}} {\ mathrm {d} t}} & = \ sum _ {i = 1} ^ {n } \ mathbf {A} ^ {i-1} {\ frac {\ mathrm {d} \ mathbf {A}} {\ mathrm {d} t}} \ mathbf {A} ^ {ni}, \\ {\ гидроразрыв {\ mathrm {d} \ mathbf {A} ^ {- n}} {\ mathrm {d} t}} & = - \ sum _ {i = 1} ^ {n} \ mathbf {A} ^ {- i} {\ frac {\ mathrm {d} \ mathbf {A}} {\ mathrm {d} t}} \ mathbf {A} ^ {- (n + 1-i)}. \ end {выравнивается}}}

Следовательно,

{\ displaystyle {\ begin {align} (\ mathbf {A} + \ varepsilon \ mathbf {X}) ^ {n} & = \ mathbf {A} ^ {n} + \ varepsilon \ sum _ {i = 1} ^ {n} \ mathbf {A} ^ {i-1} \ mathbf {X} \ mathbf {A} ^ {ni} + {\ mathcal {O}} \ left (\ varepsilon ^ {2} \ right), \\ (\ mathbf {A} + \ varepsilon \ mathbf {X}) ^ {- n} & = \ mathbf {A} ^ {- n} - \ varepsilon \ sum _ {i = 1} ^ {n} \ mathbf {A} ^ {- i} \ mathbf {X} \ mathbf {A} ^ {- (n + 1-i)} + {\ mathcal {O}} \ left (\ varepsilon ^ {2} \ right) . \ end {выровнено}}}

Обобщенная обратная

Некоторые свойства обратных матриц являются общими для обобщенных обратных матриц (например, обратная матрица Мура – Пенроуза ), которая может быть определена для любой матрицы размера m на n .

Приложения

Для большинства практических приложений нет необходимости инвертировать матрицу для решения системы линейных уравнений ; однако, для однозначного решения, то есть необходимо, чтобы матрица участвует обратимым.

Методы декомпозиции, такие как LU-декомпозиция , намного быстрее, чем инверсия, также были разработаны различные быстрые алгоритмы для специальных классов линейных систем.

Регрессия / наименьшие квадраты

Хотя явное обратное не требуется для оценки вектора неизвестных, это самый простой способ оценить их точность, находящуюся на диагонали обратной матрицы (матрица апостериорной ковариации вектора неизвестных). Однако во многих случаях известны более быстрые алгоритмы вычисления только диагональных элементов обратной матрицы. ^[19]

Обращение матриц в симуляциях в реальном времени

Инверсия матриц играет важную роль в компьютерной графике , особенно в рендеринге трехмерной графики и трехмерном моделировании. Примеры включают преобразование лучей из экрана в мир , преобразования объектов из мира в подпространство в мир и физические симуляции.

Матрица инверсия в беспроводной связи MIMO

Инверсия матрицы также играет важную роль в технологии MIMO (Multiple-Input, Multiple-Output) в беспроводной связи. Система MIMO состоит из N передающих и M приемных антенн. Уникальные сигналы, занимающие одну и ту же полосу частот, отправляются через N передающих антенн и принимаются через M приемных антенн. Сигнала , поступающего на каждой приемной антенны будет представлять собой линейную комбинацию из N передаваемых сигналов , образующих N × M матрицу передачи H . Крайне важно, чтобы матрица H была обратимой, чтобы приемник мог вычислить передаваемую информацию.

Смотрите также

Биномиальная обратная теорема
LU разложение
Разложение матрицы
Матричный квадратный корень
Минор (линейная алгебра)
Частичная обратная матрица
Псевдообратный
Разложение по сингулярным числам
Тождество матрицы Вудбери

дальнейшее чтение

"Обращение матрицы" , Энциклопедия математики , EMS Press , 2001 [1994]
Кормен, Томас Х .; Лейзерсон, Чарльз Э .; Ривест, Рональд Л .; Стейн, Клиффорд (2001) [1990]. «28.4: Инвертирование матриц». Введение в алгоритмы (2-е изд.). MIT Press и McGraw-Hill. С. 755–760. ISBN 0-262-03293-7.
Бернштейн, Деннис С. (2009). Матричная математика: теория, факты и формулы (2-е изд.). Издательство Принстонского университета. ISBN 978-0691140391- через Google Книги .
Петерсен, Кааре Брандт; Педерсен, Майкл Сискинд (15 ноября 2012 г.). "Поваренная книга Матрицы" (PDF) . С. 17–23.

Внешние ссылки

Сандерсон, Грант (15 августа 2016 г.). «Обратные матрицы, пространство столбцов и пустое пространство» . Суть линейной алгебры - через YouTube .
Стрэнг, Гилберт. «Лекция по линейной алгебре по обратным матрицам» . MIT OpenCourseWare .
Символьный калькулятор обратной матрицы с указанными шагами
Обратная матрица Мура-Пенроуза

[:0-1] «Исчерпывающий список символов алгебры» . Математическое хранилище . 2020-03-25 . Проверено 8 сентября 2020 .

[2] «Обратимые матрицы» . www.sosmath.com . Проверено 8 сентября 2020 .

[3] Вайсштейн, Эрик В. «Матрица инверсная» . mathworld.wolfram.com . Проверено 8 сентября 2020 .

[4] Вайсштейн, Эрик В. «Теорема об обратимой матрице» . mathworld.wolfram.com . Проверено 8 сентября 2020 .

[5] Хорн, Роджер А .; Джонсон, Чарльз Р. (1985). Матричный анализ . Издательство Кембриджского университета . п. 14. ISBN 978-0-521-38632-6..

[6] Пан, Виктор; Рейф, Джон (1985), Эффективное параллельное решение линейных систем , Труды 17-го ежегодного симпозиума ACM по теории вычислений, Providence: ACM

[7] Пан, Виктор; Рейф, Джон (1985), Центр исследований в области вычислительной техники Гарвардского университета, отчет TR-02-85 , Кембридж, Массачусетс: вычислительная лаборатория Эйкена

[8] «Обращение больших матриц». Байт Журнал . 11 (4): 181–190. Апрель 1986 г.

[9] Доказательство можно найти в Приложении B к Кондратюк, Л.А.; Криворученко М.И. (1992). «Сверхпроводящее кварковое вещество в цветовой группе SU (2)» . Zeitschrift für Physik . 344 : 99–115. DOI : 10.1007 / BF01291027 . S2CID 120467300 .

[10] Стрэнг, Гилберт (2003). Введение в линейную алгебру (3-е изд.). СИАМ. п. 71. ISBN 978-0-9614088-9-3., Глава 2, страница 71

[11] Бернштейн, Деннис (2005). Матричная математика . Издательство Принстонского университета. п. 44. ISBN 978-0-691-11802-4.

[12] Бернштейн, Деннис (2005). Матричная математика . Издательство Принстонского университета. п. 45. ISBN 978-0-691-11802-4.

[13] TH Cormen, CE Leiserson, RL Rivest, C. Stein, Введение в алгоритмы , 3-е изд., MIT Press, Кембридж, Массачусетс, 2009, §28.2.

[14] Ran Raz . О сложности матричного произведения. В материалах тридцать четвертого ежегодного симпозиума ACM по теории вычислений. ACM Press, 2002. DOI : 10,1145 / 509907,509932 .

[15] Стюарт, Гилберт (1998). Матричные алгоритмы: основные разложения . СИАМ. п. 55. ISBN 978-0-89871-414-2.

[16] Haramoto, H .; Мацумото, М. (2009). «P-адический алгоритм вычисления инверсии целочисленных матриц» . Журнал вычислительной и прикладной математики . 225 : 320–322. DOI : 10.1016 / j.cam.2008.07.044 .

[17] «IML - Библиотека целочисленных матриц» . cs.uwaterloo.ca . Проверено 14 апреля 2018 года .

[18] Магнус, Ян Р .; Neudecker, Хайнц (1999). Матричное дифференциальное исчисление: с приложениями в статистике и эконометрике (пересмотренное издание). Нью-Йорк: Джон Вили и сыновья. С. 151–152. ISBN 0-471-98633-X.

[19] Линь, Линь; Лу, Цзяньфэн; Инь, Лексинг; Автомобиль, Роберто; E, Weinan (2009). «Быстрый алгоритм выделения диагонали обратной матрицы с приложением к анализу электронной структуры металлических систем» . Сообщения в математических науках . 7 (3): 755–777. DOI : 10.4310 / CMS.2009.v7.n3.a12 .

[1]