Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В линейной алгебре , с ортогональной матрицей , или ортонормированной матрицей , реальная квадратная матрица , столбцы которой и строками являются ортонормированными векторами .

Один из способов выразить это -

где Q Т является транспонированной из Q и I является единичной матрицей .

Это приводит к эквивалентной характеристике: матрица Q ортогональна, если ее транспонирование равно ее обратной :

где Q -1 является обратным Q .

Ортогональная матрица Q обязательно обратят (с обратным Q -1 = Q T ), унитарный ( Q -1 = Q * ), где Q * является эрмитово сопряженным ( сопряженным транспонированным ) из Q , и , следовательно , нормальная ( Q * Q = QQ ) над действительными числами . Определитель любой ортогональной матрицы равен +1 или -1. Как линейное преобразование, Ортогональная матрица сохраняет скалярное произведение векторов, и , следовательно , действует как изометрии в евклидове пространства , например, вращение , отражение или rotoreflection . Другими словами, это унитарное преобразование .

Множество п × п ортогональных матриц образует группу , O ( п ) , известный как ортогональной группы . Подгруппа SO ( п ) , состоящая из ортогональных матриц с определителем +1 называется специальной ортогональной группой , и каждый из его элементов является специальной ортогональной матрицей . Как линейное преобразование, каждая специальная ортогональная матрица действует как вращение.

Обзор [ править ]

Ортогональная матрица - это реальная специализация унитарной матрицы и, следовательно, всегда нормальная матрица . Хотя здесь мы рассматриваем только вещественные матрицы, определение можно использовать для матриц с записями из любого поля . Однако ортогональные матрицы возникают естественным образом из скалярных произведений , а для матриц комплексных чисел это приводит к унитарному требованию. Ортогональные матрицы сохраняют скалярное произведение [1], поэтому для векторов u и v в n -мерном вещественном евклидовом пространстве

где Q - ортогональная матрица. Чтобы увидеть связь внутреннего произведения, рассмотрим вектор v в n- мерном вещественном евклидовом пространстве . Написанный относительно ортонормированного базиса, квадрат длины v равен v T v . Если линейное преобразование в матричной форме Q v сохраняет длины векторов, то

Таким образом, конечномерные линейные изометрии - вращения, отражения и их комбинации - создают ортогональные матрицы. Верно и обратное: ортогональные матрицы подразумевают ортогональные преобразования. Однако линейная алгебра включает ортогональные преобразования между пространствами, которые не могут быть ни конечномерными, ни одинаковыми, и они не имеют эквивалента ортогональной матрицы.

Ортогональные матрицы важны по ряду причин, как теоретических, так и практических. П × п ортогональные матрицы образуют группу под матричным умножением, в ортогональных группы , обозначенной O ( п ) , который-с-ее подгруппа широко используется в области математики и физических науках. Например, точечная группа молекулы является подгруппой O (3). Поскольку версии ортогональных матриц с плавающей запятой обладают полезными свойствами, они являются ключевыми для многих алгоритмов числовой линейной алгебры , таких как QR- разложение . В качестве другого примера, при соответствующей нормализациидискретное косинусное преобразование (используемое в сжатии MP3 ) представлено ортогональной матрицей.

Примеры [ править ]

Ниже приведены несколько примеров небольших ортогональных матриц и возможные интерпретации.

  •    (преобразование идентичности)
  •    (поворот на 16,26 °)
  •    (отражение по оси x )
  •    (перестановка осей координат)

Элементарные конструкции [ править ]

Нижние размеры [ править ]

Простейшими ортогональными матрицами являются матрицы 1 × 1 [1] и [−1], которые мы можем интерпретировать как тождество и отражение реальной линии через начало координат.

В 2 × 2 матрицы имеет вид

требования ортогональности удовлетворяют трем уравнениям

С учетом первого уравнения без ограничения общности пусть p = cos θ , q = sin θ ; тогда либо t = - q , u = p, либо t = q , u = - p . Мы можем интерпретировать первый случай как поворот на θ (где θ = 0 - тождество), а второй как отражение поперек линии под угломθ/2.

Частный случай матрицы отражения с θ = 90 ° генерирует отражение относительно линии под углом 45 °, задаваемой y = x, и поэтому меняет местами x и y ; это матрица перестановок с одной единицей в каждом столбце и строке (а в противном случае - 0):

Тождество также является матрицей перестановок.

Отражение является своим собственным обратным , что означает, что матрица отражения является симметричной (равной своему транспонированию), а также ортогональной. Произведение двух матриц вращения является матрицей вращения, а произведение двух матриц отражения также является матрицей вращения.

Высшие измерения [ править ]

Независимо от размера, всегда можно классифицировать ортогональные матрицы как чисто вращательные или нет, но для матриц 3 × 3 и более невращающиеся матрицы могут быть более сложными, чем отражения. Например,

представляют собой инверсию относительно начала координат и ротацию , соответственно, относительно оси z .

Вращения усложняются в более высоких измерениях; они больше не могут быть полностью охарактеризованы одним углом и могут влиять на более чем одно плоское подпространство. Обычно матрицу вращения 3 × 3 описывают в терминах оси и угла , но это работает только в трех измерениях. Выше трех измерений необходимы два или более угла, каждый из которых связан с плоскостью вращения .

Однако у нас есть элементарные строительные блоки для перестановок, отражений и поворотов, которые применимы в целом.

Примитивы [ править ]

Самая элементарная перестановка - это транспозиция, полученная из единичной матрицы перестановкой двух строк. Любая матрица перестановок n × n может быть построена как произведение не более чем n - 1 транспозиций.

Хаусхолдера отражение строится из ненулевого вектора V как

Здесь числитель представляет собой симметричную матрицу, а знаменатель - число, квадрат величины v . Это отражение в гиперплоскости, перпендикулярной v (отрицание любой компоненты вектора, параллельной v ). Если v единичный вектор, то Q = I - 2 VV T хватает. Отражение Хаусхолдера обычно используется для одновременного обнуления нижней части столбца. Любая ортогональная матрица размера n × n может быть построена как произведение не более чем n таких отражений.

Вращения Гивенс действует на двумерной (плоской) подпространства , натянутого двумя осями координат, вращающейся по выбранным углом. Обычно он используется для обнуления одной поддиагональной записи. Любая матрица вращения размера n × n может быть построена как произведение не более чемп ( п - 1)/2такие вращения. В случае матриц 3 × 3 достаточно трех таких поворотов; и, зафиксировав последовательность, мы можем, таким образом, описать все матрицы поворота 3 × 3 (хотя и не однозначно) в терминах трех используемых углов, часто называемых углами Эйлера .

Вращения Якоби имеют ту же форму, что и вращение Гивенса, но используются к нулю оба недиагональных элементов из более 2 × 2 симметричной подматрицы.

Свойства [ править ]

Свойства матрицы [ править ]

Реальная квадратная матрица ортогональна тогда и только тогда , когда ее столбцы образуют ортонормированный базис в евклидово пространства п с обычным евклидовым скалярным произведением , которое имеет место в случае , если и только если ее строки образуют ортонормированный базис н . Может возникнуть соблазн предположить, что матрица с ортогональными (не ортонормированными) столбцами будет называться ортогональной матрицей, но такие матрицы не представляют особого интереса и не имеют специального названия; они только удовлетворяют M T M = D , с D диагональная матрица .

Определитель любой ортогональной матрицы равен +1 или -1. Это следует из основных фактов о детерминантах, а именно:

Обратное неверно; наличие определителя ± 1 не гарантирует ортогональности даже с ортогональными столбцами, как показано в следующем контрпримере.

В матрицах перестановок определитель соответствует сигнатуре , будучи +1 или -1, поскольку четность перестановки четная или нечетная, поскольку определитель является переменной функцией строк.

Более сильным, чем ограничение детерминанта, является тот факт, что ортогональная матрица всегда может быть диагонализована по комплексным числам для отображения полного набора собственных значений , все из которых должны иметь (комплексный) модуль  1.

Свойства группы [ править ]

Инверсия каждой ортогональной матрицы снова ортогональна, как и матричное произведение двух ортогональных матриц. Фактически, множество всех ортогональных матриц размера n × n удовлетворяет всем аксиомам группы . Это компактная группа Ли размерностип ( п - 1)/2, называется ортогональной группой и обозначается O ( n ) .

Ортогональные матрицы, определитель равен +1 , образуют линейно связным нормальная подгруппа из О ( п ) из индекса 2, специальная ортогональная группа SO ( п ) из вращений . Фактор - группа О ( п ) / SO ( п ) изоморфна O (1) , с проекцией карты выбирают [+1] или [-1] в соответствии с определителем. Ортогональные матрицы с определителем −1 не включают тождество и поэтому не образуют подгруппу, а только смежный класс; он также (отдельно) подключен. Таким образом, каждая ортогональная группа распадается на две части; и потому , что проекция расколов , О ( п ) является полупрямым произведением из SO ( п ) с помощью O (1) . С практической точки зрения сопоставимое утверждение состоит в том, что любую ортогональную матрицу можно получить, взяв матрицу вращения и, возможно, отрицая один из ее столбцов, как мы видели с матрицами 2 × 2 . Если n нечетно, то полупрямое произведение на самом деле является прямым произведением, и любую ортогональную матрицу можно получить, взяв матрицу вращения и, возможно, отрицая все ее столбцы. Это следует из свойства определителей, что отрицание столбца отрицает определитель, и, таким образом, отрицание нечетного (но не четного) числа столбцов отрицает определитель.

Теперь рассмотрим ( n + 1) × ( n + 1) ортогональных матриц с нижним правым элементом, равным 1. Остаток последнего столбца (и последней строки) должен быть нулями, а произведение любых двух таких матриц имеет тот же вид . Остальная часть матрицы представляет собой ортогональную матрицу размера n × n ; таким образом, O ( n ) является подгруппой O ( n + 1) (и всех высших групп).

Поскольку элементарное отражение в форме матрицы Хаусхолдера может привести любую ортогональную матрицу к этой ограниченной форме, серия таких отражений может привести любую ортогональную матрицу к единице; таким образом, ортогональная группа - это группа отражений . Последний столбец может быть привязан к любому единичному вектору, и каждый выбор дает другую копию O ( n ) в O ( n + 1) ; таким образом, O ( n + 1) является расслоением над единичной сферой S n со слоем O ( n ) .

Точно так же SO ( n ) является подгруппой SO ( n + 1) ; и любая специальная ортогональная матрица может быть сгенерирована вращением плоскости Гивенса с использованием аналогичной процедуры. Структура расслоения сохраняется: SO ( n ) ↪ SO ( n + 1) → S n . Одно вращение может привести к нулю в первой строке последнего столбца, а серия из n - 1 поворотов обнулит всю, кроме последней строки последнего столбца матрицы вращения n × n . Поскольку плоскости неподвижны, каждое вращение имеет только одну степень свободы - свой угол. По индукции SO ( n) поэтому имеет

степеней свободы, как и O ( n ) .

Матрицы перестановок еще проще; они образуют не группу Ли, а только конечную группу порядка n ! симметрическая группа S n . По тем же аргументам S n является подгруппой в S n + 1 . Четные перестановки производят подгруппу матриц перестановок с определителем +1, порядокп !/2 переменная группа .

Каноническая форма [ править ]

В более широком смысле, действие любой ортогональной матрицы разделяется на независимые действия на ортогональных двумерных подпространствах. То есть, если Q является специальным ортогональным, то всегда можно найти ортогональную матрицу P , (вращательное) изменение базиса , которое приводит Q к блочно-диагональной форме:

где матрицы R 1 , ..., R k представляют собой матрицы вращения 2 × 2 , а остальные элементы равны нулю. В исключительных случаях , блок вращения может быть диагональным, ± я . Таким образом, отрицая один столбец, если необходимо, и отмечая, что отражение 2 × 2 диагонализуется до +1 и -1, любую ортогональную матрицу можно привести к виду

Матрицы R 1 , ..., R k задают сопряженные пары собственных значений, лежащих на единичной окружности комплексной плоскости ; таким образом, это разложение подтверждает, что все собственные значения имеют абсолютное значение 1. Если n нечетно, существует по крайней мере одно действительное собственное значение, +1 или -1; для вращения 3 × 3 собственный вектор, связанный с +1, является осью вращения.

Алгебра Ли [ править ]

Пусть вхождения Q дифференцируемые функции т , и т = 0 дает Q = I . Дифференцирование условия ортогональности

дает

Оценка при t = 0 ( Q = I ) тогда подразумевает

В терминах группы Ли это означает, что алгебра Ли ортогональной группы матриц состоит из кососимметрических матриц . Если пойти в другом направлении, матричная экспонента любой кососимметричной матрицы является ортогональной матрицей (фактически, специальной ортогональной).

Например, физика трехмерных объектов называет угловую скорость дифференциальным вращением, таким образом вектор в алгебре Ли (3) касается SO (3) . Для ω = ( , , ) , где v = ( x , y , z ) является единичным вектором, правильная кососимметричная матричная форма ω имеет вид

Экспонента этого является ортогональной матрицей для поворота вокруг оси v на угол θ ; установка c = cosθ/2, s = грехθ/2,

Числовая линейная алгебра [ править ]

Преимущества [ править ]

Численный анализ использует преимущества многих свойств ортогональных матриц числовой линейной алгебры , и они возникают естественным образом. Например, часто бывает желательно вычислить ортонормированный базис для пространства или ортогональное изменение базиса; оба принимают форму ортогональных матриц. Наличие определителя ± 1 и всех собственных значений с величиной 1 имеет большое преимущество для числовой стабильности . Одно из следствий состоит в том, что число обусловленности равно 1 (что является минимумом), поэтому ошибки не увеличиваются при умножении на ортогональную матрицу. Многие алгоритмы используют ортогональные матрицы, такие как отражения Хаусхолдера и вращения Гивенса.по этой причине. Также полезно то, что ортогональная матрица не только обратима, но и доступна, по существу, бесплатно, путем обмена индексами.

Перестановки необходимы для успеха многих алгоритмов, включая «рабочую лошадку» исключения Гаусса с частичным поворотом (где перестановки выполняют поворот). Однако они редко появляются в явном виде как матрицы; их особая форма позволяет более эффективно представлять, например список из n индексов.

Точно так же алгоритмы, использующие матрицы Хаусхолдера и Гивенса, обычно используют специализированные методы умножения и хранения. Например, поворот Гивенса влияет только на две строки матрицы, которую он умножает, изменяя полное умножение порядка n 3 на гораздо более эффективный порядок n . Когда использование этих отражений и поворотов вводит нули в матрицу, освободившегося пространства достаточно для хранения данных, достаточных для воспроизведения преобразования, и для надежной работы. (Следуя Стюарту (1976) , мы не храним угол поворота, что и дорого, и плохо работает.)

Разложения [ править ]

Ряд важных матричных разложений ( Голуб и Ван Лоан, 1996 ) включает ортогональные матрицы, в частности:

QR- разложение
M = QR , Q ортогональный, R верхний треугольный
Разложение по сингулярным числам
M = U Σ V T , U и V ортогональные, Σ диагональная матрица
Собственное разложение симметричной матрицы (разложение по спектральной теореме )
S = Q Λ Q T , S симметричный, Q ортогональный, Λ диагональный
Полярное разложение
M = QS , Q ортогональный, S симметричный положительно-полуопределенный

Примеры [ править ]

Рассмотрим переопределенную систему линейных уравнений , которая может возникнуть при повторных измерениях физического явления для компенсации экспериментальных ошибок. Напишите A x = b , где A - это m × n , m > n . QR - разложение приводит А к верхней треугольной R . Например, если A равно 5 × 3, то R имеет вид

Задача линейных наименьших квадратов состоит в том, чтобы найти x, который минимизирует || A x - b || , Что эквивалентно проецировании Ь на подпространство , натянутое на столбцы A . Предполагая, что столбцы матрицы A (и, следовательно, R ) независимы, проекционное решение находится из A T A x = A T b . Теперь A T A квадратный ( n × n ) и обратимый, а также равен R T R. Но нижние строки нулей в R излишни в произведении, которое, таким образом, уже имеет нижнетреугольную верхнетреугольную факторизованную форму, как в случае исключения Гаусса ( разложение Холецкого ). Здесь ортогональность важна не только для уменьшения A T A = ( R T Q T ) QR до R T R , но также для разрешения решения без увеличения численных проблем.

В случае недоопределенной линейной системы или необратимой матрицы , разложение по сингулярным числам (SVD) также полезно. Если A разложить на множители как U Σ V T , удовлетворительное решение использует псевдообратную матрицу Мура-Пенроуза , V Σ + U T , где Σ + просто заменяет каждую ненулевую диагональную запись обратной величиной. Набор х к V Σ + U T б .

Интересен также случай квадратной обратимой матрицы. Предположим, например, что A - это матрица вращения 3 × 3, которая была вычислена как композиция множества поворотов и поворотов. Плавающая точка не соответствует математическому идеалу действительных чисел, поэтому A постепенно утратил свою истинную ортогональность. Gram-Schmidt процесс может ортогонализации столбцов, но это не самый надежный, ни самым эффективным, ни наиболее инвариантный метод. Полярное разложение коэффициентов матрицы в пару, одна из которых является единственным ближайшимортогональная матрица к данной матрице, или одна из ближайших, если данная матрица сингулярна. (Близость может быть измерена любой нормой матрицы, инвариантной относительно ортогонального изменения базиса, такой как спектральная норма или норма Фробениуса.) Для почти ортогональной матрицы быстрая сходимость к ортогональному множителю может быть достигнута с помощью « метода Ньютона » подход, предложенный Хигэмом (1986) ( 1990 ), многократно усредняющий матрицу с ее обратным транспонированием. Dubrulle (1994) опубликовал ускоренный метод с удобным тестом сходимости.

Например, рассмотрим неортогональную матрицу, для которой простой алгоритм усреднения занимает семь шагов

и какое ускорение сокращается до двух ступеней (с γ = 0,353553, 0,565685).

Грам-Шмидт дает худшее решение, показанное расстоянием Фробениуса 8,28659 вместо минимального 8,12404.

Рандомизация [ править ]

Некоторые численные приложения, такие как методы Монте-Карло и исследование пространств данных большой размерности, требуют генерации равномерно распределенных случайных ортогональных матриц. В этом контексте «равномерное» определяется в терминах меры Хаара , которая по существу требует, чтобы распределение не изменялось при умножении на любую свободно выбранную ортогональную матрицу. Ортогонализация матриц с независимыми равномерно распределенными случайными элементами не приводит к равномерно распределенным ортогональным матрицам [ необходима цитата ] , но QR- разложение независимых нормально распределенных случайных элементов дает, пока диагональR содержит только положительные записи ( Mezzadri 2006 ). Стюарт (1980) заменил это более эффективной идеей, которую Диаконис и Шахшахани (1987) позже обобщили как «алгоритм подгруппы» (в какой форме он работает так же хорошо для перестановок и вращений). Чтобы сгенерировать ортогональную матрицу ( n + 1) × ( n + 1) , возьмите матрицу n × n и равномерно распределенный единичный вектор размерности n + 1 . Постройте отражение Хаусхолдера от вектора, затем примените его к меньшей матрице (встроенной в матрицу большего размера с 1 в правом нижнем углу).

Ближайшая ортогональная матрица [ править ]

Проблема нахождения ближайшей к данной матрице M ортогональной матрицы Q связана с проблемой Ортогональной Прокруста . Есть несколько способов , чтобы получить единственное решение, самый простой из которых принимает сингулярное разложение на М и замещающие сингулярные значения с единицами. Другой метод выражает R явно, но требует использования квадратного корня из матрицы : [2]

Это можно комбинировать с вавилонским методом извлечения квадратного корня из матрицы, чтобы получить повторение, которое квадратично сходится к ортогональной матрице:

где Q 0 = М .

Эти итерации стабильны при условии , что условие число из М меньше трех. [3]

Использование аппроксимации первого порядка обратной и той же инициализации приводит к измененной итерации:

Крутить и закреплять [ править ]

Некоторые виды использования ортогональных матриц возникают из-за тонкой технической проблемы. Не только компоненты группы с определителем +1 и -1 не связаны друг с другом, даже компонент +1, SO ( n ) , не является односвязным (за исключением SO (1), который тривиален). Таким образом, иногда выгодно, или даже необходимо, чтобы работать с покрывающей группой из SO ( п ), в спиновой группе , Спин ( п ) . Аналогично, O ( n ) имеет покрывающие группы, группы контактов, Pin ( n ). Для n > 2 Spin ( n) односвязна и, следовательно, универсальная накрывающая группа для SO ( n ) . Безусловно, самым известным примером спиновой группы является Spin (3) , который представляет собой не что иное, как SU (2) или группу единичных кватернионов .

Группы Pin и Spin находятся в алгебрах Клиффорда , которые сами могут быть построены из ортогональных матриц.

Прямоугольные матрицы [ править ]

Если Q не является квадратной матрицей, то условия Q T Q = I и QQ T = I не эквивалентны. Условие Q T Q = I говорит, что столбцы Q ортонормированы. Это может произойти, только если Q - матрица размера m × n с nm (из-за линейной зависимости). Аналогично, QQ T = I говорит, что строки Q ортонормированы, что требует nм .

Для этих матриц нет стандартной терминологии. Иногда их называют «ортонормированными матрицами», иногда «ортогональными матрицами», а иногда просто «матрицами с ортонормированными строками / столбцами».

См. Также [ править ]

  • Вращение (математика)
  • Кососимметричная матрица , матрица, транспонирование которой является отрицательным
  • Симплектическая матрица

Примечания [ править ]

  1. ^ "Онлайн-математические заметки Пола" [ требуется полная ссылка ] , Пол Докинз, Университет Ламара , 2008. Теорема 3 (c)
  2. ^ «Нахождение ближайшей ортонормированной матрицы» , Бертольд К. П. Хорн , Массачусетский технологический институт .
  3. ^ "Метод Ньютона для матричного квадратного корня" Архивировано 29 сентября 2011 г. в Wayback Machine , Николас Дж. Хайэм, Математика вычислений, Том 46, номер 174, 1986.

Ссылки [ править ]

  • Диаконис, Перси ; Шахшахани, Мердад (1987), "Алгоритм подгруппы для генерации однородных случайных величин", Пробл. В англ. И информация. Sci. , 1 : 15-32, DOI : 10,1017 / S0269964800000255 , ISSN  0269-9648
  • Dubrulle, Огюстин А. (1999), "Оптимальная итерация для матричного полярного разложения" , Электрон. Пер. Нумер. Анальный. , 8 : 21–25
  • Голуб, Джин Х .; Ван Лоан, Чарльз Ф. (1996), Matrix Computations (3 / e ed.), Балтимор: Johns Hopkins University Press, ISBN 978-0-8018-5414-9
  • Higham, Николай (1986), "Вычисление полярного разложения-с приложениями" (PDF) , SIAM журнал по научным и статистическим Вычислительный , 7 (4): 1160-1174, DOI : 10,1137 / 0907079 , ISSN  0196-5204
  • Хайэм, Николас ; Schreiber, Роберт (июль 1990), "Быстрый полярное разложение произвольной матрицы", SIAM журнал по научному и статистической Вычислительному , 11 (4): 648-655, CiteSeerX  10.1.1.230.4322 , DOI : 10,1137 / 0911038 , ISSN  0196 -5204 [1]
  • Стюарт, GW (1976), "Экономичный Хранение Plane Вращения", Numerische Mathematik , 25 (2): 137-138, DOI : 10.1007 / BF01462266 , ISSN  0029-599X
  • Стюарт, GW (1980), "Эффективное создание случайных ортогональных матриц с приложением к оценкам условий", SIAM J. Numer. Анальный. , 17 (3): 403-409, DOI : 10,1137 / 0717034 , ISSN  0036-1429
  • Меззадри, Франческо (2006), "Как сгенерировать случайные матрицы из классических компактных групп", Уведомления Американского математического общества , 54

Внешние ссылки [ править ]

  • "Ортогональная матрица" , Математическая энциклопедия , EMS Press , 2001 [1994]
  • Учебная и интерактивная программа по ортогональной матрице