Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В линейной алгебре , А симметрична реальная матрица называется положительно определенной , если скалярный строго положительна для любого ненулевого столбца вектора из действительных чисел. Здесь обозначает транспонирование о . [1] При интерпретации в качестве выхода оператора, , что действует на входе, , свойство положительной определенности означает , что выходной сигнал всегда имеет положительное скалярное произведение с входом, как это часто наблюдается в физических процессах. Другими словами, это в общем направлении (в пределах угла от ).

В целом, комплекс эрмитова матрица называется положительно определенным , если скалярное строго положительны для каждого вектора ненулевого столбца из комплексных чисел. Здесь обозначает сопряженное транспонирование о . Обратите внимание, что это автоматически реально, поскольку является эрмитовым.

Положительные полуопределенные матрицы определяются аналогично, за исключением того, что указанные выше скаляры или должны быть положительными или нулевыми (т. Е. Неотрицательными). Аналогично определяются отрицательно-определенные и отрицательно-полуопределенные матрицы. Матрица, которая не является положительно полуопределенной и не отрицательной полуопределенной, называется неопределенной .

Матрица положительно определена тогда и только тогда , когда билинейная форма является положительно определенной (и аналогично для положительно определенной формы полуторалинейной в комплексном случае). Это координатная реализация скалярного продукта в векторном пространстве . [2]

Некоторые авторы используют более общие определения определенности, включая некоторые несимметричные вещественные матрицы или неэрмитовы комплексные.

Определения [ править ]

В следующих определениях, является транспонированием , является сопряженной транспозицией от и обозначает п - мерный вектор нулевого.

Определения для вещественных матриц [ править ]

Симметричная вещественная матрица называется положительно определенной , если для всех ненулевых в . Формально,

Симметричная вещественная матрица называется неотрицательно или неотрицательно определенной , если для всех в . Формально,

Симметричная вещественная матрица называется отрицательно определенной , если для всех ненулевых в . Формально,

Симметричная вещественная матрица называется отрицательным полуопределенным или без положительной определенности , если для всех в . Формально,

Симметричная вещественная матрица , которая не является ни положительным , ни полуопределенной полуотрицательно называется неопределенным .

Определения для сложных матриц [ править ]

Все следующие определения включают этот термин . Обратите внимание, что это всегда действительное число для любой квадратной эрмитовой матрицы .

Эрмитова комплексная матрица называется положительно определенной , если для всех ненулевых в . Формально,

Эрмитова комплексная матрица называется положительной полуопределенная или неотрицательно определенной , если для всех в . Формально,

Эрмитова комплексная матрица называется отрицательно определенной , если для всех ненулевых в . Формально,

Эрмитова комплексная матрица называется отрицательной полуопределенная или без положительной определенности , если для всех в . Формально,

Эрмитова комплексная матрица , которая не является ни положительным , ни полуопределенной полуотрицательно называется неопределенным .

Согласованность между реальными и сложными определениями [ править ]

Поскольку каждая вещественная матрица также является комплексной матрицей, определения «определенности» для этих двух классов должны согласовываться.

Для сложных матриц наиболее распространенное определение гласит, что « положительно определен, если и только если он действительный и положительный для всех ненулевых комплексных векторов-столбцов ». Это условие означает, что оно эрмитово (т. Е. Его транспонирование совпадает со своим сопряженным). Чтобы убедиться в этом, рассмотрим матрицы и , чтобы и . Матрицы и эрмитовы, поэтому и индивидуально реально. Если реально, то для всех должно быть ноль . Тогда - нулевая матрица и , что доказывает, эрмитова.

По этому определению положительно определенная вещественная матрица эрмитова, следовательно, симметрична; и положительный для всех ненулевых действительных векторов-столбцов . Однако одного последнего условия недостаточно для того, чтобы быть положительно определенным. Например, если

то для любого действительного вектора с элементами, а у нас есть , что всегда положительно, если не равно нулю. Однако, если это сложный вектор с элементами и , получается

что не реально. Следовательно, не является положительно-определенным.

С другой стороны, для симметричной вещественной матрицы , условие « для всех ненулевых вещественных векторов » это означает , что положительно определена в комплексном смысле.

Обозначение [ править ]

Если эрмитова матрица положительно полуопределенная, иногда пишут, а если положительно определенную - пишут . Для обозначения отрицательного полуопределенного пишут, а для обозначения отрицательно-определенного пишут .

Это понятие пришло из функционального анализа, в котором положительные полуопределенные матрицы определяют положительные операторы .

Общая альтернатива обозначение , , и для положительных полуопределенных и положительно определенных, отрицательно полуопределенных и отрицательных определенных матриц, соответственно. Это может сбивать с толку, так как иногда неотрицательные матрицы (соответственно, неположительные матрицы) также обозначаются таким образом.

Примеры [ править ]

  • Единичная матрица положительно определена (и , как таковые , также положительно полуопределенная). Это действительная симметричная матрица, и для любого ненулевого вектора-столбца z с действительными элементами a и b один имеет
    .

    Рассматриваемый как комплексная матрица, для любого ненулевого вектора-столбца z с комплексными элементами a и b один имеет

    .
    В любом случае результат будет положительным, поскольку вектор не является нулевым (то есть хотя бы один из и не равен нулю).
  • Действительная симметричная матрица
    положительно определен, поскольку для любого ненулевого вектора-столбца z с элементами a , b и c мы имеем
    Этот результат является суммой квадратов и, следовательно, неотрицателен; и равен нулю, только если , то есть когда z является нулевым вектором.
  • Для любой действительной обратимой матрицы продукт является положительно определенной матрицей (если средние значения столбцов матрицы A равны 0, это также называется ковариационной матрицей ). Простое доказательство состоит в том, что для любого ненулевого вектора условие обратимости матрицы означает, что
  • Приведенный выше пример показывает, что матрица, в которой некоторые элементы отрицательны, может быть положительно определенной. И наоборот, матрица, все элементы которой положительны, не обязательно положительно определена, как, например,
    для которого

Собственные значения [ править ]

Позвольте быть эрмитовой матрицей . Это означает, что все его собственные значения действительны.

  • положительно определен тогда и только тогда, когда все его собственные значения положительны.
  • положительно полуопределено тогда и только тогда, когда все его собственные значения неотрицательны.
  • отрицательно определен тогда и только тогда, когда все его собственные значения отрицательны
  • отрицательно полуопределено тогда и только тогда, когда все его собственные значения неположительны.
  • неопределенно тогда и только тогда, когда у него есть как положительные, так и отрицательные собственные значения.

Пусть быть eigendecomposition из , где представляет собой унитарную матрицу сложной , столбцы которой содержит ортогональный базис из собственных векторов из , и является реальной диагональной матрицей , чья главной диагональ содержит соответствующие собственные значения . Матрицу можно рассматривать как диагональную матрицу , которая была повторно выражена в координатах базиса (собственных векторов) . Другими словами, применение M к некоторому вектору z в нашей системе координат ( M z ) аналогично изменение базиса нашего z на систему координат собственного вектора с использованием P −1 ( P −1 z ), применение к нему растягивающего преобразования D ( DP −1 z ), а затем изменение базиса обратно в нашу систему с помощью P ( PDP - 1 з ).

Имея это в виду, однозначное изменение переменной показывает, что она действительна и положительна для любого комплексного вектора тогда и только тогда, когда она действительна и положительна для любого ; другими словами, если положительно определено. Для диагональной матрицы это верно, только если каждый элемент главной диагонали, то есть каждое собственное значение , положителен. Поскольку спектральная теорема гарантирует, что все собственные значения эрмитовой матрицы будут действительными, положительность собственных значений может быть проверена с помощью правила чередования знаков Декарта, когда доступен характеристический многочлен реальной симметричной матрицы .

Разложение [ править ]

Позвольте быть эрмитовой матрицей . положительно полуопределено тогда и только тогда, когда оно может быть разложено как произведение

матрицы с сопряженным транспонированием .

Когда реально, также может быть реальным, и разложение можно записать как

положительно определено тогда и только тогда, когда такое разложение существует с обратимым . В более общем смысле, положительно полуопределенный с рангом тогда и только тогда, когда существует разложение с матрицей полного ранга строки (т. Е. Ранга ). Кроме того, для любого разложения , . [3]

Колонны из можно рассматривать как векторы в комплексном или вещественном векторном пространстве , соответственно. Тогда элементы являются внутренними продуктами (то есть скалярными произведениями , в реальном случае) этих векторов

Другими словами, эрмитова матрица положительно полуопределенная тогда и только тогда, когда она является матрицей Грама некоторых векторов . Она положительно определена тогда и только тогда, когда она является матрицей Грама некоторых линейно независимых векторов. В общем, ранг матрицы векторов Грама равен размерности пространства, натянутого на эти векторы. [4]

Уникальность с точностью до унитарных преобразований [ править ]

Разложение не однозначно: если для некоторой матрицы и если - любая унитарная матрица (смысл ), то для .

Однако это единственный способ, которым два разложения могут различаться: разложение уникально с точностью до унитарных преобразований . Более формально, если это матрица и является матрицей , такими , что , то есть матрица с ортонормирован- столбцами (смысловой ) такие , что . [5] Когда это означает является унитарной .

Это утверждение имеет интуитивно понятную геометрическую интерпретацию в реальном случае: пусть столбцы и будут векторами и in . Реальная унитарная матрица - это ортогональная матрица , которая описывает жесткое преобразование (изометрию евклидова пространства ), сохраняющее нулевую точку (то есть повороты и отражения без сдвигов). Следовательно, скалярные произведения и равны тогда и только тогда, когда какое-то жесткое преобразование преобразует векторы в (и 0 в 0).

Квадратный корень [ править ]

Матрица является положительно полуопределенной тогда и только тогда, когда существует положительно полуопределенная матрица (в частности , эрмитова, поэтому ) удовлетворяющая . Эта матрица уникальна, [6] называется неотрицательным квадратным корнем из и обозначается значком . Когда положительно определено, так и есть , поэтому его также называют положительным квадратным корнем из .

Неотрицательный квадратный корень не следует путать с другими разложениями . Некоторые авторы используют имя квадратный корень и для любого такого разложения, или, в частности, для разложения Холецкого или любого разложения формы ; другие используют его только для неотрицательного квадратного корня.

Если тогда .

Разложение Холецкого [ править ]

Положительная полуопределенная матрица может быть записана как , где - нижний треугольник с неотрицательной диагональю (эквивалентно где - верхний треугольник); это разложение Холецкого . Если положительно определен, то диагональ положительна и разложение Холецкого единственно. Разложение Холецкого особенно полезно для эффективных численных расчетов. Разложение тесно связано это разложение ЛНП , где диагоналей и находится ниже унитреугольная .

Другие характеристики [ править ]

Позвольте быть эрмитовой матрицей . Следующие свойства эквивалентны положительной определенности:

Соответствующая полуторалинейная форма является внутренним продуктом.
Полуторалинейная форма определяется функция от , чтобы таким образом, что для всех и в , где сопряженном транспонированном . Для любой комплексной матрицы эта форма линейна по и полулинейна по . Следовательно, форма является внутренним продуктом в том и только в том случае, если она действительна и положительна для всех ненулевых ; то есть тогда и только тогда, когда положительно определен. (Фактически, каждое внутреннее произведение на возникает таким образом из эрмитовой положительно определенной матрицы.)
Все ведущие основные несовершеннолетние положительные
К - й ведущий главный минор матрицы является определяющим фактором его верхнего левого подматрицы. Оказывается, матрица положительно определена тогда и только тогда, когда все эти определители положительны. Это условие известно как критерий Сильвестра и обеспечивает эффективную проверку положительной определенности симметричной вещественной матрицы. А именно, матрица сводится к верхнетреугольной матрице с использованием элементарных операций со строками , как в первой части метода исключения Гаусса , заботясь о сохранении знака ее определителя во время процесса поворота . Поскольку k-й ведущий главный минор треугольной матрицы является произведением ее диагональных элементов до строки , критерий Сильвестра эквивалентен проверке, все ли ее диагональные элементы положительны. Это условие можно проверять каждый раз, когда получается новая строка треугольной матрицы.

Положительно полуопределенная матрица положительно определена тогда и только тогда, когда она обратима . [7] Матрица отрицательна (полу) определена тогда и только тогда, когда она положительна (полу) определена.

Квадратичные формы [ править ]

(Чисто) квадратичная форма, связанная с вещественной матрицей, - это функция, такая что для всех . можно считать симметричным, заменив его на .

Симметричная матрица положительно определена тогда и только тогда, когда ее квадратичная форма является строго выпуклой функцией .

В более общем смысле, любая квадратичная функция от до может быть записана как где - симметричная матрица, - действительный вектор и действительная константа. Эта квадратичная функция строго выпукла и, следовательно, имеет единственный конечный глобальный минимум тогда и только тогда, когда она положительно определена. По этой причине положительно определенные матрицы играют важную роль в задачах оптимизации .

Одновременная диагонализация [ править ]

Симметричная матрица и другая симметричная и положительно определенная матрица могут быть одновременно диагонализованы , хотя и не обязательно с помощью преобразования подобия . Этот результат не распространяется на случай трех и более матриц. В этом разделе мы пишем для реального случая. Немедленное распространение на сложный случай.

Позвольте быть симметричной и симметричной и положительно определенной матрицы. Напишите обобщенное уравнение на собственные значения как там, где мы налагаем нормировку, т . Е. Теперь мы используем разложение Холецкого, чтобы записать обратное к as . Умножая на и позволяя , мы получаем , что можно переписать как где . Манипуляция теперь дает где - матрица, имеющая в качестве столбцов обобщенные собственные векторы, а - диагональная матрица обобщенных собственных значений. Теперь предварительное умножение на дает окончательный результат: и, но обратите внимание, что это больше не ортогональная диагонализация по отношению к внутреннему произведению где . Фактически, мы диагонализовали относительно внутреннего продукта, индуцированного . [8]

Обратите внимание, что этот результат не противоречит тому, что сказано об одновременной диагонализации в статье « Диагонализируемая матрица» , которая относится к одновременной диагонализации посредством преобразования подобия. Наш результат здесь больше похож на одновременную диагонализацию двух квадратичных форм и полезен для оптимизации одной формы при условиях другой.

Свойства [ править ]

Вызванное частичное упорядочивание [ править ]

Для произвольных квадратных матриц , мы пишем , если есть, является положительным полуопределенным. Это определяет частичный порядок на множестве всех квадратных матриц. Аналогичным образом можно определить строгий частичный порядок . Заказ называется заказом Лёвнера .

Инверсия положительно определенной матрицы [ править ]

Любая положительно определенная матрица обратима, и ее обратная матрица также положительно определена. [9] Если тогда . [10] Более того, по теореме min-max , k- е наибольшее собственное значение для больше, чем k- е наибольшее собственное значение .

Масштабирование [ править ]

Если положительно определено и является действительным числом, то положительно определено. [11]

Дополнение [ править ]

  • Если и положительно определены, то сумма также положительно определена. [11]
  • Если и положительно-полуопределенные, то и положительно-полуопределенная сумма .
  • Если положительно определен и положительно полуопределен, то сумма также положительно определена.

Умножение [ править ]

  • Если и положительно определены, то произведения и также положительно определены. Если , то также положительно определено.
  • Если положительно полуопределенный, то положительно полуопределенный для любой (возможно, прямоугольной) матрицы . Если положительно определен и имеет полный ранг столбца, то положительно определен. [12]

Подматрицы [ править ]

Каждая главная подматрица положительно определенной матрицы положительно определена.

След [ править ]

Диагональные элементы положительно-полуопределенной матрицы действительны и неотрицательны. Как следствие этого , след , . Кроме того, [13], поскольку каждая главная подматрица (в частности, 2 на 2) положительно полуопределенная,

и, таким образом, когда ,

Эрмитова матрица положительно определена , если она удовлетворяет следующие неравенства следовых: [14]

Другой важный результат состоит в том, что для любых и положительно-полуопределенных матриц

Произведение Адамара [ править ]

Если , хотя это и не обязательно, положительно полуопределенное произведение, произведение Адамара будет (этот результат часто называют теоремой Шура о произведении ). [15]

Что касается Адамара двух положительных полуопределенных матриц , есть два заметных неравенства:

  • Неравенство Оппенгейма: [16]
  • . [17]

Продукт Кронекера [ править ]

Если , хотя и не обязательно, положительно полуопределенное произведение Кронекера .

Продукт Фробениуса [ править ]

Если , хотя и не обязательно, положительно полуопределенное произведение, произведение Фробениуса (Ланкастер – Тисменецкий, Теория матриц , стр. 218).

Выпуклость [ править ]

Множество положительно полуопределенных симметрических матриц выпукло . То есть, если и положительно полуопределены, то для любого между 0 и 1 также положительно полуопределены. Для любого вектора :

Это свойство гарантирует, что задачи полуопределенного программирования сходятся к глобально оптимальному решению.

Связь с косинусом [ править ]

Положительная определенность матрицы выражает то, что угол между любым вектором и его изображением всегда равен :

Другие свойства [ править ]

  1. Если это симметричная матрица Теплица , т.е. записи приведены в зависимости от их абсолютных разностей индексов: и строгое неравенство имеет место, то есть строго положительно определена.
  2. Пусть и эрмитовски. Если (соответственно ), то (соответственно ). [18]
  3. Если реально, то существует такое, что , где - единичная матрица .
  4. Если обозначает ведущий минор, это k- й стержень во время разложения LU .
  5. Матрица является отрицательно определенной, если ее ведущий главный минор k- го порядка отрицательный, когда он нечетный, и положительный, когда четный.

Эрмитова матрица положительно полуопределенная тогда и только тогда, когда все ее главные миноры неотрицательны. Однако недостаточно рассматривать только главные главные миноры, как это проверяется на диагональной матрице с элементами 0 и −1.

Матрицы блоков [ править ]

Положительная матрица также может быть определена блоками :

где каждый блок . Применяя условие положительности, сразу следует, что и являются эрмитовыми, и .

У нас есть это для всего комплекса , и в частности для . потом

Аналогичный аргумент может быть применен к , и, таким образом, мы заключаем, что обе и также должны быть положительно определенными матрицами.

Обратные результаты могут быть доказаны с помощью более сильных условий на блоки, например, с использованием дополнения Шура .

Локальные экстремумы [ править ]

Общая квадратичная форма от вещественных переменных всегда может быть записана как где - вектор-столбец с этими переменными и является симметричной вещественной матрицей. Следовательно, положительно определенная матрица означает, что она имеет единственный минимум (ноль), когда она равна нулю, и строго положительна для любого другого .

В более общем смысле, дважды дифференцируемая вещественная функция от вещественных переменных имеет локальный минимум в аргументах, если ее градиент равен нулю, а ее гессиан (матрица всех вторых производных) положительно полуопределен в этой точке. Аналогичные утверждения можно сделать для отрицательно определенных и полуопределенных матриц.

Ковариация [ править ]

В статистике , то ковариационная матрица из многомерного распределения вероятностей всегда положительно полуопределенная; и он положительно определен, если одна переменная не является точной линейной функцией других. И наоборот, каждая положительно полуопределенная матрица является ковариационной матрицей некоторого многомерного распределения.

Расширение для неэрмитовых квадратных матриц [ править ]

Определение положительно определенной можно обобщить, обозначив любую комплексную матрицу (например, действительную несимметричную) как положительно определенную, если для всех ненулевых комплексных векторов , где обозначает действительную часть комплексного числа . [19] Только эрмитова часть определяет, является ли матрица положительно определенной, и оценивается в более узком смысле выше. Точно так же, если и являются действительными, мы имеем для всех вещественных ненулевых векторов тогда и только тогда, когда симметричная часть положительно определена в более узком смысле. Сразу видно , что нечувствителен к транспозиции М .

Следовательно, несимметричная вещественная матрица только с положительными собственными значениями не обязательно должна быть положительно определенной. Например, матрица имеет положительные собственные значения, но не является положительно определенной; в частности, при выборе получается отрицательное значение (которое является собственным вектором, связанным с отрицательным собственным значением симметричной части ).

Таким образом, различие между действительным и комплексным случаями состоит в том, что ограниченный положительный оператор в комплексном гильбертовом пространстве обязательно эрмитов или самосопряжен. Общее утверждение можно аргументировать, используя поляризационное тождество . В действительности это уже не так.

Приложения [ править ]

Матрица теплопроводности [ править ]

Закон теплопроводности Фурье, определяющий тепловой поток в терминах градиента температуры, записывается для анизотропных сред как , в котором - симметричная матрица теплопроводности . Отрицание вставлено в закон Фурье, чтобы отразить ожидание того, что тепло всегда будет течь от горячего к холодному. Другими словами, поскольку температурный градиент всегда направлен от холодного к горячему, ожидается , что тепловой поток будет иметь отрицательный внутренний продукт с таким образом . Подстановка закона Фурье дает это ожидание как , подразумевая, что матрица проводимости должна быть положительно определенной.

См. Также [ править ]

  • Ковариационная матрица
  • М-матрица
  • Положительно определенная функция
  • Положительно определенное ядро
  • Дополнение Шура
  • Критерий сильвестра
  • Числовой диапазон

Заметки [ править ]

  1. ^ «Приложение C: Положительные полуопределенные и положительно определенные матрицы» . Оценка параметров для ученых и инженеров : 259–263. DOI : 10.1002 / 9780470173862.app3 .
  2. ^ Стюарт, Дж. (1976). «Положительно определенные функции и обобщения, исторический обзор» . Скалистые горы J. Math . 6 (3): 409–434. DOI : 10,1216 / RMJ-1976-6-3-409 .
  3. ^ Хорн и Джонсон (2013) , стр. 440, теорема 7.2.7
  4. ^ Хорн и Джонсон (2013) , стр. 441, теорема 7.2.10
  5. ^ Хорн и Джонсон (2013) , стр. 452, теорема 7.3.11
  6. ^ Хорн и Джонсон (2013) , стр. 439, теорема 7.2.6 с
  7. ^ Хорн и Джонсон (2013) , стр. 431, следствие 7.1.7
  8. ^ Хорн и Джонсон (2013) , стр. 485, теорема 7.6.1
  9. ^ Хорн и Джонсон (2013) , стр. 438, теорема 7.2.1
  10. ^ Хорн и Джонсон (2013) , стр. 495, следствие 7.7.4 (а)
  11. ^ a b Хорн и Джонсон (2013) , стр. 430, наблюдение 7.1.3
  12. ^ Хорн и Джонсон (2013) , стр. 431, Наблюдение 7.1.8
  13. ^ Хорн и Джонсон (2013) , стр. 430
  14. ^ Волкович, Генри; Стьян, Джордж PH (1980). «Границы собственных значений с использованием следов». Линейная алгебра и ее приложения . Эльзевьер (29): 471–506.
  15. ^ Хорн и Джонсон (2013) , стр. 479, теорема 7.5.3
  16. ^ Хорн и Джонсон (2013) , стр. 509, теорема 7.8.16
  17. ^ Styan, GP (1973). «Произведения Адамара и многомерный статистический анализ». Линейная алгебра и ее приложения . 6 : 217–240., Следствие 3.6, с. 227
  18. ^ Бхатия, Раджендра (2007). Положительно определенные матрицы . Принстон, Нью-Джерси: Издательство Принстонского университета. п. 8. ISBN  978-0-691-12918-1.
  19. ^ Вайсштейн, Эрик В. Положительно определенная матрица. Материал из MathWorld - веб-ресурса Wolfram . По состоянию на 26 июля 2012 г.

Ссылки [ править ]

  • Хорн, Роджер А .; Джонсон, Чарльз Р. (2013). Матричный анализ (2-е изд.). Издательство Кембриджского университета . ISBN 978-0-521-54823-6.
  • Бхатия, Раджендра (2007). Положительно определенные матрицы . Принстонская серия по прикладной математике. ISBN 978-0-691-12918-1.
  • Бернштейн, Б .; Тупен, Р.А. (1962). «Некоторые свойства матрицы Гессе строго выпуклой функции». Journal für die reine und angewandte Mathematik . 210 : 67–72. DOI : 10,1515 / crll.1962.210.65 .

Внешние ссылки [ править ]

  • "Положительно-определенная форма" , Энциклопедия математики , EMS Press , 2001 [1994]
  • Wolfram MathWorld: положительно определенная матрица