Из Википедии, свободной энциклопедии
Перейти к навигацииПерейти к поиску

В математике , A симметричная матрица с действительными записями положительно определен, если действительное числоположительна для любого ненулевого действительного вектора-столбца куда является транспонированной из. [1] В более общем смысле, эрмитова матрица (то есть комплексная матрица, равная ее сопряженному транспонированию ) положительно определена, если действительное число положительна для любого ненулевого комплексного вектора-столбца куда обозначает сопряженное транспонирование

Положительные полуопределенные матрицы определяются аналогично, за исключением того, что скаляры и должны быть положительными или нулевыми (что неотрицательно). Аналогично определяются отрицательно-определенные и отрицательно-полуопределенные матрицы. Матрица, которая не является положительно полуопределенной и не отрицательной полуопределенной, иногда называется неопределенной .

Таким образом, матрица положительно определена тогда и только тогда, когда она является матрицей положительно определенной квадратичной формы или эрмитовой формы . Другими словами, матрица положительно определена тогда и только тогда, когда она определяет внутренний продукт .

Положительно определенные и положительно-полуопределенные матрицы можно охарактеризовать по-разному, что может объяснить важность этого понятия в различных разделах математики. Матрица M положительно определена (соответственно, положительно полуопределена) тогда и только тогда, когда удовлетворяет любому из следующих эквивалентных условий.

  • M является конгруэнтен с диагональной матрицей с положительными (соответственно. Неотрицательным) реальным данные.
  • M является симметричным или эрмитовым, и все его собственные значения действительны и положительны (соответственно неотрицательны).
  • M является симметричным или эрмитовым, и все его старшие главные миноры положительны (соответственно, все главные миноры неотрицательны).
  • Существует обратимая матрица (соотв. Матрица) с сопряженным транспонированием такой, что

Положительно определенные и положительно-полуопределенные вещественные матрицы лежат в основе выпуклой оптимизации , поскольку, если задана дважды дифференцируемая функция нескольких действительных переменных , то если ее матрица Гессе (матрица ее вторых частных производных) положительно определена в точке в точке p , то функция выпукла около точки p , и, наоборот, если функция выпукла около точки p , то матрица Гессе положительно полуопределенная в точке p .

Некоторые авторы используют более общие определения определенности, включая некоторые несимметричные вещественные матрицы или неэрмитовы комплексные.

Определения

В следующих определениях это транспонирование , является сопряженной транспозицией из и обозначает n -мерный нуль-вектор.

Определения для вещественных матриц

An симметричная вещественная матрица называется положительно определенным, если для всех ненулевых в . Формально,

An симметричная вещественная матрица называется положительно полуопределенным или неотрицательно определенным, если для всех в . Формально,

An симметричная вещественная матрица называется отрицательно-определенным, если для всех ненулевых в . Формально,

An симметричная вещественная матрица называется отрицательно-полуопределенным или отрицательно-определенным, если для всех в . Формально,

An симметричная вещественная матрица, которая не является ни положительно полуопределенной, ни отрицательной полуопределенной, называется неопределенной .

Определения для сложных матриц

Все следующие определения включают термин . Обратите внимание, что это всегда действительное число для любой квадратной эрмитовой матрицы..

An Эрмитова комплексная матрица называется положительно определенным, если для всех ненулевых в . Формально,

An Эрмитова комплексная матрица называется положительно полуопределенным или неотрицательно определенным, если для всех в . Формально,

An Эрмитова комплексная матрица называется отрицательно-определенным, если для всех ненулевых в . Формально,

An Эрмитова комплексная матрица называется отрицательно полуопределенным или неположительно определенным, если для всех в . Формально,

An Эрмитова комплексная матрица, которая не является ни положительно полуопределенной, ни отрицательной полуопределенной, называется неопределенной .

Согласованность между реальными и сложными определениями

Поскольку каждая вещественная матрица также является комплексной матрицей, определения «определенности» для этих двух классов должны согласовываться.

Для сложных матриц наиболее распространенное определение гласит, что " положительно определен тогда и только тогда, когда действительна и положительна для всех ненулевых комплексных векторов-столбцов". Это условие означает, что эрмитово (т.е. его транспонирование равно сопряженному). Чтобы убедиться в этом, рассмотрим матрицы и , и что и . Матрицы и эрмитовы, поэтому и индивидуально реальны. Если реально, тогда должен быть нулевым для всех . Затем - нулевая матрица и , доказывая, что эрмитово.

По этому определению положительно определенная вещественная матрицаэрмитово, следовательно, симметрично; иположительно для всех ненулевых действительных векторов-столбцов. Однако одного последнего условия недостаточно длябыть положительно определенным. Например, если

тогда для любого реального вектора с записями и у нас есть , что всегда положительно, если не равно нулю. Однако если - комплексный вектор с элементами и , получается

что не реально. Следовательно, не является положительно-определенным.

С другой стороны, для симметричной вещественной матрицы, условие " для всех ненулевых действительных векторов " Это означает , что положительно определен в сложном смысле.

Обозначение

Если эрмитова матрица положительно полуопределенный, иногда пишут и если положительно определенный пишет . Чтобы обозначить, что отрицательно полуопределенный пишет и обозначить, что отрицательно-определенный пишет .

Это понятие пришло из функционального анализа, в котором положительные полуопределенные матрицы определяют положительные операторы .

Обычное альтернативное обозначение , , и для положительно полуопределенных и положительно определенных, отрицательных полуопределенных и отрицательно определенных матриц соответственно. Это может сбивать с толку, так как иногда неотрицательные матрицы (соответственно, неположительные матрицы) также обозначаются таким образом.

Примеры

  • Матрица положительно определен (и как таковой также положительно полуопределен). Это действительная симметричная матрица, и для любого ненулевого вектора-столбца z с действительными элементами a и b один имеет
    .

    Рассматриваемый как комплексная матрица, для любого ненулевого вектора-столбца z с комплексными элементами a и b один имеет

    .
    В любом случае результат положительный, поскольку не является нулевым вектором (то есть, по крайней мере, один из и не равно нулю).
  • Действительная симметричная матрица
    положительно определен, поскольку для любого ненулевого вектора-столбца z с элементами a , b и c мы имеем
    Этот результат является суммой квадратов и, следовательно, неотрицателен; и равен нулю, только если, то есть когда z - нулевой вектор.
  • Для любой действительной обратимой матрицы , продукт является положительно определенной матрицей (если средние значения столбцов матрицы A равны 0, это также называется ковариационной матрицей ). Простое доказательство состоит в том, что для любого ненулевого вектора, условие поскольку обратимость матрицы Значит это
  • Пример Выше показано, что матрица, в которой некоторые элементы отрицательны, может быть положительно определенной. И наоборот, матрица, все элементы которой положительны, не обязательно положительно определена, как, например,
    для которого

Собственные значения

Позволять быть Эрмитова матрица . Это означает, что все его собственные значения действительны.

  • положительно определен тогда и только тогда, когда все его собственные значения положительны.
  • положительно полуопределено тогда и только тогда, когда все его собственные значения неотрицательны.
  • отрицательно определен тогда и только тогда, когда все его собственные значения отрицательны
  • отрицательно полуопределено тогда и только тогда, когда все его собственные значения неположительны.
  • неопределенно тогда и только тогда, когда у него есть как положительные, так и отрицательные собственные значения.

Позволять быть eigendecomposition из, куда является унитарной комплексной матрицей , столбцы которой содержит ортогональный базис из собственных векторов из, и - вещественная диагональная матрица , главная диагональ которой содержит соответствующие собственные значения . Матрица можно рассматривать как диагональную матрицу который был повторно выражен в координатах базиса (собственных векторов) . Другими словами, применение M к некоторому вектору z в нашей системе координат ( M z ) аналогично изменению базиса нашего z на систему координат собственного вектора с использованием P −1 ( P −1 z ), применяя преобразование растяжения D к it ( DP −1 z ), а затем вернем базис в нашу систему с помощью P ( PDP −1 z ).

Имея это в виду, однозначное изменение переменной показывает, что действительна и положительна для любого комплексного вектора если и только если реально и положительно для любого ; другими словами, еслиположительно определен. Для диагональной матрицы это верно, только если каждый элемент главной диагонали, то есть каждое собственное значение матрицы - положительно. Поскольку спектральная теорема гарантирует, что все собственные значения эрмитовой матрицы будут действительными, положительность собственных значений может быть проверена с помощью правила чередования знаков Декарта, когда характеристический многочлен действительной симметричной матрицы доступен.

Разложение

Позволять быть Эрмитова матрица . положительно полуопределено тогда и только тогда, когда оно может быть разложено как произведение

матрицы с его сопряженным транспонированием .

Когда это реально, также могут быть действительными, и разложение можно записать как

положительно определено тогда и только тогда, когда такое разложение существует с обратимый . В более общем смысле, положительно полуопределено с рангом тогда и только тогда, когда существует разложение с матрица полного ранга строки (т. е. ранга ). Более того, для любого разложения, . [2]

Колонны из можно рассматривать как векторы в комплексном или реальном векторном пространстве , соответственно. Тогда записиявляются внутренними продуктами (то есть скалярными произведениями в реальном случае) этих векторов

Другими словами, эрмитова матрица положительно полуопределено тогда и только тогда, когда это матрица Грама некоторых векторов. Она положительно определена тогда и только тогда, когда она является матрицей Грама некоторых линейно независимых векторов. В общем случае ранг матрицы Грама векторовравна размерности пространства, покрытого этими векторами. [3]

Уникальность с точностью до унитарных преобразований

Разложение не однозначно: если для некоторых матрица и если любой унитарный матрица (значение ), потом для .

Однако это единственный способ, которым два разложения могут различаться: разложение уникально с точностью до унитарных преобразований . Более формально, если это матрица и это матрица такая, что , то есть матрица с ортонормированными столбцами (что означает ) такой, что . [4] Когда это означает является унитарной .

В реальном случае это утверждение имеет интуитивно понятную геометрическую интерпретацию: пусть столбцы и быть векторами и в . Реальная унитарная матрица - это ортогональная матрица , описывающая жесткое преобразование (изометрия евклидова пространства) с сохранением точки 0 (т.е. повороты и отражения , без сдвигов). Следовательно, скалярные произведения и равны тогда и только тогда, когда некоторое жесткое преобразование преобразует векторы к (и от 0 до 0).

Квадратный корень

Матрица положительно полуопределенная тогда и только тогда, когда существует положительно полуопределенная матрица (в частности эрмитовский, поэтому ) удовлетворение . Эта матрицаединственна, [5] называется неотрицательным квадратным корнем из, и обозначается . Когда положительно определен, так же , поэтому его также называют положительным квадратным корнем из.

Неотрицательный квадратный корень не следует путать с другими разложениями. . Некоторые авторы используют имя квадратный корень идля любого такого разложения, или конкретно для разложения Холецкого , или любого разложения формы; другие используют его только для неотрицательного квадратного корня.

Если потом .

Разложение Холецкого

Положительная полуопределенная матрица можно записать как , куда является нижним треугольником с неотрицательной диагональю (эквивалентно куда верхнетреугольная); это разложение Холецкого . Если положительно определена, то диагональ положительно и разложение Холецкого единственно. Разложение Холецкого особенно полезно для эффективных численных расчетов. Близкое разложение - разложение ЛПНП ,, куда диагональный и это ниже унитреугольная .

Другие характеристики

Позволять быть Эрмитова матрица . Следующие свойства эквивалентны будучи положительно определенным:

Соответствующая полуторалинейная форма является внутренним продуктом.
Полуторалинейная форма определяется это функция из к такой, что для всех и в , куда является сопряженным транспонированием . Для любой сложной матрицы, эта форма линейна по и полулинейный в . Таким образом, форма является внутренним продуктом на если и только если действительна и положительна для всех ненулевых ; то есть тогда и только тогда, когдаположительно определен. (Фактически, каждый внутренний продукт на возникает таким образом из эрмитовой положительно определенной матрицы.)
Все ведущие основные несовершеннолетние положительные
К - й ведущий главного минора матрицыявляется определителем его верхнего левогоподматрица. Оказывается, матрица положительно определена тогда и только тогда, когда все эти определители положительны. Это условие известно как критерий Сильвестра и обеспечивает эффективную проверку положительной определенности симметричной вещественной матрицы. А именно, матрица сводится к верхнетреугольной матрице с использованием элементарных операций со строками , как в первой части метода исключения Гаусса , заботясь о сохранении знака ее определителя во время процесса поворота . Поскольку k- й старший главный минор треугольной матрицы является произведением ее диагональных элементов до строки, Критерий Сильвестра эквивалентен проверке положительности всех его диагональных элементов. Это условие можно проверять каждый раз, когда появляется новая строка треугольной матрицы.

Положительно полуопределенная матрица положительно определена тогда и только тогда, когда она обратима . [6] Матрица отрицательно (полу) определенно тогда и только тогда, когда положительно (полу) определенно.

Квадратичные формы

(Чисто) квадратичная форма, ассоциированная с вещественным матрица это функция такой, что для всех . можно считать симметричным, заменив его на .

Симметричная матрица положительно определен тогда и только тогда, когда его квадратичная форма является строго выпуклой функцией .

В более общем смысле, любая квадратичная функция из к можно записать как куда симметричный матрица настоящий -вектор и настоящая константа. Эта квадратичная функция строго выпукла и, следовательно, имеет единственный конечный глобальный минимум тогда и только тогда, когдаположительно определен. По этой причине положительно определенные матрицы играют важную роль в задачах оптимизации .

Одновременная диагонализация

Симметричная матрица и другая симметричная и положительно определенная матрица могут быть одновременно диагонализованы , хотя и не обязательно с помощью преобразования подобия . Этот результат не распространяется на случай трех и более матриц. В этом разделе мы пишем для реального случая. Немедленное распространение на сложный случай.

Позволять быть симметричным и симметричная и положительно определенная матрица. Запишите обобщенное уравнение на собственные значения в виде где мы налагаем, что быть нормализованным, т. е. . Теперь воспользуемся разложением Холецкого, чтобы записать обратное к в виде . Умножение на и позволяя , мы получили , который можно переписать как куда . Манипуляция теперь дает куда матрица, имеющая в качестве столбцов обобщенные собственные векторы и - диагональная матрица обобщенных собственных значений. Теперь предварительное умножение на дает окончательный результат: и , но обратите внимание, что это больше не ортогональная диагонализация по отношению к внутреннему произведению, где . Фактически мы диагонализовали относительно внутреннего продукта, индуцированного . [7]

Обратите внимание, что этот результат не противоречит тому, что сказано об одновременной диагонализации в статье « Диагонализируемая матрица» , которая относится к одновременной диагонализации с помощью преобразования подобия. Наш результат здесь больше похож на одновременную диагонализацию двух квадратичных форм и полезен для оптимизации одной формы при условиях другой.

Свойства

Вызванное частичное упорядочивание

Для произвольных квадратных матриц , мы пишем если т.е. положительно полуопределенный. Это определяет частичный порядок на множестве всех квадратных матриц. Аналогичным образом можно определить строгий частичный порядок. Заказ называется заказом Лёвнера .

Инверсия положительно определенной матрицы

Любая положительно определенная матрица обратима, и ее обратная матрица также положительно определена. [8] Если потом . [9] Кроме того, по теореме мин-макс , то к й наибольшее собственное значениебольше k- го наибольшего собственного значения.

Масштабирование

Если положительно определен и это действительное число, тогда положительно определен. [10]

Дополнение

  • Если и положительно определенные, то сумма также положительно определен. [10]
  • Если и положительно-полуопределенные, то сумма также положительно-полуопределенный.
  • Если положительно определен и положительно-полуопределённая, то сумма также положительно определен.

Умножение

  • Если и положительно определены, то продукты и также положительно определенные. Если, потом также положительно определен.
  • Если положительно полуопределено, то положительно полуопределенна для любой (возможно, прямоугольной) матрицы . Если положительно определен и имеет полный ранг столбца, тогда положительно определен. [11]

Подматрицы

Каждая главная подматрица положительно определенной матрицы положительно определена.

След

Диагональные записи положительно-полуопределенной матрицы действительны и неотрицательны. Как следствие след ,. Кроме того, [12], поскольку каждая главная подматрица (в частности, 2 на 2) положительно полуопределенная,

и, таким образом, когда ,

An Эрмитова матрица положительно определен, если он удовлетворяет следующим следовым неравенствам: [13]

Еще один важный результат: при любом и положительно-полуопределенные матрицы,

Произведение Адамара

Если , хотя не обязательно положительно полуопределенное произведение Адамара ,(этот результат часто называют теоремой Шура о произведении ). [14]

Относительно произведения Адамара двух положительно полуопределенных матриц , , есть два заметных неравенства:

  • Неравенство Оппенгейма: [15]
  • . [16]

Продукт Кронекера

Если , хотя не обязательно положительно полуопределенное произведение Кронекера .

Продукт Фробениуса

Если , хотя не обязательно положительно полуопределенное произведение Фробениуса (Ланкастер – Тисменецкий, Теория матриц , стр. 218).

Выпуклость

Множество положительно полуопределенных симметрических матриц выпукло . То есть, если и положительно полуопределенные, то для любого от 0 до 1, также положительно полуопределено. Для любого вектора:

Это свойство гарантирует, что задачи полуопределенного программирования сходятся к глобально оптимальному решению.

Связь с косинусом

Положительная определенность матрицы выражает, что угол между любым вектором и его образ является всегда :

Другие свойства

  1. Если является симметричной тёплицевой матрицей , т. е. элементы даны как функция их абсолютных разностей индексов: , и строгое неравенство держит, то является строго положительно определена.
  2. Позволять и Эрмитский. Если (соответственно, ) потом (соответственно, ). [17]
  3. Если реально, то есть такой, что , куда - единичная матрица .
  4. Если обозначает ведущий незначительный, является к - й оси во время разложения LU .
  5. Матрица является отрицательно определенной, если ее старший главный минор k- го порядка отрицателен, когда нечетное и положительное, когда даже.

Эрмитова матрица положительно полуопределенная тогда и только тогда, когда все ее главные миноры неотрицательны. Однако недостаточно рассматривать только главные главные миноры, как это проверяется на диагональной матрице с элементами 0 и −1.

Матрицы блоков

Положительный матрица также может быть определена блоками :

где каждый блок . Из условия положительности сразу следует, что и эрмитовские, и .

У нас есть это для всего комплекса , и в частности для . Затем

Аналогичный аргумент можно применить к , и, таким образом, мы заключаем, что оба и также должны быть положительно определенные матрицы.

Обратные результаты могут быть доказаны с помощью более сильных условий на блоки, например, с использованием дополнения Шура .

Локальные экстремумы

Общая квадратичная форма на реальные переменные всегда можно записать как куда вектор-столбец с этими переменными, а является симметричной вещественной матрицей. Следовательно, положительно определенная матрица означает, что имеет единственный минимум (ноль), когда равен нулю и строго положителен для любых других .

В более общем смысле, дважды дифференцируемая действительная функция на реальные переменные имеют локальный минимум аргументов если его градиент равен нулю, а его гессиан (матрица всех вторых производных) положительно полуопределен в этой точке. Аналогичные утверждения можно сделать для отрицательно определенных и полуопределенных матриц.

Ковариация

В статистике , то ковариационная матрица из многомерного распределения вероятностей всегда положительно полуопределенная; и он положительно определен, если одна переменная не является точной линейной функцией других. И наоборот, каждая положительно полуопределенная матрица является ковариационной матрицей некоторого многомерного распределения.

Расширение для неэрмитовых квадратных матриц

Определение положительно определенного можно обобщить, обозначив любую сложную матрицу (например, действительный несимметричный) как положительно определенный, если для всех ненулевых комплексных векторов , куда обозначает действительную часть комплексного числа . [18] Только эрмитская частьопределяет, является ли матрица положительно определенной, и оценивается в более узком смысле выше. Аналогично, если и настоящие, у нас есть для всех действительных ненулевых векторов тогда и только тогда, когда симметричная часть положительно определен в более узком смысле. Сразу видно, чтонечувствителен к транспозиции М .

Следовательно, несимметричная вещественная матрица только с положительными собственными значениями не обязательно должна быть положительно определенной. Например, матрицаимеет положительные собственные значения, но не является положительно определенным; в частности отрицательное значение получается с выбором (который является собственным вектором, связанным с отрицательным собственным значением симметричной части ).

Таким образом, отличительная черта между действительным и комплексным случаем состоит в том, что ограниченный положительный оператор в комплексном гильбертовом пространстве обязательно эрмитов или самосопряжен. Общее утверждение можно аргументировать, используя поляризационное тождество . В действительности это уже не так.

Приложения

Матрица теплопроводности

Закон теплопроводности Фурье, дающий тепловой поток по температурному градиенту для анизотропных сред записывается как , в котором - симметричная матрица теплопроводности . Отрицательный элемент вставлен в закон Фурье, чтобы отразить ожидание того, что тепло всегда будет переходить от горячего к холодному. Другими словами, поскольку температурный градиент всегда указывает от холода к горячему, тепловой поток ожидается, что будет иметь негативный внутренний продукт с и что . Подстановка закона Фурье дает это ожидание как, что означает, что матрица проводимости должна быть положительно определенной.

См. Также

  • Ковариационная матрица
  • М-матрица
  • Положительно определенная функция
  • Положительно определенное ядро
  • Дополнение Шура
  • Критерий сильвестра
  • Числовой диапазон

Примечания

  1. ^ «Приложение C: Положительные полуопределенные и положительно определенные матрицы» . Оценка параметров для ученых и инженеров : 259–263. DOI : 10.1002 / 9780470173862.app3 .
  2. ^ Хорн и Джонсон (2013) , стр. 440, теорема 7.2.7
  3. ^ Хорн и Джонсон (2013) , стр. 441, теорема 7.2.10
  4. ^ Хорн и Джонсон (2013) , стр. 452, теорема 7.3.11
  5. ^ Хорн и Джонсон (2013) , стр. 439, теорема 7.2.6 с
  6. ^ Хорн и Джонсон (2013) , стр. 431, следствие 7.1.7
  7. ^ Хорн и Джонсон (2013) , стр. 485, теорема 7.6.1
  8. ^ Хорн и Джонсон (2013) , стр. 438, теорема 7.2.1
  9. ^ Хорн и Джонсон (2013) , стр. 495, следствие 7.7.4 (а)
  10. ^ a b Хорн и Джонсон (2013) , стр. 430, наблюдение 7.1.3
  11. ^ Хорн и Джонсон (2013) , стр. 431, Наблюдение 7.1.8
  12. ^ Хорн и Джонсон (2013) , стр. 430
  13. ^ Волкович, Генри; Стьян, Джордж PH (1980). «Границы собственных значений с использованием следов». Линейная алгебра и ее приложения . Эльзевьер (29): 471–506.
  14. ^ Хорн и Джонсон (2013) , стр. 479, теорема 7.5.3
  15. ^ Хорн и Джонсон (2013) , стр. 509, теорема 7.8.16
  16. ^ Styan, GP (1973). «Произведения Адамара и многомерный статистический анализ». Линейная алгебра и ее приложения . 6 : 217–240., Следствие 3.6, с. 227
  17. ^ Бхатия, Раджендра (2007). Положительно определенные матрицы . Принстон, Нью-Джерси: Издательство Принстонского университета. п. 8. ISBN  978-0-691-12918-1.
  18. ^ Вайсштейн, Эрик В. Положительно определенная матрица. Материал из MathWorld - веб-ресурса Wolfram . По состоянию на 26 июля 2012 г.

Ссылки

  • Хорн, Роджер А .; Джонсон, Чарльз Р. (2013). Матричный анализ (2-е изд.). Издательство Кембриджского университета . ISBN 978-0-521-54823-6.
  • Бхатия, Раджендра (2007). Положительно определенные матрицы . Принстонская серия по прикладной математике. ISBN 978-0-691-12918-1.
  • Bernstein, B .; Тупен, Р.А. (1962). «Некоторые свойства матрицы Гессе строго выпуклой функции». Journal für die reine und angewandte Mathematik . 210 : 67–72. DOI : 10,1515 / crll.1962.210.65 .

Внешние ссылки

  • "Положительно-определенная форма" , Энциклопедия математики , EMS Press , 2001 [1994]
  • Wolfram MathWorld: положительно определенная матрица