В математике , A симметричная матрица с действительными записями положительно определен, если действительное числоположительна для любого ненулевого действительного вектора-столбца где является транспонированной из. [1] В более общем смысле, эрмитова матрица (то есть комплексная матрица, равная ее сопряженному транспонированию ) положительно определена, если действительное число положительна для любого ненулевого комплексного вектора-столбца мы обозначает сопряженное транспонирование
Положительные полуопределенные матрицы определяются аналогично, за исключением того, что скаляры а также должны быть положительными или нулевыми (что неотрицательно). Аналогично определяются отрицательно-определенные и отрицательно-полуопределенные матрицы. Матрица, которая не является положительно полуопределенной и не отрицательной полуопределенной, иногда называется неопределенной .
Таким образом, матрица положительно определена тогда и только тогда, когда она является матрицей положительно определенной квадратичной формы или эрмитовой формы . Другими словами, матрица положительно определена тогда и только тогда, когда она определяет внутренний продукт .
Положительно определенные и положительно-полуопределенные матрицы можно охарактеризовать по-разному, что может объяснить важность этого понятия в различных разделах математики. Матрица M положительно определена (соответственно, положительно полуопределена) тогда и только тогда, когда удовлетворяет любому из следующих эквивалентных условий.
- M является конгруэнтен с диагональной матрицей с положительными (соответственно. Неотрицательным) реальным данные.
- M является симметричным или эрмитовым, и все его собственные значения действительны и положительны (соответственно неотрицательны).
- M является симметричным или эрмитовым, и все его старшие главные миноры положительны (соответственно, все главные миноры неотрицательны).
- Существует обратимая матрица (соотв. Матрица) с сопряженным транспонированием такой, что
Положительно определенные и положительно-полуопределенные вещественные матрицы лежат в основе выпуклой оптимизации , поскольку, если задана дважды дифференцируемая функция нескольких действительных переменных , то если ее матрица Гессе (матрица ее вторых частных производных) положительно определена в точке в точке p , то функция выпукла около точки p , и, наоборот, если функция выпукла около точки p , то матрица Гессе положительно полуопределенная в точке p .
Некоторые авторы используют более общие определения определенности, включая некоторые несимметричные вещественные матрицы или неэрмитовы комплексные.
Определения
В следующих определениях это транспонирование , является сопряженной транспозицией из а также обозначает n -мерный нуль-вектор.
Определения для вещественных матриц
An симметричная вещественная матрица называется положительно определенным, если для всех ненулевых в . Формально,
An симметричная вещественная матрица называется положительно полуопределенным или неотрицательно определенным, если для всех в . Формально,
An симметричная вещественная матрица называется отрицательно-определенным, если для всех ненулевых в . Формально,
An симметричная вещественная матрица называется отрицательно-полуопределенным или отрицательно-определенным, если для всех в . Формально,
An симметричная вещественная матрица, которая не является ни положительно полуопределенной, ни отрицательной полуопределенной, называется неопределенной .
Определения для комплексных матриц
Все следующие определения включают термин . Обратите внимание, что это всегда действительное число для любой квадратной эрмитовой матрицы..
An Эрмитова комплексная матрица называется положительно определенным, если для всех ненулевых в . Формально,
An Эрмитова комплексная матрица называется положительно полуопределенным или неотрицательно определенным, если для всех в . Формально,
An Эрмитова комплексная матрица называется отрицательно-определенным, если для всех ненулевых в . Формально,
An Эрмитова комплексная матрица называется отрицательно полуопределенным или неположительно определенным, если для всех в . Формально,
An Эрмитова комплексная матрица, которая не является ни положительно полуопределенной, ни отрицательной полуопределенной, называется неопределенной .
Согласованность между реальными и сложными определениями
Поскольку каждая вещественная матрица также является комплексной матрицей, определения «определенности» для этих двух классов должны согласовываться.
Для сложных матриц наиболее распространенное определение гласит, что " положительно определен тогда и только тогда, когда действительна и положительна для всех ненулевых комплексных векторов-столбцов". Это условие означает, что эрмитово (т.е. его транспонирование равно сопряженному). Чтобы убедиться в этом, рассмотрим матрицы а также , чтобы а также . Матрицы а также эрмитовы, поэтому а также индивидуально реальны. Если реально, тогда должен быть нулевым для всех . потом - нулевая матрица и , доказывая, что эрмитово.
По этому определению положительно определенная вещественная матрицаэрмитово, следовательно, симметрично; а такжеположительно для всех ненулевых действительных векторов-столбцов. Однако одного последнего условия недостаточно длябыть положительно определенным. Например, если
тогда для любого реального вектора с записями а также у нас есть , что всегда положительно, если не равно нулю. Однако если - комплексный вектор с элементами а также , получается
что не реально. Следовательно, не является положительно-определенным.
С другой стороны, для симметричной вещественной матрицы, условие " для всех ненулевых действительных векторов " Это означает , что положительно определен в сложном смысле.
Обозначение
Если эрмитова матрица положительно полуопределенный, иногда пишут и если положительно-определенный пишет . Чтобы обозначить, что отрицательный полуопределенный пишет и обозначить, что отрицательно-определенный пишет .
Это понятие пришло из функционального анализа, в котором положительные полуопределенные матрицы определяют положительные операторы .
Обычное альтернативное обозначение , , а также для положительно полуопределенных и положительно определенных, отрицательных полуопределенных и отрицательно определенных матриц соответственно. Это может сбивать с толку, так как иногда неотрицательные матрицы (соответственно, неположительные матрицы) также обозначаются таким образом.
Примеры
- Матрица положительно определен (и как таковой также положительно полуопределен). Это действительная симметричная матрица, и для любого ненулевого вектора-столбца z с действительными элементами a и b один имеет
- .
Рассматриваемый как комплексная матрица, для любого ненулевого вектора-столбца z с комплексными элементами a и b один имеет
- .
- Действительная симметричная матрица
- Для любой действительной обратимой матрицы , продукт является положительно определенной матрицей (если средние значения столбцов матрицы A равны 0, это также называется ковариационной матрицей ). Простое доказательство состоит в том, что для любого ненулевого вектора, условие поскольку обратимость матрицы Значит это
- Пример Выше показано, что матрица, в которой некоторые элементы отрицательны, может быть положительно определенной. И наоборот, матрица, все элементы которой положительны, не обязательно положительно определена, как, например,
Собственные значения
Позволять быть Эрмитова матрица . Это означает, что все его собственные значения действительны.
- положительно определен тогда и только тогда, когда все его собственные значения положительны.
- положительно полуопределено тогда и только тогда, когда все его собственные значения неотрицательны.
- отрицательно определен тогда и только тогда, когда все его собственные значения отрицательны
- отрицательно полуопределено тогда и только тогда, когда все его собственные значения неположительны.
- неопределенно тогда и только тогда, когда у него есть как положительные, так и отрицательные собственные значения.
Позволять быть eigendecomposition из, где является унитарной комплексной матрицей , столбцы которой содержит ортогональный базис из собственных векторов из, а также - вещественная диагональная матрица , главная диагональ которой содержит соответствующие собственные значения . Матрица можно рассматривать как диагональную матрицу который был повторно выражен в координатах базиса (собственных векторов) . Другими словами, применение M к некоторому вектору z в нашей системе координат ( M z ) аналогично изменению базиса нашего z на систему координат собственного вектора с использованием P −1 ( P −1 z ), применяя преобразование растяжения D к it ( DP −1 z ), а затем вернем базис в нашу систему с помощью P ( PDP −1 z ).
Имея это в виду, однозначное изменение переменной показывает, что действительна и положительна для любого комплексного вектора если и только если реально и положительно для любого ; другими словами, еслиположительно определен. Для диагональной матрицы это верно, только если каждый элемент главной диагонали, то есть каждое собственное значение матрицы- положительно. Поскольку спектральная теорема гарантирует, что все собственные значения эрмитовой матрицы будут действительными, положительность собственных значений может быть проверена с помощью правила чередования знаков Декарта, когда характеристический многочлен действительной симметричной матрицы доступен.
Разложение
Позволять быть Эрмитова матрица . положительно полуопределено тогда и только тогда, когда оно может быть разложено как произведение
матрицы с его сопряженным транспонированием .
Когда это реально, также могут быть действительными, и разложение можно записать как
положительно определен тогда и только тогда, когда такое разложение существует с обратимый . В более общем смысле, положительно полуопределено с рангом тогда и только тогда, когда существует разложение с матрица полного ранга строки (т.е. ранга ). Более того, для любого разложения, . [2]
Доказательство |
---|
Если , тогда , так положительно полуопределено. Если к тому же обратимо, то неравенство строго при , так положительно определен. Если является ранга , тогда . В другом направлении предположим положительно полуопределено. Сэрмитово, имеет собственное разложение где является унитарной и диагональная матрица, элементы которой являются собственными значениями матрицы С положительно полуопределено, собственные значения - неотрицательные действительные числа, поэтому можно определить как диагональная матрица, элементы которой являются неотрицательными квадратными корнями из собственных значений. потом для . Если к тому же положительно определена, то собственные значения (строго) положительны, поэтому обратима, а значит также обратима. Если имеет звание , то в нем ровно положительные собственные значения, а остальные равны нулю, поэтому в все, но все строки обнуляются. Обрезка нулевых строк дает матрица такой, что . |
Колонны из можно рассматривать как векторы в комплексном или реальном векторном пространстве , соответственно. Тогда записиявляются внутренними продуктами (то есть скалярными произведениями в реальном случае) этих векторов
Другими словами, эрмитова матрица положительно полуопределено тогда и только тогда, когда это матрица Грама некоторых векторов. Она положительно определена тогда и только тогда, когда она является матрицей Грама некоторых линейно независимых векторов. В общем случае ранг матрицы Грама векторовравна размерности пространства, натянутого на эти векторы. [3]
Единственность с точностью до унитарных преобразований
Разложение не однозначно: если для некоторых матрица и если любой унитарный матрица (значение ), тогда для .
Однако это единственный способ, которым два разложения могут различаться: разложение уникально с точностью до унитарных преобразований . Более формально, если это матрица и это матрица такая, что , то есть матрица с ортонормированными столбцами (что означает ) такие, что . [4] Когда это означает является унитарной .
В реальном случае это утверждение имеет интуитивно понятную геометрическую интерпретацию: пусть столбцы а также быть векторами а также в . Реальная унитарная матрица - это ортогональная матрица , описывающая жесткое преобразование (изометрия евклидова пространства) с сохранением точки 0 (т.е. повороты и отражения , без сдвигов). Следовательно, скалярные произведения а также равны тогда и только тогда, когда некоторое жесткое преобразование преобразует векторы к (и от 0 до 0).
Квадратный корень
Матрица положительно полуопределенная тогда и только тогда, когда существует положительно полуопределенная матрица (в частности эрмитово, поэтому ) удовлетворение . Эта матрицаединственна, [5] называется неотрицательным квадратным корнем из, и обозначается . Когда положительно определен, так же , поэтому его также называют положительным квадратным корнем из.
Неотрицательный квадратный корень не следует путать с другими разложениями. . Некоторые авторы используют имя квадратный корень идля любого такого разложения, или конкретно для разложения Холецкого , или любого разложения формы; другие используют его только для неотрицательного квадратного корня.
Если тогда .
Разложение Холецкого
Положительная полуопределенная матрица можно записать как , где является нижним треугольником с неотрицательной диагональю (эквивалентно где верхнетреугольная); это разложение Холецкого . Если положительно определена, то диагональ положительно и разложение Холецкого единственно. Разложение Холецкого особенно полезно для эффективных численных расчетов. Близким разложением является разложение ЛПНП ,, где диагональный и это ниже унитреугольная .
Другие характеристики
Позволять быть Эрмитова матрица . Следующие свойства эквивалентны будучи положительно определенным:
- Соответствующая полуторалинейная форма является внутренним продуктом.
- Полуторалинейная форма определяется это функция из к такой, что для всех а также в , где является сопряженным транспонированием . Для любой сложной матрицы , эта форма линейна по и полулинейный в . Таким образом, форма является внутренним продуктом на если и только если действительна и положительна для всех ненулевых ; то есть тогда и только тогда, когда положительно определен. (Фактически, каждый внутренний продукт на возникает таким образом из эрмитовой положительно определенной матрицы.)
- Все ведущие основные несовершеннолетние положительные
- К - й ведущий главного минора матрицы является фактором , определяющим его верхнего левого подматрица. Оказывается, матрица положительно определена тогда и только тогда, когда все эти определители положительны. Это условие известно как критерий Сильвестра и обеспечивает эффективную проверку положительной определенности симметричной вещественной матрицы. А именно, матрица сводится к верхнетреугольной матрице с использованием элементарных операций со строками , как в первой части метода исключения Гаусса , заботясь о сохранении знака ее определителя во время процесса поворота . Поскольку k- й старший главный минор треугольной матрицы является произведением ее диагональных элементов до строки , Критерий Сильвестра эквивалентен проверке положительности всех его диагональных элементов. Это условие можно проверять каждый раз, когда появляется новая строка треугольной матрицы.
Положительно полуопределенная матрица положительно определена тогда и только тогда, когда она обратима . [6] Матрица отрицательно (полу) определенно тогда и только тогда, когда положительно (полу) определенно.
Квадратичные формы
(Чистая) квадратичная форма, ассоциированная с вещественным матрица это функция такой, что для всех . можно считать симметричным, заменив его на .
Симметричная матрица положительно определен тогда и только тогда, когда его квадратичная форма является строго выпуклой функцией .
В более общем смысле, любая квадратичная функция из к можно записать как где симметричный матрица настоящий -вектор и настоящая константа. Эта квадратичная функция строго выпукла и, следовательно, имеет единственный конечный глобальный минимум тогда и только тогда, когдаположительно определен. По этой причине положительно определенные матрицы играют важную роль в задачах оптимизации .
Одновременная диагонализация
Симметричная матрица и другая симметричная и положительно определенная матрица могут быть одновременно диагонализованы , хотя и не обязательно с помощью преобразования подобия . Этот результат не распространяется на случай трех и более матриц. В этом разделе мы пишем для реального случая. Немедленное распространение на сложный случай.
Позволять быть симметричным и симметричная и положительно определенная матрица. Запишите обобщенное уравнение на собственные значения в виде где мы налагаем, что быть нормализованным, т. е. . Теперь воспользуемся разложением Холецкого, чтобы записать обратное к в виде . Умножение на и позволяя , мы получили , который можно переписать как где . Манипуляция теперь дает где матрица, имеющая в качестве столбцов обобщенные собственные векторы и - диагональная матрица обобщенных собственных значений. Теперь предварительное умножение на дает окончательный результат: а также , но обратите внимание, что это больше не ортогональная диагонализация по отношению к внутреннему произведению, где . Фактически мы диагонализовали относительно внутреннего продукта, индуцированного . [7]
Обратите внимание, что этот результат не противоречит тому, что сказано об одновременной диагонализации в статье « Диагонализируемая матрица» , которая относится к одновременной диагонализации с помощью преобразования подобия. Наш результат здесь больше похож на одновременную диагонализацию двух квадратичных форм и полезен для оптимизации одной формы при условиях другой.
Характеристики
Индуцированное частичное упорядочение
Для произвольных квадратных матриц , мы пишем если т.е. положительно полуопределенный. Это определяет частичный порядок на множестве всех квадратных матриц. Аналогичным образом можно определить строгий частичный порядок. Заказ называется заказом Лёвнера .
Обращение к положительно определенной матрице
Любая положительно определенная матрица обратима, и ее обратная матрица также положительно определена. [8] Если тогда . [9] Кроме того, по теореме мин-макс , то к й наибольшее собственное значениебольше k- го наибольшего собственного значения.
Масштабирование
Если положительно определен и это действительное число, тогда положительно определен. [10]
Добавление
- Если а также положительно определенные, то сумма также положительно определен. [10]
- Если а также положительно-полуопределенные, то сумма также положительно-полуопределённо.
- Если положительно определен и положительно-полуопределённая, то сумма также положительно определен.
Умножение
- Если а также положительно определены, то продукты а также также положительно определенные. Если, тогда также положительно определен.
- Если положительно полуопределено, то положительно полуопределенна для любой (возможно, прямоугольной) матрицы . Если положительно определен и имеет полный ранг столбца, тогда положительно определен. [11]
Подматрицы
Каждая главная подматрица положительно определенной матрицы положительно определена.
След
Диагональные записи положительно-полуопределенной матрицы действительны и неотрицательны. Как следствие след ,. Кроме того, [12], поскольку каждая главная подматрица (в частности, 2 на 2) положительно полуопределенная,
и, таким образом, когда ,
An Эрмитова матрица положительно определен, если он удовлетворяет следующим следовым неравенствам: [13]
Еще один важный результат: при любом а также положительно-полуопределенные матрицы,
Произведение Адамара
Если , хотя не обязательно положительно полуопределенное произведение Адамара ,(этот результат часто называют теоремой Шура о произведении ). [14]
Относительно произведения Адамара двух положительно полуопределенных матриц , , есть два заметных неравенства:
- Неравенство Оппенгейма: [15]
- . [16]
Кронекер продукт
Если , хотя не обязательно положительно полуопределенное произведение Кронекера .
Произведение Фробениуса
Если , хотя не обязательно положительно полуопределенное произведение Фробениуса (Ланкастер – Тисменецкий, Теория матриц , стр. 218).
Выпуклость
Множество положительно полуопределенных симметрических матриц выпукло . То есть, если а также положительно полуопределены, то для любого от 0 до 1, также положительно полуопределено. Для любого вектора:
Это свойство гарантирует, что задачи полуопределенного программирования сходятся к глобально оптимальному решению.
Связь с косинусом
Положительная определенность матрицы выражает, что угол между любым вектором и его образ является всегда :
Другие свойства
- Если является симметричной тёплицевой матрицей , т. е. элементы даны как функция их абсолютных разностей индексов: , и строгое неравенство держит, то является строго положительно определена.
- Позволять а также Эрмитский. Если (соответственно, ) тогда (соответственно, ). [17]
- Если реально, то есть такой, что , где - единичная матрица .
- Если обозначает ведущий незначительный, - k- й стержень во время разложения LU .
- Матрица является отрицательно определенной, если ее старший главный минор k- го порядка отрицателен, когда нечетное и положительное, когда даже.
Эрмитова матрица положительно полуопределенная тогда и только тогда, когда все ее главные миноры неотрицательны. Однако недостаточно рассматривать только главные главные миноры, как это проверяется на диагональной матрице с элементами 0 и −1.
Блочные матрицы
Положительный матрица также может быть определена блоками :
где каждый блок . Из условия положительности сразу следует, что а также эрмитские, и .
У нас есть это для всего комплекса , и в частности для . потом
Аналогичный аргумент можно применить к , и, таким образом, мы заключаем, что оба а также также должны быть положительно определенные матрицы.
Обратные результаты могут быть доказаны с помощью более сильных условий на блоки, например, с использованием дополнения Шура .
Локальные экстремумы
Общая квадратичная форма на реальные переменные всегда можно записать как где вектор-столбец с этими переменными, а является симметричной вещественной матрицей. Следовательно, положительно определенная матрица означает, что имеет единственный минимум (ноль), когда равен нулю и строго положителен для любых других .
В более общем смысле, дважды дифференцируемая действительная функция на реальные переменные имеют локальный минимум аргументов если его градиент равен нулю, а его гессиан (матрица всех вторых производных) положительно полуопределен в этой точке. Аналогичные утверждения можно сделать для отрицательно определенных и полуопределенных матриц.
Ковариация
В статистике , то ковариационная матрица из многомерного распределения вероятностей всегда положительно полуопределенная; и он положительно определен, если одна переменная не является точной линейной функцией других. И наоборот, каждая положительно полуопределенная матрица является ковариационной матрицей некоторого многомерного распределения.
Расширение для неэрмитовых квадратных матриц
Определение положительно определенного можно обобщить, обозначив любую сложную матрицу (например, действительный несимметричный) как положительно определенный, если для всех ненулевых комплексных векторов , где обозначает действительную часть комплексного числа . [18] Только эрмитская частьопределяет, является ли матрица положительно определенной, и оценивается в более узком смысле выше. Аналогично, если а также настоящие, у нас есть для всех действительных ненулевых векторов тогда и только тогда, когда симметричная часть положительно определен в более узком смысле. Сразу видно, чтонечувствителен к транспозиции М .
Следовательно, несимметричная вещественная матрица только с положительными собственными значениями не обязательно должна быть положительно определенной. Например, матрицаимеет положительные собственные значения, но не является положительно определенным; в частности отрицательное значение получается с выбором (который является собственным вектором, связанным с отрицательным собственным значением симметричной части ).
Таким образом, различие между действительным и комплексным случаями состоит в том, что ограниченный положительный оператор в комплексном гильбертовом пространстве обязательно эрмитов или самосопряжен. Общее утверждение можно аргументировать, используя поляризационное тождество . В действительности это уже не так.
Приложения
Матрица теплопроводности
Закон теплопроводности Фурье, дающий тепловой поток по температурному градиенту для анизотропных сред записывается как , в котором - симметричная матрица теплопроводности . Отрицательный элемент вставлен в закон Фурье, чтобы отразить ожидание того, что тепло всегда будет течь от горячего к холодному. Другими словами, поскольку температурный градиент всегда указывает от холода к горячему, тепловой поток ожидается отрицательный внутренний продукт с чтобы . Подстановка закона Фурье дает это ожидание как, что означает, что матрица проводимости должна быть положительно определенной.
Смотрите также
- Ковариационная матрица
- М-матрица
- Положительно определенная функция
- Положительно определенное ядро
- Дополнение Шура
- Критерий сильвестра
- Числовой диапазон
Заметки
- ^ «Приложение C: Положительные полуопределенные и положительно определенные матрицы» . Оценка параметров для ученых и инженеров : 259–263. DOI : 10.1002 / 9780470173862.app3 .
- ^ Хорн и Джонсон (2013) , стр. 440, теорема 7.2.7
- ^ Хорн и Джонсон (2013) , стр. 441, теорема 7.2.10
- ^ Хорн и Джонсон (2013) , стр. 452, теорема 7.3.11
- ^ Хорн и Джонсон (2013) , стр. 439, теорема 7.2.6 с
- ^ Хорн и Джонсон (2013) , стр. 431, следствие 7.1.7
- ^ Хорн и Джонсон (2013) , стр. 485, теорема 7.6.1
- ^ Хорн и Джонсон (2013) , стр. 438, теорема 7.2.1
- ^ Хорн и Джонсон (2013) , стр. 495, следствие 7.7.4 (а)
- ^ a b Хорн и Джонсон (2013) , стр. 430, наблюдение 7.1.3
- ^ Хорн и Джонсон (2013) , стр. 431, Наблюдение 7.1.8
- ^ Хорн и Джонсон (2013) , стр. 430
- ^ Волкович, Генри; Стьян, Джордж PH (1980). «Границы собственных значений с использованием следов». Линейная алгебра и ее приложения . Эльзевьер (29): 471–506.
- ^ Хорн и Джонсон (2013) , стр. 479, теорема 7.5.3
- ^ Хорн и Джонсон (2013) , стр. 509, теорема 7.8.16
- ^ Стян, Г.П. (1973). «Произведения Адамара и многомерный статистический анализ». Линейная алгебра и ее приложения . 6 : 217–240., Следствие 3.6, с. 227
- ^ Бхатия, Раджендра (2007). Положительно определенные матрицы . Принстон, Нью-Джерси: Издательство Принстонского университета. п. 8. ISBN 978-0-691-12918-1.
- ^ Вайсштейн, Эрик В. Положительно определенная матрица. Материал из MathWorld - веб-ресурса Wolfram . По состоянию на 26 июля 2012 г.
Рекомендации
- Хорн, Роджер А .; Джонсон, Чарльз Р. (2013). Матричный анализ (2-е изд.). Издательство Кембриджского университета . ISBN 978-0-521-54823-6.
- Бхатия, Раджендра (2007). Положительно определенные матрицы . Принстонская серия по прикладной математике. ISBN 978-0-691-12918-1.
- Бернштейн, Б .; Тупен, Р.А. (1962). «Некоторые свойства матрицы Гессе строго выпуклой функции». Journal für die reine und angewandte Mathematik . 210 : 67–72. DOI : 10,1515 / crll.1962.210.65 .
Внешние ссылки
- "Положительно-определенная форма" , Энциклопедия математики , EMS Press , 2001 [1994]
- Wolfram MathWorld: положительно определенная матрица