Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Двумерный функция плотности вероятности гауссова с центром в точке (0, 0), с ковариационной матрицей , заданной
Выборочные точки из двумерного распределения Гаусса со стандартным отклонением 3 примерно в нижнем левом верхнем правом направлении и 1 в ортогональном направлении. Поскольку компоненты x и y изменяются одновременно, дисперсии и не полностью описывают распределение. Требуется ковариационная матрица; направления стрелок соответствуют собственным векторам этой ковариационной матрицы, а их длины - квадратным корням из собственных значений .

В теории вероятностей и статистики , A ковариационной матрицы (также известный как авто- ковариационной матрицы , дисперсии матрицы , дисперсии матрицы , или ковариационной матрицы ) представляет собой квадратную матрицу давая ковариации между каждой парой элементов данного случайного вектора . Любая ковариационная матрица является симметричной и положительно полуопределенной, а ее главная диагональ содержит дисперсии (т. Е. Ковариацию каждого элемента с самим собой).

Интуитивно ковариационная матрица обобщает понятие дисперсии на несколько измерений. В качестве примера, изменение в коллекции случайных точек в двумерном пространстве не может быть полностью охарактеризован одним числом, ни бы разницы в и направления содержат всю необходимую информацию; матрица будет необходимо , чтобы полностью охарактеризовать двумерный вариант.

Ковариационная матрица случайного вектора обычно обозначается символом или .

Определение [ править ]

В этой статье жирного шрифт unsubscripted и используется для обозначения случайных векторов, и unboldfaced индексируется и используется для обозначения скалярных случайных величин.

Если записи в векторе столбца

являются случайными величинами , каждый из которых с конечной дисперсией и ожидаемого значения , то матрица ковариации является матрица, запись является ковариационной [1] : р. 177

где оператор обозначает ожидаемое значение (среднее) своего аргумента.

Другими словами,

Приведенное выше определение эквивалентно матричному равенству

где .

Обобщение дисперсии [ править ]

Эту форму ( уравнение 1 ) можно рассматривать как обобщение скалярной дисперсии на более высокие измерения. Помните, что для случайной величины со скалярным знаком

Действительно, элементы на диагонали автоковариационной матрицы - это дисперсии каждого элемента вектора .

Противоречивые номенклатуры и обозначения [ править ]

Номенклатуры различаются. Некоторые статистики, следуя вероятностник Феллер в своей двухтомной книге Введения в теорию вероятностей и ее применение , [2] называть матрицу с дисперсией случайного вектора , потому что это естественное обобщение на более высокие размерности 1-мерного дисперсия. Другие называют ее ковариационной матрицей , потому что это матрица ковариаций между скалярными компонентами вектора .

Обе формы вполне стандартные, и между ними нет никакой двусмысленности. Матрицу также часто называют матрицей дисперсии-ковариации , поскольку диагональные члены на самом деле являются дисперсиями.

Для сравнения, обозначение матрицы кросс-ковариации между двумя векторами:

Свойства [ править ]

Связь с автокорреляционной матрицей [ править ]

Матрица автоковариации связана с матрицей автокорреляции соотношением

где автокорреляционная матрица определяется как .

Связь с корреляционной матрицей [ править ]

Сущность, тесно связанная с ковариационной матрицей, - это матрица коэффициентов корреляции момента произведения Пирсона между каждой из случайных величин в случайном векторе , которая может быть записана как

где - матрица диагональных элементов (т. е. диагональная матрица дисперсий для ).

Эквивалентно, корреляционная матрица может рассматриваться как ковариационная матрица стандартизованных случайных величин для .

Каждый элемент на главной диагонали корреляционной матрицы представляет собой корреляцию случайной величины с самим собой, которая всегда равна 1. Каждый недиагональный элемент находится в диапазоне от -1 до +1 включительно.

Обратная матрица ковариации [ править ]

Обратная матрица, если она существует, является матрицей обратной ковариации, также известной как матрица концентрации или матрица точности . [3]

Основные свойства [ править ]

Для и , где - -мерная случайная величина, применяются следующие основные свойства: [4]

  1. является положительным полуопределенной , т.е.
  2. является симметричным , т.е.
  3. Для любой постоянной (т.е. неслучайной) матрицы и постоянного вектора один имеет
  4. Если это еще один случайный вектор с той же размерности, что и , затем , где является кросс-ковариационная матрица из и .

Матрицы блоков [ править ]

Совместная средняя и совместная ковариационная матрица из и может быть записана в виде блока

где , и .

и могут быть определены как матрицы дисперсии предельных распределений для и соответственно.

Если и будут совместно распределены нормально ,

тогда условное распределение для данного дается выражением

[5]

определяется условным средним

и условная дисперсия

Матрица известна как матрица коэффициентов регрессии , а в линейной алгебре - это дополнение Шура для in .

Матрица коэффициентов регрессии часто может быть дана в транспонированной форме, подходящей для последующего умножения вектора-строки независимых переменных, а не предварительного умножения вектора-столбца . В таком виде они соответствуют коэффициентам , полученным путем переворачивания матрицу нормальных уравнений по обычным методом наименьших квадратов (МНК).

Матрица частичной ковариации [ править ]

Ковариационная матрица со всеми ненулевыми элементами говорит нам, что все отдельные случайные величины взаимосвязаны. Это означает, что переменные не только напрямую связаны, но и косвенно связаны через другие переменные. Часто такие косвенные корреляции общего режима тривиальны и неинтересны. Их можно подавить, вычислив частичную матрицу ковариации, то есть часть матрицы ковариации, которая показывает только интересную часть корреляций.

Если два вектора случайных величин и коррелируют через другой вектор , последние корреляции подавляются в матрице [6]

Матрица частичной ковариации фактически представляет собой простую матрицу ковариации, как если бы неинтересные случайные величины оставались постоянными.

Матрица ковариации как параметр распределения [ править ]

Если вектор - столбец из , возможно , коррелированных случайных величин совместно распределен нормально , или в более общем случае эллиптический распределен , то его функция плотности вероятности может быть выражена в терминах ковариационной матрицы следующим образом [6]

где и является определяющим фактором в .

Матрица ковариации как линейный оператор [ править ]

Применительно к одному вектору, ковариационная матрица отображает линейную комбинацию C случайных величин X на вектор ковариации с этими переменными: . Обработанные в качестве билинейной формы , она дает ковариации между двумя линейными комбинациями: . Тогда дисперсия линейной комбинации - это ее ковариация с самой собой.

Точно так же (псевдо) обратная ковариационная матрица обеспечивает внутренний продукт , который индуцирует расстояние Махаланобиса , меру «маловероятности» c . [ необходима цитата ]

Какие матрицы являются ковариационными матрицами? [ редактировать ]

Из тождества чуть выше, пусть будет вещественным вектором, тогда

который всегда должен быть неотрицательным, поскольку это дисперсия случайной величины с действительным знаком, поэтому ковариационная матрица всегда является положительно-полуопределенной матрицей .

Приведенный выше аргумент можно расширить следующим образом:

И наоборот, каждая симметричная положительно полуопределенная матрица является ковариационной матрицей. Чтобы убедиться в этом, предположим, что это симметричная положительно-полуопределенная матрица. Из конечномерного случая спектральной теоремы следует, что имеет неотрицательный симметричный квадратный корень , который можно обозначить через M 1/2 . Позвольте быть любой случайной величиной с вектором-столбцом, ковариационная матрица которой является единичной матрицей. потом

Сложные случайные векторы [ править ]

Матрица ковариации [ править ]

Дисперсию из сложного скалярной случайной переменной с ожидаемым значением обычно определяется с использованием комплексного сопряжения :

где комплексное сопряжение комплексного числа обозначается ; таким образом, дисперсия сложной случайной величины является действительным числом.

Если - вектор-столбец комплексных случайных величин, то сопряженное транспонирование формируется как транспонированием, так и сопряжением. В следующем выражении произведение вектора на сопряженное транспонирование приводит к квадратной матрице, называемой матрицей ковариации , в качестве математического ожидания: [7] : p. 293

,

где обозначает сопряженное транспонирование, которое применимо к скалярному случаю, поскольку транспонирование скаляра по-прежнему является скаляром. Матрица , полученная таким образом будет эрмитово положительным полуопределенной , [8] с вещественными числами в главной диагонали и комплексных чисел внедиагональными.

Матрица псевдоковариации [ править ]

Для сложных случайных векторов, другого типа второго центрального момента, матрица псевдоковариации (также называемая матрицей отношений) определяется следующим образом. В отличие от ковариационной матрицы, определенной выше, эрмитова транспозиция заменяется транспонированием в определении.

Свойства [ править ]

  • Ковариационная матрица является эрмитовой матрицей , то есть . [1] : стр. 179
  • Диагональные элементы ковариационной матрицы действительны. [1] : стр. 179

Оценка [ править ]

Если и представляют собой центрированные матрицы данных размерности и, соответственно, то есть с n столбцами наблюдений p и q строк переменных, из которых были вычтены средние по строкам, тогда, если средние по строкам были оценены на основе данных, выборочные ковариационные матрицы и можно определить как

или, если средние строки были известны априори,

Эти эмпирические выборочные ковариационные матрицы являются наиболее простыми и наиболее часто используемыми оценщиками для ковариационных матриц, но существуют и другие оценщики, включая регуляризованные или усадочные оценщики, которые могут иметь лучшие свойства.

Приложения [ править ]

Ковариационная матрица - полезный инструмент во многих различных областях. Из него может быть получена матрица преобразования , называемая преобразованием отбеливания , которая позволяет полностью декоррелировать данные [ необходима цитата ] или, с другой точки зрения, найти оптимальную основу для представления данных в компактном виде [ цитата требуется ] (см. фактор Рэлея для формального доказательства и дополнительных свойств ковариационных матриц). Это называется анализом главных компонент (PCA) и преобразованием Карунена – Лоэва (KL-преобразованием).

Ковариационная матрица играет ключевую роль в финансовой экономике , особенно в теории портфелей и ее теореме разделения паевых инвестиционных фондов, а также в модели ценообразования капитальных активов . Матрица ковариаций доходности различных активов используется для определения, при определенных допущениях, относительных сумм различных активов, которые инвесторы должны (в нормативном анализе ) или, по прогнозам (в положительном анализе ), предпочитают держать в контексте диверсификация .

Отображение ковариации [ править ]

При ковариационном отображении значения матрицы или отображаются в виде двухмерной карты. Когда векторы и являются дискретными случайными функциями , карта показывает статистические отношения между различными областями случайных функций. Статистически независимые области функций отображаются на карте как равнины с нулевым уровнем, а положительные или отрицательные корреляции отображаются, соответственно, как холмы или долины.

На практике векторы-столбцы и получаются экспериментально в виде строк выборок, например

где - i-е дискретное значение в выборке j случайной функции . Ожидаемые значения, необходимые в формуле ковариации, оцениваются с использованием выборочного среднего , например

а ковариационная матрица оценивается выборочной ковариационной матрицей

где угловые скобки обозначают усреднение выборки, как и раньше, за исключением того, что необходимо сделать поправку Бесселя, чтобы избежать смещения . Используя эту оценку, частную матрицу ковариации можно рассчитать как

где обратная косая черта обозначает левый оператор деления матрицы , который обходит требование инвертировать матрицу и доступен в некоторых вычислительных пакетах, таких как Matlab . [9]

Рисунок 1: Построение частичной ковариационной карты молекул N 2 , подвергающихся кулоновскому взрыву, индуцированному лазером на свободных электронах. [10] Панели a и b отображают два члена ковариационной матрицы, которая показана на панели c . Панель d отображает синфазные корреляции через флуктуации интенсивности лазера. Панель e отображает частичную матрицу ковариаций, скорректированную с учетом флуктуаций интенсивности. Панель fпоказывает, что 10% избыточная коррекция улучшает карту и делает ионно-ионную корреляцию четко видимой. Благодаря сохранению импульса эти корреляции выглядят как линии, приблизительно перпендикулярные линии автокорреляции (и периодическим модуляциям, вызываемым звоном детектора).

На рис. 1 показано, как строится частичная ковариационная карта на примере эксперимента, проведенного на лазере на свободных электронах FLASH в Гамбурге. [10] Случайная функция - это времяпролетный спектр ионов от кулоновского взрыва молекул азота, многократно ионизированных лазерным импульсом. Поскольку за каждый лазерный импульс ионизируются всего несколько сотен молекул, однократные спектры сильно колеблются. Однако, как правило, сбор таких спектров и их усреднение дает гладкий спектр , который показан красным в нижней части рисунка 1. Средний спектрпоказывает несколько ионов азота в виде пиков, уширенных по их кинетической энергии, но для нахождения корреляций между стадиями ионизации и импульсами ионов необходимо вычислить ковариационную карту.

В примере на рис. 1 спектры и совпадают, за исключением того, что различается диапазон времени пролета . Панель a показывает , панель b показывает, а панель c показывает их различие (обратите внимание на изменение цветовой шкалы). К сожалению, эта карта перегружена неинтересными синфазными корреляциями, вызванными колебаниями интенсивности лазера от кадра к кадру. Чтобы подавить такие корреляции, интенсивность лазера записывается при каждом выстреле, вводится и рассчитывается как панели d и e.Показать. Однако подавление неинтересных корреляций несовершенно, поскольку помимо интенсивности лазера существуют другие источники синфазных флуктуаций, и в принципе все эти источники следует контролировать в векторе . Однако на практике часто бывает достаточно сверхкомпенсировать частичную ковариационную поправку, как показано на панели f , где теперь четко видны интересные корреляции импульсов ионов в виде прямых линий, центрированных на стадиях ионизации атомарного азота.

Двумерная инфракрасная спектроскопия [ править ]

Двумерная инфракрасная спектроскопия использует корреляционный анализ для получения двумерных спектров конденсированной фазы . Есть две версии этого анализа: синхронный и асинхронный . Математически первый выражается в терминах выборочной матрицы ковариаций, а метод эквивалентен ковариационному отображению. [11]

См. Также [ править ]

  • Многовариантная статистика
  • Матрица грамиана
  • Разложение на собственные значения
  • Квадратичная форма (статистика)
  • Основные компоненты

Ссылки [ править ]

  1. ^ a b c Парк, Кун Иль (2018). Основы вероятностных и случайных процессов с приложениями к коммуникациям . Springer. ISBN 978-3-319-68074-3.
  2. ^ Уильям Феллер (1971). Введение в теорию вероятностей и ее приложения . Вайли. ISBN 978-0-471-25709-7. Проверено 10 августа 2012 года .
  3. ^ Вассерман, Ларри (2004). Вся статистика: краткий курс статистических выводов . ISBN 0-387-40272-1.
  4. ^ Табога, Марко (2010). «Лекции по теории вероятностей и математической статистике» .
  5. ^ Итон, Моррис Л. (1983). Многомерная статистика: подход векторного пространства . Джон Уайли и сыновья. С. 116–117. ISBN 0-471-02776-6.
  6. ^ a b W J Krzanowski "Принципы многомерного анализа" (Oxford University Press, Нью-Йорк, 1988), гл. 14,4; К. В. Мардиа, Дж. Т. Кент и Дж. М. Бибби "Многомерный анализ (Academic Press, Лондон, 1997), глава 6.5.3; Т. В. Андерсон" Введение в многомерный статистический анализ "(Wiley, Нью-Йорк, 2003), 3-е изд., Главы 2.5.1 и 4.3.1.
  7. ^ Лапидофова Amos (2009). Фонд цифровых коммуникаций . Издательство Кембриджского университета. ISBN 978-0-521-19395-5.
  8. ^ Брукс, Майк. «Справочное руководство по матрице» . Cite journal requires |journal= (help)
  9. ^ LJ Frasinski "Методы отображения ковариации" J. Phys. Летучая мышь. Мол. Опт. Phys. 49 152004 (2016), открытый доступ
  10. ^ a b О. Корнилов, М. Экштейн, М. Розенблатт, С. П. Шульц, К. Мотомура, А. Рузе, Дж. Клей, Л. Фукар, М. Сиано, А. Любке, Ф. Шаппер, П. Джонссон, Д. М. П. Голландия, Т. Шлатхольтер, Т. Марченко, С. Düsterer, K Ueda, MJJ Vrakking и LJ Frasinski "Кулоновский взрыв двухатомных молекул в интенсивных XUV-полях, отображаемых с помощью частичной ковариации" J. Phys. Летучая мышь. Мол. Опт. Phys. 46 164028 (2013), открытый доступ
  11. ^ I Noda "Обобщенный метод двумерной корреляции, применимый к инфракрасной, рамановской и другим типам спектроскопии" Appl. Spectrosc. 47 1329–36 (1993)

Дальнейшее чтение [ править ]

  • "Матрица ковариаций" , Математическая энциклопедия , EMS Press , 2001 [1994]
  • Вайсштейн, Эрик В. «Матрица ковариации» . MathWorld .
  • ван Кампен, Н.Г. (1981). Случайные процессы в физике и химии . Нью-Йорк: Северная Голландия. ISBN 0-444-86200-5.