Ковариация


В теории вероятностей и статистике ковариация является мерой совместной изменчивости двух случайных величин . [1] Если большие значения одной переменной в основном соответствуют большим значениям другой переменной, и то же самое верно для меньших значений (то есть переменные имеют тенденцию демонстрировать одинаковое поведение), ковариация положительна. [2] В противоположном случае, когда большие значения одной переменной в основном соответствуют меньшим значениям другой (т. е. переменные имеют тенденцию показывать противоположное поведение), ковариация отрицательна. Таким образом, знак ковариации показывает тенденцию в линейной зависимостимежду переменными. Величину ковариации нелегко интерпретировать, поскольку она не нормирована и, следовательно, зависит от величин переменных. Однако нормализованная версия ковариации , коэффициент корреляции , своей величиной показывает силу линейной зависимости.

Необходимо различать (1) ковариацию двух случайных величин, которая является параметром генеральной совокупности , который можно рассматривать как свойство совместного распределения вероятностей , и (2) выборочную ковариацию, которая помимо того, что служит дескриптором выборки также служит оценочным значением параметра генеральной совокупности.

Для двух совместно распределенных действительных случайных величин и с конечными секундными моментами ковариация определяется как ожидаемое значение (или среднее значение) произведения их отклонений от их индивидуальных ожидаемых значений: [3] [4] : с. 119 

где ожидаемое значение , также известное как среднее значение . Ковариация также иногда обозначается или по аналогии с дисперсией . Используя свойство линейности ожиданий, это можно упростить до ожидаемого значения их продукта за вычетом произведения их ожидаемых значений:

но это уравнение подвержено катастрофической отмене (см. раздел о численных вычислениях ниже).

Единицы измерения ковариации - это умноженные на . Напротив, коэффициенты корреляции , которые зависят от ковариации, являются безразмерной мерой линейной зависимости. (На самом деле коэффициенты корреляции можно просто понимать как нормализованную версию ковариации.)


Знак ковариации двух случайных величин X и Y
Геометрическая интерпретация примера ковариации. Каждый прямоугольный параллелепипед является ограничивающим прямоугольником своей точки ( x , y , f  ( x , y )) и означает X и Y (пурпурная точка). Ковариация представляет собой сумму объемов красных кубоидов минус синих кубоидов.