Общая линейная модель


Общая линейная модель или общая модель многомерной регрессии — это компактный способ одновременного написания нескольких моделей множественной линейной регрессии . В этом смысле это не отдельная статистическая линейная модель . Различные модели множественной линейной регрессии можно компактно записать как [1]

где Yматрица с серией многомерных измерений (каждый столбец представляет собой набор измерений одной из зависимых переменных ), X — матрица наблюдений за независимыми переменными , которая может быть матрицей плана (каждый столбец представляет собой набор наблюдений за одна из независимых переменных), B — матрица, содержащая параметры, которые обычно подлежат оценке, а U — матрица, содержащая ошибки (шум). Обычно предполагается, что ошибки не коррелируют между измерениями и следуют многомерному нормальному распределению .. Если ошибки не подчиняются многомерному нормальному распределению, можно использовать обобщенные линейные модели , чтобы ослабить предположения относительно Y и U.

Общая линейная модель включает ряд различных статистических моделей: ANOVA , ANCOVA , MANOVA , MANCOVA , обычная линейная регрессия , t - тест и F - тест . Общая линейная модель представляет собой обобщение множественной линейной регрессии на случай более чем одной зависимой переменной. Если бы Y , B и U были векторами-столбцами , приведенное выше матричное уравнение представляло бы множественную линейную регрессию.

Проверка гипотез с помощью общей линейной модели может быть выполнена двумя способами: многофакторной или в виде нескольких независимых одномерных проверок. В многомерных тестах столбцы Y проверяются вместе, тогда как в одномерных тестах столбцы Y проверяются независимо, т. е. как несколько одномерных тестов с одной и той же матрицей плана.

Множественная линейная регрессия — это обобщение простой линейной регрессии на случай более чем одной независимой переменной и частный случай общих линейных моделей, ограниченных одной зависимой переменной. Базовая модель множественной линейной регрессии:

В приведенной выше формуле мы рассматриваем n наблюдений одной зависимой переменной и p независимых переменных. Таким образом, Y i является i наблюдением зависимой переменной, X ij является i наблюдением j независимой переменной, j = 1, 2, ..., p . Значения β j представляют собой оцениваемые параметры, а ε i является i независимой одинаково распределенной нормальной ошибкой.