Лучший линейный объективный прогноз

В статистике , наилучшая линейная несмещенная предсказание ( BLUP ) используются в линейных смешанных моделях для оценки случайных эффектов . BLUP был получен Чарльзом Роем Хендерсоном в 1950 году, но термин «лучший линейный несмещенный предсказатель» (или «предсказание»), похоже, не использовался до 1962 года. ^[1] «Лучшие линейные несмещенные предсказания» (BLUP) случайных эффектов аналогичны к наилучшим линейным несмещенным оценкам (BLUE) (см. теорему Гаусса – Маркова ) фиксированных эффектов. Различие возникает из-за того, что принято говорить об оценке фиксированных эффектов, но прогнозироватьслучайные эффекты, но в остальном эти два термина эквивалентны. (Это немного странно, поскольку случайные эффекты уже «реализованы»; они уже существуют. Термин «предсказание» может быть использован потому, что в области разведения животных, в которой работал Хендерсон, случайные эффекты обычно были генетическими достоинствами. , который можно использовать для прогнозирования качества потомства (Робинсон ^[1] стр. 28)). Однако уравнения для «фиксированных» эффектов и для случайных эффектов различны.

На практике часто бывает, что параметры, связанные с термином (ами) случайного эффекта (ами), неизвестны; эти параметры представляют собой дисперсии случайных эффектов и остатков. Обычно параметры оцениваются и вводятся в предсказатель, что приводит к эмпирическому лучшему линейному несмещенному предсказателю (EBLUP). Обратите внимание, что при простом добавлении оцененного параметра в предсказатель не учитывается дополнительная изменчивость, что приводит к излишне оптимистичной дисперсии предсказания для EBLUP. ^{[ необходима цитата ]}

Лучшие линейные несмещенные прогнозы аналогичны эмпирическим байесовским оценкам случайных эффектов в линейных смешанных моделях, за исключением того, что в последнем случае, когда веса зависят от неизвестных значений компонентов дисперсии, эти неизвестные дисперсии заменяются оценками на основе выборки.

Пример [ править ]

Предположим, что модель для наблюдений { Y _j ; j = 1, ..., n } записывается как

{\ displaystyle Y_ {j} = \ mu + x_ {j} ^ {T} \ beta + \ xi _ {j} + \ varepsilon _ {j}, \,}

где ξ _j и ε _j представляют собой случайный эффект и ошибку наблюдения для наблюдения j , и предположим, что они некоррелированы и имеют известные дисперсии σ _ξ² и σ _ε² соответственно. Кроме того, x _j - это вектор независимых переменных для j- го наблюдения, а β - вектор параметров регрессии. Задача BLUP обеспечения оценки безошибочного значения наблюдения для k- го наблюдения,

{\ Displaystyle {\ тильда {Y_ {k}}} = \ mu + x_ {k} ^ {T} \ beta + \ xi _ {k},}

можно сформулировать как требование, чтобы коэффициенты линейного предиктора, определенного как

{\ displaystyle {\ widehat {Y}} _ {k} = \ sum _ {j = 1} ^ {n} c_ {j, k} Y_ {j},}

следует выбирать так, чтобы минимизировать дисперсию ошибки предсказания,

V=\operatorname {Var} ({\tilde {Y_{k}}}-{\widehat {Y}}_{k}),

при условии, что предиктор беспристрастен,

\operatorname {E} ({\tilde {Y_{k}}}-{\widehat {Y}}_{k})=0.

BLUP vs BLUE [ править ]

В отличие от случая наилучшей линейной несмещенной оценки , «оцениваемая величина» не только имеет вклад от случайного элемента, но и в одну из наблюдаемых величин, в частности, которая вносит вклад , также имеет вклад от того же случайного элемента. . ${\tilde {Y_{k}}}$ $Y_{k}$ ${\widehat {Y_{k}}}$

В отличие от BLUE, BLUP учитывает известные или предполагаемые отклонения. ^[2]

История БЛУП в селекции [ править ]

Хендерсон исследовал разведение со статистической точки зрения. Его работа помогла разработать Индекс селекции (SI) и Оценочную племенную ценность (EBV). Эти статистические методы повлияли на рейтинги производителей искусственного осеменения, используемые в США. Эти ранние статистические методы путают с BLUP, широко распространенным в животноводстве.

Фактический термин BLUP возник из-за работы в Университете Гвельфа в Канаде. В статье «Оценка реакции на выбор с использованием методологии наименьших квадратов и смешанной модели», январь 1984 г., Journal of Animal Science 58 (5) DOI: 10.2527 / jas1984.5851097x Д.А. Соренсена и Б.В. Кеннеди они расширили результаты Хендерсона на модель, которая включает несколько циклов. выбора. Эта модель была популяризирована Университетом Гвельфа в молочной промышленности как BLUP. Дальнейшая работа университета показала превосходство BLUP над EBV и SI, что привело к тому, что он стал основным генетическим предиктором.

Таким образом, существует путаница между популяризованной выше моделью BLUP и лучшим статистическим методом линейного несмещенного прогнозирования, который был слишком теоретическим для общего использования. Модель поставлялась фермерам для использования на компьютерах.

В Канаде все молочные предприятия отчитываются на национальном уровне. Генетика в Канаде была общей, что сделало ее крупнейшим генетическим пулом и, следовательно, источником улучшений. Это и BLUP привели к быстрому повышению качества крупного рогатого скота голштинской породы .

См. Также [ править ]

Минимальная среднеквадратичная ошибка

Заметки [ править ]

^ ^a ^b Робинсон, GK (1991). «Этот BLUP - хорошая вещь: оценка случайных эффектов» . Статистическая наука . 6 (1): 15–32. DOI : 10,1214 / сс / 1177011926 . JSTOR 2245695 . Руководство по ремонту 1108815 . Zbl 0955.62500 .
^ Станек, Эдвард Дж. III; Что ж, Арнольд; Окене, Ира (1999). «Почему бы обычно не использовать лучшие линейные объективные предикторы (BLUP) для оценки холестерина, процента жира от ккал и физической активности?». Статистика в медицине . 18 (21): 2943–2959. DOI : 10.1002 / (sici) 1097-0258 (19991115) 18:21 <2943 :: help-sim241> 3.0.co; 2-0 .

Ссылки [ править ]

Хендерсон, CR (1975). «Лучшая линейная объективная оценка и прогноз по модели выбора». Биометрия . 31 (2): 423–447. DOI : 10.2307 / 2529430 . JSTOR 2529430 . PMID 1174616 .
Лю, Сюй-Цин; Жун, Цзянь-Инь; Лю, Сю-Инь (2008). «Лучший линейный несмещенный прогноз для линейных комбинаций в общих смешанных линейных моделях». Журнал многомерного анализа . 99 (8): 1503–1517. DOI : 10.1016 / j.jmva.2008.01.004 .

[Robinson-1] Робинсон, GK (1991). «Этот BLUP - хорошая вещь: оценка случайных эффектов» . Статистическая наука . 6 (1): 15–32. DOI : 10,1214 / сс / 1177011926 . JSTOR 2245695 . Руководство по ремонту 1108815 . Zbl 0955.62500 .

[2] Станек, Эдвард Дж. III; Что ж, Арнольд; Окене, Ира (1999). «Почему бы обычно не использовать лучшие линейные объективные предикторы (BLUP) для оценки холестерина, процента жира от ккал и физической активности?». Статистика в медицине . 18 (21): 2943–2959. DOI : 10.1002 / (sici) 1097-0258 (19991115) 18:21 <2943 :: help-sim241> 3.0.co; 2-0 .

[1]