Из Википедии, бесплатной энциклопедии
  (Перенаправлено с BLUP )
Перейти к навигации Перейти к поиску

В статистике , наилучшая линейная несмещенная предсказание ( BLUP ) используются в линейных смешанных моделях для оценки случайных эффектов . BLUP был получен Чарльзом Роем Хендерсоном в 1950 году, но термин «лучший линейный несмещенный предсказатель» (или «предсказание»), похоже, не использовался до 1962 года. [1] «Лучшие линейные несмещенные предсказания» (BLUP) случайных эффектов аналогичны к наилучшим линейным несмещенным оценкам (BLUE) (см. теорему Гаусса – Маркова ) фиксированных эффектов. Различие возникает из-за того, что принято говорить об оценке фиксированных эффектов, но прогнозироватьслучайные эффекты, но в остальном эти два термина эквивалентны. (Это немного странно, поскольку случайные эффекты уже «реализованы»; они уже существуют. Термин «предсказание» может быть использован потому, что в области разведения животных, в которой работал Хендерсон, случайные эффекты обычно были генетическими достоинствами. , который можно использовать для прогнозирования качества потомства (Робинсон [1] стр. 28)). Однако уравнения для «фиксированных» эффектов и для случайных эффектов различны.

На практике часто бывает, что параметры, связанные с термином (ами) случайного эффекта (ами), неизвестны; эти параметры представляют собой дисперсии случайных эффектов и остатков. Обычно параметры оцениваются и вводятся в предсказатель, что приводит к эмпирическому лучшему линейному несмещенному предсказателю (EBLUP). Обратите внимание, что при простом добавлении оцененного параметра в предсказатель не учитывается дополнительная изменчивость, что приводит к излишне оптимистичной дисперсии предсказания для EBLUP. [ необходима цитата ]

Лучшие линейные несмещенные прогнозы аналогичны эмпирическим байесовским оценкам случайных эффектов в линейных смешанных моделях, за исключением того, что в последнем случае, когда веса зависят от неизвестных значений компонентов дисперсии, эти неизвестные дисперсии заменяются оценками на основе выборки.

Пример [ править ]

Предположим, что модель для наблюдений { Y j ; j = 1, ..., n } записывается как

где ξ j и ε j представляют собой случайный эффект и ошибку наблюдения для наблюдения j , и предположим, что они некоррелированы и имеют известные дисперсии σ ξ 2 и σ ε 2 соответственно. Кроме того, x j - это вектор независимых переменных для j- го наблюдения, а β - вектор параметров регрессии. Задача BLUP обеспечения оценки безошибочного значения наблюдения для k- го наблюдения,

можно сформулировать как требование, чтобы коэффициенты линейного предиктора, определенного как

следует выбирать так, чтобы минимизировать дисперсию ошибки предсказания,

при условии, что предиктор беспристрастен,

BLUP vs BLUE [ править ]

В отличие от случая наилучшей линейной несмещенной оценки , «оцениваемая величина» не только имеет вклад от случайного элемента, но и в одну из наблюдаемых величин, в частности, которая вносит вклад , также имеет вклад от того же случайного элемента. .

В отличие от BLUE, BLUP учитывает известные или предполагаемые отклонения. [2]

История БЛУП в селекции [ править ]

Хендерсон исследовал разведение со статистической точки зрения. Его работа помогла разработать Индекс селекции (SI) и Оценочную племенную ценность (EBV). Эти статистические методы повлияли на рейтинги производителей искусственного осеменения, используемые в США. Эти ранние статистические методы путают с BLUP, широко распространенным в животноводстве.

Фактический термин BLUP возник из-за работы в Университете Гвельфа в Канаде. В статье «Оценка реакции на выбор с использованием методологии наименьших квадратов и смешанной модели», январь 1984 г., Journal of Animal Science 58 (5) DOI: 10.2527 / jas1984.5851097x Д.А. Соренсена и Б.В. Кеннеди они расширили результаты Хендерсона на модель, которая включает несколько циклов. выбора. Эта модель была популяризирована Университетом Гвельфа в молочной промышленности как BLUP. Дальнейшая работа университета показала превосходство BLUP над EBV и SI, что привело к тому, что он стал основным генетическим предиктором.

Таким образом, существует путаница между популяризованной выше моделью BLUP и лучшим статистическим методом линейного несмещенного прогнозирования, который был слишком теоретическим для общего использования. Модель поставлялась фермерам для использования на компьютерах.

В Канаде все молочные предприятия отчитываются на национальном уровне. Генетика в Канаде была общей, что сделало ее крупнейшим генетическим пулом и, следовательно, источником улучшений. Это и BLUP привели к быстрому повышению качества крупного рогатого скота голштинской породы .

См. Также [ править ]

Заметки [ править ]

  1. ^ a b Робинсон, GK (1991). «Этот BLUP - хорошая вещь: оценка случайных эффектов» . Статистическая наука . 6 (1): 15–32. DOI : 10,1214 / сс / 1177011926 . JSTOR  2245695 . Руководство по ремонту  1108815 . Zbl  0955.62500 .
  2. ^ Станек, Эдвард Дж. III; Что ж, Арнольд; Окене, Ира (1999). «Почему бы обычно не использовать лучшие линейные объективные предикторы (BLUP) для оценки холестерина, процента жира от ккал и физической активности?». Статистика в медицине . 18 (21): 2943–2959. DOI : 10.1002 / (sici) 1097-0258 (19991115) 18:21 <2943 :: help-sim241> 3.0.co; 2-0 .

Ссылки [ править ]

  • Хендерсон, CR (1975). «Лучшая линейная объективная оценка и прогноз по модели выбора». Биометрия . 31 (2): 423–447. DOI : 10.2307 / 2529430 . JSTOR  2529430 . PMID  1174616 .
  • Лю, Сюй-Цин; Жун, Цзянь-Инь; Лю, Сю-Инь (2008). «Лучший линейный несмещенный прогноз для линейных комбинаций в общих смешанных линейных моделях». Журнал многомерного анализа . 99 (8): 1503–1517. DOI : 10.1016 / j.jmva.2008.01.004 .