Байесовская оценка

В теории оценивания и теории принятия решений , в Байесе оценивани или действие Байеса является оценщиком или решающее правило , которое минимизирует задний ожидаемая величину в виде функции потерь (то есть, задний ожидаемый убыток ). Точно так же он максимизирует апостериорное ожидание функции полезности . Альтернативный способ формулирования оценки в рамках байесовской статистики - это максимальная апостериорная оценка .

Определение

Предположим неизвестный параметр ${\ displaystyle \ theta}$ известно, что имеет предварительное распространение ${\ displaystyle \ pi}$ . Позволять ${\ displaystyle {\ widehat {\ theta}} = {\ widehat {\ theta}} (х)}$ быть оценщиком ${\ displaystyle \ theta}$ (на основе некоторых измерений x ), и пусть ${\ Displaystyle L (\ theta, {\ widehat {\ theta}})}$ быть функцией потерь , например квадратичной ошибкой. Байесовский риск из ${\ displaystyle {\ widehat {\ theta}}}$ определяется как ${\ Displaystyle E _ {\ pi} (L (\ theta, {\ widehat {\ theta}}))}$ , где математическое ожидание берется по распределению вероятностей ${\ displaystyle \ theta}$ : определяет функцию риска как функцию ${\ displaystyle {\ widehat {\ theta}}}$ . Оценщик ${\ displaystyle {\ widehat {\ theta}}}$ считается байесовским оценщиком, если он минимизирует байесовский риск среди всех оценщиков. Эквивалентно, оценка, которая минимизирует апостериорные ожидаемые потери ${\ Displaystyle E (L (\ theta, {\ widehat {\ theta}}) | х)}$ для каждого ${\ displaystyle x}$ также минимизирует байесовский риск и, следовательно, является байесовским оценщиком. ^[1]

Если априорное значение неверно, то оценка, которая минимизирует апостериорные ожидаемые потери для каждого ${\ displaystyle x}$ называется обобщенной байесовской оценкой . ^[2]

Примеры

Оценка минимальной среднеквадратичной ошибки

Наиболее распространенной функцией риска, используемой для байесовской оценки, является среднеквадратическая ошибка (MSE), также называемая квадратом риска ошибки . MSE определяется

{\ displaystyle \ mathrm {MSE} = E \ left [({\ widehat {\ theta}} (x) - \ theta) ^ {2} \ right],}

где математическое ожидание берется за совместное распределение ${\ displaystyle \ theta}$ а также ${\ displaystyle x}$ .

Заднее среднее

Использование MSE в качестве риска байесовской оценки неизвестного параметра просто среднее значение заднего распределения , ^[3]

{\ displaystyle {\ widehat {\ theta}} (x) = E [\ theta | x] = \ int \ theta \, p (\ theta | x) \, d \ theta.}

Это известно как средство оценки минимальной среднеквадратичной ошибки (MMSE).

Байесовские оценки для сопряженных априорных вероятностей

Если нет причин предпочитать одно априорное распределение вероятностей другому, для простоты иногда выбирают сопряженное априорное распределение . Сопряженное априорное распределение определяется как априорное распределение, принадлежащее некоторому параметрическому семейству , для которого результирующее апостериорное распределение также принадлежит к тому же семейству. Это важное свойство, поскольку байесовская оценка, а также ее статистические свойства (дисперсия, доверительный интервал и т. Д.) Могут быть получены из апостериорного распределения.

Сопряженные априорные значения особенно полезны для последовательной оценки, когда апостериор текущего измерения используется как апостериор в следующем измерении. При последовательной оценке, если не используется сопряженное априорное распределение, апостериорное распределение обычно становится более сложным с каждым добавленным измерением, и байесовская оценка обычно не может быть вычислена без использования численных методов.

Ниже приведены некоторые примеры сопряженных априорных чисел.

Если ${\ Displaystyle х | \ тета}$ это нормальный , ${\ Displaystyle х | \ тета \ сим N (\ тета, \ sigma ^ {2})}$ , а приора нормально, ${\ Displaystyle \ тета \ сим N (\ му, \ тау ^ {2})}$ , то апостериорная оценка также является нормальной, а байесовская оценка при MSE определяется выражением

{\ displaystyle {\ widehat {\ theta}} (x) = {\ frac {\ sigma ^ {2}} {\ sigma ^ {2} + \ tau ^ {2}}} \ mu + {\ frac {\ tau ^ {2}} {\ sigma ^ {2} + \ tau ^ {2}}} x.}

Если ${\ displaystyle x_ {1}, ..., x_ {n}}$ являются IID Пуассона случайных величин ${\ Displaystyle х_ {я} | \ тета \ сим Р (\ тета)}$ , и если априор является гамма-распределенным ${\ Displaystyle \ тета \ сим G (а, б)}$ , то апостериорная функция также имеет гамма-распределение, а байесовская оценка при MSE определяется выражением

{\ displaystyle {\ widehat {\ theta}} (X) = {\ frac {n {\ overline {X}} + a} {n + b}}.}

Если ${\ displaystyle x_ {1}, ..., x_ {n}}$ которые н.о.р. равномерно распределены ${\ Displaystyle х_ {я} | \ тета \ сим U (0, \ тета)}$ , и если априор распределен по Парето ${\ Displaystyle \ тета \ сим Па (\ тета _ {0}, а)}$ , то апостериорная функция также распределена по Парето, а байесовская оценка при MSE определяется выражением

{\ displaystyle {\ widehat {\ theta}} (X) = {\ frac {(a + n) \ max {(\ theta _ {0}, x_ {1}, ..., x_ {n})} } {a + n-1}}.}

Альтернативные функции риска

Функции риска выбираются в зависимости от того, как измеряется расстояние между оценкой и неизвестным параметром. MSE - наиболее часто используемая функция управления рисками, в первую очередь из-за ее простоты. Однако иногда используются альтернативные функции риска. Ниже приводится несколько примеров таких альтернатив. Обозначим апостериорную обобщенную функцию распределения через ${\ displaystyle F}$ .

Задняя медиана и другие квантили

«Линейная» функция потерь с ${\ displaystyle a> 0}$ , что дает апостериорную медиану как оценку Байеса:

{\ Displaystyle L (\ theta, {\ widehat {\ theta}}) = а | \ theta - {\ widehat {\ theta}} |}

{\ displaystyle F ({\ widehat {\ theta}} (x) | X) = {\ tfrac {1} {2}}.}

Еще одна «линейная» функция потерь, которая присваивает разные «веса» ${\ displaystyle a, b> 0}$ к переоценке или переоценке. Он дает квантиль из апостериорного распределения и является обобщением предыдущей функции потерь:

{\ Displaystyle L (\ theta, {\ widehat {\ theta}}) = {\ begin {cases} a | \ theta - {\ widehat {\ theta}} |, & {\ mbox {for}} \ theta - {\ widehat {\ theta}} \ geq 0 \\ b | \ theta - {\ widehat {\ theta}} |, & {\ mbox {for}} \ theta - {\ widehat {\ theta}} <0 \ конец {case}}}

{\ displaystyle F ({\ widehat {\ theta}} (x) | X) = {\ frac {a} {a + b}}.}

Задний режим

Следующая функция потерь более сложна: она дает либо апостериорную моду , либо точку, близкую к ней, в зависимости от кривизны и свойств апостериорного распределения. Малые значения параметра ${\ displaystyle K> 0}$ рекомендуются, чтобы использовать режим в качестве приближения ( ${\ displaystyle L> 0}$ ):

{\ Displaystyle L (\ theta, {\ widehat {\ theta}}) = {\ begin {cases} 0, & {\ mbox {for}} | \ theta - {\ widehat {\ theta}} |

Можно придумать и другие функции потерь, хотя среднеквадратичная ошибка является наиболее широко используемой и проверенной. Другие функции потерь используются в статистике, особенно в надежной статистике .

Обобщенные байесовские оценки

Предыдущее распространение ${\ displaystyle p}$ до сих пор считалось истинным распределением вероятностей в том смысле, что

{\ Displaystyle \ int p (\ theta) d \ theta = 1.}

Однако иногда это может быть ограничительным требованием. Например, не существует распределения (охватывающего множество R всех действительных чисел), для которого каждое действительное число равновероятно. Тем не менее, в некотором смысле такое «распределение» кажется естественным выбором для неинформативного априорного распределения, то есть априорного распределения, которое не подразумевает предпочтения какого-либо конкретного значения неизвестного параметра. Еще можно определить функцию ${\ Displaystyle р (\ тета) = 1}$ , но это не было бы правильным распределением вероятностей, поскольку оно имеет бесконечную массу,

{\ displaystyle \ int {p (\ theta) d \ theta} = \ infty.}

Такие меры ${\ Displaystyle р (\ тета)}$ , которые не являются распределениями вероятностей, называются неправильными априорными числами .

Использование неправильного априорного значения означает, что байесовский риск не определен (поскольку априорный результат не является вероятностным распределением, и мы не можем принять за него математическое ожидание). Как следствие, бессмысленно говорить о байесовской оценке, которая минимизирует байесовский риск. Тем не менее во многих случаях можно определить апостериорное распределение

{\ Displaystyle p (\ theta | x) = {\ frac {p (x | \ theta) p (\ theta)} {\ int p (x | \ theta) p (\ theta) d \ theta}}.}

Это определение, а не приложение теоремы Байеса , поскольку теорема Байеса может применяться только тогда, когда все распределения являются правильными. Однако нередко полученное «апостериорное» распределение является допустимым распределением вероятностей. В этом случае апостериорный ожидаемый убыток

{\ Displaystyle \ int {L (\ тета, а) п (\ тета | х) д \ тета}}

обычно четко определен и конечен. Напомним, что для правильного априорного значения байесовская оценка минимизирует апостериорные ожидаемые потери. Когда априорная оценка является неправильной, оценщик, который минимизирует апостериорные ожидаемые потери, называется обобщенной байесовской оценкой . ^[2]

Пример

Типичный пример - оценка параметра местоположения с помощью функции потерь типа ${\ Displaystyle L (а- \ тета)}$ . Здесь ${\ displaystyle \ theta}$ - параметр местоположения, т. е. ${\ Displaystyle р (х | \ тета) = е (х- \ тета)}$ .

Обычно используется неправильный предварительный ${\ Displaystyle р (\ тета) = 1}$ в этом случае, особенно когда нет другой более субъективной информации. Это дает

{\ Displaystyle p (\ theta | x) = {\ frac {p (x | \ theta) p (\ theta)} {p (x)}} = {\ frac {f (x- \ theta)} {p (Икс)}}}

так что апостериорная ожидаемая потеря

{\ Displaystyle E [L (a- \ theta) | x] = \ int {L (a- \ theta) p (\ theta | x) d \ theta} = {\ frac {1} {p (x)} } \ int L (a- \ theta) f (x- \ theta) d \ theta.}

Обобщенная байесовская оценка - это величина ${\ Displaystyle а (х)}$ который минимизирует это выражение для данного ${\ displaystyle x}$ . Это эквивалентно минимизации

{\ Displaystyle \ Int L (а- \ тета) е (х- \ тета) д \ тета}

для данного

{\ displaystyle x.}

(1)

В этом случае можно показать, что обобщенная байесовская оценка имеет вид ${\ displaystyle x + a_ {0}}$ , для некоторой постоянной ${\ displaystyle a_ {0}}$ . Чтобы увидеть это, позвольте ${\ displaystyle a_ {0}}$ - значение, минимизирующее (1), когда ${\ displaystyle x = 0}$ . Тогда, учитывая другое значение ${\ displaystyle x_ {1}}$ , мы должны минимизировать

{\ Displaystyle \ int L (a- \ theta) f (x_ {1} - \ theta) d \ theta = \ int L (a-x_ {1} - \ theta ') f (- \ theta') d \ тета '.}

(2)

Это идентично (1), за исключением того, что ${\ displaystyle a}$ был заменен на ${\ displaystyle a-x_ {1}}$ . Таким образом, выражение, минимизирующее, дается выражением ${\ displaystyle a-x_ {1} = a_ {0}}$ , так что оптимальная оценка имеет вид

{\ Displaystyle а (х) = а_ {0} + х. \, \!}

Эмпирические байесовские оценки

Байесовская оценка, полученная с помощью эмпирического байесовского метода , называется эмпирической байесовской оценкой . Эмпирические байесовские методы позволяют использовать вспомогательные эмпирические данные из наблюдений за соответствующими параметрами при разработке байесовской оценки. Это делается в предположении, что оценочные параметры получены из общей априорной точки. Например, если выполняются независимые наблюдения различных параметров, то эффективность оценки конкретного параметра иногда может быть улучшена за счет использования данных из других наблюдений.

Существуют параметрические и непараметрические подходы к эмпирическому байесовскому оцениванию. Параметрический эмпирический байесовский метод обычно предпочтительнее, поскольку он более применим и более точен на небольших объемах данных. ^[4]

Пример

Ниже приводится простой пример параметрического эмпирического байесовского оценивания. Учитывая прошлые наблюдения ${\ displaystyle x_ {1}, \ ldots, x_ {n}}$ имеющий условное распределение ${\ displaystyle f (x_ {i} | \ theta _ {i})}$ , интересно оценить ${\ Displaystyle \ theta _ {п + 1}}$ на основе ${\ displaystyle x_ {n + 1}}$ . Предположим, что ${\ displaystyle \ theta _ {я}}$ есть общий приор ${\ displaystyle \ pi}$ зависящее от неизвестных параметров. Например, предположим, что ${\ displaystyle \ pi}$ нормально с неизвестным средним ${\ displaystyle \ mu _ {\ pi} \, \!}$ и дисперсия ${\ displaystyle \ sigma _ {\ pi} \, \ !.}$ Затем мы можем использовать прошлые наблюдения для определения среднего и дисперсии ${\ displaystyle \ pi}$ следующим образом.

Сначала оценим среднее ${\ Displaystyle \ му _ {м} \, \!}$ и дисперсия ${\ Displaystyle \ sigma _ {м} \, \!}$ предельного распределения ${\ displaystyle x_ {1}, \ ldots, x_ {n}}$ с использованием подхода максимального правдоподобия :

{\ displaystyle {\ widehat {\ mu}} _ {m} = {\ frac {1} {n}} \ sum {x_ {i}},}

{\ displaystyle {\ widehat {\ sigma}} _ {m} ^ {2} = {\ frac {1} {n}} \ sum {(x_ {i} - {\ widehat {\ mu}} _ {м }) ^ {2}}.}

Далее воспользуемся соотношением

{\ displaystyle \ mu _ {m} = E _ {\ pi} [\ mu _ {f} (\ theta)] \, \ !,}

{\ displaystyle \ sigma _ {m} ^ {2} = E _ {\ pi} [\ sigma _ {f} ^ {2} (\ theta)] + E _ {\ pi} [(\ mu _ {f} ( \ theta) - \ mu _ {m}) ^ {2}],}

где ${\ Displaystyle \ му _ {е} (\ тета)}$ а также ${\ Displaystyle \ sigma _ {е} (\ тета)}$ моменты условного распределения ${\ displaystyle f (x_ {i} | \ theta _ {i})}$ , которые считаются известными. В частности, предположим, что ${\ Displaystyle \ му _ {е} (\ тета) = \ тета}$ и это ${\ displaystyle \ sigma _ {f} ^ {2} (\ theta) = K}$ ; тогда у нас есть

{\ Displaystyle \ му _ {\ пи} = \ му _ {м} \, \ !,}

{\ displaystyle \ sigma _ {\ pi} ^ {2} = \ sigma _ {m} ^ {2} - \ sigma _ {f} ^ {2} = \ sigma _ {m} ^ {2} -K. }

Наконец, мы получаем оценочные моменты априорной,

{\ displaystyle {\ widehat {\ mu}} _ {\ pi} = {\ widehat {\ mu}} _ {m},}

{\ displaystyle {\ widehat {\ sigma}} _ {\ pi} ^ {2} = {\ widehat {\ sigma}} _ {m} ^ {2} -K.}

Например, если ${\ Displaystyle х_ {я} | \ тета _ {я} \ сим N (\ тета _ {я}, 1)}$ , и если мы предполагаем нормальный априор (который в данном случае является сопряженным априором), мы заключаем, что ${\ displaystyle \ theta _ {n + 1} \ sim N ({\ widehat {\ mu}} _ {\ pi}, {\ widehat {\ sigma}} _ {\ pi} ^ {2})}$ , из которого байесовская оценка ${\ Displaystyle \ theta _ {п + 1}}$ на основе ${\ displaystyle x_ {n + 1}}$ можно рассчитать.

Характеристики

Допустимость

Обычно допустимы правила Байеса с конечным байесовским риском . Ниже приведены некоторые конкретные примеры теорем о допустимости.

Если правило Байеса уникально, оно допустимо. ^[5] Например, как указано выше, при среднеквадратичной ошибке (MSE) правило Байеса является уникальным и, следовательно, допустимым.
Если θ принадлежит дискретному множеству , то допустимы все правила Байеса.
Если θ принадлежит непрерывному (недискретному) множеству и если функция риска R (θ, δ) непрерывна по θ для любого δ, то все правила Байеса допустимы.

Напротив, обобщенные правила Байеса часто имеют неопределенный риск Байеса в случае неправильных априорных значений. Эти правила часто недопустимы, и проверка их допустимости может быть затруднена. Например, обобщенная байесовская оценка параметра местоположения θ на основе гауссовых выборок (описанная в разделе «Обобщенная байесовская оценка» выше) недопустима для ${\ displaystyle p> 2}$ ; это известно как феномен Штейна .

Асимптотическая эффективность

Пусть θ - неизвестная случайная величина, и предположим, что ${\ Displaystyle x_ {1}, x_ {2}, \ ldots}$ являются IID образцы с плотностью ${\ displaystyle f (x_ {i} | \ theta)}$ . Позволять ${\ displaystyle \ delta _ {n} = \ delta _ {n} (x_ {1}, \ ldots, x_ {n})}$ - последовательность байесовских оценок θ, основанная на увеличивающемся количестве измерений. Нас интересует анализ асимптотической производительности этой последовательности оценок, т. Е. Производительности ${\ displaystyle \ delta _ {n}}$ для больших n .

С этой целью принято рассматривать θ как детерминированный параметр, истинное значение которого ${\ displaystyle \ theta _ {0}}$ . При определенных условиях ^[6] для больших выборок (большие значения n ) апостериорная плотность θ приблизительно нормальна. Другими словами, для больших n влияние априорной вероятности на апостериорную вероятность незначительно. Более того, если δ - оценка Байеса при риске MSE, то она асимптотически несмещена и сходится по распределению к нормальному распределению :

{\ displaystyle {\ sqrt {n}} (\ delta _ {n} - \ theta _ {0}) \ to N \ left (0, {\ frac {1} {I (\ theta _ {0})} }\верно),}

где I (θ ₀ ) - информация рыбака для θ ₀ . Отсюда следует, что байесовская оценка δ _n при MSE асимптотически эффективна .

Другой оценщик, который является асимптотически нормальным и эффективным, - это оценщик максимального правдоподобия (MLE). Связь между оценками максимального правдоподобия и байесовскими оценками можно показать на следующем простом примере.

Пример: оценка p в биномиальном распределении

Рассмотрим оценку θ на основе биномиальной выборки x ~ b (θ, n ), где θ обозначает вероятность успеха. Предполагая, что θ распределен согласно сопряженному априорному распределению, которое в данном случае является бета-распределением B ( a , b ), апостериорное распределение известно как B (a + x, b + nx). Таким образом, байесовская оценка при MSE равна

{\ displaystyle \ delta _ {n} (x) = E [\ theta | x] = {\ frac {a + x} {a + b + n}}.}

MLE в этом случае - x / n, и поэтому мы получаем,

{\ displaystyle \ delta _ {n} (x) = {\ frac {a + b} {a + b + n}} E [\ theta] + {\ frac {n} {a + b + n}} \ дельта _ {MLE}.}

Последнее уравнение означает, что при n → ∞ байесовская оценка (в описанной задаче) близка к MLE.

С другой стороны, когда n мало, априорная информация все еще актуальна для проблемы решения и влияет на оценку. Чтобы увидеть относительный вес априорной информации, предположим, что a = b ; в этом случае каждое измерение приносит 1 новый бит информации; приведенная выше формула показывает, что предыдущая информация имеет тот же вес, что и биты a + b новой информации. В приложениях часто очень мало известно о мелких деталях предшествующего распределения; в частности, нет оснований предполагать, что он в точности совпадает с B ( a , b ). В таком случае одна из возможных интерпретаций этого расчета: «существует априорное непатологическое распределение со средним значением 0,5 и стандартным отклонением d, которое дает вес априорной информации, равный 1 / (4 d ² ) -1. кусочки новой информации ".

Другой пример того же явления - случай, когда априорная оценка и измерение имеют нормальное распределение. Если предыдущий центр центрирован в точке B с отклонением Σ, а измерение сосредоточено в точке b с отклонением σ, то апостериор центрируется в ${\ displaystyle {\ frac {\ alpha} {\ alpha + \ beta}} B + {\ frac {\ beta} {\ alpha + \ beta}} b}$ , где веса в этом средневзвешенном значении равны α = σ², β = Σ². Кроме того, квадрат апостериорного отклонения равен Σ² + σ². Другими словами, предварительное измерение сочетается с измерением точно так же, как если бы оно было дополнительным измерением, которое необходимо принять во внимание.

Например, если Σ = σ / 2, то отклонение 4 измерений, объединенных вместе, совпадает с отклонением предыдущего (при условии, что ошибки измерений независимы). И веса α, β в формуле для апостериорной оценки соответствуют этому: вес априорной оценки в 4 раза превышает вес измерения. Комбинируя это предварительное с n измерениями со средним v, получаем задний центр с центром в ${\ displaystyle {\ frac {4} {4 + n}} V + {\ frac {n} {4 + n}} v}$ ; в частности, предварительное измерение играет ту же роль, что и 4 измерения, сделанные заранее. Как правило, приор имеет вес (σ / Σ) ² измерений.

Сравните с примером биномиального распределения: там априор имеет вес (σ / Σ) ² − 1 измерений. Можно видеть, что точный вес действительно зависит от деталей распределения, но когда σ≫Σ, разница становится небольшой.

Практический пример байесовских оценок

База данных Internet Movie использует формулу для вычисления и сравнения рейтинги фильмов его пользователями, в том числе их Лучшие 250 заглавий , которые испрашивается дать «истинную байесовской оценки». ^[7] Следующая байесовская формула изначально использовалась для расчета средневзвешенного балла для 250 лучших, хотя с тех пор формула была изменена:

{\ Displaystyle W = {Rv + Cm \ над v + m} \}

где:

{\ Displaystyle W \}

= взвешенный рейтинг

{\ Displaystyle R \}

= средний рейтинг фильма в виде числа от 1 до 10 (средний) = (Рейтинг)

{\ displaystyle v \}

= количество голосов / оценок за фильм = (голосов)

{\ displaystyle m \}

= вес, присвоенный предыдущей оценке (в данном случае количество голосов, которое IMDB считает необходимым для приближения средней оценки к статистической достоверности)

{\ Displaystyle C \}

= средний голос по всему пулу (в настоящее время 7.0)

Обратите внимание , что W представляет только взвешенное среднее арифметическое из R и C с весом вектора (V, м) . Поскольку количество оценок превышает m , достоверность среднего рейтинга превосходит доверие среднего голоса для всех фильмов (C), а взвешенный байесовский рейтинг (W) приближается к прямому среднему (R). Чем ближе v (количество оценок фильма) к нулю, тем ближе W к C , где W - взвешенный рейтинг, а C - средний рейтинг всех фильмов. Таким образом, проще говоря, чем меньше оценок / голосов отдано фильму, тем больше взвешенный рейтинг этого фильма будет отклоняться от среднего по всем фильмам, в то время как фильмы с большим количеством оценок / голосов будут иметь рейтинг, приближающийся к его чисто арифметическому среднему рейтингу.

Подход IMDb гарантирует, что фильм с несколькими рейтингами, все из которых составляет 10, не окажется выше «Крестного отца», например, со средним значением 9,2 из более чем 500 000 оценок.

Смотрите также

Рекурсивная байесовская оценка
Обобщенная ожидаемая полезность

Заметки

^ Леманн и Казелла, теорема 4.1.1
^ a b Леманн и Каселла, определение 4.2.9.
Перейти ↑ Jaynes, ET (2007). Теория вероятностей: логика науки (5. печат. Изд.). Кембридж [ua]: Cambridge Univ. Нажмите. п. 172. ISBN. 978-0-521-59271-0.
^ Бергер (1980), раздел 4.5.
^ Леманн и Казелла (1998), теорема 5.2.4.
^ Леманн и Казелла (1998), раздел 6.8
^ IMDb Top 250

Внешние ссылки

Байесовское оценивание на cnx.org
«Байесовская оценка» , Энциклопедия математики , EMS Press , 2001 [1994]

[1] Леманн и Казелла, теорема 4.1.1

[L&C-2] Леманн и Каселла, определение 4.2.9.

[3] Перейти ↑ Jaynes, ET (2007). Теория вероятностей: логика науки (5. печат. Изд.). Кембридж [ua]: Cambridge Univ. Нажмите. п. 172. ISBN. 978-0-521-59271-0.

[4] Бергер (1980), раздел 4.5.

[5] Леманн и Казелла (1998), теорема 5.2.4.

[6] Леманн и Казелла (1998), раздел 6.8

[7] IMDb Top 250

[1]

Байесовская оценка

Определение

Примеры

Оценка минимальной среднеквадратичной ошибки

Заднее среднее

Байесовские оценки для сопряженных априорных вероятностей

Альтернативные функции риска

Задняя медиана и другие квантили

Задний режим

Обобщенные байесовские оценки

Пример

Эмпирические байесовские оценки

Пример

Характеристики

Допустимость

Асимптотическая эффективность

Пример: оценка p в биномиальном распределении

Практический пример байесовских оценок

Смотрите также

Заметки

Рекомендации

Внешние ссылки