Из Википедии, бесплатной энциклопедии
  (Перенаправлено из полной статистики )
Перейти к навигации Перейти к поиску

В статистике , полнота является свойством статистики по отношению к модели для набора наблюдаемых данных. По сути, это обеспечивает различие распределений, соответствующих разным значениям параметров.

Он тесно связан с идеей идентифицируемости , но в статистической теории часто встречается как условие, налагаемое на достаточную статистику, из которой выводятся определенные результаты оптимальности.

Определение [ править ]

Рассмотрим случайную величину X , распределение вероятностей которой принадлежит параметрической модели P θ, параметризованной с помощью  θ .

Скажем, T - статистика ; то есть композиция измеримой функции со случайной выборкой X 1 , ..., X n .

Статистика T называется полной для распределения X, если для каждой измеримой функции g : [1]

Статистика T называется ограниченно полной для распределения X, если эта импликация верна для любой измеримой функции g, которая также ограничена.

Пример 1: модель Бернулли [ править ]

Модель Бернулли допускает полную статистику. [2] Пусть X - случайная выборка размера n, такая, что каждый X i имеет одинаковое распределение Бернулли с параметром p . Пусть T - количество единиц, наблюдаемых в образце. T - статистика X, имеющая биномиальное распределение с параметрами ( n , p ). Если пространство параметров для p равно (0,1), то T - полная статистика. Чтобы увидеть это, обратите внимание, что

Отметим также, что ни p, ни 1 -  p не могут быть 0. Следовательно, тогда и только тогда, когда:

Обозначая p / (1 -  p ) через r , получаем:

Во-первых, обратите внимание, что диапазон r - это положительные действительные числа . Кроме того , Е ( г ( Т )) является многочленом в г и, следовательно, может быть только идентичен 0 , если все коэффициенты равны 0, то есть г ( т ) = 0 для всех  т .

Важно отметить, что результат, что все коэффициенты должны быть равны 0, был получен из-за диапазона значений r . Если бы пространство параметров было конечным и с числом элементов, меньшим или равным n , можно было бы решить линейные уравнения в g ( t ), полученные путем подстановки значений r и получить решения, отличные от 0. Например, если n = 1 и пространство параметров равно {0,5}, одно наблюдение и одно значение параметра, T не является полным. Обратите внимание на это с определением:

Затем, Е ( г ( Т )) = 0 , хотя г ( т ) не является 0 при т = 0 , ни для т = 1.

Отношение к достаточной статистике [ править ]

Для некоторых параметрических семейств не существует полной достаточной статистики (например, см. Galili and Meilijson 2016 [3] ). Кроме того, нет необходимости в минимальной достаточной статистике. (Случай, в котором нет минимально достаточной статистики, был показан Бахадуром в 1957 г. [ необходима цитата ] ) При мягких условиях минимально достаточная статистика существует всегда. В частности, эти условия всегда выполняются, если все случайные величины (связанные с P θ ) дискретны или непрерывны. [ необходима цитата ]

Важность полноты [ править ]

Понятие полноты имеет множество приложений в статистике, особенно в следующих двух теоремах математической статистики.

Теорема Лемана – Шеффе [ править ]

Полнота происходит в теореме Лемана-Шеффе , [4] , который гласит , что если статистика , которая является объективной, полной и достаточной для некоторого параметра & thetas , то лучшее средство-несмещенная оценка для  & thetas . Другими словами, эта статистика имеет меньшие ожидаемые потери для любой выпуклой функции потерь; во многих практических приложениях с квадратичной функцией потерь она имеет меньшую среднеквадратичную ошибку среди любых оценок с тем же ожидаемым значением .

Существуют примеры того, что, когда минимальная достаточная статистика не является полной, существует несколько альтернативных статистик для несмещенной оценки θ , в то время как некоторые из них имеют более низкую дисперсию, чем другие. [5]

См. Также несмещенную оценку с минимальной дисперсией .

Теорема Басу [ править ]

Ограниченность полнота имеет место в теореме Баса , [6] , который утверждает , что статистика , которая является одновременно ограниченно полной и достаточно является независимой от любой вспомогательной статистики .

Теорема Бахадура [ править ]

Ограниченная полнота встречается и в теореме Бахадура . В случае, когда существует хотя бы одна минимальная достаточная статистика, статистика, которая является достаточной и ограниченно полной, обязательно является минимально достаточной.

Заметки [ править ]

  1. ^ Янг, GA и Смит, RL (2005). Основы статистического вывода. (стр.94). Издательство Кембриджского университета.
  2. Перейти ↑ Casella, G. and Berger, RL (2001). Статистические выводы. (стр. 285–286). Duxbury Press.
  3. ^ Tal Galili и Исаак Meilijson (31 марта 2016). «Пример улучшаемого улучшения Рао – Блэквелла, неэффективного оценщика максимального правдоподобия и несмещенного обобщенного байесовского оценщика» . Американский статистик . 70 (1): 108–113. DOI : 10.1080 / 00031305.2015.1100683 . PMC  4960505 . PMID  27499547 .CS1 maint: uses authors parameter (link)
  4. ^ Каселла, Джордж; Бергер, Роджер Л. (2001). Статистический вывод (2-е изд.). Duxbury Press. ISBN 978-0534243128.
  5. ^ Tal Galili и Исаак Meilijson (31 марта 2016). «Пример улучшаемого улучшения Рао – Блэквелла, неэффективного оценщика максимального правдоподобия и несмещенного обобщенного байесовского оценщика» . Американский статистик . 70 (1): 108–113. DOI : 10.1080 / 00031305.2015.1100683 . PMC 4960505 . PMID 27499547 .  CS1 maint: uses authors parameter (link)
  6. Перейти ↑ Casella, G. and Berger, RL (2001). Статистические выводы. (стр.287). Duxbury Press.

Ссылки [ править ]

  • Басу, Д. (1988). Дж. К. Гош (ред.). Статистическая информация и вероятность: сборник критических статей доктора Д. Басу . Конспект лекций по статистике. 45 . Springer. ISBN 978-0-387-96751-6. Руководство по ремонту  0953081 .
  • Бикель, Питер Дж .; Доксум, Челл А. (2001). Математическая статистика, Том 1: Основные и избранные темы (Вторая (обновленная печать 2007 г.) изд. Holden-Day 1976 г.). Пирсон Прентис – Холл. ISBN 978-0-13-850363-5. Руководство по ремонту  0443141 .
  • EL, Lehmann ; Романо, Джозеф П. (2005). Проверка статистических гипотез . Тексты Springer в статистике (Третье изд.). Нью-Йорк: Спрингер. С. xiv + 784. ISBN 978-0-387-98864-1. Руководство по ремонту  2135927 . Архивировано из оригинала на 2013-02-02.
  • Lehmann, EL; Шеффе, Х. (1950). «Полнота, близость регионов и объективная оценка. I.» Санкхья: Индийский статистический журнал . 10 (4): 305–340. DOI : 10.1007 / 978-1-4614-1412-4_23 . JSTOR  25048038 . Руководство по ремонту  0039201 .
  • Lehmann, EL; Шеффе, Х. (1955). «Полнота, близость регионов и объективная оценка. II» . Санкхья: Индийский статистический журнал . 15 (3): 219–236. DOI : 10.1007 / 978-1-4614-1412-4_24 . JSTOR  25048243 . Руководство по ремонту  0072410 .