Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

При сравнении различных статистических процедур , эффективность является мерой качества с оценкой , из эксперимента , [1] или из проверки гипотез процедуры. [2] По сути, более эффективный оценщик, эксперимент или тест требует меньшего количества наблюдений, чем менее эффективный для достижения заданной производительности. Эта статья в первую очередь посвящена эффективности оценщиков.

Относительная эффективность двух процедур является отношение их эффективности, хотя часто это понятие используется там , где сравнение между данной процедурой и условной «наилучшей» процедуры. Эффективность и относительная эффективность двух процедур теоретически зависят от размера выборки, доступной для данной процедуры, но часто можно использовать асимптотическую относительную эффективность (определяемую как предел относительной эффективности по мере роста размера выборки) в качестве основного мера сравнения.

Эффективный оценщик характеризуется небольшой дисперсией или среднеквадратической ошибкой , что указывает на небольшое отклонение между расчетным значением и «истинным» значением. [1]

Оценщики [ править ]

Эффективность с несмещенной оценки , Т , в виде параметра & thetas определяется как [3]

где - информация Фишера для выборки. Таким образом, e ( T ) - это минимально возможная дисперсия для несмещенной оценки, деленная на ее фактическую дисперсию. Крамера-Рао может быть использован , чтобы доказать , что е ( Т ) ≤ 1.

Эффективные оценщики [ править ]

Эффективная оценка является оценщиком , который оценивает количество интереса в каком - то «наилучших» образом. Понятие «наилучшего из возможных» основывается на выборе конкретной функции потерь - функции, которая количественно определяет относительную степень нежелательности ошибок оценки разной величины. Чаще всего функция потерь выбирается квадратичной , что дает критерий оптимальности среднеквадратичной ошибки . [4]

В общем, разброс оценщика вокруг параметра θ является мерой эффективности и производительности оценщика. Эту производительность можно рассчитать, найдя среднеквадратичную ошибку:

Пусть T - оценка параметра θ. Среднеквадратичная ошибка T - это значение .

Здесь,

Следовательно, средство оценки T 1 работает лучше, чем средство оценки T 2 if . [5]


В более конкретном случае, если T 1 и T 2 являются двумя несмещенными оценками для одного и того же параметра θ, тогда дисперсия может сравниваться для определения производительности.

Т 2 является более эффективным , чем T 1 , если дисперсия Т 2 является меньшей , чем дисперсия Т 1 , то есть для всех значений & thetas.

Это соотношение может быть определено путем упрощения приведенного выше более общего случая для среднеквадратичной ошибки. Так как ожидаемое значение несмещенной оценки равно значению параметра, .

Следовательно, как только член выпадает из нуля, [5]


Если несмещенная оценка параметра θ достигается для всех значений параметра, то оценка называется эффективной. [3]

Эквивалентно, оценка достигает равенства в неравенстве Крамера – Рао для всех θ . Крамер-Рао нижней границы является нижней границей дисперсии несмещенной оценки, представляющий «лучшая» несмещенная оценка может быть.

Эффективная оценка также является несмещенной оценкой минимальной дисперсии (MVUE). Это связано с тем, что эффективный оценщик поддерживает равенство неравенства Крамера – Рао для всех значений параметров, что означает, что он достигает минимальной дисперсии для всех параметров (определение MVUE). Оценщик MVUE, даже если он существует, не обязательно эффективен, потому что «минимум» не означает, что равенство выполняется на неравенстве Крамера – Рао.

Таким образом, нет необходимости в эффективном оценщике, но если он есть, то это MVUE.

Эффективность конечной выборки [ править ]

Предположим, что { P θ | θ ∈ Θ } - параметрическая модель, а X = ( X 1 ,…, X n ) - данные, выбранные из этой модели. Пусть T = T ( X ) - оценка параметра θ . Если эта оценка несмещена (то есть E [  T  ] = θ ), то неравенство Крамера – Рао утверждает, что дисперсия этой оценки ограничена снизу:

где - информационная матрица Фишера модели в точке θ . Обычно дисперсия измеряет степень разброса случайной величины вокруг ее среднего значения. Таким образом, оценщики с небольшими отклонениями более концентрированы, они более точно оценивают параметры. Мы говорим, что оценка является эффективной оценкой с конечной выборкой (в классе несмещенных оценок), если она достигает нижней границы в неравенстве Крамера – Рао, приведенном выше, для всех θ ∈ Θ . Эффективные оценщики всегда представляют собой несмещенные оценщики с минимальной дисперсией . Однако обратное неверно: существуют задачи точечной оценки, для которых несмещенная оценка с минимальной дисперсией неэффективна. [6]

Исторически эффективность конечной выборки была ранним критерием оптимальности. Однако у этого критерия есть некоторые ограничения:

  • Эффективные оценки с конечной выборкой встречаются крайне редко. Фактически было доказано, что эффективное оценивание возможно только в экспоненциальном семействе и только для естественных параметров этого семейства. [ необходима цитата ]
  • Это понятие эффективности иногда ограничивается классом несмещенных оценок. (Часто это не так. [7] ) Поскольку нет веских теоретических причин требовать, чтобы оценки были несмещенными, это ограничение неудобно. Фактически, если мы используем среднеквадратичную ошибку в качестве критерия выбора, многие смещенные оценки будут немного превосходить «лучшие» несмещенные. Например, в многомерной статистике для измерения три или более несмещенная оценка среднего , выборочная средняя , недопустима : независимо от результата ее эффективность хуже, чем, например, оценка Джеймса – Стейна . [ необходима цитата ]
  • Эффективность конечной выборки основана на дисперсии как критерии, согласно которому оцениваются оценки. Более общий подход заключается в использовании функций потерь, отличных от квадратичных, и в этом случае эффективность конечной выборки больше не может быть сформулирована. [ необходима цитата ] [ сомнительно ]

В качестве примера, среди моделей , встречающихся на практике, существуют эффективные оценки для: среднее μ из нормального распределения (но не дисперсия сг 2 ), параметр λ из распределения Пуассона , вероятность р в биномиальной или полиномиального распределения .

Рассмотрим модель нормального распределения с неизвестным средним, но известной дисперсией: { P θ = N ( θ , σ 2 ) | θR }. Данные состоят из n независимых и одинаково распределенных наблюдений из этой модели: X = ( x 1 ,…, x n ) . Мы оцениваем параметр θ, используя выборочное среднее всех наблюдений:

Этот оценщик имеет среднее значение θ и дисперсию σ 2  /  n , которая равна обратной величине информации Фишера из выборки. Таким образом, выборочное среднее является эффективным оценщиком конечной выборки для среднего нормального распределения.

Асимптотическая эффективность [ править ]

Некоторые оценки могут достигать эффективности асимптотически и поэтому называются асимптотически эффективными оценками . Это может иметь место для некоторых оценок максимального правдоподобия или любых оценок, которые асимптотически достигают равенства границы Крамера – Рао.

Пример: медиана[ редактировать ]

Рассмотрим размерную выборку, взятую из нормального распределения среднего и единичной дисперсии , т. Е.

Выборочное среднее , , в образце , определяется как

Дисперсия среднего, 1 / N (квадрат стандартной ошибки ) равна обратной величине информации Фишера из выборки, и, таким образом, согласно неравенству Крамера – Рао , выборочное среднее является эффективным в том смысле, что его эффективность равно единице (100%).

Теперь рассмотрим пример медиану , . Это объективная и последовательная оценка для . Для больших выборок медиана приблизительно нормально распределена со средним значением и дисперсией [8]

Эффективность медианы для крупных , таким образом ,

Другими словами, относительная дисперсия медианы будет на 57% больше дисперсии среднего - стандартная ошибка медианы будет на 25% больше, чем средняя. [9]

Обратите внимание, что это асимптотическая эффективность, то есть эффективность в пределе, когда размер выборки стремится к бесконечности. Для конечных значений КПД выше этого (например, размер выборки 3 дает КПД около 74%). [ необходима цитата ]

Таким образом, выборочное среднее в этом примере более эффективно, чем выборочное среднее. Однако могут быть меры, по которым медиана работает лучше. Например, медиана гораздо более устойчива к выбросам , поэтому, если модель Гаусса сомнительна или приблизительна, использование медианы может иметь преимущества (см. Надежная статистика ).

Доминирующие оценщики [ править ]

Если и являются оценками параметра , то говорят, что доминируют, если:

  1. его среднеквадратичная ошибка (MSE) меньше, по крайней мере, для некоторого значения
  2. MSE не превышает MSE для любого значения θ.

Формально доминирует, если

справедливо для всех , где где-то сохраняется строгое неравенство.

Относительная эффективность [ править ]

Относительная эффективность двух оценщиков определяется как [10]

Хотя в целом это функция от , во многих случаях зависимость выпадает; если это так, то значение больше единицы будет означать, что это предпочтительнее, независимо от истинного значения .

Альтернативой относительной эффективности для сравнения оценок является критерий близости Питмана . Это заменяет сравнение среднеквадратических ошибок сравнением того, как часто один оценщик дает оценки, более близкие к истинному значению, чем другой оценщик.

Если и являются оценками параметра , то говорят, что доминируют, если:

  1. его среднеквадратичная ошибка (MSE) меньше, по крайней мере, для некоторого значения
  2. MSE не превышает MSE для любого значения θ.

Формально доминирует, если

справедливо для всех , где где-то сохраняется строгое неравенство.

Оценки среднего значения переменных uid [ править ]

При оценке среднего значения некоррелированных, одинаково распределенных переменных мы можем воспользоваться тем фактом, что дисперсия суммы является суммой дисперсий . В этом случае эффективность можно определить как квадрат коэффициента вариации , т. Е. [11]

Таким образом, относительную эффективность двух таких оценщиков можно интерпретировать как относительный размер выборки одного, необходимый для достижения достоверности другого. Доказательство:

Теперь, потому что у нас есть , поэтому относительная эффективность выражает относительный размер выборки первого оценщика, необходимый для сопоставления дисперсии второго.

Надежность [ править ]

Эффективность оценщика может значительно измениться, если распределение изменится, часто снижаясь. Это одна из мотиваций надежной статистики - такая оценка, как выборочное среднее, является, например, эффективной оценкой генерального среднего нормального распределения, но может быть неэффективной оценкой смешанного распределения двух нормальных распределений с одинаковыми среднее и разные дисперсии. Например, если распределение представляет собой комбинацию 98% N ( μ, σ ) и 2% N ( μ, 10 σ), наличие экстремальных значений из последнего распределения (часто «загрязняющих выбросов») значительно снижает эффективность выборочного среднего как оценки μ. Напротив, усеченное среднее менее эффективно для нормального распределения, но более устойчиво (менее подвержено влиянию) изменений в распределении и, таким образом, может быть более эффективным для смешанного распределения. Точно так же форма распределения, такая как асимметрия или тяжелые хвосты, может значительно снизить эффективность оценок, которые предполагают симметричное распределение или тонкие хвосты.

Использование неэффективных оценщиков [ править ]

Хотя эффективность является желаемым качеством оценщика, ее необходимо сопоставлять с другими соображениями, а оценщик, который эффективен для определенных распределений, вполне может быть неэффективным для других распределений. Наиболее важно то, что оценки, которые эффективны для чистых данных из простого распределения, такого как нормальное распределение (которое является симметричным, одномодальным и имеет тонкие хвосты), могут быть не устойчивыми к загрязнению выбросами и могут быть неэффективными для более сложных распределений. В надежной статистике больше внимания уделяется надежности и применимости к большому количеству распределений, а не эффективности для одного распределения. М-оценкипредставляют собой общий класс решений, мотивированных этими соображениями, обеспечивающих как надежность, так и высокую относительную эффективность, хотя в некоторых случаях, возможно, более низкую эффективность, чем традиционные оценки. Однако они потенциально очень сложны в вычислительном отношении.

Более традиционной альтернативой являются L-оценки , которые представляют собой очень простые статистические данные, которые легко вычислить и интерпретировать, во многих случаях надежные и часто достаточно эффективные для начальных оценок. См. Применение L-оценок для дальнейшего обсуждения.

Эффективность в статистике [ править ]

Эффективность статистики важна, потому что она позволяет сравнивать производительность различных оценщиков. Хотя несмещенная оценка обычно предпочтительнее, чем смещенная, более эффективная смещенная оценка иногда может быть более ценной, чем менее эффективная несмещенная оценка. Например, это может произойти, когда значения смещенной оценки собираются вокруг числа, более близкого к истинному значению. Таким образом, эффективность оценщика можно легко предсказать, сравнив их среднеквадратичные ошибки или дисперсии.

Проверка гипотез [ править ]

Для сравнения критериев значимости можно определить значимую меру эффективности на основе размера выборки, необходимой для того, чтобы тест достиг заданной мощности задачи . [12]

Эффективность Питмана [13] и эффективность Бахадура (или эффективность Ходжеса – Лемана ) [14] [15] относятся к сравнению эффективности процедур статистической проверки гипотез . Энциклопедия математики дает краткое изложение этих трех критериев.

Экспериментальный дизайн [ править ]

Для экспериментальных дизайнов эффективность относится к способности дизайна достичь цели исследования с минимальными затратами ресурсов, таких как время и деньги. В простых случаях относительная эффективность планов может быть выражена как отношение размеров выборки, необходимых для достижения поставленной цели. [16]


См. Также [ править ]

  • Байесовская оценка
  • Последовательный оценщик
  • Оценщик Ходжеса
  • Оптимальные инструменты

Примечания [ править ]

  1. ^ а б Эверитт 2002 , стр. 128.
  2. ^ Никулин, MS (2001) [1994], "Эффективность статистической процедуры" , Энциклопедия математики , EMS Press
  3. ^ а б Фишер, Р. (1921). «О математических основах теоретической статистики». Философские труды Королевского общества Лондона A . 222 : 309–368. JSTOR 91208 . 
  4. ^ Everitt, BS (2002). Кембриджский статистический словарь (2-е изд.). Нью-Йорк, издательство Кембриджского университета. п. 128 . ISBN 0-521-81099-X.
  5. ^ a b Деккинг, FM (2007). Современное введение в вероятность и статистику: понимание, почему и как . Springer. стр.  303 -305. ISBN 978-1852338961.
  6. ^ Романо, Джозеф П .; Сигел, Эндрю Ф. (1986). Контрпримеры в вероятности и статистике . Чепмен и Холл. п. 194.
  7. ^ ДеГрут; Шервиш (2002). Вероятность и статистика (3-е изд.). С. 440–441.
  8. Перейти ↑ Williams, D. (2001). Взвешивая шансы . Издательство Кембриджского университета. п. 165 . ISBN 052100618X.
  9. ^ Майндональд, Джон; Браун, У. Джон (06.05.2010). Анализ данных и графики с использованием R: подход на основе примеров . Издательство Кембриджского университета. п. 104. ISBN 978-1-139-48667-5.
  10. ^ Wackerly, Деннис D .; Менденхолл, Уильям; Шеаффер, Ричард Л. (2008). Математическая статистика с приложениями (Седьмое изд.). Бельмонт, Калифорния: Томсон Брукс / Коул. п. 445 . ISBN 9780495110811. OCLC  183886598 .
  11. ^ Граббс, Франк (1965). Статистические меры меткости для стрелков и инженеров-ракетчиков . С. 26–27.
  12. ^ Everitt 2002 , стр. 321.
  13. ^ Никитин Я.Ю. (2001) [1994], "Эффективность, асимптотика" , Энциклопедия математики , EMS Press
  14. ^ Arcones МЫ «эффективность Багадур вероятность того, тест соотношения» препринт
  15. ^ Canay IA & Otsu, T. "Оптимальность Ходжеса – Лемана для тестирования моделей состояния момента"
  16. Перейти ↑ Dodge, Y. (2006). Оксфордский словарь статистических терминов . Издательство Оксфордского университета. ISBN 0-19-920613-9.

Ссылки [ править ]

  • Эверит, Брайан С. (2002). Кембриджский статистический словарь . Издательство Кембриджского университета. ISBN 0-521-81099-X.
  • Леманн, Эрих Л. (1998). Элементы теории больших выборок . Нью-Йорк: Springer Verlag. ISBN 978-0-387-98595-4.

Дальнейшее чтение [ править ]

  • Lehmann, EL ; Казелла, Г. (1998). Теория точечного оценивания (2-е изд.). Springer. ISBN 0-387-98502-6.
  • Пфанцагль, Иоганн ; при содействии Р. Хамбёкера (1994). Параметрическая статистическая теория . Берлин: Вальтер де Грюйтер. ISBN 3-11-013863-8. Руководство по ремонту  1291393 .