Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Усечен среднее или усеченное среднее является статистической мерой центральной тенденции , очень как средний и медианный . Он включает в себя вычисление среднего после отбрасывания заданных частей вероятностного распределения или выборки на верхнем и нижнем конце и, как правило, отбрасывания равного количества обоих. Это количество отбрасываемых баллов обычно указывается в процентах от общего количества баллов, но также может быть дано как фиксированное количество баллов.

Для большинства статистических приложений отбрасывается от 5 до 25 процентов концов. Например, для набора из 8 точек при обрезке на 12,5% будут отброшены минимальное и максимальное значение в выборке: наименьшее и наибольшее значения, а также будет вычислено среднее значение оставшихся 6 точек. Усеченное на 25% среднее (когда отбрасываются самые низкие 25% и самые высокие 25%) известно как межквартильное среднее .

Медиана может рассматриваться как полностью усеченное среднее значение и является наиболее надежной. Как и в случае с другими усеченными оценками , основным преимуществом усеченного среднего является надежность и более высокая эффективность для смешанных распределений и распределения с тяжелыми хвостами (например, распределения Коши ) за счет более низкой эффективности для некоторых других распределений с меньшими хвостами (например, нормальное распределение). Для промежуточных распределений разница между эффективностью среднего и медианного не очень велика, например, для распределения Стьюдента с 2 степенями свободы дисперсии для среднего и медианного почти равны.

Терминология [ править ]

В некоторых регионах Центральной Европы оно также известно как Виндзорское среднее , [ необходима цитата ], но это название не следует путать с Винзорзированным средним : в последнем наблюдении, которое отбрасывается усеченным средним , вместо этого заменяются наибольшим / наименьшее из оставшихся значений.

Отбрасывание только максимума и минимума известно как модифицированное среднее , особенно в статистике управления. [1] Это также известно как олимпийский средний показатель (например, в сельском хозяйстве США, например, выбор среднего дохода от урожая ) из-за его использования в олимпийских соревнованиях, таких как Система судейства ИСУ в фигурном катании , чтобы оценка была устойчивой к единственный судья-исключение. [2]

Интерполяция [ править ]

Когда процент отбрасываемых точек не дает целого числа, усеченное среднее значение может быть определено путем интерполяции, обычно линейной интерполяции, между ближайшими целыми числами. Например, если вам нужно рассчитать 15% усеченное среднее для выборки, содержащей 10 записей, строго это будет означать отбрасывание 1 точки с каждого конца (что эквивалентно 10% усеченному среднему). При интерполяции можно было бы вместо этого вычислить 10% усеченное среднее (отбрасывая по 1 точке с каждого конца) и 20% усеченное среднее (отбрасывая 2 точки с каждого конца), а затем интерполировать, в данном случае усредняя эти два значения. Точно так же, если интерполировать 12% усеченное среднее, нужно взять средневзвешенное : 10% усеченное среднее значение взвешивается на 0,8, а 20% усеченное среднее - на 0,2.

Преимущества [ править ]

Усеченное среднее является полезным средством оценки, поскольку оно менее чувствительно к выбросам, чем среднее значение, но все же дает разумную оценку центральной тенденции или среднего значения для многих статистических моделей. В связи с этим его называют робастной оценкой . Например, при использовании в олимпийском судействе усечение максимума и минимума не позволяет единоличному судье увеличивать или понижать общую оценку, выставляя исключительно высокую или низкую оценку.

Одна из ситуаций , в которых он может быть выгодно использовать усеченного среднее значение при оценке параметра местоположения в виде распределения Коши , в форме колокола с распределением вероятностей (много) толще хвосты , чем нормальное распределение . Можно показать, что усеченное среднее среднего 24% статистики порядка выборки (т. Е. Усечение выборки на 38% на каждом конце) дает оценку для параметра местоположения совокупности, которая более эффективна, чем использование либо медианы выборки, либо полной выборочное среднее. [3] [4] Однако из-за толстых хвостов распределения Коши эффективность средства оценки снижается по мере того, как в оценке используется больше выборки. [3] [4] Обратите внимание, что для распределения Коши ни усеченное среднее, ни среднее значение полной выборки, ни медиана выборки не представляют оценку максимального правдоподобия и не являются столь же асимптотически эффективными, как оценка максимального правдоподобия; однако оценку максимального правдоподобия вычислить труднее, поэтому в качестве полезной альтернативы остается усеченное среднее значение. [4] [5]

Недостатки [ править ]

Усеченное среднее использует больше информации из распределения или выборки, чем медиана , но если базовое распределение не является симметричным , усеченное среднее выборки вряд ли даст несмещенную оценку для среднего или медианного значения.

Статистические тесты [ править ]

Можно выполнить Т-тест Стьюдента на основе усеченных среднем, которая называется т-тест YUEN, в [6] [7] , который также имеет несколько реализаций в R . [8] [9]

Примеры [ править ]

Метод подсчета очков, используемый во многих видах спорта , оцениваемых судейской коллегией, представляет собой усеченное среднее значение: отбрасывать самые низкие и самые высокие оценки; вычислить среднее значение оставшихся баллов . [10]

Либор ориентир процентной ставки рассчитывается как усеченное среднее: 18 дано ответа, отбрасываются верхней 4 и нижней 4, а остальные 10 усредняются (дающим дифферента фактор 4/18 ≈ 22%). [11]

Рассмотрим набор данных, состоящий из:

{92, 19, 101 , 58, 1053 , 91, 26, 78, 10, 13, −40 , 101 , 86, 85, 15, 89, 89, 28, −5 , 41} (N = 20, среднее значение = 101,5)

5-й процентиль (-6,75) находится между -40 и -5, а 95-й процентиль (148,6) находится между 101 и 1053 (значения выделены жирным шрифтом). Тогда усеченное на 5% среднее приведет к следующему:

{92, 19, 101, 58, 91, 26, 78, 10, 13, 101, 86, 85, 15, 89, 89, 28, −5, 41} (N = 18, среднее значение = 56,5)

Этот пример можно сравнить с примером, использующим процедуру Winsorising .

См. Также [ править ]

  • Тримян
  • Межквартильное среднее
  • Winsorized среднее

Ссылки [ править ]

  1. ^ Арулможи, Г .; Статистика для менеджмента, 2-е издание, Tata McGraw-Hill Education, 2009 г., стр. 458
  2. Пол Э. Петерсон (3 августа 2012 г.). «Уроки LIBOR» . После составления котировок LIBOR использует процесс усеченного среднего, при котором высшие и наименьшие значения отбрасываются, а оставшиеся значения усредняются. Его иногда называют «олимпийским средним» из-за его использования на Олимпийских играх, чтобы исключить влияние предвзятого судьи на окончательный результат спортсмена.
  3. ^ a b Ротенберг, Томас Дж .; Фишер, Франклин, М .; Тиланус, CB (1964). «Примечание об оценке по выборке коши». Журнал Американской статистической ассоциации . 59 (306): 460–463. DOI : 10.1080 / 01621459.1964.10482170 .
  4. ^ a b c Блох, Даниэль (1966). «Примечание об оценке параметров местоположения распределения Коши». Журнал Американской статистической ассоциации . 61 (316): 852–855. DOI : 10.1080 / 01621459.1966.10480912 . JSTOR 2282794 . 
  5. ^ Фергюсон, Томас С. (1978). «Оценки максимального правдоподобия параметров распределения Коши для выборок размера 3 и 4». Журнал Американской статистической ассоциации . 73 (361): 211. DOI : 10.1080 / 01621459.1978.10480031 . JSTOR 2286549 . 
  6. ^ Yuen, KK (1974) Две выборки, усеченные t для неравных дисперсий совокупности. Биометрика, 61, 165-170.
  7. Перейти ↑ Wilcox, RR (2005). Введение в робастную оценку и проверку гипотез. Академическая пресса.
  8. ^ https://cran.r-project.org/web/packages/WRS2/
  9. ^ https://cran.r-project.org/web/packages/DescTools/
  10. Бялик, Карл (27 июля 2012 г.). «Устранение предвзятости судей - задача олимпийского размера» . The Wall Street Journal . Проверено 7 сентября 2014 года . CS1 maint: обескураженный параметр ( ссылка )
  11. ^ «bbalibor: Основы» . Британская ассоциация банкиров.