Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В статистической теории , U-статистика является классом статистики , что особенно важно в теории оценивания ; буква «U» означает беспристрастность. В элементарной статистике U-статистика возникает естественным образом при производстве несмещенных оценок с минимальной дисперсией .

Теория U-статистика позволяет минимальной дисперсия несмещенная оценка , которые будут получена от каждой несмещенной оценки из с почтенным параметром ( в качестве альтернативы, статистического функционального ) для больших классов вероятностных распределений. [1] [2] почтенный параметр является измеримой функцией от населения кумулятивного распределения вероятностей : Например, для каждого распределения вероятностей, медиана населения является параметром почтенным. Теория U-статистики применяется к общим классам вероятностных распределений.

Многие статистические данные, первоначально полученные для конкретных параметрических семейств, были признаны U-статистикой для общих распределений. В непараметрической статистике теория U-статистики используется для установления статистических процедур (таких как оценки и тесты) и оценок, относящихся к асимптотической нормальности и дисперсии (в конечных выборках) таких величин. [3] Теория использовалась для изучения более общей статистики, а также случайных процессов , таких как случайные графы . [4] [5] [6]

Предположим, что проблема включает в себя независимые и одинаково распределенные случайные величины и что требуется оценка определенного параметра. Предположим, что простая несмещенная оценка может быть построена на основе всего нескольких наблюдений: это определяет базовую оценку, основанную на заданном количестве наблюдений. Например, одно наблюдение само по себе является объективной оценкой среднего, а пара наблюдений может использоваться для получения несмещенной оценки дисперсии. U-статистика, основанная на этой оценке, определяется как среднее (по всем комбинаторным выборкам заданного размера из полного набора наблюдений) базовой оценки, примененной к подвыборкам.

Сен (1992) представляет обзор статьи Василия Хёффдинга (1948), в которой вводится U-статистика и излагается относящаяся к ней теория, и тем самым Сен подчеркивает важность U-статистики в статистической теории. Сен говорит [7]: «Влияние Хёффдинга (1948) огромно в настоящее время и, скорее всего, будет продолжаться в ближайшие годы». Обратите внимание, что теория U-статистики не ограничивается [8] случаем независимых и одинаково распределенных случайных величин или скалярных случайных величин. [9]

Определение [ править ]

Термин U-статистика, использованный Хёффдингом (1948), определяется следующим образом.

Позвольте быть действительной или комплексной функцией переменных. Для каждого связанная U-статистика равна среднему по упорядоченным выборкам размера значений выборки . Другими словами,

,

где обозначает из -выбрать- различных упорядоченных выборок размера, взятых из . Каждая U-статистика обязательно является симметричной функцией .

U-статистика очень естественна в статистической работе, особенно в контексте Хёффдинга независимых и одинаково распределенных случайных величин , или, в более общем смысле, для заменяемых последовательностей , например, в простой случайной выборке из конечной совокупности, где определяющее свойство называется `` наследование на среднее'.

K -статистика Фишера и polykays Тьюки являются примерами однородной полиномиальной U-статистики (Fisher, 1929; Tukey, 1950). Для простой случайной выборки φ размера  n, взятой из совокупности размера  N , U-статистика обладает тем свойством, что среднее значение по выборке  ƒ n ( ) в точности равно значению совокупности  ƒ N ( x ).

Примеры [ править ]

Некоторые примеры: Если U-статистика является выборочным средним.

Если , U-статистика - это среднее попарное отклонение , определенное для .

Если , U-статистика - это выборочная дисперсия с делителем , определенная для .

Третья -статистика , для которой определена асимметрия выборки , является U-статистикой.

Следующий случай подчеркивает важный момент. Если - это медиана трех значений, это не медиана значений. Однако это несмещенная оценка минимальной дисперсии ожидаемого значения медианы трех значений, а не медианы совокупности. Подобные оценки играют центральную роль, когда параметры семейства распределений вероятностей оцениваются с помощью моментов, взвешенных по вероятности, или L-моментов .

См. Также [ править ]

  • V-статистика

Заметки [ править ]

  1. Cox & Hinkley (1974), стр. 200, стр. 258
  2. ^ Hoeffding (1948), между уравнениями (4.3), (4.4)
  3. Сен (1992)
  4. ^ Страница 508 в Королюк, В.С.; Боровскич, Ю. В. (1994). Теория U- статистики . Математика и ее приложения. 273 (Перевод П. В. Малышева и Д. В. Малышева из русского оригинала 1989 г.). Дордрехт: Kluwer Academic Publishers Group. с. x + 552. ISBN 0-7923-2608-3. Руководство по ремонту  1472486 .
  5. ^ Страницы 381–382 в Боровских, Ю. В. (1996).U -статистика в банаховых пространствах . Утрехт: ВСП. С. xii + 420. ISBN 90-6764-200-2. Руководство по ремонту  1419498 .
  6. ^ Page XII в Квапень, Stanisƚaw; Войчинский, Войбор А. (1992). Случайные ряды и стохастические интегралы: одиночные и кратные . Вероятность и ее приложения. Бостон, Массачусетс: Birkhäuser Boston, Inc., стр. Xvi + 360. ISBN 0-8176-3572-6. Руководство по ремонту  1167198 .
  7. ^ Сен (1992) стр. 307
  8. ^ Sen (1992), P306
  9. ^ Последняя глава Боровских обсуждает U-статистику для заменяемых случайных элементов, принимающих значения в векторном пространстве ( сепарабельном банаховом пространстве ).

Ссылки [ править ]

  • Боровских, Ю. В. (1996).U -статистика в банаховых пространствах . Утрехт: ВСП. С. xii + 420. ISBN 90-6764-200-2. Руководство по ремонту  1419498 .
  • Кокс, Д. Р., Хинкли, Д. В. (1974) Теоретическая статистика . Чепмен и Холл. ISBN 0-412-12420-3 
  • Фишер, Р. А. (1929) Моменты и моменты произведения выборочных распределений. Труды Лондонского математического общества , 2, 30: 199–238.
  • Hoeffding, W. (1948) Класс статистики с асимптотически нормальным распределением. Анналы статистики , 19: 293–325. (Частично перепечатано в: Kotz, S., Johnson, NL (1992) Breakthroughs in Statistics , Vol I, pp 308–334. Springer-Verlag. ISBN 0-387-94037-5 ) 
  • Королюк В.С.; Боровскич, Ю. В. (1994). Теория U- статистики . Математика и ее приложения. 273 (Перевод П. В. Малышева и Д. В. Малышева из русского оригинала 1989 г.). Дордрехт: Kluwer Academic Publishers Group. с. x + 552. ISBN 0-7923-2608-3. Руководство по ремонту  1472486 .
  • Ли, AJ (1990) U-статистика: теория и практика . Марсель Деккер, Нью-Йорк. pp320 ISBN 0-8247-8253-4 
  • Сен, П.К. (1992) Введение в Хёффдинг (1948) Класс статистики с асимптотически нормальным распределением. В: Коц, С., Джонсон, Н.Л. Прорывы в статистике , Том I, стр. 299–307. Springer-Verlag. ISBN 0-387-94037-5 . 
  • Серфлинг, Роберт Дж. (1980). Аппроксимационные теоремы математической статистики . Нью-Йорк: Джон Уайли и сыновья. ISBN 0-471-02403-1.
  • Тьюки, JW (1950). «Некоторая упрощенная выборка». Журнал Американской статистической ассоциации . 45 (252): 501–519. DOI : 10.1080 / 01621459.1950.10501142 .
  • Халмос, П. (1946). «Теория объективного оценивания» . Анналы математической статистики . 1 (17): 34–43. DOI : 10.1214 / АОМ / 1177731020 .