В теории вероятности и статистики , то неравенство Дворецкого-Кифер-Вулфовиц-Massart ограничивает , насколько близко определяются эмпирический функция распределения будет в функцию распределения , из которого черпается эмпирические образцы. Он назван в честь Арье Дворецки , Джека Кифера и Якоба Вулфовица , которые в 1956 году доказали неравенство
с неопределенной мультипликативной константой C перед показателем в правой части. [1]
В 1990 году Паскаль Массарт доказал неравенство с точной константой C = 2, [2] подтвердив гипотезу Бирнбаума и Маккарти. [3] В 2021 году Майкл Нааман доказал многомерную версию неравенства DKW и обобщил результат плотности Массарта на многомерный случай, что привело к точной константе, в два раза превышающей количество переменных, C = 2k. [4]
Неравенство DKW
Для натурального числа n пусть X 1 , X 2 ,…, X n - действительные независимые и одинаково распределенные случайные величины с кумулятивной функцией распределения F (·). Пусть F n обозначает ассоциированную эмпирическую функцию распределения, определяемую формулой
Так есть вероятность того, что одна случайная величина меньше чем , а также - доля случайных величин, меньших, чем.
Неравенство Дворецкого – Кифера – Вулфовица ограничивает вероятность того, что случайная функция F n отличается от F более чем на заданную константу ε > 0 в любом месте вещественной прямой. Точнее, есть односторонняя оценка
что также влечет двустороннюю оценку [5]
Это усиливает теорему Гливенко – Кантелли за счет количественной оценки скорости сходимости при стремлении n к бесконечности. Он также оценивает хвостовую вероятность статистики Колмогорова – Смирнова . Приведенные выше неравенства следуют из случая, когда F соответствует равномерному распределению на [0,1], ввиду того факта [6], что F n имеет те же распределения, что и G n ( F ), где G n - эмпирическое распределение U 1 , U 2 ,…, U n, где они независимы и равномерные (0,1), и отмечая, что
с равенством тогда и только тогда, когда F непрерывно.
Многомерный случай
В многомерном случае X 1 , X 2 ,…, X n представляет собой последовательность идентификаторов k-мерных векторов. Если F n - многомерный эмпирический cdf, то
для любого ε, n, k> 0. Член (n + 1) можно заменить на 2 для любого достаточно большого n. [4]
Создание групп CDF
Неравенство Дворецкого – Кифера – Вулфовица - это один из методов построения доверительных границ на основе CDF и получения доверительной полосы . Цель этого доверительного интервала состоит в том, чтобы содержать всю CDF на заданном уровне достоверности, в то время как альтернативные подходы пытаются достичь уровня достоверности только в каждой отдельной точке, который может позволить более жесткую границу. Граница DKW проходит параллельно эмпирической CDF и находится в равной степени выше и ниже нее. Равномерно распределенный доверительный интервал вокруг эмпирического CDF допускает разную частоту нарушений в рамках поддержки распределения. В частности, CDF чаще оказывается за пределами границы CDF, оцененной с использованием неравенства DKW около медианы распределения, чем около конечных точек распределения.
Интервал, содержащий истинный CDF, , с вероятностью часто указывается как
что также является частным случаем асимптотической процедуры для многомерного случая [4], в которой используется следующее критическое значение
для многомерного теста; можно заменить 2k на k (n + 1) для проверки, которая выполняется для всех n; более того, многомерный тест, описанный Нааманом, можно обобщить, чтобы учесть неоднородность и зависимость.
Смотрите также
- Неравенство концентрации - сводка оценок наборов случайных величин.
Рекомендации
- ^ Дворецкий, А .; Кифер, Дж . ; Вольфовиц, Дж (1956), «Асимптотическое минимаксное характер функции распределения образца и классической полиномиальной оценки» , Annals математической статистики , 27 (3): 642-669, DOI : 10,1214 / АОМ / 1177728174 , МР 0083864 CS1 maint: обескураженный параметр ( ссылка )
- ^ Массарт, П. (1990), "Плотный константа в неравенстве Дворецкого-Kiefer-Вольфовица" , Анналы вероятности , 18 (3): 1269-1283, DOI : 10,1214 / AOP / 1176990746 , МР 1062069
- ^ Бирнбаум, ZW; Маккарти, Р. К. (1958). «Верхняя доверительная граница без распределения для Pr {Y
},> . Анналы математической статистики . 29 : 558–562. DOI : 10.1214 / АОМ / 1177706631 . Руководство по ремонту 0093874 . Zbl 0087.34002 . - ^ а б в Нааман, Майкл (2021). «О жесткой константе в многомерном неравенстве Дворецкого-Кифера-Вулфовица» . Статистика и вероятностные письма . 173 : 1–8 - через Science Direct.
- ^ Косорок, М.Р. (2008), «Глава 11: Дополнительные результаты эмпирических процессов», Введение в эмпирические процессы и полупараметрический вывод , Springer, p. 210, ISBN 9780387749778
- ^ Shorack, GR; Веллнер, Дж. А. (1986), Эмпирические процессы с приложениями к статистике , Wiley, ISBN 0-471-86725-X