Теорема Гливенко – Кантелли.

В теории вероятностей , то теорема Гливенко-Cantelli (иногда упоминаются как основная теорема статистики ), названной в честь Валерия Иванович Гливенко и Франческо Паоло Кантелл , определяет асимптотическое поведение эмпирической функции распределения , как число независимы и одинаково распределен наблюдения растет. ^[1]

Заявление

Равномерная сходимость более общих эмпирических мер становится важным свойством классов функций или множеств Гливенко – Кантелли . ^[2] Классы Гливенко – Кантелли возникают в теории Вапника – Червоненкиса с приложениями к машинному обучению . Можно найти приложения в эконометрике с использованием M-оценок .

Предположить, что ${\ Displaystyle X_ {1}, X_ {2}, \ точки}$ являются независимыми и одинаково распределенными случайными величинами в ${\ Displaystyle \ mathbb {R}}$ с общей кумулятивной функцией распределения ${\ Displaystyle F (х)}$ . Эмпирическая функция распределения для ${\ Displaystyle X_ {1}, \ точки, X_ {n}}$ определяется

{\ displaystyle F_ {n} (x) = {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} I _ {[X_ {i}, \ infty)} (x) = { \ frac {1} {n}} \ left | \ left \ {1 \ leq i \ leq n | X_ {i} \ leq x \ right \} \ right |}

где ${\ displaystyle I_ {C}}$ - индикаторная функция множества ${\ displaystyle C}$ . Для каждого (фиксированного) ${\ displaystyle x}$ , ${\ Displaystyle F_ {п} (х)}$ представляет собой последовательность случайных величин, которые сходятся к ${\ Displaystyle F (х)}$ почти наверняка по усиленному закону больших чисел , т. е. ${\ displaystyle F_ {n}}$ сходится к ${\ displaystyle F}$ точечно . Гливенко и Cantelli усилил этот результат, доказав , равномерная сходимость в ${\ displaystyle F_ {n}}$ к ${\ displaystyle F}$ .

Теорема

{\ displaystyle \ | F_ {n} -F \ | _ {\ infty} = \ sup _ {x \ in \ mathbb {R}} | F_ {n} (x) -F (x) | \ longrightarrow 0}

почти наверняка. ^[3]

Эта теорема берет свое начало с Валерием Гливенко , ^[4] и Франческо Cantelli , ^[5] в 1933 году.

Замечания

Если ${\ displaystyle X_ {n}}$ - стационарный эргодический процесс , то ${\ Displaystyle F_ {п} (х)}$ почти наверняка сходится к ${\ Displaystyle F (x) = E (1_ {X_ {1} \ leq x})}$ . Теорема Гливенко – Кантелли дает более сильный способ сходимости, чем это в случае iid .
Еще более сильный результат равномерной сходимости для эмпирической функции распределения доступен в форме расширенного типа закона повторного логарифма . ^[6] См. Асимптотические свойства эмпирической функции распределения для этого и связанных результатов.

Доказательство

Для простоты рассмотрим случай непрерывной случайной величины ${\ displaystyle X}$ . Исправить ${\ displaystyle - \ infty = x_ {0}$ такой, что ${\ Displaystyle F (x_ {j}) - F (x_ {j-1}) = {\ frac {1} {m}}}$ для ${\ displaystyle j = 1, \ dots, m}$ . Теперь для всех ${\ Displaystyle х \ в \ mathbb {R}}$ Существует ${\ displaystyle j \ in \ {1, \ dots, m \}}$ такой, что ${\ displaystyle x \ in [x_ {j-1}, x_ {j}]}$ . Обратите внимание, что

${\ displaystyle {\ begin {align} F_ {n} (x) -F (x) & \ leq F_ {n} (x_ {j}) - F (x_ {j-1}) = F_ {n} ( x_ {j}) - F (x_ {j}) + 1 / m, \\ F_ {n} (x) -F (x) & \ geq F_ {n} (x_ {j-1}) - F ( x_ {j}) = F_ {n} (x_ {j-1}) - F (x_ {j-1}) - 1 / м. \ end {выровнено}}}$

Следовательно,

${\ displaystyle || F_ {n} -F || _ {\ infty} = \ sup _ {x \ in \ mathbb {R}} | F_ {n} (x) -F (x) | \ leq \ max _ {j \ in \ {1, \ dots, m \}} | F_ {n} (x_ {j}) - F (x_ {j}) | + 1 / m.}$

С ${\ textstyle \ max _ {j \ in \ {1, \ dots, m \}} | F_ {n} (x_ {j}) - F (x_ {j}) | \ to 0 {\ text {as} }}$ с помощью строгого закона больших чисел мы можем гарантировать, что для любого положительного ${\ textstyle \ epsilon}$ и любое целое число ${\ textstyle m}$ такой, что ${\ textstyle 1 / м <\ epsilon}$ , мы можем найти ${\ textstyle N}$ такое, что для всех ${\ Displaystyle п \ geq N}$ , у нас есть ${\ textstyle | \ max _ {j \ in \ {1, \ dots, m \}} | F_ {n} (x_ {j}) - F (x_ {j}) | \ leq \ epsilon -1 / m {\ text {as}}}$ . В сочетании с приведенным выше результатом это также означает, что ${\ textstyle || F_ {n} -F || _ {\ infty} \ leq \ epsilon {\ text {as}}}$ , которое является определением почти наверное сходимости.

Эмпирические меры

Можно обобщить эмпирическую функцию распределения , заменив множество ${\ displaystyle (- \ infty, x]}$ произвольным множеством C из класса множеств ${\ displaystyle {\ mathcal {C}}}$ для получения эмпирической меры, индексированной множеством ${\ displaystyle C \ in {\ mathcal {C}}.}$

{\ displaystyle P_ {n} (C) = {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} I_ {C} (X_ {i}), C \ in {\ mathcal {C}}}

Где ${\ Displaystyle I_ {C} (х)}$ это индикаторная функция каждого набора ${\ displaystyle C}$ .

Дальнейшее обобщение - это отображение, индуцированное ${\ displaystyle P_ {n}}$ на измеримых действительных функциях f , который задается формулой

{\ displaystyle f \ mapsto P_ {n} f = \ int _ {S} f \, dP_ {n} = {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} f ( X_ {i}), f \ in {\ mathcal {F}}.}

Тогда важным свойством этих классов становится то, что усиленный закон больших чисел выполняется равномерно на ${\ Displaystyle {\ mathcal {F}}}$ или же ${\ displaystyle {\ mathcal {C}}}$ .

Класс Гливенко – Кантелли

Рассмотрим набор ${\ Displaystyle {\ mathcal {S}}}$ с сигма - алгебре борелевских подмножеств A и вероятностной меры P . Для класса подмножеств

{\ displaystyle {\ mathcal {C}} \ subset \ {C: C {\ mbox {- измеримое подмножество}} {\ mathcal {S}} \}}

и класс функций

{\ displaystyle {\ mathcal {F}} \ subset \ {f: {\ mathcal {S}} \ to \ mathbb {R}, f {\ mbox {измеримо}} \, \}}

определить случайные величины

{\ displaystyle \ | P_ {n} -P \ | _ {\ mathcal {C}} = \ sup _ {C \ in {\ mathcal {C}}} | P_ {n} (C) -P (C) |}

{\ displaystyle \ | P_ {n} -P \ | _ {\ mathcal {F}} = \ sup _ {f \ in {\ mathcal {F}}} | P_ {n} f-Pf |}

где ${\ displaystyle P_ {n} (C)}$ эмпирическая мера, ${\ displaystyle P_ {n} f}$ - соответствующее отображение, а

{\ Displaystyle \ mathbb {E} е = \ int _ {\ mathcal {S}} f \, dP = Pf}

, предполагая, что он существует.

Определения

Класс ${\ displaystyle {\ mathcal {C}}}$ называется классом Гливенко – Кантелли (или классом GC ) относительно вероятностной меры P, если верно любое из следующих эквивалентных утверждений.

1.

{\ displaystyle \ | P_ {n} -P \ | _ {\ mathcal {C}} \ to 0}

почти наверняка как

{\ Displaystyle п \ к \ infty}

.

2.

{\ displaystyle \ | P_ {n} -P \ | _ {\ mathcal {C}} \ to 0}

по вероятности как

{\ Displaystyle п \ к \ infty}

.

3.

{\ Displaystyle \ mathbb {E} \ | P_ {n} -P \ | _ {\ mathcal {C}} \ to 0}

, в виде

{\ Displaystyle п \ к \ infty}

(сходимость в среднем).

Аналогично определяются классы функций Гливенко – Кантелли.

Класс называется универсальным классом Гливенко – Кантелли, если он является классом GC относительно любой вероятностной меры P на ( S , A ).
Класс называется равномерно Гливенко – Кантелли, если сходимость происходит равномерно по всем вероятностным мерам P на ( S , A ):

{\ displaystyle \ sup _ {P \ in {\ mathcal {P}} (S, A)} \ mathbb {E} \ | P_ {n} -P \ | _ {\ mathcal {C}} \ to 0; }

{\ displaystyle \ sup _ {P \ in {\ mathcal {P}} (S, A)} \ mathbb {E} \ | P_ {n} -P \ | _ {\ mathcal {F}} \ до 0. }

Теорема ( Вапник и Червоненкис , 1968) ^[7]

Класс наборов ${\ displaystyle {\ mathcal {C}}}$ равномерно GC тогда и только тогда, когда это класс Вапника – Червоненкиса .

Примеры

Позволять ${\ Displaystyle S = \ mathbb {R}}$ а также ${\ Displaystyle {\ mathcal {C}} = \ {(- \ infty, t]: т \ in {\ mathbb {R}} \}}$ . Из классической теоремы Гливенко – Кантелли следует, что этот класс является универсальным классом GC. Кроме того, по теореме Колмогорова ,

{\ Displaystyle \ sup _ {P \ in {\ mathcal {P}} (S, A)} \ | P_ {n} -P \ | _ {\ mathcal {C}} \ sim n ^ {- 1/2 }}

, это

{\ displaystyle {\ mathcal {C}}}

является равномерным классом Гливенко – Кантелли.

Пусть P - неатомная вероятностная мера на S и ${\ displaystyle {\ mathcal {C}}}$ быть класс всех конечных подмножеств в S . Так как ${\ displaystyle A_ {n} = \ {X_ {1}, \ ldots, X_ {n} \} \ in {\ mathcal {C}}}$ , ${\ displaystyle P (A_ {n}) = 0}$ , ${\ Displaystyle P_ {n} (A_ {n}) = 1}$ у нас есть это ${\ displaystyle \ | P_ {n} -P \ | _ {\ mathcal {C}} = 1}$ и другие ${\ displaystyle {\ mathcal {C}}}$ это не GC класса по отношению к P .

Смотрите также

Теорема Донскера
Неравенство Дворецкого – Кифера – Вулфовица - усиливает теорему Гливенко – Кантелли путем количественной оценки скорости сходимости.

дальнейшее чтение

Дадли, Р.М. (1999). Равномерные центральные предельные теоремы . Издательство Кембриджского университета. ISBN 0-521-46102-2.
Питман, EJG (1979). «Функция распределения выборки». Некоторая основная теория статистических выводов . Лондон: Чепмен и Холл. п. 79–97. ISBN 0-470-26554-X.
Shorack, GR; Веллнер, Дж. А. (1986). Эмпирические процессы с приложениями к статистике . Вайли. ISBN 0-471-86725-X.
ван дер Ваарт, AW ; Веллнер, Дж. А. (1996). Слабая конвергенция и эмпирические процессы . Springer. ISBN 0-387-94640-3.
van der Vaart, Aad W .; Веллнер, Джон А. (1996). Теоремы Гливенко-Кантелли . Springer.
van der Vaart, Aad W .; Веллнер, Джон А. (2000). Теоремы сохранения для классов Гливенко-Кантелли и равномерных классов Гливенко-Кантелли . Springer.

[1] Ховард Дж. Такер (1959). «Обобщение теоремы Гливенко-Кантелли» . Летопись математической статистики . 30 (3): 828–830. DOI : 10.1214 / АОМ / 1177706212 . JSTOR 2237422 .

[2] ван дер Ваарт, AW (1998). Асимптотическая статистика . Издательство Кембриджского университета. п. 279 . ISBN 978-0-521-78450-4.

[3] ван дер Ваарт, AW (1998). Асимптотическая статистика . Издательство Кембриджского университета. п. 265 . ISBN 978-0-521-78450-4.

[4] Гливенко, В. (1933). Sullaterminazione empirica delle leggi di probabilità. Giorn. Ist. Ital. Аттуари 4, 92-99.

[5] Перейти ↑ Cantelli, FP (1933). Sullaterminazione empirica delle leggi di probabilità. Giorn. Ist. Ital. Аттуари 4, 421-424.

[6] ван дер Ваарт, AW (1998). Асимптотическая статистика . Издательство Кембриджского университета. п. 268 . ISBN 978-0-521-78450-4.

[7] Вапник, ВН; Червоненкис, А. Я (1971). «О равномерной сходимости относительных частот событий к их вероятностям». Теория вероятностей и ее приложения . 16 (2): 264–280. DOI : 10.1137 / 1116025 .

[1]