Полосы уверенности и прогнозов

Доверительный интервал используется в статистическом анализе , чтобы представлять неопределенность в оценке кривой или функции на основе ограниченных или зашумленных данных. Точно так же полоса прогнозирования используется для представления неопределенности относительно значения новой точки данных на кривой, но с учетом шума. Полосы уверенности и прогноза часто используются как часть графического представления результатов регрессионного анализа .

Полосы достоверности тесно связаны с доверительными интервалами , которые представляют неопределенность в оценке единственного числового значения. «Поскольку доверительные интервалы по своей конструкции относятся только к одной точке, они уже (в этой точке), чем доверительная полоса, которая должна удерживаться одновременно во многих точках». ^[1]

Точечные и одновременные доверительные интервалы [ править ]

Предположим, наша цель - оценить функцию f ( x ). Например, f ( x ) может быть долей людей определенного возраста x, которые поддерживают данного кандидата на выборах. Если x измеряется с точностью до одного года, мы можем построить отдельный 95% доверительный интервал для каждого возраста. Каждый из этих доверительных интервалов покрывает соответствующее истинное значение f ( x ) с достоверностью 0,95. Взятые вместе, эти доверительные интервалы составляют 95% точечный доверительный интервал для f ( x ).

С математической точки зрения, точечный доверительный интервал с вероятностью охвата 1 - α удовлетворяет следующему условию отдельно для каждого значения x : ${\ Displaystyle {\ шляпа {е}} (х) \ pm ш (х)}$

{\ Displaystyle \ Pr {\ Big (} {\ hat {f}} (x) -w (x) \ leq f (x) \ leq {\ hat {f}} (x) + w (x) {\ Большой)} = 1- \ alpha,}

где - точечная оценка функции f ( x ). ${\ Displaystyle {\ шляпа {f}} (х)}$

Вероятность одновременного охвата коллекции доверительных интервалов является вероятность того, что все они покрывают свои соответствующие истинные ценности одновременно. В приведенном выше примере вероятность одновременного охвата - это вероятность того, что интервалы для x = 18,19, ... все покрывают свои истинные значения (при условии, что 18 - это самый молодой возраст, в котором человек может голосовать). Если каждый интервал в отдельности имеет вероятность охвата 0,95, вероятность одновременного охвата обычно меньше 0,95. 95% доверительный интервал одновременного представляет собой набор доверительных интервалов для всех значений х в области F ( х), который рассчитан на вероятность одновременного охвата 0,95.

С математической точки зрения, диапазон одновременной уверенности с вероятностью охвата 1 - α удовлетворяет следующему условию: ${\ Displaystyle {\ шляпа {е}} (х) \ pm ш (х)}$

{\ displaystyle \ Pr {\ Big (} {\ hat {f}} (x) -w (x) \ leq f (x) \ leq {\ hat {f}} (x) + w (x) \; \; {\ text {для всех}} x {\ Big)} = 1- \ alpha.}

Почти во всех случаях одновременная доверительная полоса будет шире, чем точечная доверительная полоса с той же вероятностью охвата. В определении точечной доверительной полосы этот универсальный квантор выходит за пределы функции вероятности.

Полосы уверенности для смоделированных данных, отображающие долю избирателей, поддерживающих данного кандидата на выборах, в зависимости от возраста избирателей. Показаны точечные 95% доверительные интервалы и одновременные 95% доверительные интервалы, построенные с использованием поправки Бонферрони .

Полосы уверенности в регрессионном анализе [ править ]

Полосы уверенности обычно возникают при регрессионном анализе . ^[2] В случае простой регрессии, включающей одну независимую переменную, результаты могут быть представлены в виде графика, показывающего оценочную линию регрессии вместе с точечными или одновременными доверительными полосами. Обычно используемые методы для построения одновременных доверительных интервалов в регрессии - это методы Бонферрони и Шеффе ; см. дополнительные сведения о процедурах контроля уровня ошибок в семье .

Полосы уверенности для простого линейного регрессионного анализа с использованием смоделированных данных. Показаны точечные 95% доверительные интервалы и одновременные 95% доверительные интервалы, построенные с использованием метода Шеффе .

Полосы уверенности для вероятностных распределений [ править ]

Полосы уверенности могут быть построены на основе оценок эмпирической функции распределения . Простая теория позволяет построить точечные доверительные интервалы, но также возможно построить одновременную доверительную полосу для кумулятивной функции распределения в целом, инвертируя тест Колмогорова-Смирнова или используя непараметрические методы правдоподобия. ^[3]

Другие применения доверительных интервалов [ править ]

Полосы уверенности возникают всякий раз, когда статистический анализ направлен на оценку функции.

Доверительные полосы были также разработаны для оценок функций плотности , спектральной плотности функций, ^[4] квантиль функции , диаграммы рассеяния сглаживает , функции выживания , и характеристических функций . ^{[ необходима цитата ]}

Полосы прогнозов [ править ]

В этом разделе не процитировать любые источники . Пожалуйста, помогите улучшить этот раздел , добавив цитаты из надежных источников . Материал, не полученный от источника, может быть оспорен и удален . ( Март 2021 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения )

Полосы прогнозирования связаны с интервалами прогнозирования так же, как доверительные диапазоны связаны с доверительными интервалами. Полосы прогнозирования обычно возникают при регрессионном анализе. Цель диапазона прогнозов - охватить с заданной вероятностью значения одного или нескольких будущих наблюдений из той же совокупности, из которой был выбран данный набор данных. Так же, как интервалы прогнозирования шире доверительных интервалов, диапазоны прогнозирования будут шире доверительных интервалов.

Этот раздел может сбивать с толку или непонятно читателям . Помогите, пожалуйста, прояснить раздел . На странице обсуждения может быть обсуждение этого вопроса . ( Март 2021 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения )

С математической точки зрения, диапазон прогнозирования с вероятностью охвата 1 - α удовлетворяет следующему условию для каждого значения x : ${\ Displaystyle {\ шляпа {е}} (х) \ pm ш (х)}$

{\ displaystyle \ Pr {\ Big (} {\ hat {f}} (x) -w (x) \ leq y ^ {*} \ leq {\ hat {f}} (x) + w (x) { \ Big)} = 1- \ alpha,}

где y ^* - это наблюдение, полученное в процессе генерации данных в данной точке x, которое не зависит от данных, используемых для построения точечной оценки и доверительного ^[^{неопределенного}^] интервала w ( x ). Это интервал точечного прогнозирования. ^[^{неопределенный}^] Можно было бы построить одновременный интервал ^[^{неопределенный}^] для конечного числа независимых наблюдений, используя, например, метод Бонферрони, чтобы расширить интервал ^[^{неопределенный}^] на соответствующую величину. ${\ Displaystyle {\ шляпа {f}} (х)}$

Ссылки [ править ]

^ стр.65 в W. Härdle, M. Müller, S. Sperlich, A. Werwatz (2004), Непараметрические и полупараметрические модели, Springer, ISBN 3540207228 « Архивная копия» . Архивировано из оригинала на 2013-04-12 . Проверено 6 февраля 2013 . CS1 maint: не рекомендуется параметр ( ссылка ) CS1 maint: заархивированная копия как заголовок ( ссылка ), [1]
^ Лю, Вт; Lin S .; Пигорш WW (2008). «Построение точных одновременных доверительных интервалов для модели простой линейной регрессии» . Международное статистическое обозрение . 76 (1): 39–57. DOI : 10.1111 / j.1751-5823.2007.00027.x .
Перейти ↑ Owen, AB (1995). «Непараметрические доверительные интервалы правдоподобия для функции распределения». Журнал Американской статистической ассоциации . Американская статистическая ассоциация. 90 (430): 516–521. DOI : 10.2307 / 2291062 . JSTOR 2291062 .
^ Neumann, MH; Папародит Э. (2008). «Одновременные доверительные интервалы в оценке спектральной плотности». Биометрика . 95 (2): 381. CiteSeerX 10.1.1.569.3978 . DOI : 10.1093 / Biomet / asn005 .

[1] стр.65 в W. Härdle, M. Müller, S. Sperlich, A. Werwatz (2004), Непараметрические и полупараметрические модели, Springer, ISBN 3540207228 « Архивная копия» . Архивировано из оригинала на 2013-04-12 . Проверено 6 февраля 2013 . CS1 maint: не рекомендуется параметр ( ссылка ) CS1 maint: заархивированная копия как заголовок ( ссылка ), [1]

[2] Лю, Вт; Lin S .; Пигорш WW (2008). «Построение точных одновременных доверительных интервалов для модели простой линейной регрессии» . Международное статистическое обозрение . 76 (1): 39–57. DOI : 10.1111 / j.1751-5823.2007.00027.x .

[3] Перейти ↑ Owen, AB (1995). «Непараметрические доверительные интервалы правдоподобия для функции распределения». Журнал Американской статистической ассоциации . Американская статистическая ассоциация. 90 (430): 516–521. DOI : 10.2307 / 2291062 . JSTOR 2291062 .

[4] Neumann, MH; Папародит Э. (2008). «Одновременные доверительные интервалы в оценке спектральной плотности». Биометрика . 95 (2): 381. CiteSeerX 10.1.1.569.3978 . DOI : 10.1093 / Biomet / asn005 .

[1]