Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В статистическом выводе концепция доверительного распределения ( CD ) часто вольно упоминается как функция распределения в пространстве параметров, которая может представлять доверительные интервалы всех уровней для интересующего параметра. Исторически сложилось так, что он обычно строился путем инвертирования верхних пределов нижних боковых доверительных интервалов всех уровней, а также обычно ассоциировался с реперной [1] интерпретацией ( реперным распределением ), хотя это чисто частотная концепция. [2] Доверительное распределение НЕ является функцией распределения вероятности интересующего параметра, но все же может быть функцией, полезной для заключения. [3]

В последние годы наблюдается всплеск интереса к распределению уверенности. [3] В более поздних разработках концепция доверительного распределения возникла как чисто частотная концепция, без какой-либо фидуциальной интерпретации или рассуждений. Концептуально доверительное распределение не отличается от точечного оценщика или интервального оценщика ( доверительного интервала ), но оно использует зависящую от выборки функцию распределения в пространстве параметров (вместо точки или интервала) для оценки интересующего параметра.

Простым примером доверительного распределения, которое широко используется в статистической практике, является бутстраповское распределение. [4] Разработка и интерпретация бутстраповского дистрибутива не требует каких-либо проверочных доводов; то же самое верно и для концепции доверительного распределения. Но понятие доверительного распределения намного шире, чем понятие начального распределения. В частности, недавние исследования показывают, что он охватывает и объединяет широкий спектр примеров, от обычных параметрических случаев (включая большинство примеров классического развития фидуциального распределения Фишера) до бутстрап-распределений, функций p-значения , [5] нормализованных функций правдоподобия.и, в некоторых случаях, байесовские априорные и байесовские апостериоры . [6]

Подобно тому, как байесовское апостериорное распределение содержит массу информации для любого типа байесовского вывода , доверительное распределение содержит огромное количество информации для построения почти всех типов частотных выводов, включая точечные оценки , доверительные интервалы , критические значения, статистическую мощность и p- значения, [7] среди других. Некоторые недавние события высветили многообещающие возможности концепции КР как эффективного инструмента вывода. [3]

История концепции CD [ править ]

Нейман (1937) [8] представил идею «уверенности» в своей основополагающей статье о доверительных интервалах, которая прояснила свойство частотного повторения. Согласно Фрейзеру [9] семя (идея) распределения уверенности можно проследить даже до Байеса (1763) [10] и Фишера (1930). [1] Хотя эта фраза, кажется, впервые была использована в Cox (1958). [11] Некоторые исследователи рассматривают доверительное распределение как «интерпретацию Неймана фидуциальных распределений Фишера» [12], которая «яростно оспаривается Фишером». [13] Также считается, что эти «непродуктивные споры» и «упорная настойчивость» Фишера [13]может быть причиной того, что концепция распределения уверенности долгое время неверно истолковывалась как фидуциальная концепция и не была полностью разработана в рамках частотных рамок. [6] [14] Действительно, доверительное распределение является чисто частотной концепцией с чисто частотной интерпретацией, а также имеет связи с концепциями байесовского вывода и фидуциальными аргументами.

Определение [ править ]

Классическое определение [ править ]

Обычно доверительное распределение определяется путем инвертирования верхних пределов ряда нижних доверительных интервалов. [15] [16] [ необходима страница ] В частности,

Для каждого α в (0, 1) пусть (−∞,  ξ n ( α )] будет 100α% -ным нижним доверительным интервалом для θ , где ξ n ( α ) =  ξ n ( X n , α) непрерывно и увеличивая α для каждой выборки X n . Тогда H n (•) =  ξ n −1 (•) является доверительным распределением для  θ .

Эфрон заявил, что это распределение «присваивает вероятность 0,05 θ, лежащему между верхними конечными точками доверительного интервала 0,90 и 0,95 и т . Д.». и «у него мощная интуитивная привлекательность». [16] В классической литературе [3] функция доверительного распределения интерпретируется как функция распределения параметра θ , что невозможно без использования проверочных расчетов, поскольку в частотной настройке параметры фиксированы и не случайны.

Полностью интерпретировать функцию CD с частотной точки зрения и не интерпретировать ее как функцию распределения (фиксированного / неслучайного) параметра - одно из основных отклонений недавних разработок по сравнению с классическим подходом. Хорошая вещь в том, чтобы рассматривать доверительные распределения как чисто частотную концепцию (похожую на точечную оценку), заключается в том, что теперь она свободна от тех ограничительных, если не спорных, ограничений, установленных Фишером для реперных распределений. [6] [14]

Современное определение [ править ]

Применяется следующее определение; [12] [17] [18] Θ - это пространство параметров неизвестного интересующего параметра θ , а χ - это пространство выборок, соответствующее данным X n = { X 1 , ..., X n }:

Функция H n (•) = H n ( X n , •) на χ  ×  Θ  → [0, 1] называется доверительным распределением (CD) для параметра θ , если она соответствует двум требованиям:
  • (R 1 ) Для каждого заданного X пх , Н п (•) = Н п ( Х п , •) является непрерывным Интегральная функция распределения по & thetas ;
  • (R2) При истинном значении параметра θ  =  θ 0 , H n ( θ 0 ) ≡  H n ( X n , θ 0 ), как функция выборки X n , следует равномерному распределению U [0, 1].

Кроме того, функция H является асимптотическим CD ( aCD ), если требование U [0, 1] выполняется только асимптотически и требование непрерывности H n (•) отбрасывается.

С нетехнической точки зрения, доверительное распределение является функцией как параметра, так и случайной выборки с двумя требованиями. Первое требование (R1) просто требует, чтобы компакт-диск был распределением в пространстве параметров. Второе требование (R2) устанавливает ограничение на функцию, чтобы выводы (точечные оценки, доверительные интервалы, проверка гипотез и т. Д.), Основанные на распределении достоверности, имели желаемые частотные свойства. Это похоже на ограничения в точечной оценке, чтобы гарантировать определенные желаемые свойства, такие как объективность, согласованность, эффективность и т. Д. [6] [19]

Доверительное распределение, полученное путем инвертирования верхних пределов доверительных интервалов (классическое определение), также удовлетворяет требованиям приведенного выше определения, и эта версия определения согласуется с классическим определением. [18]

В отличие от классического реперного вывода, для оценки параметра при любой конкретной настройке может быть доступно более одного доверительного распределения. Кроме того, в отличие от классического фидуциального вывода, оптимальность не является частью требования. В зависимости от настройки и используемого критерия иногда существует уникальное «наилучшее» (с точки зрения оптимальности) распределение достоверности. Но иногда нет доступного оптимального распределения достоверности или, в некоторых крайних случаях, мы даже не можем найти значимое распределение достоверности. Это не отличается от практики балльной оценки.

Примеры [ править ]

Пример 1. Нормальное среднее значение и дисперсия [ править ]

Предположим  , что дана нормальная выборка X i  ~  N ( μσ 2 ), i = 1, 2, ...,  n .

(1) Дисперсия σ 2 известна

Пусть Φ будет кумулятивной функцией распределения стандартного нормального распределения и кумулятивной функцией распределения распределения Стьюдента . Обе функции и заданные

удовлетворяют двум требованиям в определении CD, и они являются функциями доверительного распределения для  μ . [3] Кроме того,

удовлетворяет определению асимптотического доверительного распределения при n → ∞ и является асимптотическим доверительным распределением для μ . Использование и эквивалентно утверждению, которое мы используем, и для оценки , соответственно.

(2) Дисперсия σ 2 неизвестна.

Для параметра μ , поскольку он включает неизвестный параметр σ и нарушает два требования в определении CD, он больше не является «оценкой распределения» или доверительным распределением для  μ . [3] Тем не менее, это все еще CD для μ и CD для  μ .

Для параметра σ 2 кумулятивная функция распределения, зависящая от выборки

- функция доверительного распределения для σ 2 . [6] Здесь - кумулятивная функция распределения.

В случае, когда дисперсия σ 2 известна, оптимальна с точки зрения получения самых коротких доверительных интервалов на любом заданном уровне. В случае, когда дисперсия σ 2 неизвестна, является оптимальным доверительным распределением для μ .

Пример 2: Двумерная нормальная корреляция [ править ]

Пусть ρ обозначает коэффициент корреляции в виде двухмерного нормального населения. Хорошо известно, что z Фишера определяется преобразованием Фишера :

имеет предельное распределение с высокой скоростью сходимости, где r - корреляция выборки, а n - размер выборки.

Функция

является асимптотическим доверительным распределением для ρ . [ необходима цитата ]

Использование распределений достоверности для вывода [ править ]

Доверительный интервал [ править ]

Из определения CD очевидно, что интервал и обеспечивает 100 (1 -  α )% -ных доверительных интервалов различных видов для θ для любого α  ∈ (0, 1). Также имеется доверительный интервал уровня 100 (1 -  α 1  -  α 2 )% для параметра θ для любых α 1  > 0, α 2  > 0 и α 1  +  α 2  <1. Здесь 100 β % квантиль или он решает относительно θ в уравнении. То же самое и для CD, где уровень достоверности достигается в пределах лимита. Некоторые авторы предложили использовать их для графического просмотра значений параметров, согласующихся с данными, вместо целей охвата или производительности. [20] [21]

Оценка баллов [ править ]

Точечные оценщики также могут быть построены с учетом оценщика доверительного распределения для интересующего параметра. Например, при заданном H n ( θ ) CD для параметра θ естественный выбор точечных оценок включает в себя медианное значение M n  =  H n −1 (1/2), среднее значение и точку максимума плотности CD.

При некоторых скромных условиях, помимо других свойств, можно доказать, что все эти точечные оценки согласованы. [6] [22]

Проверка гипотез [ править ]

Можно получить p-значение для теста, одностороннего или двустороннего, относительно параметра  θ , исходя из его доверительного распределения H n ( θ ). [6] [22] Обозначим вероятностной массой множества C при функции распределения достоверности. Это p s (C) называется «опорой» в выводе CD, а в справочной литературе также известно как «вера». [23] У нас есть

(1) Для одностороннего теста K 0 : θ  ∈  C vs. K 1 : θ  ∈  C c , где C имеет тип (−∞,  b ] или [ b , ∞), можно показать из CD определение, что sup θ  ∈  C P θ ( p s ( C ) ≤  α ) =  α . Таким образом, p s ( C ) =  H n ( C ) - соответствующее p-значение теста.

(2) Для одноэлементного теста K 0 : θ  =  b vs. K 1 : θ  ≠  b , P { K 0 : θ  =  b } (2 min { p s ( C lo ), из определения CD можно показать, что p s ( C up )} ≤  α ) =  α . Таким образом, 2 min { p s ( C lo ),  p s ( C up )} = 2 min {H n ( b ), 1 -  H n ( b )} - соответствующее p-значение теста. Здесь C lo = (−∞,  b ] и C up  = [ b , ∞).

См. Рисунок 1 от Xie and Singh (2011) [6] для графической иллюстрации вывода CD.

Реализации [ править ]

Несколько статистических программ реализовали возможность построения и построения графиков доверительных распределений.

R через пакеты concurve, [24] [25] pvaluefunctions , [26] и episheet[27]

Excel , через episheet[28]

Стата , через concurve[24]

См. Также [ править ]

  • Вероятность покрытия

Ссылки [ править ]

  1. ^ a b Фишер, Р. А. (1930). «Обратная вероятность». Proc. Кембридж Пилос. Soc. 26 , 528–535.
  2. Перейти ↑ Cox, DR (1958). « Некоторые проблемы, связанные со статистическим выводом », « Анналы математической статистики », «29» 357-372 (раздел 4, стр. 363)
  3. ^ Б с д е е С, M. (2013). «Реплика распределения уверенности, частичного оценщика распределения параметра - обзор» . "International Statistical Review , 81 , 68-77.
  4. Перейти ↑ Efron, B. (1998). «Р.А.Фишер в 21 веке» Статистическая наука. 13 95–122.
  5. Перейти ↑ Fraser, DAS (1991). «Статистический вывод: вероятность значимости». Журнал Американской статистической ассоциации , 86 , 258–265.
  6. ^ Б с д е е г ч Се, М. и Синг, К. (2013). «Распределение уверенности, частичная оценка распределения параметра - обзор (с обсуждением)» . "Международный статистический обзор , 81 , 3-39.
  7. ^ Фрейзер, DAS (2019-03-29). «Функция p-значения и статистический вывод» . Американский статистик . 73 (sup1): 135–147. DOI : 10.1080 / 00031305.2018.1556735 . ISSN  0003-1305 .
  8. ^ Нейман, J. (1937). «Изложение теории статистического оценивания на основе классической теории вероятностей». Фил. Пер. Рой. Soc A237 333–380
  9. Перейти ↑ Fraser, DAS (2011). "Является ли Байесовский апостериор просто быстрой и грязной уверенностью?" Статистическая наука 26 , 299-316.
  10. ^ Байес, Т. (1763). « Очерк решения проблемы в Доктрине Шанса ». Фил. Пер. Рой. Soc , London 53 370–418 54 296–325. Перепечатано в Biometrika 45 (1958) 293–315.
  11. Перейти ↑ Cox, DR (июнь 1958 г.). «Некоторые проблемы, связанные со статистическим выводом» . Летопись математической статистики . 29 (2): 357–372. DOI : 10.1214 / АОМ / 1177706618 . ISSN 0003-4851 . 
  12. ^ a b Schweder, T. и Hjort, NL (2002). «Доверие и вероятность», Скандинавский статистический журнал. 29 309–332. DOI : 10.1111 / 1467-9469.00285
  13. ^ а б Забелл, SL (1992). «Р.А.Фишер и реперный аргумент», Стат. Sci. , 7 , 369–387
  14. ^ a b Сингх, К. и Се, М. (2011). «Обсуждение вопроса« Является ли Байесовский апостериор просто быстрой и грязной уверенностью? » пользователя DAS Fraser ". Статистическая наука. Vol. 26, 319-321.
  15. Перейти ↑ Cox, DR (2006). Принципы статистического вывода , CUP. ISBN 0-521-68567-2 . (стр.66) 
  16. ^ а б Эфрон, Б. (1993). «Байесовские и вероятностные расчеты на основе доверительных интервалов. Biometrika , 80 3–26.
  17. ^ Синг, К. Се, М. и Strawderman, мы (2001). «Доверительные распределения - концепция, теория и приложения». Технический отчет, Департамент статистики, Rutgers Univ. Пересмотрено в 2004 г.
  18. ^ a b Сингх, К. Се, М. и Strawderman, WE (2005). «Объединение информации из независимых источников посредством распределения достоверности » Annals of Statistics , 33 , 159–183.
  19. ^ Се, М., Liu, R., Daramuju, CV, Olsan, W. (2012). «Объединение мнений экспертов с информацией из биномиальных клинических испытаний». Анналы прикладной статистики. В прессе.
  20. ^ Кокс, DR; Хинкли, Д.В. (1979-09-06). Теоретическая статистика . Чепмен и Холл / CRC. DOI : 10.1201 / b14832 . ISBN 978-0-429-17021-8.
  21. ^ Рафи, Зад; Гренландия, Сандер (30 сентября 2020 г.). «Семантические и когнитивные инструменты в помощь статистической науке: замените уверенность и значимость совместимостью и неожиданностью» . BMC Medical Research Methodology . 20 (1): 244. DOI : 10,1186 / s12874-020-01105-9 . ISSN 1471-2288 . PMC 7528258 . PMID 32998683 .   
  22. ^ a b Сингх, К. Се, М. и Strawderman, WE (2007). «Доверительное распределение (CD) - оценка распределения параметра» , в сложных наборах данных и обратных задачах Лекционные заметки IMS - серия монографий , 54 , (Р. Лю и др.) 132–150.
  23. Перейти ↑ Kendall, M., & Stuart, A. (1974). Расширенная теория статистики , Объем?. (Глава 21). Вайли.
  24. ^ a b Рафи [aut, Zad; cre; Выготский, Эндрю Д. (2020-04-20), concurve: Интервалы совместимости (достоверности) вычислений и графиков, P-значения, S-значения и интервалы правдоподобия для формирования функций созвучия, неожиданности и правдоподобия , получено 2020-05- 05
  25. ^ «Concurve графиков кривых созвучия, функций p-значения и функций S-значения« Статистическое моделирование, причинный вывод и социальные науки » . statmodeling.stat.columbia.edu . Проверено 15 апреля 2020 .
  26. ^ Infanger, Денис (2019-11-29), pvaluefunctions: создает и строит графики функций P-значения, S-значений функций, распределения достоверности и плотности достоверности , получено 15 апреля 2020 г.
  27. ^ Блэк, Джеймс; Ротман, Кен; Телуолл, Саймон (23.01.2019), Episheet: Rothman's Episheet , получено 15 апреля 2020 г.
  28. ^ «Современная эпидемиология, 2-е издание» . www.krothman.org . Проверено 15 апреля 2020 .

Библиография [ править ]

  • Се, М. и Сингх К. (2013). [1] "Распределение уверенности, оценщик распределения частотности параметра: обзор". Международный статистический обзор , 81 , 3–39.
  • Шведер, Т. и Хьорт, Нидерланды (2016). [2] Доверие, правдоподобие, вероятность: статистический вывод с распределениями достоверности . Лондон: Издательство Кембриджского университета. ISBN 9781139046671 
  • Фишер, Р.А. (1956). Статистические методы и научные выводы . Нью-Йорк: Хафнер. ISBN 0-02-844740-9 . 
  • Фишер, Р.А. (1955). «Статистические методы и научная индукция» Дж. Рой. Статист. Soc. Сер. Б. 17, 69–78. (критика статистических теорий Ежи Неймана и Абрахама Вальда с реперной точки зрения)
  • Ханниг, Дж. (2009). « Об обобщенном реперном заключении ». Statistica Sinica , 19 , 491–544.
  • Лоулесс, Ф. и Фредетт, М. (2005). « Интервалы предсказания Frequentist и предсказательные распределения ». Биометрика. 92 (3) 529–542.
  • Леманн, Э.Л. (1993). « Теории Фишера, Неймана – Пирсона для проверки гипотез: одна теория или две? » Журнал Американской статистической ассоциации 88 1242–1249.
  • Нейман, Ежи (1956). «Примечание к статье сэра Рональда Фишера». Журнал Королевского статистического общества . Серия B (Методологическая) 18 (2): 288–294. JSTOR  2983716 . (ответ Фишеру 1955, который диагностирует ошибку «фидуциального вывода»)
  • Шведер Т., Садыкова Д., Рю Д. и Коски В. (2010) « Оценка популяции по результатам аэрофотосъемки гренландских китов с естественными и переменными метками » Журнал сельскохозяйственной, биологической и экологической статистики, 2010 г. 15: 1–19
  • Битюков С., Красников Н., Надараджа С., Смирнова В. (2010) " Распределения достоверности в статистических выводах ". Материалы конференции AIP, 1305 , 346-353.
  • Сингх К. и Се М. (2012). «CD-апостериор --- объединение априорных и данных через доверительные распределения». Современные разработки в байесовском анализе и статистической теории принятия решений: сборник статей Уильяма Э. Строудермана. (Д. Фурдринье и др., Ред.). Сборник IMS, Том 8, 200-214.