Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В статистике , А доверительный интервал ( ДИ ) является одним из видов оценок вычисляются из статистики наблюдаемых данных. Это предлагает диапазон возможных значений для неизвестного параметра (например, среднего). Интервал имеет связанный уровень достоверности того, что истинный параметр находится в предложенном диапазоне. Уровень достоверности выбирается исследователем. Для данной оценки в данной выборке использование более высокого уровня достоверности создает более широкий (т. Е. Менее точный) доверительный интервал. В общих чертах, доверительный интервал для неизвестного параметра основан на выборке распределения соответствующей оценки . [1]

Это означает, что уровень достоверности представляет собой теоретическую долгосрочную частоту (т. Е. Долю) доверительных интервалов, которые содержат истинное значение неизвестного параметра совокупности. Другими словами, 90% доверительных интервалов, вычисленных на уровне достоверности 90%, содержат параметр, 95% доверительных интервалов, вычисленных с уровнем достоверности 95%, содержат параметр, 99% доверительных интервалов, вычисленных с уровнем достоверности 99%, содержат параметр параметр и т. д. [2]

Уровень достоверности обозначается перед исследованием данных. Чаще всего используется доверительный интервал 95%. [3] Однако иногда используются другие уровни достоверности, например, 90% или 99%.

Факторы, влияющие на ширину доверительного интервала, включают размер выборки, уровень достоверности и изменчивость в выборке. Более крупная выборка, как правило, дает лучшую оценку параметра совокупности, когда все другие факторы равны. Более высокий уровень достоверности, как правило, дает более широкий доверительный интервал.

Многие доверительные интервалы имеют вид , где является реализация набора данных, с является постоянной и это стандартное отклонение набора данных. [1]

Другой способ выразить форму доверительного интервала - это набор из двух параметров: (точечная оценка - граница ошибки, точечная оценка + граница ошибки) или символически выраженных как (–EBM, + EBM) , где (точечная оценка) служит оценка m (среднее значение по совокупности), а EBM - это граница ошибки для среднего значения по совокупности. [2]

Предел погрешности (EBM) зависит от уровня достоверности. [2]

Строгое общее определение:

Предположим, что дан набор данных, смоделированный как реализация случайных величин . Позвольте быть интересующим параметром и числом от 0 до 1. Если существует статистика выборки и такая, что:

для каждого значения

тогда , где и , называется доверительным интервалом % для . Число называется уровнем достоверности . [1]

Концептуальная основа [ править ]

На этой гистограмме верхние концы коричневых столбцов указывают наблюдаемые средние значения, а сегменты красной линии («столбики ошибок») представляют собой доверительные интервалы вокруг них. Хотя планки погрешностей показаны симметрично относительно средних, это не всегда так. Также важно отметить, что на большинстве графиков планки ошибок не представляют доверительные интервалы (например, они часто представляют стандартные ошибки или стандартные отклонения ).

Введение [ править ]

Интервальную оценку можно сравнить с точечной оценкой . Точечная оценка - это единичное значение, данное как оценка интересующего параметра совокупности, например среднего некоторого количества. Интервальная оценка вместо этого определяет диапазон, в котором, по оценкам, находится параметр. Доверительные интервалы обычно указываются в таблицах или графиках вместе с точечными оценками тех же параметров, чтобы показать надежность оценок.

Например, доверительный интервал можно использовать для описания надежности результатов опроса. При опросе намерений выборы-голосование может оказаться, что 40% респондентов намерены голосовать за определенную партию. Доверительный интервал 99% для доли всего населения, имеющей одинаковые намерения при опросе, может составлять от 30% до 50%. Из тех же данных можно рассчитать 90% доверительный интервал, который в этом случае может составлять от 37% до 43%. Основным фактором, определяющим длину доверительного интервала, является размер выборки, используемой в процедуре оценки, например, количество людей, принимающих участие в опросе.

Значение и толкование [ править ]

Могут быть даны различные интерпретации доверительного интервала (на примере 90% доверительного интервала).

  • Доверительный интервал может быть выражен в единицах выборок (или повторных выборок ): « Если бы эту процедуру повторили на множестве выборок, доля рассчитанных доверительных интервалов (которые будут различаться для каждой выборки), которые охватывают параметр истинной совокупности, будет иметь тенденцию к 90% ". [4]
  • Доверительный интервал может быть выражен в терминах одной выборки: « Существует 90% -ная вероятность того, что рассчитанный доверительный интервал из какого-то будущего эксперимента охватывает истинное значение параметра совокупности». Обратите внимание, что это утверждение вероятности относительно доверительного интервала, а не параметра совокупности. При этом рассматривается вероятность, связанная с доверительным интервалом с предэкспериментальной точки зрения, в том же контексте, в котором приводятся аргументы в пользу случайного распределения обработок по элементам исследования. Здесь экспериментатор излагает способ, которым они намереваются вычислить доверительный интервал, и знать, прежде чем они проведут фактический эксперимент, что интервал, который они будут вычислять, имеет особый шанс покрыть истинное, но неизвестное значение.[5] Это очень похоже на приведенную выше интерпретацию «повторяющейся выборки», за исключением того, что она избегает полагаться на рассмотрение гипотетических повторов процедуры выборки, которые могут быть неповторимы в каком-либо значимом смысле. См. Конструкцию Неймана .
  • Объяснение доверительного интервала может быть примерно таким: « Доверительный интервал представляет значения для параметра совокупности, для которых разница между параметром и наблюдаемой оценкой не является статистически значимой на уровне 10% ». [6] Эта интерпретация распространена в научных статьях, в которых используются доверительные интервалы для подтверждения своих экспериментов, хотя чрезмерное доверие к доверительным интервалам также может вызвать проблемы .

В каждом из вышеуказанных случаев применяется следующее: если истинное значение параметра лежит за пределами 90% доверительного интервала, то произошло событие выборки (а именно, получение точечной оценки параметра, по крайней мере, так далеко от истинного значения параметра. ) с вероятностью 10% (или меньше) случайности.

Недоразумения [ править ]

Доверительные интервалы и уровни часто понимаются неправильно, и опубликованные исследования показали, что даже профессиональные ученые часто неправильно их интерпретируют. [7] [8] [9] [10] [11]

  • Уровень достоверности 95% не означает, что для данного реализованного интервала существует 95% -ная вероятность того, что параметр совокупности находится в пределах интервала (т. Е. Вероятность 95% того, что интервал охватывает параметр совокупности). [12] Согласно строгой частотной интерпретации, как только интервал вычислен, этот интервал либо покрывает значение параметра, либо нет; это уже не вопрос вероятности. Вероятность 95% относится к надежности процедуры оценки, а не к конкретному расчетному интервалу. [13] Сам Нейман (первоначальный сторонник доверительных интервалов) указал на это в своей оригинальной статье: [5]

    «Следует отметить, что в приведенном выше описании утверждения вероятности относятся к проблемам оценки, которыми статистик будет заниматься в будущем. Фактически, я неоднократно заявлял, что частота правильных результатов будет стремиться к α . теперь случай, когда образец уже взят, и расчеты дали [определенные пределы]. Можно ли сказать, что в этом конкретном случае вероятность истинного значения [попадания в эти пределы] равна α ? Ответ, очевидно, в отрицательное значение. Параметр является неизвестной константой, и нельзя делать никаких заявлений о вероятности его значения ... "

Дебора Мэйо развивает это далее следующим образом: [14]

"Однако следует подчеркнуть, что, увидев значение [данных], теория Неймана – Пирсона никогда не позволяет сделать вывод, что сформированный конкретный доверительный интервал покрывает истинное значение 0 с любой (1 -  α ) 100% вероятностью или (1 -  α) 100% степень уверенности. Замечание Зайденфельда, кажется, коренится в (нередком) стремлении к доверительным интервалам Неймана – Пирсона обеспечить то, что они не могут предоставить на законных основаниях; а именно, мера степени вероятности, уверенности или поддержки того, что неизвестное значение параметра находится в определенном интервале. Следуя Сэвиджу (1962), вероятность того, что параметр находится в определенном интервале, может быть названа мерой конечной точности. Хотя мера окончательной точности может показаться желательной, и хотя уровни достоверности часто (ошибочно) интерпретируются как обеспечивающие такую ​​меру, такая интерпретация не является оправданной. По общему признанию, такое неверное толкование поощряется словом «уверенность» ».

  • Уровень достоверности 95% не означает, что 95% данных выборки находятся в пределах доверительного интервала.
  • Доверительный интервал не является окончательным диапазоном вероятных значений для параметра выборки, хотя его можно понимать как оценку вероятных значений для параметра совокупности.
  • Конкретный уровень достоверности 95%, рассчитанный на основе эксперимента, не означает, что существует 95% вероятность того, что параметр выборки из повторения эксперимента попадет в этот интервал. [11]

История [ править ]

Доверительные интервалы были введены в статистику Ежи Нейманом в статье, опубликованной в 1937 году. [15] Однако потребовалось довольно много времени, чтобы доверительные интервалы использовались точно и регулярно.

В самом раннем современном контролируемом клиническом исследовании медикаментозного лечения острого инсульта , опубликованном Дайкен и Уайт в 1959 году, исследователи не смогли отвергнуть нулевую гипотезу об отсутствии эффекта кортизола.при инсульте. Тем не менее, они пришли к выводу, что их испытание «ясно показало отсутствие возможных преимуществ лечения кортизоном». Дайкен и Уайт не рассчитывали доверительные интервалы, которые в то время в медицине были редкостью. Когда Питер Сандеркок переоценил данные в 2015 году, он обнаружил, что доверительный интервал 95% простирается от снижения риска на 12% до увеличения риска на 140%. Следовательно, утверждение авторов не было подтверждено их экспериментом. Сандеркок пришел к выводу, что, особенно в медицинских науках, где наборы данных могут быть небольшими, доверительные интервалы лучше, чем тесты гипотез, для количественной оценки неопределенности в отношении размера и направления эффекта. [16]

Только в 1980-х годах журналы требовали, чтобы в статьях указывались доверительные интервалы и p-значения. К 1992 году неточные оценки все еще были обычным явлением даже для крупных испытаний. Это помешало принять четкое решение относительно нулевой гипотезы. Например, исследование медикаментозной терапии острого инсульта пришло к выводу, что лечение инсульта может снизить или увеличить смертность на 10–20%. Строгий допуск к исследованию привел к непредвиденной ошибке, еще больше увеличив неопределенность в заключении. Исследования продолжались, и только в 1997 году исследование с большим пулом выборок и приемлемым доверительным интервалом смогло дать окончательный ответ: терапия кортизолом не снижает риск острого инсульта. [16]

Философские вопросы [ править ]

Принцип, лежащий в основе доверительных интервалов, был сформулирован, чтобы дать ответ на вопрос, поднятый при статистическом выводе, о том, как бороться с неопределенностью, присущей результатам, полученным на основе данных, которые сами по себе являются лишь случайно выбранным подмножеством населения. Есть и другие ответы, в частности те, которые дает байесовский вывод в виде достоверных интервалов.. Доверительные интервалы соответствуют выбранному правилу для определения доверительных границ, где это правило по существу определяется до получения каких-либо данных или до проведения эксперимента. Правило определяется таким образом, что среди всех возможных наборов данных, которые могут быть получены, существует высокая вероятность («высокая» конкретно определяется количественно) того, что интервал, определенный правилом, будет включать истинное значение рассматриваемой величины. Байесовский подход, по-видимому, предлагает интервалы, которые могут, при условии принятия интерпретации «вероятности» как байесовской вероятности., следует интерпретировать как означающее, что определенный интервал, рассчитанный на основе данного набора данных, имеет определенную вероятность включения истинного значения в зависимости от данных и другой доступной информации. Подход с использованием доверительного интервала не позволяет этого, поскольку в этой формулировке и на этом же этапе и границы интервала, и истинные значения являются фиксированными значениями, и случайность отсутствует. С другой стороны, байесовский подход действителен ровно настолько, насколько важна априорная вероятность, используемая в вычислениях, тогда как доверительный интервал не зависит от предположений относительно априорной вероятности.

Вопросы о том, как можно сформулировать интервал, выражающий неопределенность в оценке, и как можно интерпретировать такие интервалы, не являются строго математическими проблемами и представляют собой философские проблемы. [17] Математика может взять верх, как только будут установлены основные принципы подхода к «умозаключениям», но она играет лишь ограниченную роль в объяснении того, почему один подход должен быть предпочтительнее другого: например, уровень достоверности 95% является часто используется в биологических науках , но это вопрос соглашения или арбитража. В физических науках можно использовать гораздо более высокий уровень. [18]

Связь с другими статистическими темами [ править ]

Статистическая проверка гипотез [ править ]

Доверительные интервалы тесно связаны с проверкой статистической значимости . Например, если для некоторого оцениваемого параметра θ нужно проверить нулевую гипотезу о том, что θ  = 0, против альтернативы, что θ  ≠ 0, то этот тест можно выполнить, определив, содержит ли доверительный интервал для θ 0.

В более общем плане, учитывая доступность процедуры проверки гипотезы, которая может проверять нулевую гипотезу θ  =  θ 0 против альтернативы θ  ≠  θ 0 для любого значения θ 0 , тогда доверительный интервал с уровнем достоверности  γ  = 1 -  α может быть определяется как содержащее любое число θ 0, для которого соответствующая нулевая гипотеза не отклоняется на уровне значимости  α . [19]

Если оценки двух параметров (например, средние значения переменной в двух независимых группах) имеют доверительные интервалы, которые не перекрываются, то разница между двумя значениями более значима, чем разница , указанная отдельными значениями α . [20] Таким образом, этот «тест» слишком консервативен и может привести к результату, более значимому, чем могут показаться отдельными значениями α . Если два доверительных интервала перекрываются, два средних значения могут существенно отличаться. [21] [22] [23] Соответственно, и в соответствии с критерием хи-квадрат Мантеля-Хензеля, является предлагаемым исправлением, с помощью которого можно уменьшить границы ошибки для двух средних, умножив их на квадратный корень из ½ (0,707107) перед проведением сравнения. [24]

Хотя формулировки понятий доверительных интервалов и проверки статистических гипотез различны, они в некотором смысле связаны и в некоторой степени дополняют друг друга. Хотя не все доверительные интервалы построены таким образом, один из общих подходов к построению доверительных интервалов состоит в том, чтобы определить доверительный интервал 100 (1 -  α )%, состоящий из всех тех значений θ 0, для которых выполняется проверка гипотезы θ  =  θ. 0не отклоняется на уровне значимости 100α%. Такой подход не всегда может быть доступен, поскольку он предполагает практическую доступность соответствующего критерия значимости. Естественно, любые допущения, необходимые для проверки значимости, будут перенесены в доверительные интервалы.

Может быть удобно сделать общее соответствие, что значения параметров в пределах доверительного интервала эквивалентны тем значениям, которые не были бы отклонены проверкой гипотезы, но это было бы опасно. Во многих случаях цитируемые доверительные интервалы действительны только приблизительно, возможно, на основе «плюс-минус удвоенной стандартной ошибки», и последствия этого для предположительно соответствующих тестов гипотез обычно неизвестны.

Стоит отметить, что доверительный интервал для параметра не совпадает с допустимой областью теста для этого параметра, как иногда думают. Доверительный интервал является частью пространства параметров, тогда как приемлемая область является частью пространства образца. По той же причине уровень достоверности не совпадает с дополнительной вероятностью уровня значимости. [ требуется дальнейшее объяснение ]

Доверительный регион [ править ]

Доверительные области обобщают концепцию доверительного интервала для работы с несколькими величинами. Такие регионы могут указывать не только на степень вероятных ошибок выборки, но также могут указывать на то, так ли это, например, что если оценка для одной величины ненадежна, то другая, вероятно, также будет ненадежной.

Группа уверенности [ править ]

Доверительный интервал используется в статистическом анализе , чтобы представлять неопределенность в оценке кривой или функции на основе ограниченных или зашумленных данных. Точно так же полоса прогнозирования используется для представления неопределенности относительно значения новой точки данных на кривой, но с учетом шума. Полосы уверенности и прогноза часто используются как часть графического представления результатов регрессионного анализа .

Полосы достоверности тесно связаны с доверительными интервалами, которые представляют собой неопределенность в оценке одного числового значения. «Поскольку доверительные интервалы по своей конструкции относятся только к одной точке, они уже (в этой точке), чем доверительный интервал, который должен удерживаться одновременно во многих точках». [25]

Основные шаги [ править ]

В этом примере предполагается, что образцы взяты из нормального распределения . Основная процедура расчета доверительного интервала для среднего значения совокупности выглядит следующим образом:

1. Определить выборочное среднее, .
2. Определите, известно ли стандартное отклонение генеральной совокупности или оно неизвестно и оценивается с помощью стандартного отклонения выборки .
  • Если стандартное отклонение населения известно тогда , когда это уровень доверия и является ВПР из стандартного нормального распределения , используются в качестве критического значения. Это значение зависит только от уровня достоверности теста. Типичные двусторонние уровни достоверности: [26]
  • Если стандартное отклонение населения неизвестно , то в Стьюденте т распределение используется в качестве критического значения. Это значение зависит от уровня достоверности (C) теста и степеней свободы. Степени свободы находятся путем вычитания единицы из числа наблюдений, n  - 1. Критическое значение находится из таблицы t-распределения. В этой таблице критическое значение записано как , где - степени свободы и .
3. Подставьте найденные значения в соответствующие уравнения:
  • Для известного стандартного отклонения:
  • Для неизвестного стандартного отклонения: [27]
Нормальное распределение: графическое представление разбивки доверительных интервалов и отношения доверительных интервалов к z- и t-баллам.

Значение t-таблиц и z-таблиц [ править ]

Доверительные интервалы могут быть рассчитаны с использованием двух разных значений: t-значений или z-значений, как показано в базовом примере выше. Оба значения сведены в таблицы на основе степеней свободы и хвоста распределения вероятностей. Чаще используются z-значения. Это критические значения нормального распределения с вероятностью правого хвоста. Однако t-значения используются, когда размер выборки меньше 30 и стандартное отклонение неизвестно. [1] [28]

Когда дисперсия неизвестна, мы должны использовать другой оценщик: . Это позволяет сформировать распределение, которое зависит только от и плотность которого может быть выражена явно. [1]

Определение: Непрерывная случайная величина имеет t-распределение с параметром m, где - целое число, если ее плотность вероятности дается формулой for , где . Это распределение обозначается и называется t-распределением с m степенями свободы. [1]


Пример: Использование таблицы t- распределения [29]

1. Найдите степени свободы (df) по размеру выборки:

Если размер выборки = 10, df = 9.

2. Вычтите доверительный интервал (CL) из 1 и затем разделите его на два. Это значение альфа-уровня. (альфа + CL = 1)

2. Посмотрите df и alpha в таблице t-распределения. Для df = 9 и альфа = 0,01 таблица дает значение 2,821. Это значение, полученное из таблицы, является t-баллом.

Статистическая теория [ править ]

Определение [ править ]

Пусть X - случайная выборка из распределения вероятностей со статистическим параметром θ , который является величиной, которую необходимо оценить, и φ , представляющими величины, которые не представляют непосредственного интереса. Доверительный интервал для параметра & thetas , с уровнем достоверности или доверительным коэффициентом гаммой , представляет собой интервал со случайными конечными точками ( U ( X ),  v ( X )), определяемой парой случайных величин ¯u ( X ) и V ( X), со свойством:

Величины φ, которые не представляют непосредственного интереса, называются мешающими параметрами , так как статистической теории еще нужно найти способ справиться с ними. Число γ с типичными значениями, близкими, но не превышающими 1, иногда задается в виде 1 -  α (или в процентах 100% · (1 -  α )), где α - небольшое неотрицательное число, близкое до 0.

Здесь Pr θ , φ обозначает распределение вероятностей X, характеризуемое ( θφ ). Важной частью этой спецификации является то, что случайный интервал ( u ( X ),  v ( X )) покрывает неизвестное значение θ с высокой вероятностью, независимо от того, каково истинное значение θ на самом деле.

Обратите внимание, что здесь Pr θ , φ не обязательно относится к явно заданному параметризованному семейству распределений, хотя это часто бывает. Подобно тому, как случайная величина X теоретически соответствует другим возможным реализациям x из той же совокупности или из той же версии реальности, параметры ( θφ ) указывают, что нам необходимо рассмотреть другие версии реальности, в которых распределение X может имеют разные характеристики.

В конкретной ситуации, когда x является результатом выборки X , интервал ( u ( x ),  v ( x )) также называется доверительным интервалом для θ . Обратите внимание, что больше нельзя сказать, что (наблюдаемый) интервал ( u ( x ),  v ( x )) имеет вероятность γ содержать параметр θ . Этот наблюдаемый интервал является лишь одной реализацией всех возможных интервалов, для которых выполняется утверждение вероятности.

Приблизительные доверительные интервалы [ править ]

Во многих приложениях трудно построить доверительные интервалы, которые имеют точно требуемый уровень достоверности. Но практически полезные интервалы все же можно найти: правило построения интервала можно принять как обеспечивающее доверительный интервал на уровне, если

до приемлемого уровня приближения. В качестве альтернативы некоторые авторы [30] просто требуют, чтобы

что полезно, если вероятности определены только частично или неточны , а также при работе с дискретными распределениями . Доверительные границы формы и называются консервативными ; [31] соответственно, говорят о консервативных доверительных интервалах и в целом о регионах.

Желаемые свойства [ править ]

При применении стандартных статистических процедур часто используются стандартные способы построения доверительных интервалов. Они будут разработаны с учетом определенных желаемых свойств, которые будут выполняться при условии, что предположения, на которых основана процедура, верны. Эти желательные свойства могут быть описаны как достоверность, оптимальность и инвариантность. Из них наиболее важна «достоверность», за которой следует «оптимальность». «Инвариантность» можно рассматривать как свойство метода получения доверительного интервала, а не правила построения интервала. В нестандартных приложениях требуются те же желаемые свойства.

  • Срок действия. Это означает, что номинальная вероятность охвата (доверительный уровень) доверительного интервала должна соблюдаться либо точно, либо с хорошим приближением.
  • Оптимальность. Это означает, что правило построения доверительного интервала должно максимально использовать информацию из набора данных. Вспомните, что можно выбросить половину набора данных и все же получить допустимый доверительный интервал. Один из способов оценки оптимальности - по длине интервала, так что правило построения доверительного интервала оценивается лучше, чем другое, если оно приводит к интервалам, длина которых обычно короче.
  • Инвариантность. Во многих приложениях оцениваемое количество не может быть точно определено как таковое. Например, опрос может привести к оценке среднего дохода населения, но в равной степени его можно также рассматривать как оценку логарифма среднего дохода, учитывая, что это обычная шкала для представления графических результатов. Было бы желательно, чтобы метод, используемый для построения доверительного интервала для медианного дохода, давал эквивалентные результаты при применении к построению доверительного интервала для логарифма медианного дохода: в частности, значения на концах последнего интервала будут логарифмами. значений на концах предыдущего интервала.

Методы вывода [ править ]

Для нестандартных приложений существует несколько путей, по которым можно вывести правило построения доверительных интервалов. Установленные правила для стандартных процедур можно обосновать или объяснить несколькими из этих способов. Обычно правило построения доверительных интервалов тесно связано с конкретным способом нахождения точечной оценки рассматриваемой величины.

Сводные статистические данные
Это тесно связано с методом оценки моментов . Возникает простой пример, когда оцениваемая величина является средним значением, и в этом случае естественной оценкой является выборочное среднее. Обычные аргументы указывают на то, что дисперсию выборки можно использовать для оценки дисперсии выборочного среднего. Доверительный интервал для истинного среднего может быть построен на основе выборочного среднего с шириной, кратной квадратному корню из выборочной дисперсии.
Теория правдоподобия
Если оценки строятся с использованием принципа максимального правдоподобия , теория для этого предоставляет два способа построения доверительных интервалов или доверительных областей для оценок. [ требуется пояснение ] Один из способов - с помощью теоремы Уилкса найти все возможные значения, которые удовлетворяют следующему ограничению: [32]
Оценочные уравнения
Подход оценивания здесь можно рассматривать как обобщение метода моментов и как обобщение подхода максимального правдоподобия. Существуют соответствующие обобщения результатов теории максимального правдоподобия, которые позволяют строить доверительные интервалы на основе оценок, полученных из оценочных уравнений . [ требуется разъяснение ]
Проверка гипотезы
Если для общих значений параметра доступны тесты значимости, то доверительные интервалы / области могут быть построены путем включения в 100 p % доверительную область всех тех точек, для которых выполняется проверка значимости нулевой гипотезы о том, что истинное значение является заданным значением. не отклонено на уровне значимости (1 -  p ). [19]
Начальная загрузка
В ситуациях, когда предположения о распределении для вышеуказанных методов являются неопределенными или нарушаются, методы повторной выборки позволяют построить доверительные интервалы или интервалы прогнозирования. Наблюдаемое распределение данных и внутренние корреляции используются в качестве суррогата корреляций в более широкой популяции.

Примеры [ править ]

Практический пример [ править ]

Машина наполняет стаканы жидкостью и должна быть отрегулирована так, чтобы в стаканчиках содержалось 250 г жидкости. Поскольку машина не может наполнить каждую чашку ровно 250,0 г, содержимое, добавляемое в отдельные чашки, демонстрирует некоторые вариации и считается случайной величиной X. Предполагается, что это изменение обычно распределяется вокруг желаемого среднего значения 250 г со стандартным отклонением. , σ , 2,5 г. Чтобы определить, правильно ли откалибрована машина,  случайным образом выбирается образец из n = 25 чашек с жидкостью и чашки взвешиваются. Полученные в результате измерений массы жидкости Х 1 , ...,  X 25 , случайная выборка из  X .

Чтобы получить представление об ожидании μ , достаточно дать оценку. Соответствующим оценщиком является выборочное среднее:

В примере показаны фактические веса x 1 , ...,  x 25 со средним значением:

Если мы возьмем еще один образец из 25 чашек, мы легко сможем найти средние значения, такие как 250,4 или 251,1 грамма. Однако среднее значение образца в 280 граммов будет крайне редким, если среднее содержание чашек действительно близко к 250 граммов. Существует целый интервал вокруг наблюдаемого значения 250,2 грамма выборочного среднего, в пределах которого, если бы среднее значение генеральной совокупности фактически принимает значение в этом диапазоне, наблюдаемые данные не будут считаться особенно необычными. Такой интервал называется доверительным интервалом для параметра  μ . Как рассчитать такой интервал? Конечные точки интервала должны быть рассчитаны на основе выборки, поэтому они являются статистикой, функциями выборки X 1 , ...,  X 25 и, следовательно, сами случайные величины.

В нашем случае мы можем определить конечные точки, учитывая, что выборочное среднее X из нормально распределенной выборки также нормально распределено с тем же математическим ожиданием μ , но со стандартной ошибкой :

Путем стандартизации получаем случайную величину:

зависит от параметра μ, который необходимо оценить, но со стандартным нормальным распределением, не зависящим от параметра  μ . Следовательно, можно найти числа - z и z , не зависящие от  μ , между которыми Z лежит с вероятностью 1 - α, мера того, насколько мы уверены в себе.

Возьмем, например, 1 - α = 0,95. Итак, у нас есть:

Число z следует из кумулятивной функции распределения , в данном случае кумулятивной функции нормального распределения :

и получаем:

Другими словами, нижняя конечная точка 95% доверительного интервала:

а верхняя конечная точка 95% доверительного интервала:

Со значениями в этом примере:

Итак, 95% доверительный интервал:

Поскольку в этом случае стандартное отклонение совокупности σ известно, распределение выборочного среднего является нормальным распределением с единственным неизвестным параметром. В теоретическом примере ниже, σ параметр также неизвестен, что требует использования в Стьюденте т распределения .

Интерпретация[ редактировать ]

Это можно интерпретировать так: с вероятностью 0,95 мы найдем доверительный интервал, в котором значение параметра μ будет между стохастическими конечными точками

и

Это не означает, что существует вероятность 0,95 того, что значение параметра μ находится в интервале, полученном с использованием текущего вычисленного значения выборочного среднего,

Вместо этого каждый раз, когда измерения повторяются, будет другое значение для среднего  X образца. В 95% случаев μ будет между конечными точками, рассчитанными на основе этого среднего значения, но в 5% случаев это не будет. Фактический доверительный интервал рассчитывается путем ввода измеренных масс в формулу. Наш доверительный интервал 0,95 становится:

Сегменты синей вертикальной линии представляют 50 реализаций доверительного интервала для среднего генерального значения μ , представленного красной горизонтальной пунктирной линией; Обратите внимание, что некоторые доверительные интервалы не содержат среднего значения генеральной совокупности, как ожидалось.

Другими словами, 95% доверительный интервал находится между нижней конечной точкой 249,22 г и верхней конечной точкой 251,18 г.

Поскольку желаемое значение 250 μ находится в пределах полученного доверительного интервала, нет никаких оснований полагать, что прибор откалиброван неправильно.

Вычисленный интервал имеет фиксированные конечные точки, где μ может быть промежуточным (или нет). Таким образом , это событие имеет вероятность либо 0 , либо 1. Один не может сказать: «с вероятностью (1 -  альфа ) параметр М лежит в доверительном интервале.» Известно только, что при повторении в 100 (1 -  α )% случаев μ окажется в расчетном интервале. Однако в 100α% случаев это не так. И, к сожалению, неизвестно, в каких случаях это происходит. Вот почему (вместо использования термина «вероятность») можно сказать: «при уровне достоверности 100 (1 - α)% μ  лежит в доверительном интервале».

Расчетная максимальная ошибка составляет 0,98, поскольку это разница между значением, в котором мы уверены, с верхней или нижней конечной точкой.

На рисунке справа показаны 50 реализаций доверительного интервала для данного среднего значения μ . Если мы случайным образом выберем одну реализацию, то с вероятностью 95% мы выберем интервал, содержащий параметр; однако, возможно, нам не повезло и мы выбрали не тот. Мы никогда не узнаем; мы застряли в нашем интервале.

Медицинские примеры [ править ]

В медицинских исследованиях часто оцениваются эффекты вмешательства или воздействия на определенную популяцию. [33] Обычно исследователи определяют значимость эффектов на основе p-значения; однако в последнее время возникла потребность в дополнительной статистической информации, чтобы обеспечить более надежную основу для оценок. [33] Одним из способов решения этой проблемы является также требование предоставления отчета о доверительном интервале. Ниже приведены два примера того, как доверительные интервалы используются и используются для исследований.

В исследовании 2004 года Бритон и его коллеги провели исследование по оценке связи бесплодия с раком яичников. Отношение заболеваемости 1,98 было зарегистрировано для 95% доверительного интервала (ДИ) с диапазоном отношения от 1,4 до 2,6. [34] В статье приводятся следующие статистические данные: «(стандартизованный коэффициент заболеваемости = 1,98; 95% ДИ 1,4–2,6)». [34] Это означает, что, согласно исследованной выборке, у бесплодных женщин заболеваемость раком яичников в 1,98 раза выше, чем у бесплодных женщин. Кроме того, это также означает, что мы на 95% уверены в том, что истинный коэффициент заболеваемости среди всей бесплодной женской популяции находится в диапазоне от 1,4 до 2,6. [34]В целом, доверительный интервал предоставил больше статистической информации, поскольку он сообщил о самых низких и максимальных эффектах, которые могут возникнуть для исследуемой переменной, при этом предоставляя информацию о значимости наблюдаемых эффектов. [33]

В исследовании 2018 года распространенность и бремя заболевания атопическим дерматитом среди взрослого населения США были изучены с использованием 95% доверительных интервалов. [35] Сообщалось, что среди 1278 участвовавших взрослых распространенность атопического дерматита составляла 7,3% (5,9–8,8). [35] Кроме того, у 60,1% (56,1–64,1) участников был атопический дерматит легкой степени, в то время как у 28,9% (25,3–32,7) была умеренная, а у 11% (8,6–13,7) - тяжелая. [35] Исследование подтвердило высокую распространенность и бремя заболеваний атопическим дерматитом среди населения.

Теоретический пример [ править ]

Предположим, что { X 1 , ...,  X n } является независимой выборкой из нормально распределенной совокупности с неизвестным ( параметрами ) средним μ и дисперсией σ 2 . Позволять

Где X - выборочное среднее , а S 2 - выборочная дисперсия . потом

имеет Стьюдента т распределение с п - 1 степенями свободы. [36] Отметим, что распределение T не зависит от значений ненаблюдаемых параметров μ и σ 2 ; т.е. это основная величина . Предположим, мы хотим рассчитать 95% доверительный интервал для  μ . Затем, обозначив c как 97,5-й процентиль этого распределения,

Обратите внимание, что "97,5-е" и "0,95" верны в предыдущих выражениях. Существует вероятность 2,5%, что будет меньше, и вероятность 2,5%, что будет больше, чем . Таким образом, вероятность того, что будет между и, составляет 95%.

Как следствие,

и у нас есть теоретический (стохастический) 95% доверительный интервал для  μ .

После наблюдения за образцом мы находим значения x для X и s для S , из которых вычисляем доверительный интервал

интервал с фиксированными числами в качестве конечных точек, о котором мы уже не можем сказать, что существует определенная вероятность, что он содержит параметр  μ ; либо μ находится в этом интервале, либо нет.

Альтернативы и критика [ править ]

Доверительные интервалы - это один из методов интервальной оценки , наиболее широко используемый в частотной статистике . Аналогичная концепция в байесовской статистике - это достоверные интервалы , в то время как альтернативный частотный метод - это метод прогнозирования интервалов, которые вместо оценки параметров оценивают результат будущих выборок. Для других подходов к выражению неопределенности с использованием интервалов см. Интервальную оценку .

Сравнение с интервалами прогноза [ править ]

Интервал предсказания для случайной величины определяется аналогично доверительного интервала для статистического параметра . Рассмотрим дополнительную случайную величину Y , которые могут или не могут быть статистически зависит от случайной выборки X . Тогда ( у ( х ),  v ( Х )) обеспечивает интервал предсказания для пока еще, чтобы быть наблюдаемое значение у из Y , если

Здесь Pr θ , φ обозначает совместное распределение вероятностей случайных величин ( XY ), где это распределение зависит от статистических параметров  ( θφ ).

Сравнение с интервалами допуска [ править ]

Сравнение с байесовскими интервальными оценками[ редактировать ]

Оценка байесовского интервала называется достоверным интервалом . Используя во многом те же обозначения, что и выше, определение вероятного интервала для неизвестного истинного значения θ для данного γ : [37]

Здесь Θ используется, чтобы подчеркнуть, что неизвестное значение θ рассматривается как случайная величина. Определения двух типов интервалов можно сравнить следующим образом.

  • Определение доверительного интервала включает вероятности, вычисленные из распределения X для заданного ( θφ ) (или условного от этих значений), и условие должно выполняться для всех значений ( θφ ).
  • Определение вероятного интервала включает вероятности, вычисленные из распределения, обусловленного наблюдаемыми значениями X  =  x и маргинализованными (или усредненными) по значениям Φ, где эта последняя величина является случайной величиной, соответствующей неопределенности относительно помех. параметры в  φ .

Обратите внимание, что обработка вышеупомянутых мешающих параметров часто опускается в обсуждениях, сравнивающих достоверность и достоверные интервалы, но она заметно отличается в двух случаях.

В некоторых случаях доверительный интервал и доверительный интервал, вычисленные для данного параметра с использованием данного набора данных, идентичны. Но в других случаях они могут сильно отличаться, особенно если информативная априорная информация включена в байесовский анализ .

Существуют разногласия относительно того, какой из этих методов дает наиболее полезные результаты: математика вычислений редко подвергается сомнению - доверительные интервалы основаны на выборочных распределениях, достоверные интервалы основаны на теореме Байеса - но применение этих методов дает полезность и интерпретация производимой статистики, обсуждается.

Доверительные интервалы для пропорций и связанных количеств [ править ]

Приблизительный доверительный интервал для среднего значения совокупности может быть построен для случайных величин, которые обычно не распределяются в совокупности, на основе центральной предельной теоремы , если размеры выборки и количество достаточно велики. Формулы идентичны приведенному выше случаю (где выборочное среднее фактически нормально распределяется вокруг среднего генерального значения). Приближение будет достаточно хорошим, если в выборке будет всего несколько десятков наблюдений, если распределение вероятностей случайной величины не слишком отличается от нормального распределения (например, ее кумулятивная функция распределения не имеет разрывов и ее асимметрия умеренная).

Один из типов выборочного среднего - это среднее значение индикаторной переменной., который принимает значение 1 для истины и значение 0 для ложного. Среднее значение такой переменной равно доле, в которой переменная равна единице (как в генеральной совокупности, так и в любой выборке). Это полезное свойство индикаторных переменных, особенно для проверки гипотез. Чтобы применить центральную предельную теорему, необходимо использовать достаточно большую выборку. Приблизительное эмпирическое правило состоит в том, что нужно видеть как минимум 5 случаев, когда показатель равен 1, и как минимум 5 случаев, когда он равен 0. Доверительные интервалы, построенные с использованием приведенных выше формул, могут включать отрицательные числа или числа больше 1, но пропорции, очевидно, не может быть отрицательным или превышать 1. Кроме того, пропорции выборки могут принимать только конечное число значений, поэтому центральная предельная теорема и нормальное распределение - не лучшие инструменты для построения доверительного интервала. Видеть "Доверительный интервал биномиальной пропорции »для лучших методов, специфичных для этого случая.

Контрпримеры[ редактировать ]

С тех пор, как была предложена теория доверительных интервалов, был разработан ряд контрпримеров теории, чтобы показать, как интерпретация доверительных интервалов может быть проблематичной, по крайней мере, если интерпретировать их наивно.

Доверительная процедура для единой локации [ править ]

Велч [38] представил пример, который ясно показывает разницу между теорией доверительных интервалов и другими теориями интервальной оценки (включая опорные интервалы Фишера и объективные байесовские интервалы). Робинсон [39] назвал этот пример «[п] возможно, самым известным контрпримером для версии теории доверительных интервалов Неймана». Уэлчу это показало превосходство теории доверительного интервала; критикам теории это показывает недостаток. Здесь мы представляем упрощенную версию.

Предположим, что это независимые наблюдения из равномерного ( θ - 1/2, θ + 1/2) распределения. Тогда оптимальная 50% доверительная процедура [40] является

Фидуциарный или объективный байесовский аргумент может использоваться для получения интервальной оценки.

что также является процедурой с 50% доверительной вероятностью. Уэлч показал, что первая доверительная процедура преобладает над второй, согласно требованиям теории доверительных интервалов; для каждого вероятность того, что первая процедура содержит , меньше или равна вероятности, содержащейся во второй процедуре . Средняя ширина интервалов у первой процедуры меньше, чем у второй. Следовательно, первая процедура предпочтительнее в рамках классической теории доверительных интервалов.

Однако, когда интервалы из первой процедуры гарантированно содержат истинное значение : Следовательно, номинальный 50% доверительный коэффициент не связан с неопределенностью, которую мы должны иметь, чтобы конкретный интервал содержал истинное значение. Вторая процедура не имеет этого свойства.

Более того, когда первая процедура генерирует очень короткий интервал, это указывает на то, что они находятся очень близко друг к другу и, следовательно, предлагают информацию только в одной точке данных. Но первый интервал исключит практически все разумные значения параметра из-за его малой ширины. Вторая процедура не имеет этого свойства.

Два противоречащих интуиции свойства первой процедуры - 100% покрытие, когда они далеко друг от друга, и почти 0% покрытие, когда они расположены близко друг к другу - уравновешиваются, давая в среднем 50% покрытие. Однако, несмотря на то, что первая процедура является оптимальной, ее интервалы не дают ни оценки точности оценки, ни оценки неопределенности, необходимой для того, чтобы интервал содержал истинное значение.

Этот контрпример используется, чтобы выступить против наивных интерпретаций доверительных интервалов. Если утверждается, что доверительная процедура имеет свойства, выходящие за рамки номинального покрытия (например, отношение к точности или отношение с байесовским выводом), эти свойства должны быть доказаны; они не вытекают из того факта, что процедура является процедурой доверия.

Доверительная процедура для ω 2 [ править ]

Steiger [41] предложил ряд доверительных процедур для общих мер размера эффекта в ANOVA . Morey et al. [12] отмечают, что некоторые из этих доверительных процедур, в том числе процедура для ω 2 , обладают тем свойством, что по мере того, как F- статистика становится все более малой, что указывает на несоответствие всем возможным значениям ω 2, доверительный интервал сокращается и может даже содержать только единственное значение ω 2  = 0; то есть CI бесконечно узкий (это происходит при использовании CI).

Такое поведение согласуется с взаимосвязью между процедурой достоверности и проверкой значимости: поскольку F становится настолько малым, что групповые средние значения оказываются гораздо ближе друг к другу, чем мы могли бы случайно ожидать, проверка значимости может указывать на отклонение большинства или всех значений ω 2 . Следовательно, интервал будет очень узким или даже пустым (или, по соглашению, предложенному Штейгером, содержащим только 0). Однако это не означает, что оценка ω 2 очень точна. В некотором смысле это указывает на обратное: достоверность самих результатов может быть под сомнением. Это противоречит общепринятой интерпретации доверительных интервалов, согласно которым они показывают точность оценки.

См. Также [ править ]

  • Непараметрический доверительный интервал на основе кумулятивной функции распределения
  • Верхние пределы CL (физика элементарных частиц)
  • Распределение уверенности
  • Доверие (статистика)
  • Панель ошибок
  • Статистика оценок
  • p-значение
  • Надежные доверительные интервалы
  • Доверительный регион
  • Достоверный интервал

Доверительный интервал для конкретных распределений [ править ]

  • Доверительный интервал для биномиального распределения
  • Доверительный интервал для показателя степени распределения по степенному закону
  • Доверительный интервал для среднего экспоненциального распределения
  • Доверительный интервал для среднего значения распределения Пуассона
  • Доверительные интервалы для среднего и дисперсии нормального распределения

Ссылки [ править ]

  1. ^ a b c d e f Деккинг, FM (Фредерик Мишель) (2005). Современное введение в вероятность и статистику: понимание, почему и как . Springer. ISBN 1-85233-896-2. OCLC  783259968 .
  2. ^ a b c Ильловски, Барбара. Вводная статистика . Декан, Сьюзан Л., 1945 г., Илловски, Барбара, колледж OpenStax. Хьюстон, Техас. ISBN 978-1-947172-05-0. OCLC  899241574 .
  3. ^ Зар, Джеррольд Х. (199). Биостатистический анализ (4-е изд.). Река Аппер Сэдл, штат Нью-Джерси: Prentice Hall. С. 43–45. ISBN 978-0130815422. OCLC  39498633 .
  4. ^ Cox DR, Hinkley DV (1974) Теоретическая статистика , Chapman & Hall, p49, p209
  5. ^ a b Нейман, Дж. (1937). «Очерк теории статистического оценивания на основе классической теории вероятностей» . Философские труды Королевского общества А . 236 (767): 333–380. Bibcode : 1937RSPTA.236..333N . DOI : 10,1098 / rsta.1937.0005 . JSTOR 91337 . 
  6. ^ Cox DR, Hinkley DV (1974) Теоретическая статистика, Chapman & Hall, стр 214, 225, 233
  7. ^ [1]
  8. ^ «Архивная копия» (PDF) . Архивировано из оригинального (PDF) 04 марта 2016 года . Проверено 16 сентября 2014 . CS1 maint: archived copy as title (link)
  9. ^ Хоекстра, Р., Р. Мори, JN Rouder и EJ. Wagenmakers, 2014. Устойчивое неверное толкование доверительных интервалов. Обзор Psychonomic Bulletin, в печати. [2]
  10. ^ Понимание учеными доверительных интервалов не внушает доверия , Science News , 3 июля 2014 г.
  11. ^ a b Гренландия, Сандер; Сенн, Стивен Дж .; Ротман, Кеннет Дж .; Карлин, Джон Б .; Пул, Чарльз; Гудман, Стивен Н .; Альтман, Дуглас Г. (апрель 2016 г.). «Статистические тесты, значения P, доверительные интервалы и мощность: руководство по ошибочным интерпретациям» . Европейский журнал эпидемиологии . 31 (4): 337–350. DOI : 10.1007 / s10654-016-0149-3 . ISSN 0393-2990 . PMC 4877414 . PMID 27209009 .   
  12. ^ a b Морей, RD; Hoekstra, R .; Rouder, JN; Ли, доктор медицины; Wagenmakers, E.-J. (2016). «Заблуждение помещать уверенность в доверительные интервалы» . Психономический бюллетень и обзор . 23 (1): 103–123. DOI : 10,3758 / s13423-015-0947-8 . PMC 4742505 . PMID 26450628 .  
  13. ^ «1.3.5.2. Пределы уверенности для среднего» . nist.gov . Архивировано из оригинала на 2008-02-05 . Проверено 16 сентября 2014 .
  14. ^ Мэйо, Д.Г. (1981) "В защиту теории доверительных интервалов Неймана-Пирсона" , Philosophy of Science , 48 (2), 269–280. JSTOR  187185
  15. ^ [Нейман, Дж., 1937. Очерк теории статистического оценивания, основанный на классической теории вероятностей. Философские труды Лондонского королевского общества. Series A, Mathematical and Physical Sciences, 236 (767), pp.333-380]
  16. ^ a b Сандеркок, Питер А.Г. (2015). «Краткая история доверительных интервалов» . Инсульт . Ovid Technologies (Wolters Kluwer Health). 46 (8). DOI : 10.1161 / strokeaha.115.007750 . ISSN 0039-2499 . 
  17. ^ Т. Зайденфельд, Философские проблемы статистического вывода: уроки Р. А. Фишера , Springer-Verlag, 1979
  18. ^ «Статистическая значимость, определенная с использованием стандарта пяти сигм» .
  19. ^ a b Кокс Д. Р., Хинкли Д. В. (1974) Теоретическая статистика, Чепмен и Холл, раздел 7.2 (iii)
  20. ^ Пав Калиновский, « Понимание доверительных интервалов (ДИ) и оценка размера эффекта », Observer Vol.23, No4, апрель 2010 г.)
  21. ^ Андреа Кнежевич, « Перекрывающиеся доверительные интервалы и статистическая значимость », StatNews # 73: Cornell Statistical Consulting Unit, октябрь 2008 г.
  22. ^ Goldstein, H .; Хили, MJR (1995). «Графическое представление коллекции средств». Журнал Королевского статистического общества . 158 (1): 175–77. CiteSeerX 10.1.1.649.5259 . DOI : 10.2307 / 2983411 . JSTOR 2983411 .  
  23. Wolfe R, Hanley J (январь 2002 г.). «Если мы такие разные, почему мы продолжаем пересекаться? Когда 1 плюс 1 не дает 2» . CMAJ . 166 (1): 65–6. PMC 99228 . PMID 11800251 .  
  24. ^ Дэниел Смит, « Перекрывающиеся доверительные интервалы не являются статистическим тестом. Архивировано 22 февраля 2016 г. на Wayback Machine », Департамент здравоохранения Калифорнии, 26-й Ежегодный институт исследований и статистики, Сакраменто, Калифорния, март 2005 г.
  25. ^ стр.65 в W. Härdle, M. Müller, S. Sperlich, A. Werwatz (2004), Непараметрические и полупараметрические модели, Springer, ISBN 3-540-20722-8 
  26. ^ «Проверка статистических критических значений доверительного интервала - для чайников» . www.dummies.com . Проверено 11 февраля 2016 .
  27. ^ «Доверительные интервалы» . www.stat.yale.edu . Проверено 11 февраля 2016 .
  28. ^ "Доверительные интервалы с z и t-распределениями | Джейкоб Монтгомери" . pages.wustl.edu . Проверено 14 декабря 2019 .
  29. ^ Вероятность и статистика для инженеров и ученых . Уолпол, Рональд Э., Майерс, Раймонд Х., Майерс, Шэрон Л., 1944-, Йе, Кейинг. (9-е изд.). Бостон: Прентис Холл. 2012. ISBN 978-0-321-62911-1. OCLC  537294244 .CS1 maint: others (link)
  30. ^ Джордж Г. Руссас (1997) Курс математической статистики, 2-е издание, Academic Press, p397
  31. ^ Кокс Д. Р., Хинкли Д. В. (1974) Теоретическая статистика, Чепмен и Холл, стр. 210
  32. Абрамович, Феликс и Яаков Ритов. Статистическая теория: краткое введение. CRC Press, 2013. Страницы 121–122.
  33. ^ a b c Аттия, Абдельхамид (декабрь 2005 г.). "Уголок доказательной медицины - почему исследователи должны сообщать доверительный интервал в современных исследованиях?" . Журнал Ближневосточного общества фертильности . 10 .
  34. ^ a b c Бринтон, Луиза А; Лэмб, Эммет Дж; Могисси, Камран С; Скочча, Берт; Althuis, Michelle D; Маби, Джером Э; Вестхофф, Кэролайн Л. (август 2004 г.). «Риск рака яичников, связанный с различными причинами бесплодия». Фертильность и бесплодие . 82 (2): 405–414. DOI : 10.1016 / j.fertnstert.2004.02.109 . ISSN 0015-0282 . PMID 15302291 .  
  35. ^ a b c Chiesa Fuxench, Zelma C .; Блок, Джули К .; Богуневич, Марк; Бойл, Джон; Фонасье, Луз; Гельфанд, Джоэл М .; Grayson, Mitchell H .; Марголис, Дэвид Дж .; Митчелл, Линда; Сильверберг, Джонатан I .; Шварц, Лоуренс (март 2019). «Исследование атопического дерматита в Америке: перекрестное исследование, изучающее распространенность и бремя заболеваний атопическим дерматитом среди взрослого населения США» . Журнал следственной дерматологии . 139 (3): 583–590. DOI : 10.1016 / j.jid.2018.08.028 . ISSN 1523-1747 . PMID 30389491 .  
  36. ^ Рис. DG (2001) Essential Statistics , 4-е издание, Chapman and Hall / CRC. ISBN 1-58488-007-4 (Раздел 9.5) 
  37. ^ Бернардо JE; Смит, Адриан (2000). Байесовская теория . Нью-Йорк: Вили. п. 259. ISBN 978-0-471-49464-5.
  38. ^ Уэлч, BL (1939). «О пределах уверенности и достаточности с особым упором на параметры местонахождения» . Анналы математической статистики . 10 (1): 58–69. DOI : 10.1214 / АОМ / 1177732246 . JSTOR 2235987 . 
  39. Перейти ↑ Robinson, GK (1975). «Некоторые контрпримеры к теории доверительных интервалов». Биометрика . 62 (1): 155–161. DOI : 10.2307 / 2334498 . JSTOR 2334498 . 
  40. ^ Пратт, JW (1961). "Рецензия на книгу: проверка статистических гипотез. Э.Леманн". Журнал Американской статистической ассоциации . 56 (293): 163–167. DOI : 10.1080 / 01621459.1961.10482103 . JSTOR 2282344 . 
  41. Перейти ↑ Steiger, JH (2004). «За пределами теста F: доверительные интервалы размера эффекта и тесты на близкое соответствие в анализе дисперсии и контрастного анализа». Психологические методы . 9 (2): 164–182. DOI : 10.1037 / 1082-989x.9.2.164 . PMID 15137887 . 

Библиография [ править ]

  • Фишер Р.А. (1956) Статистические методы и научные выводы. Оливер и Бойд, Эдинбург. (См. Стр. 32.)
  • Фройнд, Дж. Э. (1962) Математическая статистика Прентис Холл, Энглвуд Клиффс, Нью-Джерси. (См. Стр. 227–228.)
  • Хакинг, I. (1965) Логика статистического вывода. Издательство Кембриджского университета, Кембридж. ISBN 0-521-05165-7 
  • Сохраняя, ES (1962) Введение в статистический вывод. Д. Ван Ностранд, Принстон, штат Нью-Джерси.
  • Кифер, Дж. (1977). «Заявления об условной уверенности и оценщики уверенности (с обсуждением)». Журнал Американской статистической ассоциации . 72 (360a): 789–827. DOI : 10.1080 / 01621459.1977.10479956 . JSTOR  2286460 .
  • Мэйо Д.Г. (1981) "В защиту теории доверительных интервалов Неймана – Пирсона" , Philosophy of Science , 48 (2), 269–280. JSTOR  187185
  • Нейман, Дж. (1937) «Очерк теории статистического оценивания на основе классической теории вероятности» Философские труды Лондонского королевского общества A, 236, 333–380. (Основная работа.)
  • Робинсон, GK (1975). «Некоторые контрпримеры к теории доверительных интервалов». Биометрика . 62 (1): 155–161. DOI : 10.1093 / Biomet / 62.1.155 . JSTOR  2334498 .
  • Сэвидж, Л. Дж. (1962), Основы статистического вывода . Метуэн, Лондон.
  • Смитсон, М. (2003) Доверительные интервалы . Количественные приложения в серии социальных наук, № 140. Бельмонт, Калифорния: SAGE Publications. ISBN 978-0-7619-2499-9 . 
  • Мехта, С. (2014) ISBN тем статистики 978-1-4992-7353-3 
  • "Оценка уверенности" , Энциклопедия математики , EMS Press , 2001 [1994]
  • Мори, РД; Hoekstra, R .; Rouder, JN; Ли, доктор медицины; Wagenmakers, E.-J. (2016). «Ошибка доверия доверительным интервалам» . Психономический бюллетень и обзор . 23 (1): 103–123. DOI : 10,3758 / s13423-015-0947-8 . PMC  4742505 . PMID  26450628 .

Внешние ссылки [ править ]

  • Учебные программы «Исследовательское программное обеспечение для доверительных интервалов», работающие в Excel
  • Калькуляторы доверительных интервалов для R-квадратов , коэффициентов регрессии и пересечений регрессии
  • Вайсштейн, Эрик В. «Доверительный интервал» . MathWorld .
  • CAUSEweb.org Многие ресурсы для обучения статистике, включая доверительные интервалы.
  • Интерактивное введение в доверительные интервалы
  • Доверительные интервалы: уровень достоверности, размер выборки и допустимая погрешность Эрика Шульца, проект Wolfram Demonstrations .
  • Доверительные интервалы в общественном здравоохранении . Простое описание с примерами и что делать с небольшими размерами выборки или коэффициентами, близкими к 0.