Правило 68–95–99,7


В статистике правило 68–95–99,7 , также известное как эмпирическое правило , представляет собой сокращение, используемое для запоминания процентной доли значений, лежащих в пределах интервальной оценки в нормальном распределении : 68%, 95% и 99,7% значения лежат в пределах одного, двух и трех стандартных отклонений от среднего соответственно.

В математической записи эти факты можно выразить следующим образом, где Pr() — функция вероятности, [1] X — наблюдение нормально распределенной случайной величины , µ (mu) — среднее значение распределения, σ (сигма ) — его стандартное отклонение:

В эмпирических науках так называемое эмпирическое правило трех сигм (или правило 3σ ) выражает обычную эвристику , согласно которой почти все значения берутся лежащими в пределах трех стандартных отклонений от среднего, и, таким образом, эмпирически полезно рассматривать 99,7% вероятность как почти достоверность. [2]

В социальных науках результат может считаться « значимым », если его уровень достоверности порядка эффекта двух сигм (95%), в то время как в физике элементарных частиц существует соглашение об эффекте пяти сигм (99,99994%). достоверность), необходимые для того, чтобы квалифицироваться как открытие .

Более слабое правило трех сигм можно вывести из неравенства Чебышева , согласно которому даже для ненормально распределенных переменных не менее 88,8% случаев должны попадать в правильно рассчитанные интервалы трех сигм. Для одномодальных распределений вероятность попадания в интервал составляет не менее 95% по неравенству Высочанского–Петунина . Могут быть определенные допущения для распределения, которые заставляют эту вероятность быть по крайней мере 98%. [3]

Эти числовые значения «68%, 95%, 99,7%» получены из кумулятивной функции распределения нормального распределения .


Для приблизительно нормального набора данных значения в пределах одного стандартного отклонения от среднего составляют около 68% набора; при этом в пределах двух стандартных отклонений приходится около 95%; и в пределах трех стандартных отклонений составляют около 99,7%. Показанные проценты представляют собой округленные теоретические вероятности, предназначенные только для аппроксимации эмпирических данных, полученных для нормальной совокупности.
Интервал прогноза (по оси Y ), полученный из стандартной оценки (по оси X ). Ось Y масштабируется логарифмически (но значения на ней не изменяются).
Диаграмма, показывающая кумулятивную функцию распределения для нормального распределения со средним значением ( μ ) 0 и дисперсией ( σ 2 ) 1