Студенческий т -распределение

В вероятности и статистике , Стьюдент т -распределение (или просто т -распределение ) является любым членом семейства непрерывных вероятностных распределений , которые возникают при оценке среднего значения в виде нормально распределенное населения в ситуациях , когда размер выборки мал и х населений стандартное отклонение неизвестно. Его разработал английский статистик Уильям Сили Госсет под псевдонимом «Студент».

Студенческий т
Функция плотности вероятности
Кумулятивная функция распределения
Параметры	${\ displaystyle \ nu> 0}$ степени свободы ( реальные )
Служба поддержки	${\ Displaystyle х \ в (- \ infty, \ infty)}$
PDF	${\ displaystyle \ textstyle {\ frac {\ Gamma \ left ({\ frac {\ nu +1} {2}} \ right)} {{\ sqrt {\ nu \ pi}} \, \ Gamma \ left ({ \ frac {\ nu} {2}} \ right)}} \ left (1 + {\ frac {x ^ {2}} {\ nu}} \ right) ^ {- {\ frac {\ nu +1} {2}}} \!}$
CDF	${\ displaystyle {\ begin {matrix} {\ frac {1} {2}} + x \ Gamma \ left ({\ frac {\ nu +1} {2}} \ right) \ times \\ [0.5em] {\ frac {\, _ {2} F_ {1} \ left ({\ frac {1} {2}}, {\ frac {\ nu +1} {2}}; {\ frac {3} {2 }}; - {\ frac {x ^ {2}} {\ nu}} \ right)} {{\ sqrt {\ pi \ nu}} \, \ Gamma \ left ({\ frac {\ nu} {2 }} \ right)}} \ end {matrix}}}$ где ₂F ₁ - гипергеометрическая функция
Иметь в виду	0 для ${\ displaystyle \ nu> 1}$ , в противном случае не определено
Медиана	0
Режим	0
Дисперсия	${\ displaystyle \ textstyle {\ frac {\ nu} {\ nu -2}}}$ для ${\ displaystyle \ nu> 2}$ , ∞ для ${\ Displaystyle 1 <\ Nu \ Leq 2}$ , в противном случае не определено
Асимметрия	0 для ${\ displaystyle \ nu> 3}$ , в противном случае не определено
Бывший. эксцесс	${\ displaystyle \ textstyle {\ frac {6} {\ nu -4}}}$ для ${\ displaystyle \ nu> 4}$ , ∞ для ${\ Displaystyle 2 <\ Nu \ Leq 4}$ , в противном случае не определено
Энтропия	${\ displaystyle {\ begin {matrix} {\ frac {\ nu +1} {2}} \ left [\ psi \ left ({\ frac {1+ \ nu} {2}} \ right) - \ psi \ left ({\ frac {\ nu} {2}} \ right) \ right] \\ [0.5em] + \ ln {\ left [{\ sqrt {\ nu}} B \ left ({\ frac {\ nu } {2}}, {\ frac {1} {2}} \ right) \ right]} \, {\ scriptstyle {\ text {(nats)}}} \ end {matrix}}}$ ψ: дигамма-функция , B : бета-функция
MGF	неопределенный
CF	${\ displaystyle \ textstyle {\ frac {K _ {\ nu / 2} \ left ({\ sqrt {\ nu}} \| t \| \ right) \ cdot \ left ({\ sqrt {\ nu}} \| t \| \ справа) ^ {\ nu / 2}} {\ Gamma (\ nu / 2) 2 ^ {\ nu / 2-1}}}}$ для ${\ displaystyle \ nu> 0}$ ${\ Displaystyle К _ {\ ню} (х)}$ : модифицированная функция Бесселя второго рода ^[1]

Т -распределение играет роль в ряде широко используемых статистических анализов, в том числе Стьюдента т -теста для оценки статистической значимости разницы между двумя образцами средств, строительство доверительных интервалов для разности двух средних, так и в линейном регрессионный анализ . Студенческий т -распределение также возникает в байесовском анализе данных из нормальной семьи.

Если взять образец ${\ displaystyle n}$ наблюдения из нормального распределения , то t -распределение с ${\ Displaystyle \ ню = п-1}$ степени свободы можно определить как распределение местоположения выборочного среднего относительно истинного среднего, деленное на стандартное отклонение выборки, после умножения на стандартизирующий член. ${\ displaystyle {\ sqrt {n}}}$ . Таким образом, t- распределение можно использовать для построения доверительного интервала для истинного среднего значения.

Т -распределение симметрично и колоколообразный, как и нормальное распределение . Однако t -распределение имеет более тяжелые хвосты, а это означает, что оно более склонно производить значения, которые далеко не соответствуют среднему значению. Это делает его полезным для понимания статистического поведения определенных типов отношений случайных величин, в которых вариация знаменателя усиливается и может давать выпадающие значения, когда знаменатель отношения приближается к нулю. Студенческий т -распределение является частным случаем обобщенного гиперболического распределения .

История и этимология

Статистик Уильям Сили Госсет, известный как «Студент»

В статистике t- распределение было впервые получено как апостериорное распределение в 1876 году Гельмертом ^[2]^[3]^[4] и Люротом . ^[5]^[6]^[7] т -распределение также появился в более общем виде , как Пирсон типа IV распределение в Карлах Pearson 1895 бумаги «ы. ^[8]

В англоязычной литературе это распространение получило свое название от статьи Уильяма Сили Госсета 1908 года в Biometrika под псевдонимом «Студент». ^[9] Госсет работал на пивоварне Guinness Brewery в Дублине, Ирландия , и интересовался проблемами малых образцов - например, химическими свойствами ячменя, где размер выборки мог составлять всего 3. Одна версия происхождения псевдонима заключается в том, что работодатель Госсета предпочитал сотрудникам использовать псевдонимы при публикации научных статей вместо их настоящего имени, поэтому он использовал имя «Студент», чтобы скрыть свою личность. Другая версия заключается в том, что Guinness не хотел, чтобы их конкуренты знали, что они использовали t- тест для определения качества сырья. ^[10]^[11]

В статье Госсета это распределение называется «частотным распределением стандартных отклонений выборок, взятых из нормальной совокупности». Это стало хорошо известно благодаря работе Рональда Фишера , который назвал распределение «распределением Стьюдента» и представил тестовое значение буквой t . ^[12]^[13]

Как распределение Стьюдента возникает из выборки

Позволять ${\ textstyle X_ {1}, \ ldots, X_ {n}}$ быть независимо и идентично взятым из распределения ${\ Displaystyle {\ mathcal {N}} (\ mu, \ sigma ^ {2})}$ , т.е. это образец размером ${\ displaystyle n}$ из нормально распределенной популяции с ожидаемым средним значением ${\ displaystyle \ mu}$ и дисперсия ${\ displaystyle \ sigma ^ {2}}$ .

Позволять

{\ displaystyle {\ bar {X}} = {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} X_ {i}}

быть выборочным средним и пусть

{\ displaystyle S ^ {2} = {\ frac {1} {n-1}} \ sum _ {i = 1} ^ {n} (X_ {i} - {\ bar {X}}) ^ {2 }}

- дисперсия выборки (с поправкой на Бесселя ). Тогда случайная величина

{\ displaystyle {\ frac {{\ bar {X}} - \ mu} {\ sigma / {\ sqrt {n}}}}}

имеет стандартное нормальное распределение (т.е. нормальное с ожидаемым средним 0 и дисперсией 1), а случайная величина

{\ displaystyle {\ frac {{\ bar {X}} - \ mu} {S / {\ sqrt {n}}}}}

где ${\ displaystyle S}$ был заменен на ${\ displaystyle \ sigma}$ имеет t -распределение Стьюдента с ${\ displaystyle n-1}$ степени свободы. Числитель и знаменатель в предыдущем выражении являются независимыми случайными величинами, несмотря на то, что они основаны на одной и той же выборке. ${\ textstyle X_ {1}, \ ldots, X_ {n}}$ .

Определение

Функция плотности вероятности

Студенческий т -распределение имеет функцию плотности вероятности , данную

{\ displaystyle f (t) = {\ frac {\ Gamma ({\ frac {\ nu +1} {2}})} {{\ sqrt {\ nu \ pi}} \, \ Gamma ({\ frac { \ nu} {2}})}} \ left (1 + {\ frac {t ^ {2}} {\ nu}} \ right) ^ {\! - {\ frac {\ nu +1} {2} }}, \!}

где ${\ displaystyle \ nu}$ это количество степеней свободы и ${\ displaystyle \ Gamma}$ это гамма-функция . Это также можно записать как

{\ displaystyle f (t) = {\ frac {1} {{\ sqrt {\ nu}} \, \ mathrm {B} ({\ frac {1} {2}}, {\ frac {\ nu} { 2}})}} \ left (1 + {\ frac {t ^ {2}} {\ nu}} \ right) ^ {\! - {\ frac {\ nu +1} {2}}} \! ,}

где B - бета-функция . В частности, для целочисленных степеней свободы ${\ displaystyle \ nu}$ у нас есть:

Для ${\ displaystyle \ nu> 1}$ четный,

{\ displaystyle {\ frac {\ Gamma ({\ frac {\ nu +1} {2}})} {{\ sqrt {\ nu \ pi}} \, \ Gamma ({\ frac {\ nu} {2 }})}} = {\ frac {(\ nu -1) (\ nu -3) \ cdots 5 \ cdot 3} {2 {\ sqrt {\ nu}} (\ nu -2) (\ nu -4 ) \ cdots 4 \ cdot 2 \,}} \ cdot}

Для ${\ displaystyle \ nu> 1}$ странный,

{\ displaystyle {\ frac {\ Gamma ({\ frac {\ nu +1} {2}})} {{\ sqrt {\ nu \ pi}} \, \ Gamma ({\ frac {\ nu} {2 }})}} = {\ frac {(\ nu -1) (\ nu -3) \ cdots 4 \ cdot 2} {\ pi {\ sqrt {\ nu}} (\ nu -2) (\ nu - 4) \ cdots 5 \ cdot 3 \,}} \ cdot \!}

Функция плотности вероятности симметрична , и ее общая форма напоминает форму колокола нормально распределенной переменной со средним значением 0 и дисперсией 1, за исключением того, что она немного ниже и шире. По мере увеличения числа степеней свободы t -распределение приближается к нормальному распределению со средним значением 0 и дисперсией 1. По этой причине ${\ displaystyle {\ nu}}$ также известен как параметр нормальности. ^[14]

На следующих изображениях показана плотность t- распределения для возрастающих значений ${\ displaystyle \ nu}$ . Нормальное распределение показано синей линией для сравнения. Обратите внимание, что t- распределение (красная линия) становится ближе к нормальному распределению, поскольку ${\ displaystyle \ nu}$ увеличивается.

Плотность t- распределения (красный) для 1, 2, 3, 5, 10 и 30 степеней свободы по сравнению со стандартным нормальным распределением (синий).
Предыдущие графики показаны зеленым цветом.
1 степень свободы	2 степени свободы	3 степени свободы
5 степеней свободы	10 степеней свободы	30 степеней свободы

Кумулятивная функция распределения

Кумулятивная функция распределения может быть записана в терминах I , регуляризованном неполной бета - функции . При t > 0 ^[15]

{\ Displaystyle F (t) = \ int _ {- \ infty} ^ {t} f (u) \, du = 1 - {\ tfrac {1} {2}} I_ {x (t)} \ left ( {\ tfrac {\ nu} {2}}, {\ tfrac {1} {2}} \ right),}

где

{\ displaystyle x (t) = {\ frac {\ nu} {t ^ {2} + \ nu}}.}

Другие значения были бы получены путем симметрии. Альтернативная формула, действующая для ${\ Displaystyle т ^ {2} <\ ню}$ , это ^[15]

{\ displaystyle \ int _ {- \ infty} ^ {t} f (u) \, du = {\ tfrac {1} {2}} + t {\ frac {\ Gamma \ left ({\ tfrac {1}) {2}} (\ nu +1) \ right)} {{\ sqrt {\ pi \ nu}} \, \ Gamma \ left ({\ tfrac {\ nu} {2}} \ right)}} \, {} _ {2} F_ {1} \ left ({\ tfrac {1} {2}}, {\ tfrac {1} {2}} (\ nu +1); {\ tfrac {3} {2} }; - {\ tfrac {t ^ {2}} {\ nu}} \ right),}

где ₂F ₁ - частный случай гипергеометрической функции .

Для получения информации о его обратной кумулятивной функции распределения см. Функцию квантиля § t-распределение Стьюдента .

Особые случаи

Определенные значения ${\ displaystyle \ nu}$ придают особенно простую форму.

${\ displaystyle \ nu = 1}$

Функция распределения:

{\ Displaystyle F (t) = {\ tfrac {1} {2}} + {\ tfrac {1} {\ pi}} \ arctan (t).}

Функция плотности:

{\ displaystyle f (t) = {\ frac {1} {\ pi (1 + t ^ {2})}}.}

См. Распределение Коши

${\ displaystyle \ nu = 2}$

Функция распределения:

{\ Displaystyle F (t) = {\ tfrac {1} {2}} + {\ frac {t} {2 {\ sqrt {2}} {\ sqrt {1 + {\ frac {t ^ {2}} {2}}}}}}.}

Функция плотности:

{\ displaystyle f (t) = {\ frac {1} {2 {\ sqrt {2}} \ left (1 + {\ frac {t ^ {2}} {2}} \ right) ^ {\ frac { 3} {2}}}}.}

${\ displaystyle \ nu = 3}$

Функция распределения:

{\ displaystyle F (t) = {\ frac {1} {2}} + {\ frac {1} {\ pi}} {\ left [{\ frac {1} {\ sqrt {3}}} {\ frac {t} {1 + {\ frac {t ^ {2}} {3}}}} + \ arctan \ left ({\ frac {t} {\ sqrt {3}}} \ right) \ right]} .}

Функция плотности:

{\ displaystyle f (t) = {\ frac {2} {\ pi {\ sqrt {3}} \ left (1 + {\ frac {t ^ {2}} {3}} \ right) ^ {2} }}.}

${\ displaystyle \ nu = 4}$

Функция распределения:

{\ Displaystyle F (t) = {\ tfrac {1} {2}} + {\ frac {3} {8}} {\ frac {t} {\ sqrt {1 + {\ frac {t ^ {2}) } {4}}}}} {\ left [1 - {\ frac {1} {12}} {\ frac {t ^ {2}} {1 + {\ frac {t ^ {2}} {4}] }}}\верно]}.}

Функция плотности:

{\ displaystyle f (t) = {\ frac {3} {8 \ left (1 + {\ frac {t ^ {2}} {4}} \ right) ^ {\ frac {5} {2}}} }.}

${\ displaystyle \ nu = 5}$

Функция распределения:

{\ displaystyle F (t) = {\ tfrac {1} {2}} + {\ frac {1} {\ pi}} {\ left [{\ frac {t} {{\ sqrt {5}} \ left (1 + {\ frac {t ^ {2}} {5}} \ right)}} \ left (1 + {\ frac {2} {3 \ left (1 + {\ frac {t ^ {2}}) {5}} \ right)}} \ right) + \ arctan \ left ({\ frac {t} {\ sqrt {5}}} \ right) \ right]}.}

Функция плотности:

{\ displaystyle f (t) = {\ frac {8} {3 \ pi {\ sqrt {5}} \ left (1 + {\ frac {t ^ {2}} {5}} \ right) ^ {3 }}}.}

${\ displaystyle \ nu = \ infty}$

Функция распределения:

{\ displaystyle F (t) = {\ frac {1} {2}} {\ left [1+ \ operatorname {erf} \ left ({\ frac {t} {\ sqrt {2}}} \ right) \ верно]}.}

См. Функцию ошибки

Функция плотности:

{\ displaystyle f (t) = {\ frac {1} {\ sqrt {2 \ pi}}} e ^ {- {\ frac {t ^ {2}} {2}}}.}

См. Нормальное распределение

Как возникает t -распределение

Выборочное распределение

Позволять ${\ Displaystyle x_ {1}, \ cdots, x_ {n}}$ быть числами, наблюдаемыми в выборке из непрерывно распределенной совокупности с ожидаемым значением ${\ displaystyle \ mu}$ . Среднее значение выборки и дисперсия выборки определяются как:

{\ displaystyle {\ begin {align} {\ bar {x}} & = {\ frac {x_ {1} + \ cdots + x_ {n}} {n}}, \\ s ^ {2} & = { \ frac {1} {n-1}} \ sum _ {i = 1} ^ {n} (x_ {i} - {\ bar {x}}) ^ {2}. \ end {выравнивается}}}

Результирующее значение t равно

{\ displaystyle t = {\ frac {{\ bar {x}} - \ mu} {s / {\ sqrt {n}}}}.}

Т -распределение с ${\ displaystyle n-1}$ степени свободы - это выборочное распределение значения t, когда выборки состоят из независимых одинаково распределенных наблюдений из нормально распределенной совокупности. Таким образом, для целей вывода t является полезной « ключевой величиной » в случае, когда среднее значение и дисперсия ${\ Displaystyle (\ му, \ sigma ^ {2})}$ являются неизвестными параметрами совокупности в том смысле, что значение t имеет распределение вероятностей, которое не зависит ни от одного ${\ displaystyle \ mu}$ ни ${\ displaystyle \ sigma ^ {2}}$ .

Байесовский вывод

В байесовской статистике (масштабированное, сдвинутое) t- распределение возникает как маргинальное распределение неизвестного среднего нормального распределения, когда зависимость от неизвестной дисперсии исключена: ^[16]

{\ Displaystyle {\ begin {выровнено} п (\ му \ mid D, I) = & \ int p (\ mu, \ sigma ^ {2} \ mid D, I) \, d \ sigma ^ {2} \ \ = & \ int p (\ mu \ mid D, \ sigma ^ {2}, I) \, p (\ sigma ^ {2} \ mid D, I) \, d \ sigma ^ {2}, \ end {выровнено}}}

где ${\ displaystyle D}$ обозначает данные ${\ displaystyle \ {x_ {i} \}}$ , а также ${\ displaystyle I}$ представляет любую другую информацию, которая могла быть использована для создания модели. Распределение, таким образом, является сложным условным распределением ${\ displaystyle \ mu}$ учитывая данные и ${\ displaystyle \ sigma ^ {2}}$ с маргинальным распределением ${\ displaystyle \ sigma ^ {2}}$ учитывая данные.

С участием ${\ displaystyle n}$ точки данных, если они неинформативны или плоские, априори местоположения и масштаба ${\ displaystyle p (\ mu \ mid \ sigma ^ {2}, I) = {\ text {const}}}$ а также ${\ displaystyle p (\ sigma ^ {2} \ mid I) \ propto 1 / \ sigma ^ {2}}$ можно взять за μ и σ ² , то теорема Байеса дает

{\ displaystyle {\ begin {align} p (\ mu \ mid D, \ sigma ^ {2}, I) & \ sim N ({\ bar {x}}, \ sigma ^ {2} / n), \ \ p (\ sigma ^ {2} \ mid D, I) & \ sim \ operatorname {Scale-inv-} \ chi ^ {2} (\ nu, s ^ ​​{2}), \ end {align}}}

нормальное распределение и масштабированное обратное распределение хи-квадрат соответственно, где ${\ Displaystyle \ ню = п-1}$ а также

{\ displaystyle s ^ {2} = \ sum {\ frac {(x_ {i} - {\ bar {x}}) ^ {2}} {n-1}}.}

Таким образом, интеграл маргинализации становится

{\ displaystyle {\ begin {align} p (\ mu \ mid D, I) & \ propto \ int _ {0} ^ {\ infty} {\ frac {1} {\ sqrt {\ sigma ^ {2}} }} \ exp \ left (- {\ frac {1} {2 \ sigma ^ {2}}} n (\ mu - {\ bar {x}}) ^ {2} \ right) \ cdot \ sigma ^ { - \ nu -2} \ exp (- \ nu s ^ {2} / 2 \ sigma ^ {2}) \, d \ sigma ^ {2} \\ & \ propto \ int _ {0} ^ {\ infty } \ sigma ^ {- \ nu -3} \ exp \ left (- {\ frac {1} {2 \ sigma ^ {2}}} \ left (n (\ mu - {\ bar {x}}) ^ {2} + \ nu s ^ {2} \ right) \ right) \, d \ sigma ^ {2}. \ End {align}}}

Это можно оценить, подставив ${\ Displaystyle г = А / 2 \ сигма ^ {2}}$ , где ${\ displaystyle A = N (\ mu - {\ bar {x}}) ^ {2} + \ nu s ^ {2}}$ , давая

{\ displaystyle dz = - {\ frac {A} {2 \ sigma ^ {4}}} \, d \ sigma ^ {2},}

так

{\ displaystyle p (\ mu \ mid D, I) \ propto A ^ {- {\ frac {\ nu +1} {2}}} \ int _ {0} ^ {\ infty} z ^ {(\ nu -1) / 2} \ exp (-z) \, dz.}

Но интеграл по z теперь является стандартным гамма-интегралом , который принимает значение константы, оставляя

{\ displaystyle {\ begin {align} p (\ mu \ mid D, I) & \ propto A ^ {- {\ frac {\ nu +1} {2}}} \\ & \ propto \ left (1+ {\ frac {n (\ mu - {\ bar {x}}) ^ {2}} {\ nu s ^ {2}}} \ right) ^ {- {\ frac {\ nu +1} {2} }}. \ end {выровнены}}}

Это форма t- распределения с явным масштабированием и сдвигом, которые будут рассмотрены более подробно в следующем разделе ниже. Его можно связать со стандартизованным t- распределением заменой

{\ displaystyle t = {\ frac {\ mu - {\ bar {x}}} {s / {\ sqrt {n}}}}.}

Вышеупомянутый вывод был представлен для случая неинформативных априорных значений для ${\ displaystyle \ mu}$ а также ${\ displaystyle \ sigma ^ {2}}$ ; но будет очевидно, что любые априорные значения, которые приводят к смешению нормального распределения с масштабированным обратным распределением хи-квадрат, приведут к t- распределению с масштабированием и сдвигом для ${\ Displaystyle P (\ mu \ mid D, I)}$ , хотя параметр масштабирования, соответствующий ${\ displaystyle {\ frac {s ^ {2}} {n}}}$ выше будет зависеть как априорная информация, так и данные, а не только данные, как указано выше.

Характеристика

Как распределение тестовой статистики

Стьюдент т -распределение с ${\ displaystyle \ nu}$ степени свободы можно определить как распределение случайной величины T с помощью ^[15]^[17]

{\ displaystyle T = {\ frac {Z} {\ sqrt {V / \ nu}}} = Z {\ sqrt {\ frac {\ nu} {V}}},}

где

Z - стандартная норма с ожидаемым значением 0 и дисперсией 1;
V имеет распределение хи-квадрат с ${\ displaystyle \ nu}$ степени свободы ;
Z и V являются независимыми ;

Другое распределение определяется как распределение случайной величины, определяемой для данной константы μ формулой

{\ displaystyle (Z + \ mu) {\ sqrt {\ frac {\ nu} {V}}}.}

Эта случайная величина имеет нецентральное t -распределение с параметром нецентральности μ. Это распределение важно при изучении мощности t- критерия Стьюдента .

Вывод

Предположим, что X ₁ , ..., X _n являются независимыми реализациями нормально распределенной случайной величины X , которая имеет математическое ожидание μ и дисперсию σ ² . Позволять

{\ displaystyle {\ overline {X}} _ {n} = {\ frac {1} {n}} (X_ {1} + \ cdots + X_ {n})}

быть выборочным средним, и

{\ displaystyle S_ {n} ^ {2} = {\ frac {1} {n-1}} \ sum _ {i = 1} ^ {n} \ left (X_ {i} - {\ overline {X}) } _ {n} \ right) ^ {2}}

быть объективной оценкой отклонения от выборки. Можно показать, что случайная величина

{\ Displaystyle V = (п-1) {\ гидроразрыва {S_ {n} ^ {2}} {\ sigma ^ {2}}}}

имеет распределение хи-квадрат с ${\ Displaystyle \ ню = п-1}$ степени свободы (по теореме Кохрана ). ^[18] Нетрудно показать, что величина

{\ displaystyle Z = \ left ({\ overline {X}} _ {n} - \ mu \ right) {\ frac {\ sqrt {n}} {\ sigma}}}

нормально распределяется со средним 0 и дисперсией 1, так как выборочное среднее ${\ displaystyle {\ overline {X}} _ {n}}$ имеет нормальное распределение со средним μ и дисперсией σ ² / n . Более того, можно показать, что эти две случайные величины (нормально распределенная Z и хи-квадрат-распределенная V ) независимы. Следовательно ^{[ необходимы разъяснения ]}решающее количество

{\ textstyle T \ Equiv {\ frac {Z} {\ sqrt {V / \ nu}}} = \ left ({\ overline {X}} _ {n} - \ mu \ right) {\ frac {\ sqrt {n}} {S_ {n}}},}

который отличается от Z тем, что точное стандартное отклонение σ заменено случайной величиной S _n , имеет t -распределение Стьюдента, как определено выше. Обратите внимание, что неизвестная дисперсия совокупности σ ² не появляется в T , поскольку она была и в числителе, и в знаменателе, поэтому она отменена. Госсет интуитивно получил указанную выше функцию плотности вероятности с ${\ displaystyle \ nu}$ равным n - 1, и Фишер доказал это в 1925 г. ^[12]

Распределение тестовой статистики T зависит от ${\ displaystyle \ nu}$ , но не μ или σ; отсутствие зависимости от μ и σ делает t- распределение важным как в теории, так и на практике.

Как максимальное распределение энтропии

Студенческий т -распределение является распределением вероятностей максимальной энтропии для случайного случайной величины X , для которого ${\ Displaystyle \ OperatorName {E} (\ пер (\ ню + X ^ {2}))}$ фиксированный. ^[19]^{[ требуется разъяснение ]}^{[ необходим более точный источник ]}

Характеристики

Моменты

Для ${\ displaystyle \ nu> 1}$ , То сырые моменты этого т -распределений являются

{\ displaystyle \ operatorname {E} (T ^ {k}) = {\ begin {cases} 0 & k {\ text {odd}}, \ quad 0

Моменты порядка ${\ displaystyle \ nu}$ или выше не существует. ^[20]

Срок для ${\ Displaystyle 0 <к <\ ню}$ , k даже, можно упростить, используя свойства гамма-функции, чтобы

{\ displaystyle \ operatorname {E} (T ^ {k}) = \ nu ^ {\ frac {k} {2}} \, \ prod _ {i = 1} ^ {k / 2} {\ frac {2i -1} {\ nu -2i}} \ qquad k {\ text {even}}, \ quad 0

Для t- распределения с ${\ displaystyle \ nu}$ степеней свободы, ожидаемое значение равно 0, если ${\ displaystyle \ nu> 1}$ , И его дисперсия является ${\ displaystyle {\ frac {\ nu} {\ nu -2}}}$ если ${\ displaystyle \ nu> 2}$ . Перекос является 0 , если ${\ displaystyle \ nu> 3}$ а избыток эксцесса является ${\ displaystyle {\ frac {6} {\ nu -4}}}$ если ${\ displaystyle \ nu> 4}$ .

Отбор проб Монте-Карло

Существуют различные подходы к построению случайных выборок из t- распределения Стьюдента. Дело зависит от того, требуются ли образцы на автономной основе или они должны быть построены путем применения квантильной функции к однородным выборкам; например, в многомерных приложениях основа связочной зависимости . ^{[ необходима цитата ]} В случае автономного отбора проб легко развернуть расширение метода Бокса – Мюллера и его полярную форму . ^[21] Его достоинством является то, что он одинаково хорошо применим ко всем действительным положительным степеням свободы ν, в то время как многие другие методы-кандидаты терпят неудачу, если ν близко к нулю. ^[21]

Интеграл функции плотности вероятности Стьюдента и p- значения

Функция A ( t | ν ) является интегралом функции плотности вероятности Стьюдента, f ( t ) между - t и t , для t ≥ 0. Таким образом, она дает вероятность того, что значение t, меньшее, чем вычисленное по наблюдаемым данным, будет происходят случайно. Следовательно, функция A ( t | ν ) может использоваться при проверке того, является ли разница между средними значениями двух наборов данных статистически значимой, путем вычисления соответствующего значения t и вероятности его появления, если два набора данных были взяты из одного и того же населения. Это используется в различных ситуациях, особенно в t- тестах . Для статистики t с ν степенями свободы A ( t | ν ) - это вероятность того, что t было бы меньше наблюдаемого значения, если бы два средних значения были одинаковыми (при условии, что меньшее среднее вычитается из большего, так что t ≥ 0). Его легко вычислить из кумулятивной функции распределения F _ν ( t ) t -распределения:

{\ Displaystyle А (т \ мид \ ню) = F _ {\ ню} (т) -F _ {\ ню} (- т) = 1-я _ {\ гидроразрыва {\ ню} {\ ню + т ^ {2} }} \ left ({\ frac {\ nu} {2}}, {\ frac {1} {2}} \ right),}

где I _x - регуляризованная неполная бета-функция ( a , b ).

Для проверки статистической гипотезы эта функция используется для построения p- значения .

Обобщенное t- распределение Стьюдента

По параметру масштабирования ${\ displaystyle {\ hat {\ sigma}}}$ или же ${\ Displaystyle {\ шляпа {\ sigma}} ^ {2}}$

Распределение Стьюдента можно обобщить на семейство с тремя параметрами в масштабе местоположения , введя параметр местоположения ${\ displaystyle {\ hat {\ mu}}}$ и масштабный параметр ${\ displaystyle {\ hat {\ sigma}}}$ , через отношение

{\ displaystyle X = {\ hat {\ mu}} + {\ hat {\ sigma}} T}

или же

{\ displaystyle T = {\ frac {X - {\ hat {\ mu}}} {\ hat {\ sigma}}}}

Это значит, что ${\ displaystyle {\ frac {x - {\ hat {\ mu}}} {\ hat {\ sigma}}}}$ имеет классическое распределение Стьюдента с ${\ displaystyle \ nu}$ степени свободы.

Результирующее нестандартизированное t- распределение Стьюдента имеет плотность, определяемую следующим образом: ^[22]

{\ Displaystyle п (х \ середина \ ню, {\ шляпа {\ му}}, {\ шляпа {\ sigma}}) = {\ гидроразрыва {\ Гамма ({\ гидроразрыва {\ ню +1} {2}} )} {\ Gamma ({\ frac {\ nu} {2}}) {\ sqrt {\ pi \ nu}} {\ hat {\ sigma}} \,}} \ left (1 + {\ frac {1 } {\ nu}} \ left ({\ frac {x - {\ hat {\ mu}}} {\ hat {\ sigma}}} \ right) ^ {2} \ right) ^ {- {\ frac { \ nu +1} {2}}}}

Здесь, ${\ displaystyle {\ hat {\ sigma}}}$ никак не соответствует стандартному отклонению : это не стандартное отклонение масштабируемого т распределения, которое не может даже существовать; это также не стандартное отклонение основного нормального распределения , которое неизвестно. ${\ displaystyle {\ hat {\ sigma}}}$ просто устанавливает общее масштабирование распределения. В байесовском выводе маргинального распределения неизвестного нормального среднего ${\ displaystyle {\ hat {\ mu}}}$ выше, ${\ displaystyle {\ hat {\ sigma}}}$ здесь соответствует количеству ${\ displaystyle {s / {\ sqrt {n}}}}$ , где

{\ displaystyle s ^ {2} = \ sum {\ frac {(x_ {i} - {\ bar {x}}) ^ {2}} {n-1}} \,}

.

Эквивалентно, распределение можно записать в терминах ${\ Displaystyle {\ шляпа {\ sigma}} ^ {2}}$ , квадрат этого масштабного параметра:

{\ displaystyle p (x \ mid \ nu, {\ hat {\ mu}}, {\ hat {\ sigma}} ^ {2}) = {\ frac {\ Gamma ({\ frac {\ nu +1}) {2}})} {\ Gamma ({\ frac {\ nu} {2}}) {\ sqrt {\ pi \ nu {\ hat {\ sigma}} ^ {2}}}}} \ left (1 + {\ frac {1} {\ nu}} {\ frac {(x - {\ hat {\ mu}}) ^ {2}} {{\ hat {\ sigma}} ^ {2}}} \ right ) ^ {- {\ frac {\ nu +1} {2}}}}

Другие свойства этой версии дистрибутива: ^[22]

{\ displaystyle {\ begin {align} \ operatorname {E} (X) & = {\ hat {\ mu}} & {\ text {for}} \ nu> 1 \\\ operatorname {var} (X) & = {\ hat {\ sigma}} ^ {2} {\ frac {\ nu} {\ nu -2}} & {\ text {for}} \ nu> 2 \\\ имя оператора {режим} (X) & = {\ hat {\ mu}} \ end {выровнено}}}

Такое распределение является результатом компаундирования с гауссовым распределением ( нормальное распределение ) с средним ${\ displaystyle \ mu}$ и неизвестная дисперсия , с обратным гамма-распределением, помещенным на дисперсию с параметрами ${\ Displaystyle а = \ ню / 2}$ а также ${\ displaystyle b = \ nu {\ hat {\ sigma}} ^ {2} / 2}$ . Другими словами, предполагается , что случайная величина X имеет гауссово распределение с неизвестной дисперсией, распределенной как обратная гамма, а затем дисперсия исключается (интегрируется). Причина полезности этой характеристики заключается в том, что обратное гамма-распределение является сопряженным априорным распределением дисперсии гауссова распределения. В результате нестандартное t- распределение Стьюдента естественным образом возникает во многих задачах байесовского вывода. См. ниже.

Эквивалентно, это распределение является результатом сложения гауссова распределения с масштабированным обратным распределением хи-квадрат с параметрами ${\ displaystyle \ nu}$ а также ${\ Displaystyle {\ шляпа {\ sigma}} ^ {2}}$ . Распределение масштабированного обратного хи-квадрат точно такое же, как и обратное гамма-распределение, но с другой параметризацией, т. Е. ${\ displaystyle \ nu = 2a, \; {\ hat {\ sigma}} ^ {2} = {\ frac {b} {a}}}$ .

В терминах параметра обратного масштабирования λ

Альтернативная параметризация в терминах параметра обратного масштабирования ${\ displaystyle \ lambda}$ (аналогично тому, как точность является обратной величиной дисперсии), определяемая соотношением ${\ displaystyle \ lambda = {\ frac {1} {{\ hat {\ sigma}} ^ {2}}} \,}$ . Плотность тогда определяется как: ^[23]

{\ displaystyle p (x \ mid \ nu, {\ hat {\ mu}}, \ lambda) = {\ frac {\ Gamma ({\ frac {\ nu +1} {2}})} {\ Gamma ( {\ frac {\ nu} {2}})}} \ left ({\ frac {\ lambda} {\ pi \ nu}} \ right) ^ {\ frac {1} {2}} \ left (1+ {\ frac {\ lambda (x - {\ hat {\ mu}}) ^ {2}} {\ nu}} \ right) ^ {- {\ frac {\ nu +1} {2}}}.}

Другие свойства этой версии дистрибутива: ^[23]

{\ displaystyle {\ begin {align} \ operatorname {E} (X) & = {\ hat {\ mu}} && {\ text {for}} \ nu> 1 \\ [5pt] \ operatorname {var} ( X) & = {\ frac {1} {\ lambda}} {\ frac {\ nu} {\ nu -2}} && {\ text {for}} \ nu> 2 \\ [5pt] \ operatorname {mode } (X) & = {\ hat {\ mu}} \ end {align}}}

Такое распределение является результатом компаундирования с гауссовым распределением с средним ${\ displaystyle {\ hat {\ mu}}}$ и неизвестная точность (величина, обратная дисперсии ), с гамма-распределением, помещенным над точностью с параметрами ${\ Displaystyle а = \ ню / 2}$ а также ${\ Displaystyle б = \ ню / (2 \ лямбда)}$ . Другими словами, предполагается , что случайная величина X имеет нормальное распределение с неизвестной точностью, распределенное как гамма, а затем это маргинализируется по гамма-распределению.

Связанные дистрибутивы

Если ${\ displaystyle X}$ имеет t -распределение Стьюдента со степенью свободы ${\ displaystyle \ nu}$ то X ² имеет F -распределение : ${\ Displaystyle X ^ {2} \ sim \ mathrm {F} \ left (\ nu _ {1} = 1, \ nu _ {2} = \ nu \ right)}$
Нецентральная т -распределение обобщает т -распределения , чтобы включать в себя параметр местоположения. В отличие от нестандартных t- распределений, нецентральные распределения не являются симметричными (медиана не совпадает с режимом).
В дискретном Стьюденте т -распределение определяется его функцией массовой вероятности при г пропорционально: ^[24]

{\ displaystyle \ prod _ {j = 1} ^ {k} {\ frac {1} {(r + j + a) ^ {2} + b ^ {2}}} \ quad \ quad r = \ ldots, -1,0,1, \ ldots.}

Здесь a , b и k - параметры. Это распределение возникает в результате построения системы дискретных распределений, аналогичных распределению Пирсона для непрерывных распределений. ^[25]

Можно сгенерировать студент - т образцы, беря отношение переменных от нормального распределения и квадратного корня из й 2 -распределения . Если мы используем вместо нормального распределения, например, в распределении Ирвин-Холла , мы получаем все более-симметричное распределение 4-параметр, который включает в себя нормально, форму , в треугольной , то студент - т и распределение Коши . Это также более гибко, чем некоторые другие симметричные обобщения нормального распределения.
t -распределение является примером соотношений распределений

Использует

В частотном статистическом выводе

Студенческий т -распределение возникает в различных задачах статистической оценки , где цель состоит в том, чтобы оценить параметр неизвестного, такие как среднее значение, в условиях , когда данные наблюдаются с аддитивными ошибками . Если (как почти во всех практических статистических работах) стандартное отклонение генеральной совокупности этих ошибок неизвестно и должно быть оценено на основе данных, t -распределение часто используется для учета дополнительной неопределенности, возникающей в результате этой оценки. В большинстве таких задач, если бы было известно стандартное отклонение ошибок, вместо t- распределения использовалось бы нормальное распределение .

Доверительные интервалы и проверки гипотез - это две статистические процедуры, в которых требуются квантили выборочного распределения конкретной статистики (например, стандартной оценки ). В любой ситуации , где эта статистика является линейной функцией от данных , деленную на обычной оценке стандартного отклонения, полученное количество может быть пересчитано и по центру , чтобы следовать Стьюдент т -распределению. Статистический анализ, включающий средние, взвешенные средние и коэффициенты регрессии, приводит к статистике, имеющей такую форму.

Довольно часто в задачах из учебников стандартное отклонение совокупности рассматривается так, как если бы оно было известно, и тем самым избегает необходимости использовать t -распределение Стьюдента. Эти проблемы обычно бывают двух видов: (1) те, в которых размер выборки настолько велик, что можно трактовать основанную на данных оценку дисперсии, как если бы она была достоверной, и (2) те, которые иллюстрируют математические рассуждения, в которых проблема оценки стандартного отклонения временно игнорируется, потому что это не тот момент, который затем объясняет автор или преподаватель.

Проверка гипотезы

Можно показать, что ряд статистических данных имеет t- распределения для выборок умеренного размера при нулевых гипотезах , которые представляют интерес, так что t- распределение формирует основу для критериев значимости. Например, распределение ранга коэффициента корреляции Спирмена р , в случае нулевой корреляции (ноль) хорошо аппроксимируется т распределения для размеров выборок выше примерно 20. ^{[ править ]}

Доверительные интервалы

Предположим, что число A выбрано так, что

{\ Displaystyle \ Pr (-A

когда T имеет t -распределение с n - 1 степенями свободы. По симметрии это то же самое, что сказать, что A удовлетворяет

{\ Displaystyle \ Pr (Т <А) = 0,95,}

так что A - "95-й процентиль" этого распределения вероятностей, или ${\ Displaystyle А = т _ {(0,05, п-1)}}$ . потом

{\ displaystyle \ Pr \ left (-A <{\ frac {{\ overline {X}} _ {n} - \ mu} {\ frac {S_ {n}} {\ sqrt {n}}}}

и это эквивалентно

{\ displaystyle \ Pr \ left ({\ overline {X}} _ {n} -A {\ frac {S_ {n}} {\ sqrt {n}}} <\ mu <{\ overline {X}} _ {n} + A {\ frac {S_ {n}} {\ sqrt {n}}} \ right) = 0,9.}

Следовательно, интервал, конечные точки которого

{\ displaystyle {\ overline {X}} _ {n} \ pm A {\ frac {S_ {n}} {\ sqrt {n}}}}

- 90% доверительный интервал для μ. Следовательно, если мы найдем среднее значение набора наблюдений, которое, как мы можем разумно ожидать, будет иметь нормальное распределение, мы можем использовать t -распределение, чтобы проверить, включают ли доверительные границы этого среднего значения какое-либо теоретически предсказанное значение, например, предсказанное значение. по нулевой гипотезе .

Именно этот результат , который используется в Стьюденте т - тестах : так как разница между средствами образцов из двух нормальных распределений сама распределена нормально, т -распределение может быть использовано для изучения того , что разница может быть разумно предполагаются равным нулю .

Если данные распределены нормально, односторонний (1 - α ) -верхний доверительный предел (UCL) среднего значения можно рассчитать с помощью следующего уравнения:

{\ displaystyle \ mathrm {UCL} _ {1- \ alpha} = {\ overline {X}} _ {n} + t _ {\ alpha, n-1} {\ frac {S_ {n}} {\ sqrt { n}}}.}

Результирующий UCL будет наибольшим средним значением, которое будет иметь место для данного доверительного интервала и размера популяции. Другими словами, ${\ displaystyle {\ overline {X}} _ {n}}$ будучи средним для набора наблюдений, вероятность того, что среднее значение распределения ниже UCL _{1 - α} , равна доверительному уровню 1 - α .

Интервалы прогноза

Т -распределение может быть использовано для построения интервала предсказания для ненаблюдаемой выборки из нормального распределения с неизвестными средним и дисперсией.

В байесовской статистике

Студенческий т -распределение, особенно в три-параметра (местоположение масштаба) версии, часто возникает в статистике байесовской в результате ее связи с нормальным распределением . Всякий раз, когда дисперсия нормально распределенной случайной величины неизвестна и над ней помещается сопряженная априорная величина, которая следует обратному гамма-распределению , результирующее предельное распределение переменной будет следовать t- распределению Стьюдента. Эквивалентные конструкции с одинаковыми результатами включают в себя сопряженное распределение масштабированного обратного хи-квадрат по дисперсии или сопряженное гамма-распределение по точности . Если несобственные перед пропорционален сгом ^-2 помещается над дисперсией, то т -распределение также возникает. Это имеет место независимо от того, известно ли среднее значение нормально распределенной переменной, неизвестно, распределено согласно сопряженному нормально распределенному предшествующему, или неизвестно распределено согласно неправильной априорной константе.

Связанные ситуации, которые также приводят к t- распределению:

Маргинальной апостериорное распределение неизвестного среднего значения нормально распределенной переменной, с неизвестной до среднего значения и дисперсии после выше модели.
Перед предсказанием распределения и задним предсказанием распределения нового нормально распределенной точки данных , когда ряд независимых одинаково распределенными которые наблюдались нормально распределенными точки данных, с предварительным средним значением и дисперсией , как в приведенной выше модели.

Надежное параметрическое моделирование

Т -распределение часто используются в качестве альтернативы нормального распределения в качестве модели для данных, которые часто имеют более тяжелые хвосты , чем нормальное распределение позволяет; см., например, Lange et al. ^[26] Классический подход заключался в том, чтобы идентифицировать выбросы (например, с помощью теста Граббса ) и каким-либо образом исключить или уменьшить их вес. Однако не всегда легко идентифицировать выбросы (особенно в больших измерениях ), и t- распределение является естественным выбором модели для таких данных и обеспечивает параметрический подход к надежной статистике .

Байесовское описание можно найти в работе Gelman et al. ^[27] Параметр степеней свободы контролирует эксцесс распределения и коррелирует с параметром масштаба. Вероятность может иметь несколько локальных максимумов, и поэтому часто необходимо фиксировать степени свободы на довольно низком значении и оценивать другие параметры, принимая это как заданное. Некоторые авторы ^{[ необходима цитата ]} сообщают, что значения от 3 до 9 часто являются хорошим выбором. Venables и Рипли ^{[ править ]} предполагают , что значение 5 часто выбор хороший.

Студенческий t- процесс

Для практических нужд регрессии и прогнозирования были введены t -процессы Стьюдента , которые являются обобщениями t- распределений Стьюдента для функций. Стьюдент т -процесс строится из Студенческого т -распределений подобно гауссовский процесс строятся из гауссовых распределений . Для гауссовского процесса все наборы значений имеют многомерное гауссовское распределение. Аналогично, ${\ Displaystyle X (т)}$ является t -процессом Стьюдента на интервале ${\ Displaystyle I = [а, б]}$ если соответствующие значения процесса ${\ Displaystyle Х (т_ {1}), ..., Х (т_ {п})}$ ( ${\ displaystyle t_ {i} \ in I}$ ) имеют совместное многомерное t -распределение Стьюдента . ^[28] Эти процессы используются для регрессии, прогнозирования, байесовской оптимизации и связанных с ними задач. Для многомерной регрессии и прогнозирования с несколькими выходами вводятся и используются многомерные t -процессы Стьюдента . ^[29]

Таблица выбранных значений

В следующей таблице перечислены значения t -распределения с ν степенями свободы для диапазона односторонних или двусторонних критических областей. Первый столбец - это ν, проценты вверху - это уровни достоверности, а числа в теле таблицы - это ${\ Displaystyle т _ {\ альфа, п-1}}$ факторы, описанные в разделе о доверительных интервалах .

Обратите внимание, что последняя строка с бесконечным ν дает критические точки для нормального распределения, поскольку t -распределение с бесконечным числом степеней свободы является нормальным распределением. (См. Связанные дистрибутивы выше).

Односторонний	75%	80%	85%	90%	95%	97,5%	99%	99,5%	99,75%	99,9%	99,95%
Двусторонний	50%	60%	70%	80%	90%	95%	98%	99%	99,5%	99,8%	99,9%
1	1.000	1,376	1,963	3,078	6,314	12,71	31,82	63,66	127,3	318,3	636,6
2	0,816	1.080	1,386	1,886	2,920	4,303	6,965	9,925	14.09	22,33	31,60
3	0,765	0,978	1,250	1,638	2,353	3,182	4,541	5,841	7,453	10.21	12,92
4	0,741	0,941	1.190	1,533	2,132	2,776	3,747	4,604	5,598	7,173	8,610
5	0,727	0,920	1,156	1,476	2,015	2,571	3,365	4,032	4,773	5,893	6,869
6	0,718	0,906	1.134	1,440	1,943	2,447	3,143	3,707	4,317	5,208	5,959
7	0,711	0,896	1.119	1,415	1,895	2.365	2,998	3,499	4,029	4,785	5,408
8	0,706	0,889	1,108	1,397	1,860	2,306	2,896	3,355	3,833	4,501	5,041
9	0,703	0,883	1.100	1,383	1,833	2,262	2,821	3,250	3,690	4,297	4,781
10	0,700	0,879	1.093	1,372	1,812	2,228	2,764	3,169	3,581	4,144	4,587
11	0,697	0,876	1.088	1,363	1,796	2.201	2,718	3,106	3,497	4,025	4,437
12	0,695	0,873	1.083	1,356	1,782	2,179	2,681	3,055	3,428	3,930	4,318
13	0,694	0,870	1.079	1,350	1,771	2,160	2,650	3,012	3,372	3,852	4,221
14	0,692	0,868	1.076	1,345	1,761	2,145	2,624	2,977	3,326	3,787	4,140
15	0,691	0,866	1.074	1,341	1,753	2,131	2,602	2,947	3,286	3,733	4,073
16	0,690	0,865	1.071	1,337	1,746	2,120	2,583	2,921	3,252	3,686	4,015
17	0,689	0,863	1.069	1,333	1,740	2,110	2,567	2,898	3,222	3,646	3,965
18	0,688	0,862	1.067	1,330	1,734	2,101	2,552	2,878	3,197	3,610	3,922
19	0,688	0,861	1.066	1,328	1,729	2,093	2,539	2,861	3,174	3,579	3,883
20	0,687	0,860	1.064	1,325	1,725	2,086	2,528	2,845	3,153	3,552	3,850
21 год	0,686	0,859	1.063	1,323	1,721	2,080	2,518	2,831	3,135	3,527	3,819
22	0,686	0,858	1.061	1,321	1,717	2,074	2,508	2,819	3,119	3,505	3,792
23	0,685	0,858	1.060	1,319	1,714	2,069	2,500	2,807	3,104	3,485	3,767
24	0,685	0,857	1.059	1,318	1,711	2,064	2,492	2,797	3,091	3,467	3,745
25	0,684	0,856	1.058	1,316	1,708	2,060	2,485	2,787	3,078	3,450	3,725
26	0,684	0,856	1.058	1,315	1,706	2,056	2,479	2,779	3,067	3,435	3,707
27	0,684	0,855	1.057	1,314	1,703	2,052	2,473	2,771	3,057	3,421	3,690
28 год	0,683	0,855	1.056	1,313	1,701	2,048	2,467	2,763	3,047	3,408	3,674
29	0,683	0,854	1.055	1,311	1,699	2,045	2,462	2,756	3,038	3,396	3,659
30	0,683	0,854	1.055	1,310	1,697	2,042	2,457	2,750	3,030	3,385	3,646
40	0,681	0,851	1.050	1,303	1,684	2,021	2,423	2,704	2,971	3,307	3,551
50	0,679	0,849	1.047	1,299	1,676	2,009	2,403	2,678	2,937	3,261	3,496
60	0,679	0,848	1.045	1,296	1,671	2.000	2.390	2,660	2,915	3,232	3,460
80	0,678	0,846	1.043	1,292	1,664	1,990	2.374	2,639	2,887	3,195	3,416
100	0,677	0,845	1.042	1,290	1,660	1,984	2.364	2,626	2,871	3,174	3,390
120	0,677	0,845	1.041	1,289	1,658	1,980	2,358	2,617	2,860	3,160	3,373
∞	0,674	0,842	1.036	1,282	1,645	1,960	2.326	2,576	2,807	3,090	3,291
Односторонний	75%	80%	85%	90%	95%	97,5%	99%	99,5%	99,75%	99,9%	99,95%
Двусторонний	50%	60%	70%	80%	90%	95%	98%	99%	99,5%	99,8%	99,9%

Расчет доверительного интервала

Допустим, у нас есть выборка размером 11, средним выборочным значением 10 и дисперсией выборки 2. Для 90% достоверности с 10 степенями свободы одностороннее t- значение из таблицы составляет 1,372. Тогда с доверительным интервалом, рассчитанным из

{\ displaystyle {\ overline {X}} _ {n} \ pm t _ {\ alpha, \ nu} {\ frac {S_ {n}} {\ sqrt {n}}},}

мы определяем, что с вероятностью 90% истинное среднее значение находится ниже

{\ displaystyle 10 + 1,372 {\ frac {\ sqrt {2}} {\ sqrt {11}}} = 10,585.}

Другими словами, в 90% случаев, когда верхний порог вычисляется этим методом на основе конкретных выборок, этот верхний порог превышает истинное среднее значение.

И с уверенностью 90% у нас есть истинное среднее, лежащее выше

{\ displaystyle 10-1.372 {\ frac {\ sqrt {2}} {\ sqrt {11}}} = 9,414.}

Другими словами, в 90% случаев, когда нижний порог вычисляется этим методом по конкретным выборкам, этот нижний порог находится ниже истинного среднего значения.

Таким образом, при 80% достоверности (рассчитанной из 100% - 2 × (1 - 90%) = 80%) у нас есть истинное среднее значение, лежащее в пределах интервала

{\ displaystyle \ left (10-1,372 {\ frac {\ sqrt {2}} {\ sqrt {11}}}, 10 + 1,372 {\ frac {\ sqrt {2}} {\ sqrt {11}}} \ справа) = (9,414,10,585).}

Сказать, что в 80% случаев, когда верхний и нижний пороги вычисляются этим методом на основе данной выборки, истинное среднее значение оказывается как ниже верхнего, так и выше нижнего порога, - это не то же самое, что утверждать, что существует 80% -ная вероятность того, что истинное среднее значение находится между конкретной парой верхнего и нижнего пороговых значений, рассчитанных этим методом; увидеть доверительный интервал и ошибку прокурора .

В настоящее время статистическое программное обеспечение, такое как язык программирования R , и функции, доступные во многих программах электронных таблиц, вычисляют значения t- распределения и его обратного без таблиц.

Смотрите также

Таблица Z- распределения
Распределение хи-квадрат
F -распределение
Гамма-распределение
Сложенные t и половинные t распределения
Распределение Хотеллинга в Т- квадрате
Многовариантное распределение студентов
t -статистический
Тау-распределение для остатков внутренней стьюдентификации
Лямбда-распределение Уилкса
Распределение Уишарта
Нормальное распределение

Заметки

^ Херст, Саймон. Характеристическая функция студенческого т Распределение , Финансовая математика Research Report No. FMRR006-95, Research Report No. Статистика SRR044-95 архивации 18 февраля 2010, в Wayback Machine
^ Helmert FR (1875). "Über die Berechnung des wahrscheinlichen Fehlers aus einer endlichen Anzahl wahrer Beobachtungsfehler". Z. Math. U. Physik . 20 : 300–3.
^ Гельмерт FR (1876 г.). "Uber die Wahrscheinlichkeit der Potenzsummen der Beobachtungsfehler und uber einige damit в Zusammenhang stehende Fragen". Z. Math. Phys . 21 : 192–218.
^ Гельмерт FR (1876 г.). "Die Genauigkeit der Formel von Peters zur Berechnung des wahrscheinlichen Beobachtungsfehlers directer Beobachtungen gleicher Genauigkeit" [Точность формулы Петерса для расчета вероятной ошибки наблюдения прямых наблюдений такой же точности] (PDF) . Astron. Nachr. (на немецком). 88 (8–9): 113–132. Bibcode : 1876AN ..... 88..113H . DOI : 10.1002 / asna.18760880802 .
^ Люрот Дж (1876 г.). "Vergleichung von zwei Werten des wahrscheinlichen Fehlers" . Astron. Nachr. 87 (14): 209–20. Bibcode : 1876AN ..... 87..209L . DOI : 10.1002 / asna.18760871402 .
^ Пфанзагл Дж, Шейнин О (1996). «Исследования по истории вероятности и статистики. XLIV. Предшественник t- распределения». Биометрика . 83 (4): 891–898. DOI : 10.1093 / Biomet / 83.4.891 . Руководство по ремонту 1766040 .
^ Шейнин О. (1995). «Работа Гельмерта по теории ошибок». Arch. Hist. Exact Sci. 49 (1): 73–104. DOI : 10.1007 / BF00374700 .
^ Пирсон, К. (1895-01-01). "Вклад в математическую теорию эволюции. II. Косые вариации в однородном материале" . Философские труды Королевского общества A: математические, физические и инженерные науки . 186 : 343–414 (374). DOI : 10,1098 / rsta.1895.0010 . ISSN 1364-503X .
^ «Студент» [ Уильям Сили Госсет ] (1908). «Вероятная ошибка среднего» (PDF) . Биометрика . 6 (1): 1–25. DOI : 10.1093 / biomet / 6.1.1 . hdl : 10338.dmlcz / 143545 . JSTOR 2331554 .
^ Wendl MC (2016). «Псевдонимная слава». Наука . 351 (6280): 1406. DOI : 10.1126 / science.351.6280.1406 . PMID 27013722 .
^ Мортимер Р.Г. (2005). Математика для физической химии (3-е изд.). Берлингтон, Массачусетс: Elsevier. С. 326 . ISBN 9780080492889. OCLC 156200058 .
^ а б Фишер Р.А. (1925). «Приложения« Студенческой »раздачи» (PDF) . Метрон . 5 : 90–104. Архивировано 5 марта 2016 года из оригинального (PDF) .
^ Уолпол Р.Э., Майерс Р., Майерс С. и др. (2006). Вероятность и статистика для инженеров и ученых (7-е изд.). Нью-Дели: Пирсон. п. 237. ISBN. 9788177584042. OCLC 818811849 .
^ Крушке Ю.К. (2015). Байесовский анализ данных (2-е изд.). Академическая пресса. ISBN 9780124058880. OCLC 959632184 .
^ а б в Джонсон Н.Л., Коц С., Балакришнан Н. (1995). «Глава 28». Непрерывные одномерные распределения . 2 (2-е изд.). Вайли. ISBN 9780471584940.
^ Гельман А.Б., Карлин Дж. С., Рубин Д. Б. и др. (1997). Байесовский анализ данных (2-е изд.). Бока-Ратон: Чепмен и Холл. п. 68. ISBN 9780412039911.
^ Хогг Р.В. , Крейг А.Т. (1978). Введение в математическую статистику (4-е изд.). Нью-Йорк: Макмиллан. ASIN B010WFO0SA . Разделы 4.4 и 4.8CS1 maint: postscript ( ссылка )
^ Кокран WG (1934). «Распределение квадратичных форм в нормальной системе с приложениями к анализу ковариации». Математика. Proc. Camb. Филос. Soc. 30 (2): 178–191. Bibcode : 1934PCPS ... 30..178C . DOI : 10.1017 / S0305004100016595 .
^ Парк С.Ю., Бера АК (2009). «Модель условной гетероскедастичности авторегрессии максимальной энтропии». J. Econom. 150 (2): 219–230. DOI : 10.1016 / j.jeconom.2008.12.014 .
^ Казелла Г., Бергер Р.Л. (1990). Статистический вывод . Ресурсный центр Даксбери. п. 56. ISBN 9780534119584.
^ а б Бейли Р.В. (1994). «Полярная генерация случайных величин с t- распределением». Математика. Comput. 62 (206): 779–781. DOI : 10.2307 / 2153537 . JSTOR 2153537 .
^ а б Джекман, С. (2009). Байесовский анализ для социальных наук . Вайли. п. 507 . DOI : 10.1002 / 9780470686621 . ISBN 9780470011546.
^ а б Епископ, CM (2006). Распознавание образов и машинное обучение . Нью-Йорк, штат Нью-Йорк: Спрингер . ISBN 9780387310732.
^ Орд JK (1972). Семейства частотных распределений . Лондон: Гриффин. ISBN 9780852641378. См. Таблицу 5.1.CS1 maint: postscript ( ссылка )
^ Орд JK (1972). «Глава 5». Семейства частотных распределений . Лондон: Гриффин. ISBN 9780852641378.
^ Ланге К.Л., Литтл Р.Дж., Тейлор Дж. М. (1989). «Робастное статистическое моделирование с использованием t- распределения» (PDF) . Варенье. Стат. Доц. 84 (408): 881–896. DOI : 10.1080 / 01621459.1989.10478852 . JSTOR 2290063 .
^ Гельман А.Б., Карлин Дж.Б., Стерн Х.С. и др. (2014). «Вычислительно эффективное моделирование цепей Маркова». Байесовский анализ данных . Бока-Ратон, Флорида: CRC Press. п. 293. ISBN 9781439898208.
^ Шах, Амар; Уилсон, Эндрю Гордон; Гахрамани, Зубин (2014). « T -процессы Стьюдента как альтернатива гауссовским процессам» (PDF) . JMLR . 33 (Материалы 17-й Международной конференции по искусственному интеллекту и статистике (AISTATS) 2014, Рейкьявик, Исландия): 877–885.
^ Чен, Зексун; Ван, Бо; Горбань, Александр Н. (2019). «Многофакторный гауссовым и Студент - т процесс регрессии для мульти-вывода предсказания» . Нейронные вычисления и приложения . arXiv : 1703.04455 . DOI : 10.1007 / s00521-019-04687-8 .

Внешние ссылки

«Распределение студентов» , Энциклопедия математики , EMS Press , 2001 [1994]
Самые ранние известные применения некоторых слов математики (S) (Замечания по истории термина «распределение учеников»)
Rouaud, M. (2013), Вероятность, статистика и оценка (PDF) (сокращенное издание) Первые студенты на странице 112.
Распределение Стьюдента, ck12

[1] Херст, Саймон. Характеристическая функция студенческого т Распределение , Финансовая математика Research Report No. FMRR006-95, Research Report No. Статистика SRR044-95 архивации 18 февраля 2010, в Wayback Machine

[HFR1-2] Helmert FR (1875). "Über die Berechnung des wahrscheinlichen Fehlers aus einer endlichen Anzahl wahrer Beobachtungsfehler". Z. Math. U. Physik . 20 : 300–3.

[HFR2-3] Гельмерт FR (1876 г.). "Uber die Wahrscheinlichkeit der Potenzsummen der Beobachtungsfehler und uber einige damit в Zusammenhang stehende Fragen". Z. Math. Phys . 21 : 192–218.

[HFR3-4] Гельмерт FR (1876 г.). "Die Genauigkeit der Formel von Peters zur Berechnung des wahrscheinlichen Beobachtungsfehlers directer Beobachtungen gleicher Genauigkeit" [Точность формулы Петерса для расчета вероятной ошибки наблюдения прямых наблюдений такой же точности] (PDF) . Astron. Nachr. (на немецком). 88 (8–9): 113–132. Bibcode : 1876AN ..... 88..113H . DOI : 10.1002 / asna.18760880802 .

[L1876-5] Люрот Дж (1876 г.). "Vergleichung von zwei Werten des wahrscheinlichen Fehlers" . Astron. Nachr. 87 (14): 209–20. Bibcode : 1876AN ..... 87..209L . DOI : 10.1002 / asna.18760871402 .

[6] Пфанзагл Дж, Шейнин О (1996). «Исследования по истории вероятности и статистики. XLIV. Предшественник t- распределения». Биометрика . 83 (4): 891–898. DOI : 10.1093 / Biomet / 83.4.891 . Руководство по ремонту 1766040 .

[7] Шейнин О. (1995). «Работа Гельмерта по теории ошибок». Arch. Hist. Exact Sci. 49 (1): 73–104. DOI : 10.1007 / BF00374700 .

[8] Пирсон, К. (1895-01-01). "Вклад в математическую теорию эволюции. II. Косые вариации в однородном материале" . Философские труды Королевского общества A: математические, физические и инженерные науки . 186 : 343–414 (374). DOI : 10,1098 / rsta.1895.0010 . ISSN 1364-503X .

[9] «Студент» [ Уильям Сили Госсет ] (1908). «Вероятная ошибка среднего» (PDF) . Биометрика . 6 (1): 1–25. DOI : 10.1093 / biomet / 6.1.1 . hdl : 10338.dmlcz / 143545 . JSTOR 2331554 .

[10] Wendl MC (2016). «Псевдонимная слава». Наука . 351 (6280): 1406. DOI : 10.1126 / science.351.6280.1406 . PMID 27013722 .

[11] Мортимер Р.Г. (2005). Математика для физической химии (3-е изд.). Берлингтон, Массачусетс: Elsevier. С. 326 . ISBN 9780080492889. OCLC 156200058 .

[Fisher_1925_90–104-12] а б Фишер Р.А. (1925). «Приложения« Студенческой »раздачи» (PDF) . Метрон . 5 : 90–104. Архивировано 5 марта 2016 года из оригинального (PDF) .

[13] Уолпол Р.Э., Майерс Р., Майерс С. и др. (2006). Вероятность и статистика для инженеров и ученых (7-е изд.). Нью-Дели: Пирсон. п. 237. ISBN. 9788177584042. OCLC 818811849 .

[14] Крушке Ю.К. (2015). Байесовский анализ данных (2-е изд.). Академическая пресса. ISBN 9780124058880. OCLC 959632184 .

[JKB-15] а б в Джонсон Н.Л., Коц С., Балакришнан Н. (1995). «Глава 28». Непрерывные одномерные распределения . 2 (2-е изд.). Вайли. ISBN 9780471584940.

[16] Гельман А.Б., Карлин Дж. С., Рубин Д. Б. и др. (1997). Байесовский анализ данных (2-е изд.). Бока-Ратон: Чепмен и Холл. п. 68. ISBN 9780412039911.

[Hogg-17] Хогг Р.В. , Крейг А.Т. (1978). Введение в математическую статистику (4-е изд.). Нью-Йорк: Макмиллан. ASIN B010WFO0SA . Разделы 4.4 и 4.8CS1 maint: postscript ( ссылка )

[18] Кокран WG (1934). «Распределение квадратичных форм в нормальной системе с приложениями к анализу ковариации». Математика. Proc. Camb. Филос. Soc. 30 (2): 178–191. Bibcode : 1934PCPS ... 30..178C . DOI : 10.1017 / S0305004100016595 .

[19] Парк С.Ю., Бера АК (2009). «Модель условной гетероскедастичности авторегрессии максимальной энтропии». J. Econom. 150 (2): 219–230. DOI : 10.1016 / j.jeconom.2008.12.014 .

[20] Казелла Г., Бергер Р.Л. (1990). Статистический вывод . Ресурсный центр Даксбери. п. 56. ISBN 9780534119584.

[Bailey-21] а б Бейли Р.В. (1994). «Полярная генерация случайных величин с t- распределением». Математика. Comput. 62 (206): 779–781. DOI : 10.2307 / 2153537 . JSTOR 2153537 .

[Jackman-22] а б Джекман, С. (2009). Байесовский анализ для социальных наук . Вайли. п. 507 . DOI : 10.1002 / 9780470686621 . ISBN 9780470011546.

[Bishop2006-23] а б Епископ, CM (2006). Распознавание образов и машинное обучение . Нью-Йорк, штат Нью-Йорк: Спрингер . ISBN 9780387310732.

[24] Орд JK (1972). Семейства частотных распределений . Лондон: Гриффин. ISBN 9780852641378. См. Таблицу 5.1.CS1 maint: postscript ( ссылка )

[25] Орд JK (1972). «Глава 5». Семейства частотных распределений . Лондон: Гриффин. ISBN 9780852641378.

[26] Ланге К.Л., Литтл Р.Дж., Тейлор Дж. М. (1989). «Робастное статистическое моделирование с использованием t- распределения» (PDF) . Варенье. Стат. Доц. 84 (408): 881–896. DOI : 10.1080 / 01621459.1989.10478852 . JSTOR 2290063 .

[27] Гельман А.Б., Карлин Дж.Б., Стерн Х.С. и др. (2014). «Вычислительно эффективное моделирование цепей Маркова». Байесовский анализ данных . Бока-Ратон, Флорида: CRC Press. п. 293. ISBN 9781439898208.

[Shah2014-28] Шах, Амар; Уилсон, Эндрю Гордон; Гахрамани, Зубин (2014). « T -процессы Стьюдента как альтернатива гауссовским процессам» (PDF) . JMLR . 33 (Материалы 17-й Международной конференции по искусственному интеллекту и статистике (AISTATS) 2014, Рейкьявик, Исландия): 877–885.

[Zexun2020-29] Чен, Зексун; Ван, Бо; Горбань, Александр Н. (2019). «Многофакторный гауссовым и Студент - т процесс регрессии для мульти-вывода предсказания» . Нейронные вычисления и приложения . arXiv : 1703.04455 . DOI : 10.1007 / s00521-019-04687-8 .

[1]

Студенческий т -распределение

История и этимология

Как распределение Стьюдента возникает из выборки

Определение

Функция плотности вероятности

Кумулятивная функция распределения

Особые случаи

Как возникает t -распределение

Выборочное распределение

Байесовский вывод

Характеристика

Как распределение тестовой статистики

Вывод

Как максимальное распределение энтропии

Характеристики

Моменты

Отбор проб Монте-Карло

Интеграл функции плотности вероятности Стьюдента и p- значения

Обобщенное t- распределение Стьюдента

По параметру масштабирования σ ^ {\ displaystyle {\ hat {\ sigma}}} или же σ ^ 2 {\ Displaystyle {\ шляпа {\ sigma}} ^ {2}}

В терминах параметра обратного масштабирования λ

Связанные дистрибутивы

Использует

В частотном статистическом выводе

Проверка гипотезы

Доверительные интервалы

Интервалы прогноза

В байесовской статистике

Надежное параметрическое моделирование

Студенческий t- процесс

Таблица выбранных значений

Смотрите также

Заметки

Рекомендации

Внешние ссылки

По параметру масштабирования ${\ displaystyle {\ hat {\ sigma}}}$ или же ${\ Displaystyle {\ шляпа {\ sigma}} ^ {2}}$