Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В статистике , то т -статистики является отношением ухода расчетного значения параметра от его предполагаемого значения к его стандартной ошибке . Он используется при проверке гипотез с помощью t- критерия Стьюдента . Т -статистики используется в т -теста , чтобы определить, следует ли поддерживать или отвергнуть нулевую гипотезу. Он очень похож на Z-оценку, но с той разницей, что t- статистика используется, когда размер выборки невелик или стандартное отклонение генеральной совокупности неизвестно. Например, t- статистика используется для оценкинаселения среднее от выборочного распределения из выборочных средних , если население стандартное отклонение неизвестно. Он также используется вместе с p-значением при запуске проверки гипотез, где p-значение говорит нам, каковы шансы того, что результаты получатся.

Определение и особенности [ править ]

Пусть - оценка параметра β в некоторой статистической модели . Тогда t- статистика для этого параметра - это любая величина вида

где β 0 - неслучайная известная константа, которая может совпадать или не соответствовать фактическому неизвестному значению параметра β , и является стандартной ошибкой средства оценки для β .

По умолчанию статистические пакеты сообщают t- статистику с β 0 = 0 (эта t- статистика используется для проверки значимости соответствующего регрессора). Однако, когда t- статистика необходима для проверки гипотезы формы H 0 : β = β 0 , тогда может использоваться ненулевой β 0 .

Если это обычные наименьших квадратов оценки в классической модели линейной регрессии (то есть, с нормально распределенными и гомоскедастичный термины ошибок), и если истинное значение параметра р равно р 0 , тогда распределение выборки из т -статистики является в Стьюдента т -распределение с ( п - к ) степеней свободы, где п есть число наблюдений, и K это количество регрессоров (включая перехват) [цитата необходима ].

В большинстве моделей, оценка является последовательным для р и распределяется асимптотически нормально . Если истинное значение параметра β равно β 0 и величина правильно оценивает асимптотическую дисперсию этой оценки, то t- статистика будет асимптотически иметь стандартное нормальное распределение.

В некоторых моделях распределение t- статистики отличается от нормального распределения даже асимптотически. Например, когда временной ряд с единичным корнем регрессируется в расширенном тесте Дики – Фуллера , t- статистика теста будет асимптотически иметь одно из распределений Дики – Фуллера (в зависимости от настроек теста).

Используйте [ редактировать ]

Чаще всего , т статистик используется в Стьюденте т - тестах , форме статистической проверки гипотез , и при вычислении определенных доверительных интервалов .

Ключевым свойством t- статистики является то, что она является ключевой величиной - хотя ее распределение определяется в терминах выборочного среднего, его выборочное распределение не зависит от параметров генеральной совокупности, и поэтому его можно использовать независимо от того, какими они могут быть.

Можно также разделить остаточный от образца стандартного отклонения :

Чтобы вычислить оценку количества стандартных отклонений, данная выборка от среднего значения, как примерная версия z-значения , z-оценка требует параметров генеральной совокупности.

Прогноз [ править ]

Учитывая нормальное распределение с неизвестным средним значением и дисперсией, t- статистика будущего наблюдения после того, как было сделано n наблюдений, является вспомогательной статистикой - ключевой величиной (не зависит от значений μ и σ 2 ), которая является статистикой (рассчитано по наблюдениям). Это позволяет вычислить интервал частотного прогнозирования ( доверительный интервал прогнозирования ) с помощью следующего t-распределения:

Решение для урожайности прогнозируемого распределения

из которых можно вычислить доверительные интервалы прогноза - с учетом вероятности p можно вычислить интервалы, такие, что в 100 p % случаев следующее наблюдение будет попадать в этот интервал.

История [ править ]

Термин « t- статистика» сокращен от «статистика проверки гипотез». [1] [ необходима цитата ] В статистике t-распределение было впервые получено как апостериорное распределение в 1876 году Гельмертом [2] [3] [4] и Люротом . [5] [6] [7] t-распределение также появилось в более общей форме как распределение Пирсона типа IV в статье Карла Пирсона 1895 года. [8] Тем не менее, Т-распределение, также известное как Т-распределение Стьюдента, получило свое название от Уильяма Сили Госсета.который впервые опубликовал это в английской литературе в своей статье 1908 года под названием Biometrika, используя псевдоним «Студент» [9] [10], потому что его работодатель предпочитал, чтобы сотрудники использовали псевдонимы при публикации научных статей вместо их настоящего имени, поэтому он использовал имя Студент », чтобы скрыть свою личность. [11] Госсет работал на пивоварне Guinness в Дублине , Ирландия., и интересовался проблемами малых образцов - например, химическими свойствами ячменя, где размер выборки может составлять всего 3. Следовательно, вторая версия этимологии термина Стьюдент заключается в том, что Guinness не хотел, чтобы их конкуренты знали что они использовали t-тест для определения качества сырья. Хотя это был Уильям Госсет, в честь которого был написан термин «Студент», на самом деле именно благодаря работе Рональда Фишера распределение стало широко известно как «Распределение Стьюдента» [12] [13] и « t-критерий Стьюдента ».

Понятия, связанные с данным [ править ]

  • z- оценка (стандартизация) : если параметры совокупности известны, то вместо вычисления t-статистики можно вычислить z-оценку; аналогично, вместо использования t- критерия используется z- критерий . Это редкость вне стандартизированного тестирования .
  • Студентизованный остаток : в регрессионном анализе стандартные ошибки оценщиков в разных точках данных различаются (сравните средние и конечные точки простой линейной регрессии ), и, таким образом, нужно разделить разные остатки на разные оценки ошибки, в результате чего получится то, что называется студентизированные остатки .

См. Также [ править ]

  • F -тест
  • t 2 -статистический
  • Т-распределение студентов
  • T-тест Стьюдента
  • Проверка гипотезы
  • Распределения сложенных t и половин t
  • Распределение хи-квадрат

Ссылки [ править ]

  1. ^ Микробиом в здоровье и болезнях . Академическая пресса. 29 мая 2020. с. 397. ISBN. 978-0-12-820001-8.
  2. ^ Сабо, Иштван (2003), Einführung в фильеры Technische Механике ., Springer Berlin Heidelberg, стр 196-199, DOI : 10.1007 / 978-3-642-61925-0_16 , ISBN 978-3-540-13293-6 Отсутствует или пусто |title=( справка ); |chapter=игнорируется ( помощь )
  3. ^ Schlyvitch Б. (октябрь 1937). "Untersuchungen über den anastomotischen Kanal zwischen der Arteria coeliaca und mesenterica superior und damit в Zusammenhang stehende Fragen". Zeitschrift für Anatomie und Entwicklungsgeschichte . 107 (6): 709–737. DOI : 10.1007 / bf02118337 . ISSN 0340-2061 . S2CID 27311567 .  
  4. ^ Хельмерт (1876). "Die Genauigkeit der Formel von Peters zur Berechnung des wahrscheinlichen Beobachtungsfehlers directer Beobachtungen gleicher Genauigkeit" . Astronomische Nachrichten (на немецком языке). 88 (8–9): 113–131. Bibcode : 1876AN ..... 88..113H . DOI : 10.1002 / asna.18760880802 .
  5. ^ Люрота, J. (1876). "Vergleichung von zwei Werthen des wahrscheinlichen Fehlers" . Astronomische Nachrichten (на немецком языке). 87 (14): 209–220. Bibcode : 1876AN ..... 87..209L . DOI : 10.1002 / asna.18760871402 .
  6. ^ Pfanzagl Дж, Шейнин О (1996). «Исследования по истории вероятности и статистики. XLIV. Предшественник t-распределения». Биометрика . 83 (4): 891–898. DOI : 10.1093 / Biomet / 83.4.891. Руководство по ремонту 1766040.
  7. ^ Шейнин, Оскар (1995). «Работа Гельмерта по теории ошибок». Архив истории точных наук . 49 (1): 73–104. DOI : 10.1007 / BF00374700 . ISSN 0003-9519 . S2CID 121241599 .  
  8. ^ Пирсон, К. (1895-01-01). "Вклад в математическую теорию эволюции. II. Косые вариации в однородном материале". Философские труды Королевского общества A: математические, физические и технические науки . 186 : 343–414 (374). DOI : 10,1098 / rsta.1895.0010. ISSN 1364-503X
  9. ^ "Студент" [ Уильям Сили Госсет ] (1908). «Вероятная ошибка среднего» (PDF). Биометрика . 6 (1): 1–25. DOI : 10.1093 / biomet / 6.1.1. hdl : 10338.dmlcz / 143545. JSTOR 2331554
  10. ^ «Таблица T | История таблицы T, этимология, таблица T с одним концом, таблица T с двумя хвостами и T-статистика» .
  11. ^ Wendl MC (2016). «Псевдонимная слава». Наука. 351 (6280): 1406. DOI: 10.1126 / science.351.6280.1406. PMID 27013722
  12. ^ "Исходный PDF". DOI : 10.15438 / rr.5.1.7 . Cite journal requires |journal= (help)
  13. ^ Уолпол, Рональд Э. (2006). Вероятность и статистика для инженеров и ученых . Майерс, Х. Раймонд. (7-е изд.). Нью-Дели: Пирсон. ISBN 81-7758-404-9. OCLC  818811849 .

Внешние ссылки [ править ]