В статистике , Уэлч т -test или неравные дисперсии т -test , является двухвыборочным тестом местоположения , который используется для проверки гипотезы о том , что две популяциях имеют одинаковые средства. Она названа в честь своего создателя, Бернарда Льюиса Уэлч , и является адаптацией Стьюдента т -TEST , [1] и является более надежным , когда два образца имеют неравные дисперсии и / или неравные размеры выборки. [2] [3] Эти тесты часто называют «непарными» или «независимыми выборками» t-тесты, поскольку они обычно применяются, когда статистические единицы, лежащие в основе двух сравниваемых выборок, не перекрываются. Учитывая, что t- критерий Велча менее популярен, чем t- критерий Стьюдента [2] и может быть менее знаком читателям, более информативным названием является « t- критерий неравных дисперсий Велча » или « t- критерий неравных дисперсий » для краткости. . [3]
Предположения
T- критерий Стьюдента предполагает, что две сравниваемые популяции обычно распределены с равной дисперсией. T- критерий Велча разработан для неравных популяционных дисперсий, но сохраняется предположение о нормальности. [1] t- критерий Велча является приближенным решением проблемы Беренса – Фишера .
Расчеты
T- критерий Велча определяет статистику t по следующей формуле:
где а также являются выборочные средний и ее стандартная ошибка для данного образца стандартного отклонения и размера выборки . В отличие от t- критерия Стьюдента , знаменатель не основан на общей оценке дисперсии .
В степени свободы Связанная с этой оценкой дисперсии аппроксимируется с помощью уравнения Велча – Саттертуэйта :
Здесь, - степени свободы, связанные с i-й оценкой дисперсии.
Статистические данные приблизительно взяты из t-распределения, поскольку у нас есть аппроксимация распределения хи-квадрат . Это приближение лучше сделать, когда оба а также больше 5. [4] [5]
Статистический тест
Как только t ибыли вычислены, эти статистические данные можно использовать с t- распределением для проверки одной из двух возможных нулевых гипотез :
- что два средних значения совокупности равны, при этом применяется двусторонний критерий ; или же
- что одно из средних значений генеральной совокупности больше или равно другому, в котором применяется односторонний критерий .
Приблизительные степени свободы округляются до ближайшего целого числа. [ необходима цитата ]
Преимущества и ограничения
T- критерий Уэлча более устойчив, чем t- критерий Стьюдента, и поддерживает частоту ошибок типа I, близкую к номинальной для неравных дисперсий и для неравных размеров выборки при нормальности. Кроме того, t- критерий Велча по силе приближается к t- критерию Стьюдента , даже когда дисперсии генеральной совокупности равны, а размеры выборки сбалансированы. [2] t- критерий Велча может быть обобщен на более чем 2 выборки, [6] что более надежно, чем односторонний дисперсионный анализ (ANOVA).
Это не рекомендуется для предварительного теста на равные дисперсии , а затем выбрать между Стьюдента т -теста или Уэлша т -теста. [7] Скорее, t- критерий Уэлча может быть применен напрямую и без каких-либо существенных недостатков к t- критерию Стьюдента, как отмечалось выше. T- критерий Велча остается устойчивым для асимметричных распределений и больших размеров выборки. [8] Надежность снижается для искаженных распределений и меньших выборок, где можно было бы выполнить t- критерий Велча . [9]
Примеры
Следующие три примера сравнить Уэлч т -test и Стьюдента т -тесту. Образцы из случайных нормальных распределений с использованием языка программирования R .
Для всех трех примеров средние по численности населения были а также .
Первый пример - для равных дисперсий () и равных размеров выборки (). Пусть A1 и A2 обозначают две случайные выборки:
Второй пример - для неравных дисперсий (, ) и неравные размеры выборки (, ). Меньшая выборка имеет большую дисперсию:
Третий пример - для неравных дисперсий (, ) и неравные размеры выборки (, ). Чем больше выборка, тем больше дисперсия:
Эталонные p-значения были получены путем моделирования распределений t- статистики для нулевой гипотезы равных средних значений совокупности (). Результаты приведены в таблице ниже с двусторонними p-значениями:
Образец A1 | Образец A2 | Студенческий t- тест | T- критерий Велча | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Пример | ||||||||||||||
1 | 15 | 20,8 | 7.9 | 15 | 23,0 | 3.8 | −2,46 | 28 год | 0,021 | 0,021 | −2,46 | 24,9 | 0,021 | 0,017 |
2 | 10 | 20,6 | 9.0 | 20 | 22,1 | 0,9 | −2,10 | 28 год | 0,045 | 0,150 | −1,57 | 9.9 | 0,149 | 0,144 |
3 | 10 | 19,4 | 1.4 | 20 | 21,6 | 17,1 | -1,64 | 28 год | 0,110 | 0,036 | −2,22 | 24,5 | 0,036 | 0,042 |
Уэлча т -test и Стьюдента т -test дали идентичные результаты , когда оба образца имеют одинаковые дисперсии и размер выборки (пример 1). Но обратите внимание, что если вы выбираете данные из совокупностей с идентичными дисперсиями, выборочные дисперсии будут отличаться, как и результаты двух t-критериев. Таким образом, с фактическими данными два теста почти всегда дают несколько разные результаты.
Для неравных дисперсий t- критерий Стьюдента дал низкое значение p, когда меньшая выборка имела большую дисперсию (Пример 2), и высокое значение p, когда большая выборка имела большую дисперсию (Пример 3). Для неравных дисперсий t- критерий Велча дал p-значения, близкие к смоделированным p-значениям.
Программные реализации
Язык / Программа | Функция | Документация |
---|---|---|
LibreOffice | TTEST(Data1; Data2; Mode; Type) | [10] |
MATLAB | ttest2(data1, data2, 'Vartype', 'unequal') | [11] |
Microsoft Excel до 2010 г. | TTEST(array1, array2, tails, type) | [12] |
Microsoft Excel 2010 и более поздние версии | T.TEST(array1, array2, tails, type) | [13] |
Minitab | Доступ через меню | [14] |
SAS (программное обеспечение) | Вывод по умолчанию из proc ttest (помечен как "Satterthwaite") | |
Python | scipy.stats.ttest_ind(a, b, equal_var=False) | [15] |
р | t.test(data1, data2, alternative="two.sided", var.equal=FALSE) | [16] |
Haskell | Statistics.Test.StudentT.welchTTest SamplesDiffer data1 data2 | [17] |
JMP | Oneway( Y( YColumn), X( XColumn), Unequal Variances( 1 ) ); | [18] |
Юлия | UnequalVarianceTTest(data1, data2) | [19] |
Stata | ttest varname1 == varname2, welch | [20] |
Google Таблицы | TTEST(range1, range2, tails, type) | [21] |
GraphPad Prism | Это выбор в диалоговом окне t-теста. | |
IBM SPSS Statistics | Опция в меню | [22] [23] |
GNU Octave | welch_test(x, y) | [24] |
Смотрите также
- Студенческий t- тест
- Z -тест
- Факторный эксперимент
- Односторонний дисперсионный анализ
- Двухвыборочная статистика Т-квадрата Хотеллинга , многомерное расширение t- критерия Велча
Рекомендации
- ^ а б Уэлч, BL (1947). «Обобщение проблемы Стьюдента, когда задействовано несколько различных популяционных дисперсий». Биометрика . 34 (1-2): 28–35. DOI : 10.1093 / Biomet / 34.1-2.28 . MR 0019277 . PMID 20287819 .
- ^ а б в Ракстон, GD (2006). «T-критерий неравной дисперсии - недостаточно используемая альтернатива t-критерию Стьюдента и U-критерию Манна-Уитни» . Поведенческая экология . 17 (4): 688–690. DOI : 10.1093 / beheco / ark016 .
- ^ а б Деррик, B; Toher, D; Уайт, П (2016). «Почему тест Уэлча устойчив к ошибкам первого типа» (PDF) . Количественные методы психологии . 12 (1): 30–38. DOI : 10.20982 / tqmp.12.1.p030 .
- ^ Формула Саттертуэйта для степеней свободы в двухвыборочном t-тесте (стр. 7)
- ^ Йейтс, Мур и Старнс, Практика статистики, 3-е изд., Стр. 792. Авторское право 2008 г., WH Freeman and Company, 41 Madison Avenue, New York, NY 10010
- ^ Уэлч, BL (1951). «О сравнении нескольких средних значений: альтернативный подход». Биометрика . 38 (3/4): 330–336. DOI : 10.2307 / 2332579 . JSTOR 2332579 .
- ^ Циммерман, DW (2004). «Примечание о предварительных проверках равенства дисперсий». Британский журнал математической и статистической психологии . 57 : 173–181. DOI : 10.1348 / 000711004849222 .
- ^ Fagerland, MW (2012). «t-тесты, непараметрические тесты и большие исследования - парадокс статистической практики?» . BMC Medical Research Methodology . 12 : 78. DOI : 10,1186 / 1471-2288-12-78 . PMC 3445820 . PMID 22697476 .
- ^ Фагерланд, МВт; Сандвик, Л. (2009). «Выполнение пяти двухвыборочных тестов местоположения для асимметричных распределений с неравными дисперсиями». Современные клинические испытания . 30 (5): 490–496. DOI : 10.1016 / j.cct.2009.06.007 .
- ^ https://help.libreoffice.org/Calc/Statistical_Functions_Part_Five#TTEST
- ^ http://uk.mathworks.com/help/stats/ttest2.html
- ^ http://office.microsoft.com/en-us/excel-help/ttest-HP005209325.aspx
- ^ http://office.microsoft.com/en-us/excel-help/t-test-function-HA102753135.aspx
- ^ Обзор для 2-Sample t - Minitab: - официальная документация для Minitab версии 18. Доступно 19 сентября 2020 г.
- ^ http://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html
- ^ https://stat.ethz.ch/R-manual/R-devel/library/stats/html/t.test.html
- ^ http://hackage.haskell.org/package/statistics-0.15.0.0/docs/Statistics-Test-StudentT.html
- ^ https://www.jmp.com/support/help/
- ^ http://hypothesistestsjl.readthedocs.org/en/latest/index.html
- ^ http://www.stata.com/help.cgi?ttest
- ^ https://support.google.com/docs/answer/6055837?hl=en
- ^ Джереми Майлз: t-критерий неравных дисперсий или U-критерий Манна-Уитни? , Дата обращения 11.04.2014.
- ^ One-Sample Test - Официальная документация для SPSS Statistics версии 24. Дата обращения 22.01.2019.
- ^ https://octave.sourceforge.io/statistics/function/welch_test.html