T- критерий Велча

В статистике , Уэлч т -test или неравные дисперсии т -test , является двухвыборочным тестом местоположения , который используется для проверки гипотезы о том , что две популяциях имеют одинаковые средства. Она названа в честь своего создателя, Бернарда Льюиса Уэлч , и является адаптацией Стьюдента т -TEST , ^[1] и является более надежным , когда два образца имеют неравные дисперсии и / или неравные размеры выборки. ^[2]^[3] Эти тесты часто называют «непарными» или «независимыми выборками» t-тесты, поскольку они обычно применяются, когда статистические единицы, лежащие в основе двух сравниваемых выборок, не перекрываются. Учитывая, что t- критерий Велча менее популярен, чем t- критерий Стьюдента ^[2] и может быть менее знаком читателям, более информативным названием является « t- критерий неравных дисперсий Велча » или « t- критерий неравных дисперсий » для краткости. . ^[3]

Предположения

T- критерий Стьюдента предполагает, что две сравниваемые популяции обычно распределены с равной дисперсией. T- критерий Велча разработан для неравных популяционных дисперсий, но сохраняется предположение о нормальности. ^[1] t- критерий Велча является приближенным решением проблемы Беренса – Фишера .

Расчеты

T- критерий Велча определяет статистику t по следующей формуле:

{\ displaystyle t = {\ frac {\ Delta {\ overline {X}}} {s _ {\ Delta {\ bar {X}}}}} = {\ frac {{\ overline {X}} _ {1} - {\ overline {X}} _ {2}} {\ sqrt {{s _ {{\ bar {X}} _ {1}} ^ {2}} + {s _ {{\ bar {X}} _ { 2}} ^ {2}}}}} \,}

{\ displaystyle s _ {{\ bar {X}} _ {i}} = {s_ {i} \ over {\ sqrt {N_ {i}}}} \,}

где ${\ Displaystyle {\ overline {X}} _ {я}}$ а также ${\ displaystyle s _ {{\ bar {X}} _ {i}}}$ являются ${\ displaystyle i ^ {\ text {th}}}$ выборочные средний и ее стандартная ошибка для данного образца стандартного отклонения и размера выборки . В отличие от t- критерия Стьюдента , знаменатель не основан на общей оценке дисперсии .

В степени свободы ${\ displaystyle \ nu}$ Связанная с этой оценкой дисперсии аппроксимируется с помощью уравнения Велча – Саттертуэйта :

{\ displaystyle \ nu ^ {- 1} \ приблизительно {\ frac {\ nu _ {1} ^ {- 1} s _ {{\ bar {X}} _ {1}} ^ {4} + \ nu _ { 2} ^ {- 1} s _ {{\ bar {X}} _ {2}} ^ {4}} {s _ {\ Delta {\ bar {X}}} ^ {4}}}}

Здесь, ${\ displaystyle \ nu _ {i} = N_ {i} -1}$ - степени свободы, связанные с i-й оценкой дисперсии.

Статистические данные приблизительно взяты из t-распределения, поскольку у нас есть аппроксимация распределения хи-квадрат . Это приближение лучше сделать, когда оба ${\ displaystyle N_ {1}}$ а также ${\ displaystyle N_ {2}}$ больше 5. ^[4]^[5]

Статистический тест

Как только t и ${\ displaystyle \ nu}$ были вычислены, эти статистические данные можно использовать с t- распределением для проверки одной из двух возможных нулевых гипотез :

что два средних значения совокупности равны, при этом применяется двусторонний критерий ; или же
что одно из средних значений генеральной совокупности больше или равно другому, в котором применяется односторонний критерий .

Приблизительные степени свободы округляются до ближайшего целого числа. ^{[ необходима цитата ]}

Преимущества и ограничения

T- критерий Уэлча более устойчив, чем t- критерий Стьюдента, и поддерживает частоту ошибок типа I, близкую к номинальной для неравных дисперсий и для неравных размеров выборки при нормальности. Кроме того, t- критерий Велча по силе приближается к t- критерию Стьюдента , даже когда дисперсии генеральной совокупности равны, а размеры выборки сбалансированы. ^[2] t- критерий Велча может быть обобщен на более чем 2 выборки, ^[6] что более надежно, чем односторонний дисперсионный анализ (ANOVA).

Это не рекомендуется для предварительного теста на равные дисперсии , а затем выбрать между Стьюдента т -теста или Уэлша т -теста. ^[7] Скорее, t- критерий Уэлча может быть применен напрямую и без каких-либо существенных недостатков к t- критерию Стьюдента, как отмечалось выше. T- критерий Велча остается устойчивым для асимметричных распределений и больших размеров выборки. ^[8] Надежность снижается для искаженных распределений и меньших выборок, где можно было бы выполнить t- критерий Велча . ^[9]

Примеры

Следующие три примера сравнить Уэлч т -test и Стьюдента т -тесту. Образцы из случайных нормальных распределений с использованием языка программирования R .

Для всех трех примеров средние по численности населения были ${\ displaystyle \ mu _ {1} = 20}$ а также ${\ displaystyle \ mu _ {2} = 22}$ .

Первый пример - для равных дисперсий ( ${\ Displaystyle \ sigma _ {1} ^ {2} = \ sigma _ {2} ^ {2} = 4}$ ) и равных размеров выборки ( ${\ Displaystyle N_ {1} = N_ {2} = 15}$ ). Пусть A1 и A2 обозначают две случайные выборки:

{\ Displaystyle A_ {1} = \ {27.5, 21.0, 19.0, 23.6, 17.0, 17.9, 16.9, 20.1, 21.9, 22.6, 23.1, 19.6, 19.0, 21.7, 21.4 \}}

{\ Displaystyle A_ {2} = \ {27.1, 22.0, 20.8, 23.4, 23.4, 23.5, 25.8, 22.0, 24.8, 20.2, 21.9, 22.1, 22.9, 20.5, 24.4 \}}

Второй пример - для неравных дисперсий ( ${\ displaystyle \ sigma _ {1} ^ {2} = 16}$ , ${\ displaystyle \ sigma _ {2} ^ {2} = 1}$ ) и неравные размеры выборки ( ${\ displaystyle N_ {1} = 10}$ , ${\ displaystyle N_ {2} = 20}$ ). Меньшая выборка имеет большую дисперсию:

{\ displaystyle {\ begin {align} A_ {1} & = \ {17.2,20.9,22.6,18.1,21.7,21.4,23.5,24.2,14.7,21.8 \} \\ A_ {2} & = \ {21.5, 22.8, 21.0, 23.0, 21.6, 23.6, 22.5, 20.7, 23.4, 21.8, 20.7, 21.7, 21.5, 22.5, 23.6, 21.5, 22.5, 23.5, 21.5, 21.8 \} \ конец {выровнено}}}

Третий пример - для неравных дисперсий ( ${\ Displaystyle \ sigma _ {1} ^ {2} = 1}$ , ${\ Displaystyle \ sigma _ {2} ^ {2} = 16}$ ) и неравные размеры выборки ( ${\ displaystyle N_ {1} = 10}$ , ${\ displaystyle N_ {2} = 20}$ ). Чем больше выборка, тем больше дисперсия:

{\ displaystyle {\ begin {align} A_ {1} & = \ {19.8,20.4,19.6,17.8,18.5,18.9,18.3,18.9,19.5,22.0 \} \\ A_ {2} & = \ {28.2, 26.6, 20.1, 23.3, 25.2, 22.1, 17.7, 27.6, 20.6, 13.7, 23.2, 17.5, 20.6, 18.0, 23.9, 21.6, 24.3, 20.4, 24.0, 13.2 \} \ end {align}}}

Эталонные p-значения были получены путем моделирования распределений t- статистики для нулевой гипотезы равных средних значений совокупности ( ${\ displaystyle \ mu _ {1} - \ mu _ {2} = 0}$ ). Результаты приведены в таблице ниже с двусторонними p-значениями:

	Образец A1			Образец A2			Студенческий t- тест				T- критерий Велча
Пример	${\ displaystyle N_ {1}}$	${\ displaystyle {\ overline {X}} _ {1}}$	${\ displaystyle s_ {1} ^ {2}}$	${\ displaystyle N_ {2}}$	${\ displaystyle {\ overline {X}} _ {2}}$	${\ displaystyle s_ {2} ^ {2}}$	${\ displaystyle t}$	${\ displaystyle \ nu}$	${\ displaystyle P}$	${\ displaystyle P _ {\ mathrm {sim}}}$	${\ displaystyle t}$	${\ displaystyle \ nu}$	${\ displaystyle P}$	${\ displaystyle P _ {\ mathrm {sim}}}$
1	15	20,8	7.9	15	23,0	3.8	−2,46	28 год	0,021	0,021	−2,46	24,9	0,021	0,017
2	10	20,6	9.0	20	22,1	0,9	−2,10	28 год	0,045	0,150	−1,57	9.9	0,149	0,144
3	10	19,4	1.4	20	21,6	17,1	-1,64	28 год	0,110	0,036	−2,22	24,5	0,036	0,042

Уэлча т -test и Стьюдента т -test дали идентичные результаты , когда оба образца имеют одинаковые дисперсии и размер выборки (пример 1). Но обратите внимание, что если вы выбираете данные из совокупностей с идентичными дисперсиями, выборочные дисперсии будут отличаться, как и результаты двух t-критериев. Таким образом, с фактическими данными два теста почти всегда дают несколько разные результаты.

Для неравных дисперсий t- критерий Стьюдента дал низкое значение p, когда меньшая выборка имела большую дисперсию (Пример 2), и высокое значение p, когда большая выборка имела большую дисперсию (Пример 3). Для неравных дисперсий t- критерий Велча дал p-значения, близкие к смоделированным p-значениям.

Программные реализации

Язык / Программа	Функция	Документация
LibreOffice	`TTEST(Data1; Data2; Mode; Type)`	^[10]
MATLAB	`ttest2(data1, data2, 'Vartype', 'unequal')`	^[11]
Microsoft Excel до 2010 г.	`TTEST(array1, array2, tails, type)`	^[12]
Microsoft Excel 2010 и более поздние версии	`T.TEST(array1, array2, tails, type)`	^[13]
Minitab	Доступ через меню	^[14]
SAS (программное обеспечение)	Вывод по умолчанию из `proc ttest`(помечен как "Satterthwaite")
Python	`scipy.stats.ttest_ind(a, b, equal_var=False)`	^[15]
р	`t.test(data1, data2, alternative="two.sided", var.equal=FALSE)`	^[16]
Haskell	`Statistics.Test.StudentT.welchTTest SamplesDiffer data1 data2`	^[17]
JMP	`Oneway( Y( YColumn), X( XColumn), Unequal Variances( 1 ) );`	^[18]
Юлия	`UnequalVarianceTTest(data1, data2)`	^[19]
Stata	`ttest varname1 == varname2, welch`	^[20]
Google Таблицы	`TTEST(range1, range2, tails, type)`	^[21]
GraphPad Prism	Это выбор в диалоговом окне t-теста.
IBM SPSS Statistics	Опция в меню	^[22]^[23]
GNU Octave	`welch_test(x, y)`	^[24]

Смотрите также

Студенческий t- тест
Z -тест
Факторный эксперимент
Односторонний дисперсионный анализ
Двухвыборочная статистика Т-квадрата Хотеллинга , многомерное расширение t- критерия Велча

Рекомендации

^ а б Уэлч, BL (1947). «Обобщение проблемы Стьюдента, когда задействовано несколько различных популяционных дисперсий». Биометрика . 34 (1-2): 28–35. DOI : 10.1093 / Biomet / 34.1-2.28 . MR 0019277 . PMID 20287819 .
^ а б в Ракстон, GD (2006). «T-критерий неравной дисперсии - недостаточно используемая альтернатива t-критерию Стьюдента и U-критерию Манна-Уитни» . Поведенческая экология . 17 (4): 688–690. DOI : 10.1093 / beheco / ark016 .
^ а б Деррик, B; Toher, D; Уайт, П (2016). «Почему тест Уэлча устойчив к ошибкам первого типа» (PDF) . Количественные методы психологии . 12 (1): 30–38. DOI : 10.20982 / tqmp.12.1.p030 .
^ Формула Саттертуэйта для степеней свободы в двухвыборочном t-тесте (стр. 7)
^ Йейтс, Мур и Старнс, Практика статистики, 3-е изд., Стр. 792. Авторское право 2008 г., WH Freeman and Company, 41 Madison Avenue, New York, NY 10010
^ Уэлч, BL (1951). «О сравнении нескольких средних значений: альтернативный подход». Биометрика . 38 (3/4): 330–336. DOI : 10.2307 / 2332579 . JSTOR 2332579 .
^ Циммерман, DW (2004). «Примечание о предварительных проверках равенства дисперсий». Британский журнал математической и статистической психологии . 57 : 173–181. DOI : 10.1348 / 000711004849222 .
^ Fagerland, MW (2012). «t-тесты, непараметрические тесты и большие исследования - парадокс статистической практики?» . BMC Medical Research Methodology . 12 : 78. DOI : 10,1186 / 1471-2288-12-78 . PMC 3445820 . PMID 22697476 .
^ Фагерланд, МВт; Сандвик, Л. (2009). «Выполнение пяти двухвыборочных тестов местоположения для асимметричных распределений с неравными дисперсиями». Современные клинические испытания . 30 (5): 490–496. DOI : 10.1016 / j.cct.2009.06.007 .
^ https://help.libreoffice.org/Calc/Statistical_Functions_Part_Five#TTEST
^ http://uk.mathworks.com/help/stats/ttest2.html
^ http://office.microsoft.com/en-us/excel-help/ttest-HP005209325.aspx
^ http://office.microsoft.com/en-us/excel-help/t-test-function-HA102753135.aspx
^ Обзор для 2-Sample t - Minitab: - официальная документация для Minitab версии 18. Доступно 19 сентября 2020 г.
^ http://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html
^ https://stat.ethz.ch/R-manual/R-devel/library/stats/html/t.test.html
^ http://hackage.haskell.org/package/statistics-0.15.0.0/docs/Statistics-Test-StudentT.html
^ https://www.jmp.com/support/help/
^ http://hypothesistestsjl.readthedocs.org/en/latest/index.html
^ http://www.stata.com/help.cgi?ttest
^ https://support.google.com/docs/answer/6055837?hl=en
^ Джереми Майлз: t-критерий неравных дисперсий или U-критерий Манна-Уитни? , Дата обращения 11.04.2014.
^ One-Sample Test - Официальная документация для SPSS Statistics версии 24. Дата обращения 22.01.2019.
^ https://octave.sourceforge.io/statistics/function/welch_test.html

[Welch1947-1] а б Уэлч, BL (1947). «Обобщение проблемы Стьюдента, когда задействовано несколько различных популяционных дисперсий». Биометрика . 34 (1-2): 28–35. DOI : 10.1093 / Biomet / 34.1-2.28 . MR 0019277 . PMID 20287819 .

[Ruxton2006-2] а б в Ракстон, GD (2006). «T-критерий неравной дисперсии - недостаточно используемая альтернатива t-критерию Стьюдента и U-критерию Манна-Уитни» . Поведенческая экология . 17 (4): 688–690. DOI : 10.1093 / beheco / ark016 .

[WhyWelch-3] а б Деррик, B; Toher, D; Уайт, П (2016). «Почему тест Уэлча устойчив к ошибкам первого типа» (PDF) . Количественные методы психологии . 12 (1): 30–38. DOI : 10.20982 / tqmp.12.1.p030 .

[4] Формула Саттертуэйта для степеней свободы в двухвыборочном t-тесте (стр. 7)

[5] Йейтс, Мур и Старнс, Практика статистики, 3-е изд., Стр. 792. Авторское право 2008 г., WH Freeman and Company, 41 Madison Avenue, New York, NY 10010

[Welch1951-6] Уэлч, BL (1951). «О сравнении нескольких средних значений: альтернативный подход». Биометрика . 38 (3/4): 330–336. DOI : 10.2307 / 2332579 . JSTOR 2332579 .

[Zimmerman2004-7] Циммерман, DW (2004). «Примечание о предварительных проверках равенства дисперсий». Британский журнал математической и статистической психологии . 57 : 173–181. DOI : 10.1348 / 000711004849222 .

[Fagerland2012-8] Fagerland, MW (2012). «t-тесты, непараметрические тесты и большие исследования - парадокс статистической практики?» . BMC Medical Research Methodology . 12 : 78. DOI : 10,1186 / 1471-2288-12-78 . PMC 3445820 . PMID 22697476 .

[Fagerland2009-9] Фагерланд, МВт; Сандвик, Л. (2009). «Выполнение пяти двухвыборочных тестов местоположения для асимметричных распределений с неравными дисперсиями». Современные клинические испытания . 30 (5): 490–496. DOI : 10.1016 / j.cct.2009.06.007 .

[10] ttps://help.libreoffice.org/Calc/Statistical_Functions_Part_Five#TTEST

[11] ttp://uk.mathworks.com/help/stats/ttest2.html

[12] ttp://office.microsoft.com/en-us/excel-help/ttest-HP005209325.aspx

[13] ttp://office.microsoft.com/en-us/excel-help/t-test-function-HA102753135.aspx

[14] Обзор для 2-Sample t - Minitab: - официальная документация для Minitab версии 18. Доступно 19 сентября 2020 г.

[15] ttp://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html

[16] ttps://stat.ethz.ch/R-manual/R-devel/library/stats/html/t.test.html

[17] ttp://hackage.haskell.org/package/statistics-0.15.0.0/docs/Statistics-Test-StudentT.html

[18] ttps://www.jmp.com/support/help/

[19] ttp://hypothesistestsjl.readthedocs.org/en/latest/index.html

[20] ttp://www.stata.com/help.cgi?ttest

[21] ttps://support.google.com/docs/answer/6055837?hl=en

[22] Джереми Майлз: t-критерий неравных дисперсий или U-критерий Манна-Уитни? , Дата обращения 11.04.2014.

[23] One-Sample Test - Официальная документация для SPSS Statistics версии 24. Дата обращения 22.01.2019.

[24] ttps://octave.sourceforge.io/statistics/function/welch_test.html

[1]