В дизайне экспериментов в статистике , то дама дегустации чая является рандомизированное эксперимент разработан Рональдом Фишером и сообщил в своей книге Дизайн экспериментов (1935). [1] Эксперимент является оригинальным изложением идеи Фишера о нулевой гипотезе , которая «никогда не доказывается и не устанавливается, но, возможно, опровергается в ходе экспериментов». [2] [3]
Женщина, о которой идет речь ( Мюриэль Бристоль ), утверждала, что может сказать , чай или молоко было сначала добавлено в чашку . Фишер предложил подать ей восемь чашек, по четыре каждого сорта, в случайном порядке. Тогда можно было бы спросить, какова вероятность того, что она получит определенное количество чашек, которое она правильно определила, но просто случайно.
Описание Фишера занимает менее 10 страниц и отличается простотой и полнотой в части терминологии, расчетов и схемы эксперимента. [4] Пример основан на событии из жизни Фишера. Используемый тест был точным тестом Фишера .
Эксперимент [ править ]
В ходе эксперимента испытуемому предоставляется 8 случайно упорядоченных чашек чая: 4 из них сначала наливают чай, затем добавляют молоко, а 4 - сначала наливают молоко, а затем добавляют чай. Испытуемый должен выбрать 4 чашки, приготовленные одним способом. Допускается оценка кубков путем прямого сравнения. Испытуемый полностью раскрывает метод, использованный в эксперименте.
Нулевая гипотеза в том , что субъект не имеет возможности различать чаи. В подходе Фишера, не было никакой альтернативной гипотезе , [2] в отличие от подхода Неймана-Пирсона .
Статистика теста - это простой подсчет количества успехов в выборе 4 чашек (количество успешно выбранных чашек данного типа). Распределение возможного числа успехов при условии, что нулевая гипотеза верна, может быть вычислено с использованием количества комбинаций. Используя формулу комбинации , с выбранным общим количеством чашек и чашек, есть
возможные комбинации.
Количество успехов | Комбинации выбора | Количество комбинаций |
---|---|---|
0 | оооо | 1 × 1 = 1 |
1 | ooox, ooxo, oxoo, xooo | 4 × 4 = 16 |
2 | ooxx, oxox, oxxo, xoxo, xxoo, xoox | 6 × 6 = 36 |
3 | oxxx, xoxx, xxox, xxxo | 4 × 4 = 16 |
4 | хххх | 1 × 1 = 1 |
Общий | 70 |
Частота возможного числа успехов, приведенная в последнем столбце этой таблицы, определяется следующим образом. Для 0 успехов, очевидно, есть только один набор из четырех вариантов (а именно, выбор всех четырех неправильных чашек), дающий такой результат. Для одного успеха и трех неудач существует четыре правильных чашки, из которых выбирается одна, что по формуле комбинации может происходить по- разному (как показано в столбце 2, где x обозначает правильную выбранную чашку, а o обозначает правильную чашку. что не выбрано); и независимо от этого есть четыре неправильных чашки, из которых три выбраны, что может происходить разными способами (как показано во втором столбце, на этот раз с x, интерпретируемым как неправильная чашка, которая не выбрана, иo указание неправильной выбранной чашки). Таким образом, выбор любой одной правильной чашки и любых трех неправильных чашек может происходить любым из 4 × 4 = 16 способов. Соответственно рассчитываются частоты других возможных успехов. Таким образом, количество успехов распределяется согласно гипергеометрическому распределению . Распределение комбинаций для создания k выборок из 2k доступных выборов соответствует k- й строке треугольника Паскаля, так что каждое целое число в строке возводится в квадрат. В этом случае, потому что 4 чашки выбраны из 8 доступных чашек.
Критической областью для отклонения нулевого значения отсутствия способности различать был единственный случай 4 успехов из 4 возможных, основанный на общепринятом критерии вероятности <5%. Это критическая область, потому что при нулевом значении отсутствия способности различать 4 успеха имеют 1 шанс из 70 (≈ 1,4% <5%), тогда как по крайней мере 3 из 4 успехов имеют вероятность (16 + 1) / 70 (≈ 24,3%> 5%).
Таким образом, если и только если женщина должным образом классифицирует все 8 чашек, Фишер будет готов отвергнуть нулевую гипотезу - фактически признав способность женщины на уровне значимости 1,4% (но без количественной оценки ее способности). Позже Фишер обсудил преимущества дополнительных испытаний и повторных тестов.
Дэвид Салсбург сообщает, что коллега Фишера, Х. Фэрфилд Смит , показал, что в реальном эксперименте женщине удалось правильно идентифицировать все восемь чашек. [5] [6] Вероятность того, что кто-то, кто просто догадывается, все сделает правильно, предполагая, что она угадает, что в любые четыре были добавлены чай сначала, а в остальные четыре - молоко, будет только 1 из 70 (комбинация 8, взятых из 4 вовремя).
Lady Дегустация чая книги [ править ]
Дэвид Салсберг опубликовал научно - популярную книгу под названием The Lady дегустация чай , [5] , который описывает эксперимент и идеи Фишера на рандомизации . Деб Басу писала, что «знаменитый случай« дегустации чая для женщин »» был «одним из двух опорных столпов ... рандомизационного анализа экспериментальных данных». [7]
См. Также [ править ]
Ссылки [ править ]
- ^ Фишер 1971 , II. Принципы экспериментирования, иллюстрируемые психофизическим экспериментом.
- ^ а б Фишер 1971 , Глава II. Принципы экспериментирования, иллюстрируемые психофизическим экспериментом, Раздел 8. Нулевая гипотеза.
- ^ КДИ цитата: 1935 Р. Фишер, Дизайн экспериментов II. 19, «Мы можем говорить об этой гипотезе как о« нулевой гипотезе »[...], нулевая гипотеза никогда не доказывается или не устанавливается, но, возможно, опровергается в ходе экспериментов».
- ^ Фишер, сэр Рональд А. (1956) [ План экспериментов (1935)]. «Математика дамы, дегустирующей чай» . В Джеймс Рой Ньюман (ред.). Мир математики, том 3 . Courier Dover Publications. ISBN 978-0-486-41151-4.
- ^ а б Сальсбург (2002)
- ^ Коробка, Джоан Фишер (1978). Р. А. Фишер, Жизнь ученого . Нью-Йорк: Вили. п. 134. ISBN 0-471-09300-9.
- ↑ Басу (1980a, с. 575; 1980b)
- Фишер, Рональд А. (1971) [1935]. Дизайн экспериментов (9-е изд.). Макмиллан. ISBN 0-02-844690-9.
- Басу, Д. (1980a). «Рандомизационный анализ экспериментальных данных: рандомизационный тест Фишера». Журнал Американской статистической ассоциации . 75 (371): 575–582. DOI : 10.2307 / 2287648 . JSTOR 2287648 .
- Басу, Д. (1980b). «Рандомизационный тест Фишера», перепечатанный с новым предисловием в книге « Статистическая информация и вероятность: сборник критических статей» доктора Д. Басу ; JK Ghosh , редактор. Springer 1988 г.
- Кемпторн, Оскар (1992). «Интервенционные эксперименты, рандомизация и вывод» . В малайском гош и Прамод К. Патхак (ред.). Актуальные вопросы статистического вывода - Очерки в честь Д. Басу . Конспект лекций Института математической статистики - Серия монографий. Хейворд, Калифорния: IMS. С. 13–31. DOI : 10.1214 / lnms / 1215458836 . ISBN 0-940600-24-2.
- Сальсбург, Д. (2002) Леди, дегустирующая чай: как статистика произвела революцию в науке в двадцатом веке , WH Freeman / Owl Book. ISBN 0-8050-7134-2