В статистике , последовательный анализ или последовательное тестирование гипотез является статистическим анализом , где размер выборки не фиксируется заранее. Вместо этого данные оцениваются по мере их сбора, и дальнейший отбор образцов останавливается в соответствии с заранее определенным правилом остановки, как только наблюдаются значимые результаты. Таким образом, иногда вывод может быть сделан на гораздо более ранней стадии, чем это было бы возможно при более классической проверке или оценке гипотез , что, как следствие, требует меньших финансовых и / или человеческих затрат.
История
Метод последовательного анализа впервые приписывается Абрахаму Вальду [1] с Якобом Вулфовицем , У. Алленом Уоллисом и Милтоном Фридманом [2] в Группе статистических исследований Колумбийского университета в качестве инструмента для более эффективного контроля качества в промышленности во время Второй мировой войны . Его ценность для военных действий была немедленно признана и привела к тому, что он получил "ограниченную" классификацию . [3] В то же время Джордж Барнард возглавлял группу, работавшую над оптимальной остановкой в Великобритании. Еще один ранний вклад в этот метод был сделан К. Дж. Эрроу с Д. Блэквеллом и М. А. Гиршиком. [4]
Подобный подход был независимо разработан из первых принципов примерно в то же время Аланом Тьюрингом как часть техники Banburismus , используемой в Bletchley Park , для проверки гипотез о том, следует ли соединять и анализировать вместе разные сообщения, закодированные немецкими машинами Enigma . Эта работа оставалась секретной до начала 1980-х годов. [5]
Питер Армитаж представил использование последовательного анализа в медицинских исследованиях, особенно в области клинических испытаний. Последовательные методы стали все более популярными в медицине после работы Стюарта Покока , в которой были даны четкие рекомендации о том, как контролировать уровень ошибок первого типа в последовательных планах. [6]
Функции расходов на альфа-версию
Когда исследователи повторно анализируют данные по мере добавления новых наблюдений, вероятность ошибки 1-го типа увеличивается. Следовательно, важно корректировать альфа-уровень при каждом промежуточном анализе, чтобы общая частота ошибок 1-го типа оставалась на желаемом уровне. Это концептуально похоже на использование поправки Бонферрони , но поскольку повторные просмотры данных являются зависимыми, можно использовать более эффективные поправки для альфа-уровня. Среди самых ранних предложений - граница Покока . Существуют альтернативные способы управления частотой ошибок 1-го типа, такие как границы Хейбитла-Пето , а дополнительная работа по определению границ для промежуточных анализов была проделана O'Brien & Fleming [7] и Wang & Tsiatis. [8]
Ограничение исправлений, таких как граница Покока, заключается в том, что количество просмотров данных должно быть определено до того, как данные будут собраны, и что просмотры данных должны быть равномерно распределены (например, после 50, 100, 150 и 200 пациенты). Подход альфа-функции затрат, разработанный Деметсом и Ланом [9] , не имеет этих ограничений и в зависимости от параметров, выбранных для функции затрат, может быть очень похож на границы Покока или поправки, предложенные О'Брайеном и Флемингом.
Приложения последовательного анализа
Клинические испытания
В рандомизированном исследовании с двумя группами лечения групповое последовательное тестирование может, например, проводиться следующим образом: после того, как n субъектов в каждой группе доступны, проводится промежуточный анализ. Статистический тест проводится для сравнения двух групп, и если нулевая гипотеза отклоняется, испытание прекращается; в противном случае испытание продолжается, набирают еще n субъектов на группу и снова проводят статистический тест, включая всех субъектов. Если нуль отклонен, испытание прекращается, в противном случае оно продолжается с периодическими оценками до тех пор, пока не будет выполнено максимальное количество промежуточных анализов, после чего проводится последний статистический тест и испытание прекращается. [10]
Другие приложения
Последовательный анализ также связан с проблемой разорения игрока, которую изучал, среди прочего, Гюйгенс в 1657 году [11].
Обнаружение ступенек - это процесс обнаружения резких изменений среднего уровня временного ряда или сигнала. Обычно его рассматривают как особый вид статистического метода, известный как обнаружение точки изменения . Часто шаг небольшой, а временной ряд искажается каким-то шумом, и это усложняет задачу, поскольку шаг может быть скрыт шумом. Поэтому часто требуются статистические алгоритмы и / или алгоритмы обработки сигналов. Когда алгоритмы запускаются онлайн по мере поступления данных, особенно с целью создания предупреждения, это приложение последовательного анализа.
Предвзятость
Испытания, которые прекращаются досрочно, поскольку они отвергают нулевую гипотезу, обычно переоценивают истинный размер эффекта. [12] Это связано с тем, что в небольших выборках только большие оценки величины эффекта приведут к значительному эффекту и последующему прекращению исследования. Были предложены методы корректировки оценок размера эффекта в единичных испытаниях. [13] Обратите внимание, что эта систематическая ошибка в основном проблематична при интерпретации отдельных исследований. В мета-анализах завышенная величина эффекта из-за раннего прекращения уравновешивается недооценкой в испытаниях, которые прекращаются поздно, что привело Скоу и Маршнер к выводу, что «раннее прекращение клинических испытаний не является существенным источником систематической ошибки в метаанализах». [14]
Значение p-значений в последовательном анализе также изменяется, потому что при использовании последовательного анализа выполняется более одного анализа, и типичное определение p-значения как наблюдаемых данных «по крайней мере столь же экстремальных» должно быть переопределено. . Одно из решений состоит в том, чтобы упорядочить p-значения серии последовательных тестов на основе времени остановки и того, насколько высока статистика теста для данного вида, что известно как поэтапное упорядочение [15], впервые предложенное Армитажем .
Смотрите также
- Оптимальная остановка
- Последовательная оценка
- Последовательный тест отношения вероятностей
Заметки
- Перейти ↑ Wald, Abraham (июнь 1945 г.). «Последовательная проверка статистических гипотез» . Летопись математической статистики . 16 (2): 117–186. DOI : 10.1214 / АОМ / 1177731118 . JSTOR 2235829 .
- ^ Бергер, Джеймс (2008). Последовательный анализ . Новый экономический словарь Пэлгрейва, 2-е изд . С. 438–439. DOI : 10.1057 / 9780230226203.1513 . ISBN 978-0-333-78676-5.
- ^ Вайгль, Ханс Гюнтер (2013). Абрахам Вальд: статистика как ключевая фигура современной эконометрики (PDF) (докторская диссертация). Гамбургский университет.
- ^ Кеннет Дж. Эрроу , Дэвид Блэквелл и М.А. Гиршик (1949). «Байесовские и минимаксные решения задач последовательного решения». Econometrica . 17 (3/4): 213–244. DOI : 10.2307 / 1905525 . JSTOR 1905525 .
- ^ Рэнделл, Брайан (1980), «Колосс», История вычислительной техники в двадцатом веке , стр. 30
- ^ У., Тернбулл, Брюс (2000). Сгруппируйте последовательные методы с приложениями к клиническим испытаниям . Чепмен и Холл. ISBN 9780849303166. OCLC 900071609 .
- ^ О'Брайен, Питер С.; Флеминг, Томас Р. (1979-01-01). «Процедура множественного тестирования для клинических испытаний». Биометрия . 35 (3): 549–556. DOI : 10.2307 / 2530245 . JSTOR 2530245 . PMID 497341 .
- ^ Wang, Samuel K .; Циатис, Анастасиос А. (01.01.1987). «Приблизительно оптимальные однопараметрические границы для групповых последовательных испытаний». Биометрия . 43 (1): 193–199. DOI : 10.2307 / 2531959 . JSTOR 2531959 .
- ^ Демец, Дэвид Л .; Лан, К.К. Гордон (1994-07-15). «Промежуточный анализ: подход альфа-функции расходов». Статистика в медицине . 13 (13–14): 1341–1352. DOI : 10.1002 / sim.4780131308 . ISSN 1097-0258 . PMID 7973215 .
- ^ Коростелева, Ольга (2008). Клиническая статистика: введение в клинические испытания, анализ выживаемости и лонгитюдный анализ данных (первое издание). Jones and Bartlett Publishers . ISBN 978-0-7637-5850-9.
- ^ Ghosh, BK; Сен, П.К. (1991). Справочник по последовательному анализу . Нью-Йорк: Марсель Деккер . ISBN 9780824784089.[ требуется страница ]
- ^ Proschan, Michael A .; Лан, К.К. Гордан; Виттес, Джанет Терк (2006). Статистический мониторинг клинических исследований: единый подход . Springer. ISBN 9780387300597. OCLC 553888945 .
- ^ Лю, А .; Холл, штат Висконсин (1999-03-01). «Беспристрастная оценка по результатам группового последовательного теста» . Биометрика . 86 (1): 71–78. DOI : 10.1093 / Biomet / 86.1.71 . ISSN 0006-3444 .
- ^ Schou, I. Manjula; Маршнер, Ян К. (10 декабря 2013 г.). «Метаанализ клинических испытаний с досрочным прекращением: исследование потенциальной предвзятости». Статистика в медицине . 32 (28): 4859–4874. DOI : 10.1002 / sim.5893 . ISSN 1097-0258 . PMID 23824994 .
- ^ Gordan., Lan, KK; Turk., Виттес, Джанет (01.01.2007). Статистический мониторинг клинических исследований: единый подход . Springer. ISBN 9780387300597. OCLC 553888945 .
Рекомендации
- Уолд, Абрахам (1947). Последовательный анализ . Нью-Йорк: Джон Уайли и сыновья .
- Бартрофф Дж., Лай Т.Л., Ши М.-К. (2013) Последовательные эксперименты в клинических испытаниях: дизайн и анализ. Springer.
- Гош, Бхаскар Кумар (1970). Последовательная проверка статистических гипотез . Читает: Эддисон-Уэсли .
- Чернов, Герман (1972). Последовательный анализ и оптимальный дизайн . СИАМ .
- Зигмунд, Дэвид (1985). Последовательный анализ . Серии Спрингера в статистике. Нью-Йорк: Springer-Verlag . ISBN 978-0-387-96134-7.
- Бакеман Р., Готтман Дж. М. (1997) Наблюдение за взаимодействием: Введение в последовательный анализ, Кембридж: Издательство Кембриджского университета.
- Дженнисон, К. и Тернбулл, Б.В. (2000) Групповые последовательные методы с применением в клинических испытаниях. Чепмен и Холл / CRC.
- Уайтхед, Дж. (1997). Дизайн и анализ последовательных клинических испытаний, 2-е издание. Джон Вили и сыновья.
Внешние ссылки
- Пакет R: последовательный тест отношения вероятности Уолда, проведенный OnlineMarketr.com
- Программное обеспечение для проведения последовательного анализа и приложений последовательного анализа в исследовании группового взаимодействия в компьютерно-опосредованной коммуникации от доктора Аллана Чонга из Университета штата Флорида.
- Коммерческий
- Программное обеспечение PASS Sample Size включает функции для настройки групповых последовательных дизайнов.