Дизайн повторных мероприятий

Ведущий раздел этой статьи , возможно , придется переписать . Используйте руководство по макету, чтобы убедиться, что раздел соответствует нормам Википедии и включает все важные детали. ( Август 2017 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения )

План повторных измерений - это план исследования, который включает в себя несколько измерений одной и той же переменной, проводимых на одних и тех же или совпадающих объектах либо в разных условиях, либо за два или более периодов времени. ^[1] Например, повторные измерения собираются в продольном исследовании, в котором оцениваются изменения во времени.

Кроссовер исследования [ править ]

Популярным методом повторных измерений является перекрестное исследование . Перекрестное исследование - это продольное исследование, в котором субъекты получают последовательность различных видов лечения (или воздействий). В то время как перекрестные исследования могут быть наблюдательными , многие важные перекрестные исследования являются контролируемыми экспериментами . Кроссоверы часто используются в экспериментах во многих научных дисциплинах , например в психологии , образовании , фармацевтике и здравоохранении , особенно в медицине.

Рандомизированные контролируемые перекрестные эксперименты особенно важны в здравоохранении. В рандомизированном клиническом исследовании испытуемым назначают лечение случайным образом . Когда такое испытание представляет собой дизайн с повторными измерениями, субъектов случайным образом распределяют по последовательности лечения. Перекрестное клиническое испытание - это дизайн с повторными измерениями, в котором каждому пациенту случайным образом назначается последовательность курсов лечения, включая как минимум два лечения (одно из которых может быть стандартным лечением или плацебо ): таким образом, каждый пациент переходит от одного лечения. к другому.

Почти все перекрестные конструкции имеют «баланс», что означает, что все субъекты должны получать одинаковое количество курсов лечения и что все субъекты участвуют в течение одинакового количества периодов. В большинстве перекрестных испытаний каждый субъект получает все виды лечения.

Однако многие дизайны с повторными измерениями не являются пересекающимися: например, для продольного исследования последовательных эффектов повторных курсов лечения не обязательно использовать какой-либо « кроссовер » (Vonesh & Chinchilli; Jones & Kenward).

Использует [ редактировать ]

Ограниченное количество участников - дизайн с повторяющимися измерениями снижает разброс оценок эффектов лечения, позволяя делать статистические выводы по меньшему количеству субъектов. ^[2]
Эффективность. Планы с повторяющимися измерениями позволяют быстрее завершить многие эксперименты, поскольку для завершения всего эксперимента необходимо обучить меньшее количество групп. Например, эксперименты, в которых каждое условие занимает всего несколько минут, тогда как обучение выполнению задач занимает столько же, если не больше времени.
Лонгитюдный анализ - планы повторяющихся измерений позволяют исследователям отслеживать, как участники меняются с течением времени, как в долгосрочной, так и в краткосрочной ситуации.

Эффекты порядка [ править ]

Эффекты порядка могут возникать, когда участник эксперимента может выполнить задание, а затем выполнить его снова. Примеры эффектов порядка включают повышение производительности или снижение производительности, что может быть связано с эффектами обучения, скукой или усталостью. Влияние эффектов порядка может быть меньше в долгосрочных лонгитюдных исследованиях или за счет уравновешивания с использованием перекрестного дизайна .

Уравновешивание [ править ]

В этом методе две группы выполняют одни и те же задачи или находятся в одних и тех же условиях, но в обратном порядке. Из двух задач или условий формируются четыре группы.

Уравновешивание
	Задача / условие	Задача / условие	Замечания
Группа А	1	2	Группа A сначала выполняет задачу / условие 1, затем задачу / условие 2.
Группа B	2	1	Группа B сначала выполняет Задачу / Условие 2, затем Задачу / Условие 1.

Уравновешивание попыток учесть два важных источника систематических вариаций в этом типе дизайна: практика и эффект скуки. И то, и другое могло бы в противном случае привести к разной результативности участников из-за того, что они были знакомы с процедурами или устали от них.

Ограничения [ править ]

Возможно, каждый участник не сможет присутствовать во всех условиях эксперимента (т.е. временные ограничения, место проведения эксперимента и т. Д.). Субъекты с тяжелыми заболеваниями, как правило, выпадают из лонгитюдных исследований, что потенциально может искажать результаты. В этих случаях предпочтительны модели со смешанными эффектами , поскольку они могут иметь дело с пропущенными значениями.

Средняя регрессия может повлиять на условия со значительными повторениями. Созревание может повлиять на исследования, которые продолжаются с течением времени. События вне эксперимента могут изменить реакцию между повторениями.

ANOVA с повторными измерениями [ править ]

Дисперсионный анализ повторных измерений (RANOVA) - это широко используемый статистический подход к планам повторных измерений. ^[3] В таких планах фактор повторных измерений (качественная независимая переменная) является фактором внутри субъектов, в то время как зависимая количественная переменная, по которой измеряется каждый участник, является зависимой переменной.

Разделение ошибки [ править ]

Одним из самых больших преимуществ rANOVA, как и в случае с планами с повторными измерениями в целом, является возможность разделения изменчивости из-за индивидуальных различий. Рассмотрим общую структуру F-статистики :

F = _{Обработка} MS / _Ошибка MS = ( _{Обработка} SS / _{Обработка} df ) / ( _Ошибка SS / _Ошибка df )

В дизайне между субъектами есть элемент расхождения из-за индивидуальных различий, который сочетается с условиями лечения и ошибок:

_Итого SS = _{Обработка} SS + _Ошибка SS

df _Итого = n - 1

В дизайне с повторными измерениями можно отделить вариабельность субъектов от терминов обработки и ошибок. В таком случае вариабельность может быть разбита на вариабельность между курсами лечения (или эффекты внутри субъектов, за исключением индивидуальных различий) и вариабельность внутри лечения. Вариабельность внутри лечения может быть далее разделена на вариабельность между субъектами (индивидуальные различия) и ошибки (за исключением индивидуальных различий): ^[4]

_Сумма SS = _{Лечение} SS _{(исключая индивидуальные различия)} + _{Субъекты} SS + _Ошибка SS

df _Всего = df _{Лечение (внутри субъектов)} + df _{между субъектами} + _ошибка df = ( k - 1) + ( n - 1) + (( n - k ) ( n - 1))

Что касается общей структуры F-статистики, ясно, что при разделении вариативности между субъектами, F-значение будет увеличиваться, потому что сумма квадратов ошибки будет меньше, что приведет к меньшей MSError. Примечательно, что разбиение на вариативность снижает степень свободы от F-теста, поэтому вариативность между субъектами должна быть достаточно значительной, чтобы компенсировать потерю степеней свободы. Если вариабельность между субъектами мала, этот процесс может фактически уменьшить F-значение. ^[4]

Предположения [ править ]

Как и при любом статистическом анализе, следует соблюдать определенные допущения, чтобы оправдать использование этого теста. Нарушения могут умеренно или серьезно повлиять на результаты и часто приводят к раздуванию ошибки типа 1 . При использовании rANOVA применяются стандартные одномерные и многомерные допущения. ^[5] Одномерные предположения:

Нормальность - для каждого уровня фактора внутри субъектов зависимая переменная должна иметь нормальное распределение .
Сферичность - баллы разницы, вычисленные между двумя уровнями фактора внутри субъектов, должны иметь одинаковую дисперсию для сравнения любых двух уровней. (Это предположение применимо только в том случае, если существует более двух уровней независимой переменной.)
Случайность - случаи должны быть получены на основе случайной выборки, а оценки разных участников не должны зависеть друг от друга.

RANOVA также требует, чтобы выполнялись некоторые многомерные допущения, потому что многомерный тест проводится по разностным оценкам. Эти предположения включают:

Многомерная нормальность - баллы разницы обычно многомерно распределяются в популяции.
Случайность - отдельные случаи должны быть получены на основе случайной выборки, а баллы разницы для каждого участника не зависят от баллов другого участника.

F test [ править ]

Как и в случае с другим анализом дисперсионных тестов, rANOVA использует F-статистику для определения значимости. В зависимости от количества внутрисубъектных факторов и нарушений предположений необходимо выбрать наиболее подходящий из трех тестов: ^[5]

Стандартный одномерный тест ANOVA F - этот тест обычно используется, учитывая только два уровня фактора внутри субъектов (т.е. временная точка 1 и временная точка 2). Этот тест не рекомендуется при более чем двух уровнях внутрисубъектного фактора, поскольку в таких случаях обычно нарушается допущение о сферичности.
Альтернативный одномерный тест ^[6] - эти тесты учитывают нарушения предположения о сферичности и могут использоваться, когда фактор внутри субъектов превышает 2 уровня. F-статистика такая же, как в стандартном одномерном ANOVA F-тесте, но связана с более точным p-значением. Эта коррекция выполняется путем уменьшения степени свободы для определения критического значения F. Обычно используются две поправки: поправка Гринхауса – Гейссера и поправка Хюйна – Фельдта. Поправка Гринхауса – Гейссера более консервативна, но решает общую проблему увеличения изменчивости с течением времени в плане повторных измерений. ^[7] Поправка Хюйна – Фельдта менее консервативна, но не решает проблемы увеличения изменчивости. Было предложено использовать нижнюю часть Huynh – Feldt с меньшими отклонениями от сферичности, а Greenhouse – Geisser - при больших отклонениях.
Многомерный тест - этот тест не предполагает сферичности, но также является очень консервативным.

Размер эффекта [ править ]

Одна из наиболее часто встречающихся статистических данных о величине эффекта для rANOVA - это частичный квадрат этажа (η _p² ). Также часто используется многомерная величина η ^2, когда предположение о сферичности было нарушено, а статистика многомерного теста сообщается. Третья статистика величины эффекта, о которой сообщается, представляет собой обобщенный η ² , который сравним с η _p² в однофакторном дисперсионном анализе с повторными измерениями. Было показано, что это лучшая оценка величины эффекта с другими тестами внутри субъектов. ^[8]^[9]

Предостережения [ править ]

RANOVA - не всегда лучший статистический анализ для планов с повторными измерениями. RANOVA уязвим для эффектов от пропущенных значений, вменения, неодинаковых моментов времени между объектами и нарушений сферичности. ^[10] Эти проблемы могут привести к смещению выборки и завышению частоты ошибок типа I. ^[11] В таких случаях может быть лучше рассмотреть использование линейной смешанной модели . ^[12]

См. Также [ править ]

Дисперсионный анализ
Протокол клинических испытаний
Кроссовер исследование
Дизайн экспериментов
Ожидаемые средние квадраты
Глоссарий экспериментального дизайна
Длительное обучение
Кривая роста
Потерянная информация
Смешанные модели
Многомерный анализ
Наблюдательное исследование
Оптимальный дизайн
Панельный анализ
Данные панели
Панельное исследование
Рандомизация
Рандомизированное контролируемое исследование
Дизайн повторных мероприятий
Последовательность
Statistical inference
Treatment effect

Notes[edit]

^ Salkind, Neil J. "Repeated Measures Design". SAGE Research Methods. SAGE. Retrieved 8 January 2019.
^ Barret, Julia R. (2013). "Particulate Matter and Cardiovascular Disease: Researchers Turn an Eye toward Microvascular Changes". Environmental Health Perspectives. 121 (9): a282. doi:10.1289/ehp.121-A282. PMC 3764084. PMID 24004855.
^ Gueorguieva; Krystal (2004). "Move Over ANOVA". Arch Gen Psychiatry. 61 (3): 310–7. doi:10.1001/archpsyc.61.3.310. PMID 14993119.
^ a b Howell, David C. (2010). Statistical methods for psychology (7th ed.). Belmont, CA: Thomson Wadsworth. ISBN 978-0-495-59784-1.
^ a b Salkind, Samuel B. Green, Neil J. (2011). Using SPSS for Windows and Macintosh : analyzing and understanding data (6th ed.). Boston: Prentice Hall. ISBN 978-0-205-02040-9.
^ Vasey; Thayer (1987). "The Continuing Problem of False Positives in Repeated Measures ANOVA in Psychophysiology: A Multivariate Solution". Psychophysiology. 24 (4): 479–486. doi:10.1111/j.1469-8986.1987.tb00324.x. PMID 3615759.
^ Park (1993). "A comparison of the generalized estimating equation approach with the maximum likelihood approach for repeated measurements". Stat Med. 12 (18): 1723–1732. doi:10.1002/sim.4780121807. PMID 8248664.
^ Bakeman (2005). "Recommended effect size statistics for repeated measures designs". Behavior Research Methods. 37 (3): 379–384. doi:10.3758/bf03192707. PMID 16405133.
^ Olejnik; Algina (2003). "Generalized eta and omega squared statistics: Measures of effect size for some common research designs". Psychological Methods. 8 (4): 434–447. doi:10.1037/1082-989x.8.4.434. PMID 14664681.
^ Gueorguieva; Krystal (2004). "Move Over ANOVA". Arch Gen Psychiatry. 61 (3): 310–317. doi:10.1001/archpsyc.61.3.310. PMID 14993119.
^ Muller; Barton (1989). "Approximate Power for Repeated-Measures ANOVA lacking sphericity". Journal of the American Statistical Association. 84 (406): 549–555. doi:10.1080/01621459.1989.10478802.
^ Kreuger; Tian (2004). "A comparison of the general linear mixed model and repeated measures ANOVA using a dataset with multiple missing data points". Biological Research for Nursing. 6 (2): 151–157. doi:10.1177/1099800404267682. PMID 15388912.

References[edit]

Design and analysis of experiments[edit]

Jones, Byron; Kenward, Michael G. (2003). Design and Analysis of Cross-Over Trials (Second ed.). London: Chapman and Hall.
Vonesh, Edward F. & Chinchilli, Vernon G. (1997). Linear and Nonlinear Models for the Analysis of Repeated Measurements. London: Chapman and Hall.

Exploration of longitudinal data[edit]

Davidian, Marie; David M. Giltinan (1995). Nonlinear Models for Repeated Measurement Data. Chapman & Hall/CRC Monographs on Statistics & Applied Probability. ISBN 978-0-412-98341-2.
Fitzmaurice, Garrett; Davidian, Marie; Verbeke, Geert; Molenberghs, Geert, eds. (2008). Longitudinal Data Analysis. Boca Raton, Florida: Chapman and Hall/CRC. ISBN 978-1-58488-658-7.
Jones, Byron; Kenward, Michael G. (2003). Design and Analysis of Cross-Over Trials (Second ed.). London: Chapman and Hall.
Kim, Kevin & Timm, Neil (2007). ""Restricted MGLM and growth curve model" (Chapter 7)". Univariate and multivariate general linear models: Theory and applications with SAS (with 1 CD-ROM for Windows and UNIX). Statistics: Textbooks and Monographs (Second ed.). Boca Raton, Florida: Chapman & Hall/CRC. ISBN 978-1-58488-634-1.
Kollo, Tõnu & von Rosen, Dietrich (2005). ""Multivariate linear models" (chapter 4), especially "The Growth curve model and extensions" (Chapter 4.1)". Advanced multivariate statistics with matrices. Mathematics and its applications. 579. New York: Springer. ISBN 978-1-4020-3418-3.
Kshirsagar, Anant M. & Smith, William Boyce (1995). Growth curves. Statistics: Textbooks and Monographs. 145. New York: Marcel Dekker, Inc. ISBN 0-8247-9341-2.
Pan, Jian-Xin & Fang, Kai-Tai (2002). Growth curve models and statistical diagnostics. Springer Series in Statistics. New York: Springer-Verlag. ISBN 0-387-95053-2.
Seber, G. A. F. & Wild, C. J. (1989). ""Growth models (Chapter 7)"". Nonlinear regression. Wiley Series in Probability and Mathematical Statistics: Probability and Mathematical Statistics. New York: John Wiley & Sons, Inc. pp. 325–367. ISBN 0-471-61760-1.
Timm, Neil H. (2002). ""The general MANOVA model (GMANOVA)" (Chapter 3.6.d)". Applied multivariate analysis. Springer Texts in Statistics. New York: Springer-Verlag. ISBN 0-387-95347-7.
Vonesh, Edward F. & Chinchilli, Vernon G. (1997). Linear and Nonlinear Models for the Analysis of Repeated Measurements. London: Chapman and Hall. (Comprehensive treatment of theory and practice)
Conaway, M. (1999, October 11). Repeated Measures Design. Retrieved February 18, 2008, from http://biostat.mc.vanderbilt.edu/twiki/pub/Main/ClinStat/repmeas.PDF
Minke, A. (1997, January). Conducting Repeated Measures Analyses: Experimental Design Considerations. Retrieved February 18, 2008, from Ericae.net: http://ericae.net/ft/tamu/Rm.htm
Shaughnessy, J. J. (2006). Research Methods in Psychology. New York: McGraw-Hill.

External links[edit]

Examples of all ANOVA and ANCOVA models with up to three treatment factors, including randomized block, split plot, repeated measures, and Latin squares, and their analysis in R (University of Southampton)

[1] Salkind, Neil J. "Repeated Measures Design". SAGE Research Methods. SAGE. Retrieved 8 January 2019.

[Barret-2] Barret, Julia R. (2013). "Particulate Matter and Cardiovascular Disease: Researchers Turn an Eye toward Microvascular Changes". Environmental Health Perspectives. 121 (9): a282. doi:10.1289/ehp.121-A282. PMC 3764084. PMID 24004855.

[Move_Over_Anova-3] Gueorguieva; Krystal (2004). "Move Over ANOVA". Arch Gen Psychiatry. 61 (3): 310–7. doi:10.1001/archpsyc.61.3.310. PMID 14993119.

[Howell_2010-4] Howell, David C. (2010). Statistical methods for psychology (7th ed.). Belmont, CA: Thomson Wadsworth. ISBN 978-0-495-59784-1.

[Salkind-5] Salkind, Samuel B. Green, Neil J. (2011). Using SPSS for Windows and Macintosh : analyzing and understanding data (6th ed.). Boston: Prentice Hall. ISBN 978-0-205-02040-9.

[6] Vasey; Thayer (1987). "The Continuing Problem of False Positives in Repeated Measures ANOVA in Psychophysiology: A Multivariate Solution". Psychophysiology. 24 (4): 479–486. doi:10.1111/j.1469-8986.1987.tb00324.x. PMID 3615759.

[7] Park (1993). "A comparison of the generalized estimating equation approach with the maximum likelihood approach for repeated measurements". Stat Med. 12 (18): 1723–1732. doi:10.1002/sim.4780121807. PMID 8248664.

[8] Bakeman (2005). "Recommended effect size statistics for repeated measures designs". Behavior Research Methods. 37 (3): 379–384. doi:10.3758/bf03192707. PMID 16405133.

[9] Olejnik; Algina (2003). "Generalized eta and omega squared statistics: Measures of effect size for some common research designs". Psychological Methods. 8 (4): 434–447. doi:10.1037/1082-989x.8.4.434. PMID 14664681.

[10] Gueorguieva; Krystal (2004). "Move Over ANOVA". Arch Gen Psychiatry. 61 (3): 310–317. doi:10.1001/archpsyc.61.3.310. PMID 14993119.

[11] Muller; Barton (1989). "Approximate Power for Repeated-Measures ANOVA lacking sphericity". Journal of the American Statistical Association. 84 (406): 549–555. doi:10.1080/01621459.1989.10478802.

[12] Kreuger; Tian (2004). "A comparison of the general linear mixed model and repeated measures ANOVA using a dataset with multiple missing data points". Biological Research for Nursing. 6 (2): 151–157. doi:10.1177/1099800404267682. PMID 15388912.

[1]

vteDesign of experiments
Scientificmethod	Scientific experiment Statistical design Control Internal and external validity Experimental unit Blinding Optimal design: Bayesian Random assignment Randomization Restricted randomization Replication versus subsampling Sample size
Treatment and blocking	Treatment Effect size Contrast Interaction Confounding Orthogonality Blocking Covariate Nuisance variable
Models and inference	Linear regression Ordinary least squares Bayesian Random effect Mixed model Hierarchical model: Bayesian Analysis of variance (Anova) Cochran's theorem Manova (multivariate) Ancova (covariance) Compare means Multiple comparison
Designs Completelyrandomized	Factorial Fractional factorial Plackett-Burman Taguchi Response surface methodology Polynomial and rational modeling Box-Behnken Central composite Block Generalized randomized block design (GRBD) Latin square Graeco-Latin square Orthogonal array Latin hypercube Repeated measures design Crossover study Randomized controlled trial Sequential analysis Sequential probability ratio test
Glossary Category Mathematics portal Statistical outline Statistical topics