Ведущий раздел этой статьи , возможно , придется переписать . ( Август 2017 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения ) |
План повторных измерений - это план исследования, который включает в себя несколько измерений одной и той же переменной, проводимых на одних и тех же или совпадающих объектах либо в разных условиях, либо за два или более периодов времени. [1] Например, повторные измерения собираются в продольном исследовании, в котором оцениваются изменения во времени.
Кроссовер исследования [ править ]
Популярным методом повторных измерений является перекрестное исследование . Перекрестное исследование - это продольное исследование, в котором субъекты получают последовательность различных видов лечения (или воздействий). В то время как перекрестные исследования могут быть наблюдательными , многие важные перекрестные исследования являются контролируемыми экспериментами . Кроссоверы часто используются в экспериментах во многих научных дисциплинах , например в психологии , образовании , фармацевтике и здравоохранении , особенно в медицине.
Рандомизированные контролируемые перекрестные эксперименты особенно важны в здравоохранении. В рандомизированном клиническом исследовании испытуемым назначают лечение случайным образом . Когда такое испытание представляет собой дизайн с повторными измерениями, субъектов случайным образом распределяют по последовательности лечения. Перекрестное клиническое испытание - это дизайн с повторными измерениями, в котором каждому пациенту случайным образом назначается последовательность курсов лечения, включая как минимум два лечения (одно из которых может быть стандартным лечением или плацебо ): таким образом, каждый пациент переходит от одного лечения. к другому.
Почти все перекрестные конструкции имеют «баланс», что означает, что все субъекты должны получать одинаковое количество курсов лечения и что все субъекты участвуют в течение одинакового количества периодов. В большинстве перекрестных испытаний каждый субъект получает все виды лечения.
Однако многие дизайны с повторными измерениями не являются пересекающимися: например, для продольного исследования последовательных эффектов повторных курсов лечения не обязательно использовать какой-либо « кроссовер » (Vonesh & Chinchilli; Jones & Kenward).
Использует [ редактировать ]
- Ограниченное количество участников - дизайн с повторяющимися измерениями снижает разброс оценок эффектов лечения, позволяя делать статистические выводы по меньшему количеству субъектов. [2]
- Эффективность. Планы с повторяющимися измерениями позволяют быстрее завершить многие эксперименты, поскольку для завершения всего эксперимента необходимо обучить меньшее количество групп. Например, эксперименты, в которых каждое условие занимает всего несколько минут, тогда как обучение выполнению задач занимает столько же, если не больше времени.
- Лонгитюдный анализ - планы повторяющихся измерений позволяют исследователям отслеживать, как участники меняются с течением времени, как в долгосрочной, так и в краткосрочной ситуации.
Эффекты порядка [ править ]
Эффекты порядка могут возникать, когда участник эксперимента может выполнить задание, а затем выполнить его снова. Примеры эффектов порядка включают повышение производительности или снижение производительности, что может быть связано с эффектами обучения, скукой или усталостью. Влияние эффектов порядка может быть меньше в долгосрочных лонгитюдных исследованиях или за счет уравновешивания с использованием перекрестного дизайна .
Уравновешивание [ править ]
В этом методе две группы выполняют одни и те же задачи или находятся в одних и тех же условиях, но в обратном порядке. Из двух задач или условий формируются четыре группы.
Задача / условие | Задача / условие | Замечания | |
---|---|---|---|
Группа А | 1 | 2 | Группа A сначала выполняет задачу / условие 1, затем задачу / условие 2. |
Группа B | 2 | 1 | Группа B сначала выполняет Задачу / Условие 2, затем Задачу / Условие 1. |
Уравновешивание попыток учесть два важных источника систематических вариаций в этом типе дизайна: практика и эффект скуки. И то, и другое могло бы в противном случае привести к разной результативности участников из-за того, что они были знакомы с процедурами или устали от них.
Ограничения [ править ]
Возможно, каждый участник не сможет присутствовать во всех условиях эксперимента (т.е. временные ограничения, место проведения эксперимента и т. Д.). Субъекты с тяжелыми заболеваниями, как правило, выпадают из лонгитюдных исследований, что потенциально может искажать результаты. В этих случаях предпочтительны модели со смешанными эффектами , поскольку они могут иметь дело с пропущенными значениями.
Средняя регрессия может повлиять на условия со значительными повторениями. Созревание может повлиять на исследования, которые продолжаются с течением времени. События вне эксперимента могут изменить реакцию между повторениями.
ANOVA с повторными измерениями [ править ]
Дисперсионный анализ повторных измерений (RANOVA) - это широко используемый статистический подход к планам повторных измерений. [3] В таких планах фактор повторных измерений (качественная независимая переменная) является фактором внутри субъектов, в то время как зависимая количественная переменная, по которой измеряется каждый участник, является зависимой переменной.
Разделение ошибки [ править ]
Одним из самых больших преимуществ rANOVA, как и в случае с планами с повторными измерениями в целом, является возможность разделения изменчивости из-за индивидуальных различий. Рассмотрим общую структуру F-статистики :
- F = Обработка MS / Ошибка MS = ( Обработка SS / Обработка df ) / ( Ошибка SS / Ошибка df )
В дизайне между субъектами есть элемент расхождения из-за индивидуальных различий, который сочетается с условиями лечения и ошибок:
- Итого SS = Обработка SS + Ошибка SS
- df Итого = n - 1
В дизайне с повторными измерениями можно отделить вариабельность субъектов от терминов обработки и ошибок. В таком случае вариабельность может быть разбита на вариабельность между курсами лечения (или эффекты внутри субъектов, за исключением индивидуальных различий) и вариабельность внутри лечения. Вариабельность внутри лечения может быть далее разделена на вариабельность между субъектами (индивидуальные различия) и ошибки (за исключением индивидуальных различий): [4]
- Сумма SS = Лечение SS (исключая индивидуальные различия) + Субъекты SS + Ошибка SS
- df Всего = df Лечение (внутри субъектов) + df между субъектами + ошибка df = ( k - 1) + ( n - 1) + (( n - k ) ( n - 1))
Что касается общей структуры F-статистики, ясно, что при разделении вариативности между субъектами, F-значение будет увеличиваться, потому что сумма квадратов ошибки будет меньше, что приведет к меньшей MSError. Примечательно, что разбиение на вариативность снижает степень свободы от F-теста, поэтому вариативность между субъектами должна быть достаточно значительной, чтобы компенсировать потерю степеней свободы. Если вариабельность между субъектами мала, этот процесс может фактически уменьшить F-значение. [4]
Предположения [ править ]
Как и при любом статистическом анализе, следует соблюдать определенные допущения, чтобы оправдать использование этого теста. Нарушения могут умеренно или серьезно повлиять на результаты и часто приводят к раздуванию ошибки типа 1 . При использовании rANOVA применяются стандартные одномерные и многомерные допущения. [5] Одномерные предположения:
- Нормальность - для каждого уровня фактора внутри субъектов зависимая переменная должна иметь нормальное распределение .
- Сферичность - баллы разницы, вычисленные между двумя уровнями фактора внутри субъектов, должны иметь одинаковую дисперсию для сравнения любых двух уровней. (Это предположение применимо только в том случае, если существует более двух уровней независимой переменной.)
- Случайность - случаи должны быть получены на основе случайной выборки, а оценки разных участников не должны зависеть друг от друга.
RANOVA также требует, чтобы выполнялись некоторые многомерные допущения, потому что многомерный тест проводится по разностным оценкам. Эти предположения включают:
- Многомерная нормальность - баллы разницы обычно многомерно распределяются в популяции.
- Случайность - отдельные случаи должны быть получены на основе случайной выборки, а баллы разницы для каждого участника не зависят от баллов другого участника.
F test [ править ]
Как и в случае с другим анализом дисперсионных тестов, rANOVA использует F-статистику для определения значимости. В зависимости от количества внутрисубъектных факторов и нарушений предположений необходимо выбрать наиболее подходящий из трех тестов: [5]
- Стандартный одномерный тест ANOVA F - этот тест обычно используется, учитывая только два уровня фактора внутри субъектов (т.е. временная точка 1 и временная точка 2). Этот тест не рекомендуется при более чем двух уровнях внутрисубъектного фактора, поскольку в таких случаях обычно нарушается допущение о сферичности.
- Альтернативный одномерный тест [6] - эти тесты учитывают нарушения предположения о сферичности и могут использоваться, когда фактор внутри субъектов превышает 2 уровня. F-статистика такая же, как в стандартном одномерном ANOVA F-тесте, но связана с более точным p-значением. Эта коррекция выполняется путем уменьшения степени свободы для определения критического значения F. Обычно используются две поправки: поправка Гринхауса – Гейссера и поправка Хюйна – Фельдта. Поправка Гринхауса – Гейссера более консервативна, но решает общую проблему увеличения изменчивости с течением времени в плане повторных измерений. [7] Поправка Хюйна – Фельдта менее консервативна, но не решает проблемы увеличения изменчивости. Было предложено использовать нижнюю часть Huynh – Feldt с меньшими отклонениями от сферичности, а Greenhouse – Geisser - при больших отклонениях.
- Многомерный тест - этот тест не предполагает сферичности, но также является очень консервативным.
Размер эффекта [ править ]
Одна из наиболее часто встречающихся статистических данных о величине эффекта для rANOVA - это частичный квадрат этажа (η p 2 ). Также часто используется многомерная величина η 2, когда предположение о сферичности было нарушено, а статистика многомерного теста сообщается. Третья статистика величины эффекта, о которой сообщается, представляет собой обобщенный η 2 , который сравним с η p 2 в однофакторном дисперсионном анализе с повторными измерениями. Было показано, что это лучшая оценка величины эффекта с другими тестами внутри субъектов. [8] [9]
Предостережения [ править ]
RANOVA - не всегда лучший статистический анализ для планов с повторными измерениями. RANOVA уязвим для эффектов от пропущенных значений, вменения, неодинаковых моментов времени между объектами и нарушений сферичности. [10] Эти проблемы могут привести к смещению выборки и завышению частоты ошибок типа I. [11] В таких случаях может быть лучше рассмотреть использование линейной смешанной модели . [12]
См. Также [ править ]
- Дисперсионный анализ
- Протокол клинических испытаний
- Кроссовер исследование
- Дизайн экспериментов
- Ожидаемые средние квадраты
- Глоссарий экспериментального дизайна
- Длительное обучение
- Кривая роста
- Потерянная информация
- Смешанные модели
- Многомерный анализ
- Наблюдательное исследование
- Оптимальный дизайн
- Панельный анализ
- Данные панели
- Панельное исследование
- Рандомизация
- Рандомизированное контролируемое исследование
- Дизайн повторных мероприятий
- Последовательность
- Statistical inference
- Treatment effect
Notes[edit]
- ^ Salkind, Neil J. "Repeated Measures Design". SAGE Research Methods. SAGE. Retrieved 8 January 2019.
- ^ Barret, Julia R. (2013). "Particulate Matter and Cardiovascular Disease: Researchers Turn an Eye toward Microvascular Changes". Environmental Health Perspectives. 121 (9): a282. doi:10.1289/ehp.121-A282. PMC 3764084. PMID 24004855.
- ^ Gueorguieva; Krystal (2004). "Move Over ANOVA". Arch Gen Psychiatry. 61 (3): 310–7. doi:10.1001/archpsyc.61.3.310. PMID 14993119.
- ^ a b Howell, David C. (2010). Statistical methods for psychology (7th ed.). Belmont, CA: Thomson Wadsworth. ISBN 978-0-495-59784-1.
- ^ a b Salkind, Samuel B. Green, Neil J. (2011). Using SPSS for Windows and Macintosh : analyzing and understanding data (6th ed.). Boston: Prentice Hall. ISBN 978-0-205-02040-9.
- ^ Vasey; Thayer (1987). "The Continuing Problem of False Positives in Repeated Measures ANOVA in Psychophysiology: A Multivariate Solution". Psychophysiology. 24 (4): 479–486. doi:10.1111/j.1469-8986.1987.tb00324.x. PMID 3615759.
- ^ Park (1993). "A comparison of the generalized estimating equation approach with the maximum likelihood approach for repeated measurements". Stat Med. 12 (18): 1723–1732. doi:10.1002/sim.4780121807. PMID 8248664.
- ^ Bakeman (2005). "Recommended effect size statistics for repeated measures designs". Behavior Research Methods. 37 (3): 379–384. doi:10.3758/bf03192707. PMID 16405133.
- ^ Olejnik; Algina (2003). "Generalized eta and omega squared statistics: Measures of effect size for some common research designs". Psychological Methods. 8 (4): 434–447. doi:10.1037/1082-989x.8.4.434. PMID 14664681.
- ^ Gueorguieva; Krystal (2004). "Move Over ANOVA". Arch Gen Psychiatry. 61 (3): 310–317. doi:10.1001/archpsyc.61.3.310. PMID 14993119.
- ^ Muller; Barton (1989). "Approximate Power for Repeated-Measures ANOVA lacking sphericity". Journal of the American Statistical Association. 84 (406): 549–555. doi:10.1080/01621459.1989.10478802.
- ^ Kreuger; Tian (2004). "A comparison of the general linear mixed model and repeated measures ANOVA using a dataset with multiple missing data points". Biological Research for Nursing. 6 (2): 151–157. doi:10.1177/1099800404267682. PMID 15388912.
References[edit]
Design and analysis of experiments[edit]
- Jones, Byron; Kenward, Michael G. (2003). Design and Analysis of Cross-Over Trials (Second ed.). London: Chapman and Hall.
- Vonesh, Edward F. & Chinchilli, Vernon G. (1997). Linear and Nonlinear Models for the Analysis of Repeated Measurements. London: Chapman and Hall.
Exploration of longitudinal data[edit]
- Davidian, Marie; David M. Giltinan (1995). Nonlinear Models for Repeated Measurement Data. Chapman & Hall/CRC Monographs on Statistics & Applied Probability. ISBN 978-0-412-98341-2.
- Fitzmaurice, Garrett; Davidian, Marie; Verbeke, Geert; Molenberghs, Geert, eds. (2008). Longitudinal Data Analysis. Boca Raton, Florida: Chapman and Hall/CRC. ISBN 978-1-58488-658-7.
- Jones, Byron; Kenward, Michael G. (2003). Design and Analysis of Cross-Over Trials (Second ed.). London: Chapman and Hall.
- Kim, Kevin & Timm, Neil (2007). ""Restricted MGLM and growth curve model" (Chapter 7)". Univariate and multivariate general linear models: Theory and applications with SAS (with 1 CD-ROM for Windows and UNIX). Statistics: Textbooks and Monographs (Second ed.). Boca Raton, Florida: Chapman & Hall/CRC. ISBN 978-1-58488-634-1.
- Kollo, Tõnu & von Rosen, Dietrich (2005). ""Multivariate linear models" (chapter 4), especially "The Growth curve model and extensions" (Chapter 4.1)". Advanced multivariate statistics with matrices. Mathematics and its applications. 579. New York: Springer. ISBN 978-1-4020-3418-3.
- Kshirsagar, Anant M. & Smith, William Boyce (1995). Growth curves. Statistics: Textbooks and Monographs. 145. New York: Marcel Dekker, Inc. ISBN 0-8247-9341-2.
- Pan, Jian-Xin & Fang, Kai-Tai (2002). Growth curve models and statistical diagnostics. Springer Series in Statistics. New York: Springer-Verlag. ISBN 0-387-95053-2.
- Seber, G. A. F. & Wild, C. J. (1989). ""Growth models (Chapter 7)"". Nonlinear regression. Wiley Series in Probability and Mathematical Statistics: Probability and Mathematical Statistics. New York: John Wiley & Sons, Inc. pp. 325–367. ISBN 0-471-61760-1.
- Timm, Neil H. (2002). ""The general MANOVA model (GMANOVA)" (Chapter 3.6.d)". Applied multivariate analysis. Springer Texts in Statistics. New York: Springer-Verlag. ISBN 0-387-95347-7.
- Vonesh, Edward F. & Chinchilli, Vernon G. (1997). Linear and Nonlinear Models for the Analysis of Repeated Measurements. London: Chapman and Hall. (Comprehensive treatment of theory and practice)
- Conaway, M. (1999, October 11). Repeated Measures Design. Retrieved February 18, 2008, from http://biostat.mc.vanderbilt.edu/twiki/pub/Main/ClinStat/repmeas.PDF
- Minke, A. (1997, January). Conducting Repeated Measures Analyses: Experimental Design Considerations. Retrieved February 18, 2008, from Ericae.net: http://ericae.net/ft/tamu/Rm.htm
- Shaughnessy, J. J. (2006). Research Methods in Psychology. New York: McGraw-Hill.
External links[edit]
- Examples of all ANOVA and ANCOVA models with up to three treatment factors, including randomized block, split plot, repeated measures, and Latin squares, and their analysis in R (University of Southampton)