Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

План повторных измерений - это план исследования, который включает в себя несколько измерений одной и той же переменной, проводимых на одних и тех же или совпадающих объектах либо в разных условиях, либо за два или более периодов времени. [1] Например, повторные измерения собираются в продольном исследовании, в котором оцениваются изменения во времени.

Кроссовер исследования [ править ]

Популярным методом повторных измерений является перекрестное исследование . Перекрестное исследование - это продольное исследование, в котором субъекты получают последовательность различных видов лечения (или воздействий). В то время как перекрестные исследования могут быть наблюдательными , многие важные перекрестные исследования являются контролируемыми экспериментами . Кроссоверы часто используются в экспериментах во многих научных дисциплинах , например в психологии , образовании , фармацевтике и здравоохранении , особенно в медицине.

Рандомизированные контролируемые перекрестные эксперименты особенно важны в здравоохранении. В рандомизированном клиническом исследовании испытуемым назначают лечение случайным образом . Когда такое испытание представляет собой дизайн с повторными измерениями, субъектов случайным образом распределяют по последовательности лечения. Перекрестное клиническое испытание - это дизайн с повторными измерениями, в котором каждому пациенту случайным образом назначается последовательность курсов лечения, включая как минимум два лечения (одно из которых может быть стандартным лечением или плацебо ): таким образом, каждый пациент переходит от одного лечения. к другому.

Почти все перекрестные конструкции имеют «баланс», что означает, что все субъекты должны получать одинаковое количество курсов лечения и что все субъекты участвуют в течение одинакового количества периодов. В большинстве перекрестных испытаний каждый субъект получает все виды лечения.

Однако многие дизайны с повторными измерениями не являются пересекающимися: например, для продольного исследования последовательных эффектов повторных курсов лечения не обязательно использовать какой-либо « кроссовер » (Vonesh & Chinchilli; Jones & Kenward).

Использует [ редактировать ]

  • Ограниченное количество участников - дизайн с повторяющимися измерениями снижает разброс оценок эффектов лечения, позволяя делать статистические выводы по меньшему количеству субъектов. [2]
  • Эффективность. Планы с повторяющимися измерениями позволяют быстрее завершить многие эксперименты, поскольку для завершения всего эксперимента необходимо обучить меньшее количество групп. Например, эксперименты, в которых каждое условие занимает всего несколько минут, тогда как обучение выполнению задач занимает столько же, если не больше времени.
  • Лонгитюдный анализ - планы повторяющихся измерений позволяют исследователям отслеживать, как участники меняются с течением времени, как в долгосрочной, так и в краткосрочной ситуации.

Эффекты порядка [ править ]

Эффекты порядка могут возникать, когда участник эксперимента может выполнить задание, а затем выполнить его снова. Примеры эффектов порядка включают повышение производительности или снижение производительности, что может быть связано с эффектами обучения, скукой или усталостью. Влияние эффектов порядка может быть меньше в долгосрочных лонгитюдных исследованиях или за счет уравновешивания с использованием перекрестного дизайна .

Уравновешивание [ править ]

В этом методе две группы выполняют одни и те же задачи или находятся в одних и тех же условиях, но в обратном порядке. Из двух задач или условий формируются четыре группы.

Уравновешивание попыток учесть два важных источника систематических вариаций в этом типе дизайна: практика и эффект скуки. И то, и другое могло бы в противном случае привести к разной результативности участников из-за того, что они были знакомы с процедурами или устали от них.

Ограничения [ править ]

Возможно, каждый участник не сможет присутствовать во всех условиях эксперимента (т.е. временные ограничения, место проведения эксперимента и т. Д.). Субъекты с тяжелыми заболеваниями, как правило, выпадают из лонгитюдных исследований, что потенциально может искажать результаты. В этих случаях предпочтительны модели со смешанными эффектами , поскольку они могут иметь дело с пропущенными значениями.

Средняя регрессия может повлиять на условия со значительными повторениями. Созревание может повлиять на исследования, которые продолжаются с течением времени. События вне эксперимента могут изменить реакцию между повторениями.

ANOVA с повторными измерениями [ править ]

Дисперсионный анализ повторных измерений (RANOVA) - это широко используемый статистический подход к планам повторных измерений. [3] В таких планах фактор повторных измерений (качественная независимая переменная) является фактором внутри субъектов, в то время как зависимая количественная переменная, по которой измеряется каждый участник, является зависимой переменной.

Разделение ошибки [ править ]

Одним из самых больших преимуществ rANOVA, как и в случае с планами с повторными измерениями в целом, является возможность разделения изменчивости из-за индивидуальных различий. Рассмотрим общую структуру F-статистики :

F = Обработка MS / Ошибка MS = ( Обработка SS / Обработка df ) / ( Ошибка SS / Ошибка df )

В дизайне между субъектами есть элемент расхождения из-за индивидуальных различий, который сочетается с условиями лечения и ошибок:

Итого SS = Обработка SS + Ошибка SS
df Итого = n - 1

В дизайне с повторными измерениями можно отделить вариабельность субъектов от терминов обработки и ошибок. В таком случае вариабельность может быть разбита на вариабельность между курсами лечения (или эффекты внутри субъектов, за исключением индивидуальных различий) и вариабельность внутри лечения. Вариабельность внутри лечения может быть далее разделена на вариабельность между субъектами (индивидуальные различия) и ошибки (за исключением индивидуальных различий): [4]

Сумма SS = Лечение SS (исключая индивидуальные различия) + Субъекты SS + Ошибка SS
df Всего = df Лечение (внутри субъектов) + df между субъектами + ошибка df = ( k - 1) + ( n - 1) + (( n - k ) ( n - 1))

Что касается общей структуры F-статистики, ясно, что при разделении вариативности между субъектами, F-значение будет увеличиваться, потому что сумма квадратов ошибки будет меньше, что приведет к меньшей MSError. Примечательно, что разбиение на вариативность снижает степень свободы от F-теста, поэтому вариативность между субъектами должна быть достаточно значительной, чтобы компенсировать потерю степеней свободы. Если вариабельность между субъектами мала, этот процесс может фактически уменьшить F-значение. [4]

Предположения [ править ]

Как и при любом статистическом анализе, следует соблюдать определенные допущения, чтобы оправдать использование этого теста. Нарушения могут умеренно или серьезно повлиять на результаты и часто приводят к раздуванию ошибки типа 1 . При использовании rANOVA применяются стандартные одномерные и многомерные допущения. [5] Одномерные предположения:

  • Нормальность - для каждого уровня фактора внутри субъектов зависимая переменная должна иметь нормальное распределение .
  • Сферичность - баллы разницы, вычисленные между двумя уровнями фактора внутри субъектов, должны иметь одинаковую дисперсию для сравнения любых двух уровней. (Это предположение применимо только в том случае, если существует более двух уровней независимой переменной.)
  • Случайность - случаи должны быть получены на основе случайной выборки, а оценки разных участников не должны зависеть друг от друга.

RANOVA также требует, чтобы выполнялись некоторые многомерные допущения, потому что многомерный тест проводится по разностным оценкам. Эти предположения включают:

  • Многомерная нормальность - баллы разницы обычно многомерно распределяются в популяции.
  • Случайность - отдельные случаи должны быть получены на основе случайной выборки, а баллы разницы для каждого участника не зависят от баллов другого участника.

F test [ править ]

Как и в случае с другим анализом дисперсионных тестов, rANOVA использует F-статистику для определения значимости. В зависимости от количества внутрисубъектных факторов и нарушений предположений необходимо выбрать наиболее подходящий из трех тестов: [5]

  • Стандартный одномерный тест ANOVA F - этот тест обычно используется, учитывая только два уровня фактора внутри субъектов (т.е. временная точка 1 и временная точка 2). Этот тест не рекомендуется при более чем двух уровнях внутрисубъектного фактора, поскольку в таких случаях обычно нарушается допущение о сферичности.
  • Альтернативный одномерный тест [6] - эти тесты учитывают нарушения предположения о сферичности и могут использоваться, когда фактор внутри субъектов превышает 2 уровня. F-статистика такая же, как в стандартном одномерном ANOVA F-тесте, но связана с более точным p-значением. Эта коррекция выполняется путем уменьшения степени свободы для определения критического значения F. Обычно используются две поправки: поправка Гринхауса – Гейссера и поправка Хюйна – Фельдта. Поправка Гринхауса – Гейссера более консервативна, но решает общую проблему увеличения изменчивости с течением времени в плане повторных измерений. [7] Поправка Хюйна – Фельдта менее консервативна, но не решает проблемы увеличения изменчивости. Было предложено использовать нижнюю часть Huynh – Feldt с меньшими отклонениями от сферичности, а Greenhouse – Geisser - при больших отклонениях.
  • Многомерный тест - этот тест не предполагает сферичности, но также является очень консервативным.

Размер эффекта [ править ]

Одна из наиболее часто встречающихся статистических данных о величине эффекта для rANOVA - это частичный квадрат этажа (η p 2 ). Также часто используется многомерная величина η 2, когда предположение о сферичности было нарушено, а статистика многомерного теста сообщается. Третья статистика величины эффекта, о которой сообщается, представляет собой обобщенный η 2 , который сравним с η p 2 в однофакторном дисперсионном анализе с повторными измерениями. Было показано, что это лучшая оценка величины эффекта с другими тестами внутри субъектов. [8] [9]

Предостережения [ править ]

RANOVA - не всегда лучший статистический анализ для планов с повторными измерениями. RANOVA уязвим для эффектов от пропущенных значений, вменения, неодинаковых моментов времени между объектами и нарушений сферичности. [10] Эти проблемы могут привести к смещению выборки и завышению частоты ошибок типа I. [11] В таких случаях может быть лучше рассмотреть использование линейной смешанной модели . [12]

См. Также [ править ]

  • Дисперсионный анализ
  • Протокол клинических испытаний
  • Кроссовер исследование
  • Дизайн экспериментов
  • Ожидаемые средние квадраты
  • Глоссарий экспериментального дизайна
  • Длительное обучение
  • Кривая роста
  • Потерянная информация
  • Смешанные модели
  • Многомерный анализ
  • Наблюдательное исследование
  • Оптимальный дизайн
  • Панельный анализ
  • Данные панели
  • Панельное исследование
  • Рандомизация
  • Рандомизированное контролируемое исследование
  • Дизайн повторных мероприятий
  • Последовательность
  • Statistical inference
  • Treatment effect

Notes[edit]

  1. ^ Salkind, Neil J. "Repeated Measures Design". SAGE Research Methods. SAGE. Retrieved 8 January 2019.
  2. ^ Barret, Julia R. (2013). "Particulate Matter and Cardiovascular Disease: Researchers Turn an Eye toward Microvascular Changes". Environmental Health Perspectives. 121 (9): a282. doi:10.1289/ehp.121-A282. PMC 3764084. PMID 24004855.
  3. ^ Gueorguieva; Krystal (2004). "Move Over ANOVA". Arch Gen Psychiatry. 61 (3): 310–7. doi:10.1001/archpsyc.61.3.310. PMID 14993119.
  4. ^ a b Howell, David C. (2010). Statistical methods for psychology (7th ed.). Belmont, CA: Thomson Wadsworth. ISBN 978-0-495-59784-1.
  5. ^ a b Salkind, Samuel B. Green, Neil J. (2011). Using SPSS for Windows and Macintosh : analyzing and understanding data (6th ed.). Boston: Prentice Hall. ISBN 978-0-205-02040-9.
  6. ^ Vasey; Thayer (1987). "The Continuing Problem of False Positives in Repeated Measures ANOVA in Psychophysiology: A Multivariate Solution". Psychophysiology. 24 (4): 479–486. doi:10.1111/j.1469-8986.1987.tb00324.x. PMID 3615759.
  7. ^ Park (1993). "A comparison of the generalized estimating equation approach with the maximum likelihood approach for repeated measurements". Stat Med. 12 (18): 1723–1732. doi:10.1002/sim.4780121807. PMID 8248664.
  8. ^ Bakeman (2005). "Recommended effect size statistics for repeated measures designs". Behavior Research Methods. 37 (3): 379–384. doi:10.3758/bf03192707. PMID 16405133.
  9. ^ Olejnik; Algina (2003). "Generalized eta and omega squared statistics: Measures of effect size for some common research designs". Psychological Methods. 8 (4): 434–447. doi:10.1037/1082-989x.8.4.434. PMID 14664681.
  10. ^ Gueorguieva; Krystal (2004). "Move Over ANOVA". Arch Gen Psychiatry. 61 (3): 310–317. doi:10.1001/archpsyc.61.3.310. PMID 14993119.
  11. ^ Muller; Barton (1989). "Approximate Power for Repeated-Measures ANOVA lacking sphericity". Journal of the American Statistical Association. 84 (406): 549–555. doi:10.1080/01621459.1989.10478802.
  12. ^ Kreuger; Tian (2004). "A comparison of the general linear mixed model and repeated measures ANOVA using a dataset with multiple missing data points". Biological Research for Nursing. 6 (2): 151–157. doi:10.1177/1099800404267682. PMID 15388912.

References[edit]

Design and analysis of experiments[edit]

  • Jones, Byron; Kenward, Michael G. (2003). Design and Analysis of Cross-Over Trials (Second ed.). London: Chapman and Hall.
  • Vonesh, Edward F. & Chinchilli, Vernon G. (1997). Linear and Nonlinear Models for the Analysis of Repeated Measurements. London: Chapman and Hall.

Exploration of longitudinal data[edit]

  • Davidian, Marie; David M. Giltinan (1995). Nonlinear Models for Repeated Measurement Data. Chapman & Hall/CRC Monographs on Statistics & Applied Probability. ISBN 978-0-412-98341-2.
  • Fitzmaurice, Garrett; Davidian, Marie; Verbeke, Geert; Molenberghs, Geert, eds. (2008). Longitudinal Data Analysis. Boca Raton, Florida: Chapman and Hall/CRC. ISBN 978-1-58488-658-7.
  • Jones, Byron; Kenward, Michael G. (2003). Design and Analysis of Cross-Over Trials (Second ed.). London: Chapman and Hall.
  • Kim, Kevin & Timm, Neil (2007). ""Restricted MGLM and growth curve model" (Chapter 7)". Univariate and multivariate general linear models: Theory and applications with SAS (with 1 CD-ROM for Windows and UNIX). Statistics: Textbooks and Monographs (Second ed.). Boca Raton, Florida: Chapman & Hall/CRC. ISBN 978-1-58488-634-1.
  • Kollo, Tõnu & von Rosen, Dietrich (2005). ""Multivariate linear models" (chapter 4), especially "The Growth curve model and extensions" (Chapter 4.1)". Advanced multivariate statistics with matrices. Mathematics and its applications. 579. New York: Springer. ISBN 978-1-4020-3418-3.
  • Kshirsagar, Anant M. & Smith, William Boyce (1995). Growth curves. Statistics: Textbooks and Monographs. 145. New York: Marcel Dekker, Inc. ISBN 0-8247-9341-2.
  • Pan, Jian-Xin & Fang, Kai-Tai (2002). Growth curve models and statistical diagnostics. Springer Series in Statistics. New York: Springer-Verlag. ISBN 0-387-95053-2.
  • Seber, G. A. F. & Wild, C. J. (1989). ""Growth models (Chapter 7)"". Nonlinear regression. Wiley Series in Probability and Mathematical Statistics: Probability and Mathematical Statistics. New York: John Wiley & Sons, Inc. pp. 325–367. ISBN 0-471-61760-1.
  • Timm, Neil H. (2002). ""The general MANOVA model (GMANOVA)" (Chapter 3.6.d)". Applied multivariate analysis. Springer Texts in Statistics. New York: Springer-Verlag. ISBN 0-387-95347-7.
  • Vonesh, Edward F. & Chinchilli, Vernon G. (1997). Linear and Nonlinear Models for the Analysis of Repeated Measurements. London: Chapman and Hall. (Comprehensive treatment of theory and practice)
  • Conaway, M. (1999, October 11). Repeated Measures Design. Retrieved February 18, 2008, from http://biostat.mc.vanderbilt.edu/twiki/pub/Main/ClinStat/repmeas.PDF
  • Minke, A. (1997, January). Conducting Repeated Measures Analyses: Experimental Design Considerations. Retrieved February 18, 2008, from Ericae.net: http://ericae.net/ft/tamu/Rm.htm
  • Shaughnessy, J. J. (2006). Research Methods in Psychology. New York: McGraw-Hill.

External links[edit]

  • Examples of all ANOVA and ANCOVA models with up to three treatment factors, including randomized block, split plot, repeated measures, and Latin squares, and their analysis in R (University of Southampton)