Ведущий раздел этой статьи , возможно , придется переписать . ( Август 2017 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения ) |
План повторных измерений - это план исследования, который включает в себя несколько измерений одной и той же переменной, выполненных на одних и тех же или подобранных предметах либо в разных условиях, либо в течение двух или более периодов времени. [1] Например, повторные измерения собираются в продольном исследовании, в котором оцениваются изменения во времени.
Кроссовер исследования [ править ]
Популярным методом повторных измерений является перекрестное исследование . Перекрестное исследование - это продольное исследование, в котором субъекты получают последовательность различных видов лечения (или воздействий). В то время как перекрестные исследования могут быть обсервационными , многие важные перекрестные исследования являются контролируемыми экспериментами . Кроссоверы часто используются для экспериментов во многих научных дисциплинах , например в психологии , образовании , фармацевтике и здравоохранении , особенно в медицине.
Рандомизированные контролируемые перекрестные эксперименты особенно важны в здравоохранении. В рандомизированном клиническом исследовании , субъекты рандомизированы лечения. Когда такое испытание представляет собой дизайн с повторными измерениями, субъектов случайным образом распределяют по последовательности лечения. Перекрестное клиническое испытание - это дизайн с повторными измерениями, в котором каждому пациенту случайным образом назначается последовательность курсов лечения, включая как минимум два лечения (одно из которых может быть стандартным лечением или плацебо ): Таким образом, каждый пациент переходит от одного лечения другому.
Почти все перекрестные конструкции имеют «баланс», что означает, что все субъекты должны получать одинаковое количество курсов лечения и что все субъекты участвуют в течение одинакового количества периодов. В большинстве перекрестных испытаний каждый субъект получает все виды лечения.
Однако многие дизайны с повторными измерениями не являются пересекающимися: например, для продольного исследования последовательных эффектов повторных курсов лечения не нужно использовать какой-либо « кроссовер » (Vonesh & Chinchilli; Jones & Kenward).
Использует [ редактировать ]
- Ограниченное количество участников - дизайн с повторяющимися измерениями снижает разброс оценок эффектов лечения, позволяя делать статистические выводы по меньшему количеству субъектов. [2]
- Эффективность. Планы с повторяющимися измерениями позволяют быстрее завершить многие эксперименты, поскольку для завершения всего эксперимента необходимо обучить меньшее количество групп. Например, эксперименты, в которых каждое условие занимает всего несколько минут, тогда как обучение выполнению задач занимает столько же, если не больше времени.
- Лонгитюдный анализ. Планы повторяющихся измерений позволяют исследователям отслеживать, как участники меняются с течением времени, как в долгосрочной, так и в краткосрочной ситуации.
Эффекты порядка [ править ]
Эффекты порядка могут возникать, когда участник эксперимента может выполнить задание, а затем выполнить его снова. Примеры эффектов порядка включают повышение производительности или снижение производительности, что может быть связано с эффектами обучения, скукой или усталостью. Влияние эффектов порядка может быть меньше в долгосрочных продольных исследованиях или за счет уравновешивания с использованием перекрестного дизайна .
Уравновешивание [ править ]
В этом методе две группы выполняют одинаковые задачи или находятся в одинаковых условиях, но в обратном порядке. Из двух задач или условий формируются четыре группы.
Задача / условие | Задача / условие | Замечания | |
---|---|---|---|
Группа А | 1 | 2 | Группа A сначала выполняет задачу / условие 1, затем задачу / условие 2. |
Группа B | 2 | 1 | Группа B сначала выполняет задачу / условие 2, затем задачу / условие 1. |
Уравновешивание пытается учесть два важных источника систематических вариаций в этом типе дизайна: практика и эффект скуки. И то, и другое могло бы в противном случае привести к разной результативности участников из-за знакомства с процедурами или усталости от них.
Ограничения [ править ]
Может оказаться невозможным для каждого участника присутствовать во всех условиях эксперимента (т.е. временные ограничения, место проведения эксперимента и т. Д.). Субъекты с тяжелыми заболеваниями, как правило, выпадают из лонгитюдных исследований, что может привести к искажению результатов. В этих случаях предпочтительны модели со смешанными эффектами , поскольку они могут работать с отсутствующими значениями.
Средняя регрессия может повлиять на условия со значительными повторениями. Созревание может повлиять на исследования, которые продолжаются со временем. События вне эксперимента могут изменить реакцию между повторениями.
ANOVA с повторными измерениями [ править ]
Дисперсионный анализ повторных измерений (RANOVA) - широко используемый статистический подход к планам повторных измерений. [3] В таких планах фактор повторных измерений (качественная независимая переменная) - это фактор внутри субъектов, в то время как зависимая количественная переменная, по которой измеряется каждый участник, является зависимой переменной.
Разделение ошибки [ править ]
Одним из самых больших преимуществ rANOVA, как и в случае с планами с повторными измерениями в целом, является возможность разделения изменчивости из-за индивидуальных различий. Рассмотрим общую структуру F-статистики :
- F = Обработка MS / Ошибка MS = ( Обработка SS / Обработка df ) / ( Ошибка SS / Ошибка df )
В дизайне между субъектами есть элемент расхождения из-за индивидуальных различий, который сочетается с условиями лечения и ошибок:
- Всего SS = Обработка SS + Ошибка SS
- df Итого = n - 1
В дизайне с повторными измерениями можно отделить вариабельность субъектов от терминов обработки и ошибок. В таком случае вариабельность может быть разбита на вариабельность между курсами лечения (или эффекты внутри субъектов, за исключением индивидуальных различий) и вариабельность внутри лечения. Вариабельность внутри лечения может быть далее разделена на вариабельность между субъектами (индивидуальные различия) и ошибки (исключая индивидуальные различия): [4]
- Сумма SS = Лечение SS (исключая индивидуальные различия) + Субъекты SS + Ошибка SS
- df Всего = df Лечение (внутри субъектов) + df между субъектами + ошибка df = ( k - 1) + ( n - 1) + (( n - k ) ( n - 1))
Что касается общей структуры F-статистики, ясно, что при разделении вариативности между субъектами, F-значение будет увеличиваться, потому что сумма квадратов ошибки будет меньше, что приведет к меньшему MSError. Примечательно, что разбиение на вариативность снижает степень свободы от F-теста, поэтому вариативность между субъектами должна быть достаточно значительной, чтобы компенсировать потерю степеней свободы. Если вариабельность между субъектами мала, этот процесс может фактически уменьшить F-значение. [4]
Предположения [ править ]
Как и при любом статистическом анализе, следует соблюдать определенные допущения, чтобы оправдать использование этого теста. Нарушения могут умеренно или серьезно повлиять на результаты и часто приводят к раздуванию ошибок типа 1 . При использовании rANOVA применяются стандартные одномерные и многомерные допущения. [5] Одномерные предположения:
- Нормальность - для каждого уровня фактора внутри субъектов зависимая переменная должна иметь нормальное распределение .
- Сферичность - баллы разницы, вычисленные между двумя уровнями фактора внутри субъектов, должны иметь одинаковую дисперсию для сравнения любых двух уровней. (Это предположение применимо только в том случае, если существует более двух уровней независимой переменной.)
- Случайность. Случаи должны быть получены на основе случайной выборки, а оценки разных участников должны быть независимыми друг от друга.
RANOVA также требует, чтобы выполнялись некоторые многомерные допущения, потому что многомерный тест проводится по разностным оценкам. Эти предположения включают:
- Многовариантная нормальность - баллы разницы обычно многомерно распределяются в популяции.
- Случайность - отдельные случаи должны быть получены на основе случайной выборки, а баллы разницы для каждого участника не зависят от баллов другого участника.
F test [ править ]
Как и в случае с другим анализом дисперсионных тестов, rANOVA использует F-статистику для определения значимости. В зависимости от количества внутрисубъектных факторов и нарушений предположений необходимо выбрать наиболее подходящий из трех тестов: [5]
- Стандартный одномерный тест ANOVA F - этот тест обычно используется, учитывая только два уровня фактора внутри субъектов (т.е. временная точка 1 и временная точка 2). Этот тест не рекомендуется при более чем двух уровнях внутрисубъектного фактора, потому что в таких случаях обычно нарушается допущение о сферичности.
- Альтернативный одномерный тест [6]. Эти тесты учитывают нарушения предположения о сферичности и могут использоваться, когда фактор внутри субъектов превышает 2 уровня. F-статистика такая же, как в стандартном одномерном ANOVA F-тесте, но связана с более точным p-значением. Эта коррекция выполняется путем уменьшения степени свободы для определения критического значения F. Обычно используются две поправки: поправка Гринхауса – Гейссера и поправка Хюйна – Фельдта. Поправка Гринхауса – Гейссера более консервативна, но решает общую проблему увеличения изменчивости с течением времени в плане повторных измерений. [7] Поправка Хюйна – Фельдта менее консервативна, но не решает проблемы увеличения изменчивости. Было предложено использовать нижнюю часть Huynh – Feldt с меньшими отклонениями от сферичности, а Greenhouse – Geisser - при больших отклонениях.
- Многомерный тест - этот тест не предполагает сферичности, но также является очень консервативным.
Размер эффекта [ править ]
Одна из наиболее часто описываемых статистических величин величины эффекта для rANOVA - это частичный квадрат эта (η p 2 ). Также часто используется многомерная η 2, когда предположение о сферичности было нарушено, и сообщается статистика многомерного теста. Третья статистика величины эффекта, о которой сообщается, представляет собой обобщенное значение η 2 , которое сравнимо с η p 2 в однофакторном дисперсионном анализе с повторными измерениями. Было показано, что это лучшая оценка величины эффекта с другими тестами внутри субъектов. [8] [9]
Предостережения [ править ]
RANOVA - не всегда лучший статистический анализ для планов с повторными измерениями. RANOVA уязвим для эффектов от пропущенных значений, вменения, неэквивалентных моментов времени между объектами и нарушений сферичности. [10] Эти проблемы могут привести к смещению выборки и завышению частоты ошибок типа I. [11] В таких случаях может быть лучше рассмотреть использование линейной смешанной модели . [12]
См. Также [ править ]
- Дисперсионный анализ
- Протокол клинических испытаний
- Кроссовер исследование
- Дизайн экспериментов
- Ожидаемые средние квадраты
- Глоссарий экспериментального дизайна
- Длительное обучение
- Кривая роста
- Отсутствующие данные
- Смешанные модели
- Многомерный анализ
- Наблюдательное исследование
- Оптимальный дизайн
- Панельный анализ
- Данные панели
- Панельное исследование
- Рандомизация
- Рандомизированное контролируемое исследование
- Дизайн повторных мероприятий
- Последовательность
- Статистические выводы
- Эффект лечения
Примечания [ править ]
- ^ Salkind, Нил Дж. «Дизайн повторяющихся мер» . Методы исследования SAGE . Шалфей . Проверено 8 января 2019 .
- ^ Баррет, Джулия Р. (2013). «Твердые частицы и сердечно-сосудистые заболевания: исследователи обращают внимание на микрососудистые изменения» . Перспективы гигиены окружающей среды . 121 (9): а282. DOI : 10.1289 / ehp.121-A282 . PMC 3764084 . PMID 24004855 .
- ^ Георгиев; Кристал (2004). «Перемещение ANOVA». Arch Gen Psychiatry . 61 (3): 310–7. DOI : 10,1001 / archpsyc.61.3.310 . PMID 14993119 .
- ^ a b Хауэлл, Дэвид С. (2010). Статистические методы психологии (7-е изд.). Бельмонт, Калифорния: Томсон Уодсворт. ISBN 978-0-495-59784-1.
- ^ a b Salkind, Сэмюэл Б. Грин, Нил Дж. (2011). Использование SPSS для Windows и Macintosh: анализ и понимание данных (6-е изд.). Бостон: Прентис Холл. ISBN 978-0-205-02040-9.
- ^ Васей; Тайер (1987). "Постоянная проблема ложных срабатываний в повторных измерениях ANOVA в психофизиологии: многомерное решение". Психофизиология . 24 (4): 479–486. DOI : 10.1111 / j.1469-8986.1987.tb00324.x . PMID 3615759 .
- ^ Парк (1993). «Сравнение подхода обобщенного оценочного уравнения с подходом максимального правдоподобия для повторных измерений». Stat Med . 12 (18): 1723–1732. DOI : 10.1002 / sim.4780121807 . PMID 8248664 .
- ^ Bakeman (2005). «Рекомендуемая статистика размера эффекта для планов с повторными измерениями» . Методы исследования поведения . 37 (3): 379–384. DOI : 10.3758 / bf03192707 . PMID 16405133 .
- ^ Олейник; Альгина (2003). «Обобщенная статистика эта и омега-квадрат: меры величины эффекта для некоторых распространенных исследовательских проектов». Психологические методы . 8 (4): 434–447. DOI : 10.1037 / 1082-989x.8.4.434 . PMID 14664681 .
- ^ Георгиев; Кристал (2004). «Перемещение ANOVA». Arch Gen Psychiatry . 61 (3): 310–317. DOI : 10,1001 / archpsyc.61.3.310 . PMID 14993119 .
- ^ Мюллер; Бартон (1989). «Приблизительная мощность для дисперсионного анализа с повторением измерений без сферичности». Журнал Американской статистической ассоциации . 84 (406): 549–555. DOI : 10.1080 / 01621459.1989.10478802 .
- ^ Крюгер; Тиан (2004). «Сравнение общей линейной смешанной модели и ANOVA с повторными измерениями с использованием набора данных с несколькими пропущенными точками данных». Биологические исследования для медсестер . 6 (2): 151–157. DOI : 10.1177 / 1099800404267682 . PMID 15388912 .
Ссылки [ править ]
Планирование и анализ экспериментов [ править ]
- Джонс, Байрон; Кенвард, Майкл Г. (2003). Дизайн и анализ перекрестных испытаний (второе изд.). Лондон: Чепмен и Холл.
- Вонеш, Эдвард Ф. и Чинчилли, Вернон Г. (1997). Линейные и нелинейные модели для анализа повторных измерений . Лондон: Чепмен и Холл.
Исследование продольных данных [ править ]
- Давидиан, Мари ; Дэвид М. Гилтинан (1995). Нелинейные модели для данных повторных измерений . Монографии Chapman & Hall / CRC по статистике и прикладной вероятности. ISBN 978-0-412-98341-2.
- Фитцморис, Гарретт; Давидиан, Мари; Вербеке, Герт; Molenberghs, Geert, eds. (2008). Продольный анализ данных . Бока-Ратон, Флорида: Чепмен и Холл / CRC. ISBN 978-1-58488-658-7.
- Джонс, Байрон; Кенвард, Майкл Г. (2003). Дизайн и анализ перекрестных испытаний (второе изд.). Лондон: Чепмен и Холл.
- Ким, Кевин и Тимм, Нил (2007). « « Ограниченная MGLM и модель кривой роста »(Глава 7)». Одномерные и многомерные общие линейные модели: теория и приложения с SAS (с 1 CD-ROM для Windows и UNIX) . Статистика: Учебники и монографии (2-е изд.). Бока-Ратон, Флорида: Chapman & Hall / CRC. ISBN 978-1-58488-634-1.
- Колло, Тыну и фон Розен, Дитрих (2005). « « Многомерные линейные модели »(глава 4), особенно« Модель кривой роста и расширения »(глава 4.1)». Расширенная многомерная статистика с матрицами . Математика и ее приложения. 579 . Нью-Йорк: Спрингер. ISBN 978-1-4020-3418-3.
- Кширсагар, Анант М. и Смит, Уильям Бойс (1995). Кривые роста . Статистика: учебники и монографии. 145 . Нью-Йорк: ISBN Marcel Dekker, Inc. 0-8247-9341-2.
- Пан, Цзянь-Синь и Фанг, Кай-Тай (2002). Модели кривой роста и статистическая диагностика . Серии Спрингера в статистике. Нью-Йорк: Springer-Verlag. ISBN 0-387-95053-2.
- Себер, GAF & Wild, CJ (1989). « « Модели роста (Глава 7) » ». Нелинейная регрессия . Ряд Уайли в вероятности и математической статистике: вероятность и математическая статистика. Нью-Йорк: John Wiley & Sons, Inc., стр. 325–367. ISBN 0-471-61760-1.
- Тимм, Нил Х. (2002). « « Общая модель MANOVA (GMANOVA) »(Глава 3.6.d)». Прикладной многомерный анализ . Тексты Springer в статистике. Нью-Йорк: Springer-Verlag. ISBN 0-387-95347-7.
- Вонеш, Эдвард Ф. и Чинчилли, Вернон Г. (1997). Линейные и нелинейные модели для анализа повторных измерений . Лондон: Чепмен и Холл. (Комплексное изложение теории и практики)
- Конавей, М. (1999, 11 октября). Дизайн повторных мероприятий. Получено 18 февраля 2008 г. с http://biostat.mc.vanderbilt.edu/twiki/pub/Main/ClinStat/repmeas.PDF.
- Минке, А. (1997, январь). Проведение анализа повторных измерений: соображения экспериментального дизайна. Получено 18 февраля 2008 г. с сайта Ericae.net: http://ericae.net/ft/tamu/Rm.htm.
- Шонесси, JJ (2006). Методы исследования в психологии. Нью-Йорк: Макгроу-Хилл.
Внешние ссылки [ править ]
- Примеры всех моделей ANOVA и ANCOVA с тремя факторами обработки, включая рандомизированный блок, разделенный график, повторные измерения и латинские квадраты, и их анализ в R (Университет Саутгемптона)