Дизайн повторных мероприятий

Ведущий раздел этой статьи , возможно , придется переписать . Используйте руководство по макету, чтобы убедиться, что раздел соответствует нормам Википедии и содержит все важные детали. ( Август 2017 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения )

План повторных измерений - это план исследования, который включает в себя несколько измерений одной и той же переменной, выполненных на одних и тех же или подобранных предметах либо в разных условиях, либо в течение двух или более периодов времени. ^[1] Например, повторные измерения собираются в продольном исследовании, в котором оцениваются изменения во времени.

Кроссовер исследования [ править ]

Популярным методом повторных измерений является перекрестное исследование . Перекрестное исследование - это продольное исследование, в котором субъекты получают последовательность различных видов лечения (или воздействий). В то время как перекрестные исследования могут быть обсервационными , многие важные перекрестные исследования являются контролируемыми экспериментами . Кроссоверы часто используются для экспериментов во многих научных дисциплинах , например в психологии , образовании , фармацевтике и здравоохранении , особенно в медицине.

Рандомизированные контролируемые перекрестные эксперименты особенно важны в здравоохранении. В рандомизированном клиническом исследовании , субъекты рандомизированы лечения. Когда такое испытание представляет собой дизайн с повторными измерениями, субъектов случайным образом распределяют по последовательности лечения. Перекрестное клиническое испытание - это дизайн с повторными измерениями, в котором каждому пациенту случайным образом назначается последовательность курсов лечения, включая как минимум два лечения (одно из которых может быть стандартным лечением или плацебо ): Таким образом, каждый пациент переходит от одного лечения другому.

Почти все перекрестные конструкции имеют «баланс», что означает, что все субъекты должны получать одинаковое количество курсов лечения и что все субъекты участвуют в течение одинакового количества периодов. В большинстве перекрестных испытаний каждый субъект получает все виды лечения.

Однако многие дизайны с повторными измерениями не являются пересекающимися: например, для продольного исследования последовательных эффектов повторных курсов лечения не нужно использовать какой-либо « кроссовер » (Vonesh & Chinchilli; Jones & Kenward).

Использует [ редактировать ]

Ограниченное количество участников - дизайн с повторяющимися измерениями снижает разброс оценок эффектов лечения, позволяя делать статистические выводы по меньшему количеству субъектов. ^[2]
Эффективность. Планы с повторяющимися измерениями позволяют быстрее завершить многие эксперименты, поскольку для завершения всего эксперимента необходимо обучить меньшее количество групп. Например, эксперименты, в которых каждое условие занимает всего несколько минут, тогда как обучение выполнению задач занимает столько же, если не больше времени.
Лонгитюдный анализ. Планы повторяющихся измерений позволяют исследователям отслеживать, как участники меняются с течением времени, как в долгосрочной, так и в краткосрочной ситуации.

Эффекты порядка [ править ]

Эффекты порядка могут возникать, когда участник эксперимента может выполнить задание, а затем выполнить его снова. Примеры эффектов порядка включают повышение производительности или снижение производительности, что может быть связано с эффектами обучения, скукой или усталостью. Влияние эффектов порядка может быть меньше в долгосрочных продольных исследованиях или за счет уравновешивания с использованием перекрестного дизайна .

Уравновешивание [ править ]

В этом методе две группы выполняют одинаковые задачи или находятся в одинаковых условиях, но в обратном порядке. Из двух задач или условий формируются четыре группы.

Уравновешивание
	Задача / условие	Задача / условие	Замечания
Группа А	1	2	Группа A сначала выполняет задачу / условие 1, затем задачу / условие 2.
Группа B	2	1	Группа B сначала выполняет задачу / условие 2, затем задачу / условие 1.

Уравновешивание пытается учесть два важных источника систематических вариаций в этом типе дизайна: практика и эффект скуки. И то, и другое могло бы в противном случае привести к разной результативности участников из-за знакомства с процедурами или усталости от них.

Ограничения [ править ]

Может оказаться невозможным для каждого участника присутствовать во всех условиях эксперимента (т.е. временные ограничения, место проведения эксперимента и т. Д.). Субъекты с тяжелыми заболеваниями, как правило, выпадают из лонгитюдных исследований, что может привести к искажению результатов. В этих случаях предпочтительны модели со смешанными эффектами , поскольку они могут работать с отсутствующими значениями.

Средняя регрессия может повлиять на условия со значительными повторениями. Созревание может повлиять на исследования, которые продолжаются со временем. События вне эксперимента могут изменить реакцию между повторениями.

ANOVA с повторными измерениями [ править ]

Дисперсионный анализ повторных измерений (RANOVA) - широко используемый статистический подход к планам повторных измерений. ^[3] В таких планах фактор повторных измерений (качественная независимая переменная) - это фактор внутри субъектов, в то время как зависимая количественная переменная, по которой измеряется каждый участник, является зависимой переменной.

Разделение ошибки [ править ]

Одним из самых больших преимуществ rANOVA, как и в случае с планами с повторными измерениями в целом, является возможность разделения изменчивости из-за индивидуальных различий. Рассмотрим общую структуру F-статистики :

F = _{Обработка} MS / _Ошибка MS = ( _{Обработка} SS / _{Обработка} df ) / ( _Ошибка SS / _Ошибка df )

В дизайне между субъектами есть элемент расхождения из-за индивидуальных различий, который сочетается с условиями лечения и ошибок:

_Всего SS = _{Обработка} SS + _Ошибка SS

df _Итого = n - 1

В дизайне с повторными измерениями можно отделить вариабельность субъектов от терминов обработки и ошибок. В таком случае вариабельность может быть разбита на вариабельность между курсами лечения (или эффекты внутри субъектов, за исключением индивидуальных различий) и вариабельность внутри лечения. Вариабельность внутри лечения может быть далее разделена на вариабельность между субъектами (индивидуальные различия) и ошибки (исключая индивидуальные различия): ^[4]

_Сумма SS = _{Лечение} SS _{(исключая индивидуальные различия)} + _{Субъекты} SS + _Ошибка SS

df _Всего = df _{Лечение (внутри субъектов)} + df _{между субъектами} + _ошибка df = ( k - 1) + ( n - 1) + (( n - k ) ( n - 1))

Что касается общей структуры F-статистики, ясно, что при разделении вариативности между субъектами, F-значение будет увеличиваться, потому что сумма квадратов ошибки будет меньше, что приведет к меньшему MSError. Примечательно, что разбиение на вариативность снижает степень свободы от F-теста, поэтому вариативность между субъектами должна быть достаточно значительной, чтобы компенсировать потерю степеней свободы. Если вариабельность между субъектами мала, этот процесс может фактически уменьшить F-значение. ^[4]

Предположения [ править ]

Как и при любом статистическом анализе, следует соблюдать определенные допущения, чтобы оправдать использование этого теста. Нарушения могут умеренно или серьезно повлиять на результаты и часто приводят к раздуванию ошибок типа 1 . При использовании rANOVA применяются стандартные одномерные и многомерные допущения. ^[5] Одномерные предположения:

Нормальность - для каждого уровня фактора внутри субъектов зависимая переменная должна иметь нормальное распределение .
Сферичность - баллы разницы, вычисленные между двумя уровнями фактора внутри субъектов, должны иметь одинаковую дисперсию для сравнения любых двух уровней. (Это предположение применимо только в том случае, если существует более двух уровней независимой переменной.)
Случайность. Случаи должны быть получены на основе случайной выборки, а оценки разных участников должны быть независимыми друг от друга.

RANOVA также требует, чтобы выполнялись некоторые многомерные допущения, потому что многомерный тест проводится по разностным оценкам. Эти предположения включают:

Многовариантная нормальность - баллы разницы обычно многомерно распределяются в популяции.
Случайность - отдельные случаи должны быть получены на основе случайной выборки, а баллы разницы для каждого участника не зависят от баллов другого участника.

F test [ править ]

Как и в случае с другим анализом дисперсионных тестов, rANOVA использует F-статистику для определения значимости. В зависимости от количества внутрисубъектных факторов и нарушений предположений необходимо выбрать наиболее подходящий из трех тестов: ^[5]

Стандартный одномерный тест ANOVA F - этот тест обычно используется, учитывая только два уровня фактора внутри субъектов (т.е. временная точка 1 и временная точка 2). Этот тест не рекомендуется при более чем двух уровнях внутрисубъектного фактора, потому что в таких случаях обычно нарушается допущение о сферичности.
Альтернативный одномерный тест ^[6]. Эти тесты учитывают нарушения предположения о сферичности и могут использоваться, когда фактор внутри субъектов превышает 2 уровня. F-статистика такая же, как в стандартном одномерном ANOVA F-тесте, но связана с более точным p-значением. Эта коррекция выполняется путем уменьшения степени свободы для определения критического значения F. Обычно используются две поправки: поправка Гринхауса – Гейссера и поправка Хюйна – Фельдта. Поправка Гринхауса – Гейссера более консервативна, но решает общую проблему увеличения изменчивости с течением времени в плане повторных измерений. ^[7] Поправка Хюйна – Фельдта менее консервативна, но не решает проблемы увеличения изменчивости. Было предложено использовать нижнюю часть Huynh – Feldt с меньшими отклонениями от сферичности, а Greenhouse – Geisser - при больших отклонениях.
Многомерный тест - этот тест не предполагает сферичности, но также является очень консервативным.

Размер эффекта [ править ]

Одна из наиболее часто описываемых статистических величин величины эффекта для rANOVA - это частичный квадрат эта (η _p² ). Также часто используется многомерная η ^2, когда предположение о сферичности было нарушено, и сообщается статистика многомерного теста. Третья статистика величины эффекта, о которой сообщается, представляет собой обобщенное значение η ² , которое сравнимо с η _p² в однофакторном дисперсионном анализе с повторными измерениями. Было показано, что это лучшая оценка величины эффекта с другими тестами внутри субъектов. ^[8]^[9]

Предостережения [ править ]

RANOVA - не всегда лучший статистический анализ для планов с повторными измерениями. RANOVA уязвим для эффектов от пропущенных значений, вменения, неэквивалентных моментов времени между объектами и нарушений сферичности. ^[10] Эти проблемы могут привести к смещению выборки и завышению частоты ошибок типа I. ^[11] В таких случаях может быть лучше рассмотреть использование линейной смешанной модели . ^[12]

См. Также [ править ]

Дисперсионный анализ
Протокол клинических испытаний
Кроссовер исследование
Дизайн экспериментов
Ожидаемые средние квадраты
Глоссарий экспериментального дизайна
Длительное обучение
Кривая роста
Отсутствующие данные
Смешанные модели
Многомерный анализ
Наблюдательное исследование
Оптимальный дизайн
Панельный анализ
Данные панели
Панельное исследование
Рандомизация
Рандомизированное контролируемое исследование
Дизайн повторных мероприятий
Последовательность
Статистические выводы
Эффект лечения

Примечания [ править ]

^ Salkind, Нил Дж. «Дизайн повторяющихся мер» . Методы исследования SAGE . Шалфей . Проверено 8 января 2019 .
^ Баррет, Джулия Р. (2013). «Твердые частицы и сердечно-сосудистые заболевания: исследователи обращают внимание на микрососудистые изменения» . Перспективы гигиены окружающей среды . 121 (9): а282. DOI : 10.1289 / ehp.121-A282 . PMC 3764084 . PMID 24004855 .
^ Георгиев; Кристал (2004). «Перемещение ANOVA». Arch Gen Psychiatry . 61 (3): 310–7. DOI : 10,1001 / archpsyc.61.3.310 . PMID 14993119 .
^ a b Хауэлл, Дэвид С. (2010). Статистические методы психологии (7-е изд.). Бельмонт, Калифорния: Томсон Уодсворт. ISBN 978-0-495-59784-1.
^ a b Salkind, Сэмюэл Б. Грин, Нил Дж. (2011). Использование SPSS для Windows и Macintosh: анализ и понимание данных (6-е изд.). Бостон: Прентис Холл. ISBN 978-0-205-02040-9.
^ Васей; Тайер (1987). "Постоянная проблема ложных срабатываний в повторных измерениях ANOVA в психофизиологии: многомерное решение". Психофизиология . 24 (4): 479–486. DOI : 10.1111 / j.1469-8986.1987.tb00324.x . PMID 3615759 .
^ Парк (1993). «Сравнение подхода обобщенного оценочного уравнения с подходом максимального правдоподобия для повторных измерений». Stat Med . 12 (18): 1723–1732. DOI : 10.1002 / sim.4780121807 . PMID 8248664 .
^ Bakeman (2005). «Рекомендуемая статистика размера эффекта для планов с повторными измерениями» . Методы исследования поведения . 37 (3): 379–384. DOI : 10.3758 / bf03192707 . PMID 16405133 .
^ Олейник; Альгина (2003). «Обобщенная статистика эта и омега-квадрат: меры величины эффекта для некоторых распространенных исследовательских проектов». Психологические методы . 8 (4): 434–447. DOI : 10.1037 / 1082-989x.8.4.434 . PMID 14664681 .
^ Георгиев; Кристал (2004). «Перемещение ANOVA». Arch Gen Psychiatry . 61 (3): 310–317. DOI : 10,1001 / archpsyc.61.3.310 . PMID 14993119 .
^ Мюллер; Бартон (1989). «Приблизительная мощность для дисперсионного анализа с повторением измерений без сферичности». Журнал Американской статистической ассоциации . 84 (406): 549–555. DOI : 10.1080 / 01621459.1989.10478802 .
^ Крюгер; Тиан (2004). «Сравнение общей линейной смешанной модели и ANOVA с повторными измерениями с использованием набора данных с несколькими пропущенными точками данных». Биологические исследования для медсестер . 6 (2): 151–157. DOI : 10.1177 / 1099800404267682 . PMID 15388912 .

Ссылки [ править ]

Планирование и анализ экспериментов [ править ]

Джонс, Байрон; Кенвард, Майкл Г. (2003). Дизайн и анализ перекрестных испытаний (второе изд.). Лондон: Чепмен и Холл.
Вонеш, Эдвард Ф. и Чинчилли, Вернон Г. (1997). Линейные и нелинейные модели для анализа повторных измерений . Лондон: Чепмен и Холл.

Исследование продольных данных [ править ]

Давидиан, Мари ; Дэвид М. Гилтинан (1995). Нелинейные модели для данных повторных измерений . Монографии Chapman & Hall / CRC по статистике и прикладной вероятности. ISBN 978-0-412-98341-2.
Фитцморис, Гарретт; Давидиан, Мари; Вербеке, Герт; Molenberghs, Geert, eds. (2008). Продольный анализ данных . Бока-Ратон, Флорида: Чепмен и Холл / CRC. ISBN 978-1-58488-658-7.
Джонс, Байрон; Кенвард, Майкл Г. (2003). Дизайн и анализ перекрестных испытаний (второе изд.). Лондон: Чепмен и Холл.
Ким, Кевин и Тимм, Нил (2007). « « Ограниченная MGLM и модель кривой роста »(Глава 7)». Одномерные и многомерные общие линейные модели: теория и приложения с SAS (с 1 CD-ROM для Windows и UNIX) . Статистика: Учебники и монографии (2-е изд.). Бока-Ратон, Флорида: Chapman & Hall / CRC. ISBN 978-1-58488-634-1.
Колло, Тыну и фон Розен, Дитрих (2005). « « Многомерные линейные модели »(глава 4), особенно« Модель кривой роста и расширения »(глава 4.1)». Расширенная многомерная статистика с матрицами . Математика и ее приложения. 579 . Нью-Йорк: Спрингер. ISBN 978-1-4020-3418-3.
Кширсагар, Анант М. и Смит, Уильям Бойс (1995). Кривые роста . Статистика: учебники и монографии. 145 . Нью-Йорк: ISBN Marcel Dekker, Inc. 0-8247-9341-2.
Пан, Цзянь-Синь и Фанг, Кай-Тай (2002). Модели кривой роста и статистическая диагностика . Серии Спрингера в статистике. Нью-Йорк: Springer-Verlag. ISBN 0-387-95053-2.
Себер, GAF & Wild, CJ (1989). « « Модели роста (Глава 7) » ». Нелинейная регрессия . Ряд Уайли в вероятности и математической статистике: вероятность и математическая статистика. Нью-Йорк: John Wiley & Sons, Inc., стр. 325–367. ISBN 0-471-61760-1.
Тимм, Нил Х. (2002). « « Общая модель MANOVA (GMANOVA) »(Глава 3.6.d)». Прикладной многомерный анализ . Тексты Springer в статистике. Нью-Йорк: Springer-Verlag. ISBN 0-387-95347-7.
Вонеш, Эдвард Ф. и Чинчилли, Вернон Г. (1997). Линейные и нелинейные модели для анализа повторных измерений . Лондон: Чепмен и Холл. (Комплексное изложение теории и практики)
Конавей, М. (1999, 11 октября). Дизайн повторных мероприятий. Получено 18 февраля 2008 г. с http://biostat.mc.vanderbilt.edu/twiki/pub/Main/ClinStat/repmeas.PDF.
Минке, А. (1997, январь). Проведение анализа повторных измерений: соображения экспериментального дизайна. Получено 18 февраля 2008 г. с сайта Ericae.net: http://ericae.net/ft/tamu/Rm.htm.
Шонесси, JJ (2006). Методы исследования в психологии. Нью-Йорк: Макгроу-Хилл.

Внешние ссылки [ править ]

Примеры всех моделей ANOVA и ANCOVA с тремя факторами обработки, включая рандомизированный блок, разделенный график, повторные измерения и латинские квадраты, и их анализ в R (Университет Саутгемптона)

[1] Salkind, Нил Дж. «Дизайн повторяющихся мер» . Методы исследования SAGE . Шалфей . Проверено 8 января 2019 .

[Barret-2] Баррет, Джулия Р. (2013). «Твердые частицы и сердечно-сосудистые заболевания: исследователи обращают внимание на микрососудистые изменения» . Перспективы гигиены окружающей среды . 121 (9): а282. DOI : 10.1289 / ehp.121-A282 . PMC 3764084 . PMID 24004855 .

[Move_Over_Anova-3] Георгиев; Кристал (2004). «Перемещение ANOVA». Arch Gen Psychiatry . 61 (3): 310–7. DOI : 10,1001 / archpsyc.61.3.310 . PMID 14993119 .

[Howell_2010-4] Хауэлл, Дэвид С. (2010). Статистические методы психологии (7-е изд.). Бельмонт, Калифорния: Томсон Уодсворт. ISBN 978-0-495-59784-1.

[Salkind-5] Salkind, Сэмюэл Б. Грин, Нил Дж. (2011). Использование SPSS для Windows и Macintosh: анализ и понимание данных (6-е изд.). Бостон: Прентис Холл. ISBN 978-0-205-02040-9.

[6] Васей; Тайер (1987). "Постоянная проблема ложных срабатываний в повторных измерениях ANOVA в психофизиологии: многомерное решение". Психофизиология . 24 (4): 479–486. DOI : 10.1111 / j.1469-8986.1987.tb00324.x . PMID 3615759 .

[7] Парк (1993). «Сравнение подхода обобщенного оценочного уравнения с подходом максимального правдоподобия для повторных измерений». Stat Med . 12 (18): 1723–1732. DOI : 10.1002 / sim.4780121807 . PMID 8248664 .

[8] Bakeman (2005). «Рекомендуемая статистика размера эффекта для планов с повторными измерениями» . Методы исследования поведения . 37 (3): 379–384. DOI : 10.3758 / bf03192707 . PMID 16405133 .

[9] Олейник; Альгина (2003). «Обобщенная статистика эта и омега-квадрат: меры величины эффекта для некоторых распространенных исследовательских проектов». Психологические методы . 8 (4): 434–447. DOI : 10.1037 / 1082-989x.8.4.434 . PMID 14664681 .

[10] Георгиев; Кристал (2004). «Перемещение ANOVA». Arch Gen Psychiatry . 61 (3): 310–317. DOI : 10,1001 / archpsyc.61.3.310 . PMID 14993119 .

[11] Мюллер; Бартон (1989). «Приблизительная мощность для дисперсионного анализа с повторением измерений без сферичности». Журнал Американской статистической ассоциации . 84 (406): 549–555. DOI : 10.1080 / 01621459.1989.10478802 .

[12] Крюгер; Тиан (2004). «Сравнение общей линейной смешанной модели и ANOVA с повторными измерениями с использованием набора данных с несколькими пропущенными точками данных». Биологические исследования для медсестер . 6 (2): 151–157. DOI : 10.1177 / 1099800404267682 . PMID 15388912 .

[1]

vтеДизайн экспериментов
Научный метод	Научный эксперимент Статистический дизайн Контроль Внутренняя и внешняя действительность Экспериментальная установка Ослепление Оптимальный дизайн : байесовский Случайное назначение Рандомизация Ограниченная рандомизация Репликация против субдискретизации Размер образца
Лечение и блокировка	Уход Размер эффекта Контраст Взаимодействие Сбивает с толку Ортогональность Блокировка Ковариантный Мешающая переменная
Модели и выводы	Линейная регрессия Обычный метод наименьших квадратов Байесовский Случайный эффект Смешанная модель Иерархическая модель: байесовская Дисперсионный анализ (Anova) Теорема Кохрана Манова ( многомерный ) Анкова ( ковариация ) Сравнить средства Множественное сравнение
Дизайн полностью рандомизирован	Факториал Дробный факториал Плакетт-Берман Тагучи Методология поверхности отклика Полиномиальное и рациональное моделирование Бокс-Бенкен Центральный композит Блокировать Обобщенный рандомизированный блочный дизайн (GRBD) Латинский квадрат Греко-латинский квадрат Ортогональный массив Латинский гиперкуб Дизайн повторяющихся мер Кроссовер исследование Рандомизированное контролируемое исследование Последовательный анализ Тест последовательного отношения вероятностей
Глоссарий Категория Математический портал Статистический обзор Статистические темы