Из Википедии, бесплатной энциклопедии
  (Перенаправлен из Повторных мероприятий )
Перейти к навигации Перейти к поиску

Дизайн повторных измерений - это план исследования, который включает в себя несколько измерений одной и той же переменной, проводимых на одних и тех же или совпадающих субъектах в разных условиях или в течение двух или более периодов времени. [1] Например, повторные измерения собираются в продольном исследовании, в котором оцениваются изменения во времени.

Кроссовер исследования [ править ]

Популярным методом повторных измерений является перекрестное исследование . Перекрестное исследование - это продольное исследование, в котором субъекты получают последовательность различных видов лечения (или воздействий). В то время как перекрестные исследования могут быть наблюдательными , многие важные перекрестные исследования являются контролируемыми экспериментами . Кроссоверы часто используются для экспериментов во многих научных дисциплинах , например в психологии , образовании , фармацевтике и здравоохранении , особенно в медицине.

Рандомизированные контролируемые перекрестные эксперименты особенно важны в здравоохранении. В рандомизированном клиническом исследовании испытуемым назначают лечение случайным образом . Когда такое испытание представляет собой дизайн с повторными измерениями, субъектов случайным образом распределяют по последовательности лечения. Перекрестное клиническое испытание - это дизайн с повторными измерениями, в котором каждому пациенту случайным образом назначается последовательность курсов лечения, включая как минимум два лечения (одно из которых может быть стандартным лечением или плацебо ): таким образом, каждый пациент переходит от одного лечения. другому.

Почти все перекрестные конструкции имеют «баланс», что означает, что все субъекты должны получать одинаковое количество курсов лечения и что все субъекты участвуют в течение одинакового количества периодов. В большинстве перекрестных испытаний каждый субъект получает все виды лечения.

Однако многие дизайны с повторными измерениями не являются пересекающимися: например, для продольного исследования последовательных эффектов повторных курсов лечения не нужно использовать какой-либо « кроссовер » (Vonesh & Chinchilli; Jones & Kenward).

Использует [ редактировать ]

  • Ограниченное количество участников - дизайн с повторными измерениями снижает разброс оценок эффектов лечения, позволяя делать статистические выводы по меньшему количеству субъектов. [2]
  • Эффективность. Планы с повторяющимися измерениями позволяют быстрее завершить многие эксперименты, поскольку для завершения всего эксперимента необходимо обучить меньшее количество групп. Например, эксперименты, в которых каждое условие занимает всего несколько минут, тогда как обучение выполнению задач занимает столько же, если не больше времени.
  • Лонгитюдный анализ - планы повторяющихся измерений позволяют исследователям отслеживать, как участники меняются с течением времени, как в долгосрочной, так и в краткосрочной ситуации.

Эффекты порядка [ править ]

Эффекты порядка могут возникать, когда участник эксперимента может выполнить задание, а затем выполнить его снова. Примеры эффектов порядка включают повышение производительности или снижение производительности, что может быть связано с эффектами обучения, скукой или усталостью. Влияние эффектов порядка может быть меньше в долгосрочных лонгитюдных исследованиях или за счет уравновешивания с использованием перекрестного дизайна .

Уравновешивание [ править ]

В этом методе каждая из двух групп выполняет одинаковые задачи или находится в одинаковых условиях, но в обратном порядке. Из двух задач или условий формируются четыре группы.

Уравновешивание попыток учесть два важных источника систематических вариаций в этом типе дизайна: практика и эффект скуки. И то, и другое могло бы в противном случае привести к разной результативности участников из-за их знакомства или усталости от лечения.

Ограничения [ править ]

Возможно, каждый участник не сможет присутствовать во всех условиях эксперимента (т.е. временные ограничения, место проведения эксперимента и т. Д.). Субъекты с тяжелыми заболеваниями, как правило, выпадают из лонгитюдных исследований, что может привести к искажению результатов. В этих случаях предпочтительны модели со смешанными эффектами , поскольку они могут работать с пропущенными значениями.

Средняя регрессия может повлиять на условия со значительными повторениями. Созревание может повлиять на исследования, которые продолжаются с течением времени. События вне эксперимента могут изменить реакцию между повторениями.

ANOVA с повторными измерениями [ править ]

Дисперсионный анализ повторных измерений (RANOVA) - это широко используемый статистический подход к планам повторных измерений. [3] В таких планах фактор повторных измерений (качественная независимая переменная) является фактором внутри субъектов, в то время как зависимая количественная переменная, по которой измеряется каждый участник, является зависимой переменной.

Разделение ошибки [ править ]

Одним из самых больших преимуществ rANOVA, как и в случае с планами с повторными измерениями в целом, является возможность разделения изменчивости из-за индивидуальных различий. Рассмотрим общую структуру F-статистики :

F = Обработка MS / Ошибка MS = ( Обработка SS / Обработка df ) / ( Ошибка SS / Ошибка df )

В дизайне между субъектами есть элемент расхождения из-за индивидуальных различий, который сочетается с условиями лечения и ошибок:

Итого SS = Обработка SS + Ошибка SS
df Итого = n - 1

В дизайне с повторными измерениями можно отделить вариабельность субъектов от терминов обработки и ошибок. В таком случае вариабельность может быть разбита на вариабельность между курсами лечения (или эффекты внутри субъектов, за исключением индивидуальных различий) и вариабельность внутри курсов лечения. Вариабельность внутри лечения может быть далее разделена на вариабельность между субъектами (индивидуальные различия) и ошибки (за исключением индивидуальных различий): [4]

Всего SS = Лечение SS (исключая индивидуальные различия) + Субъекты SS + Ошибка SS
df Всего = df Лечение (внутри субъектов) + df между субъектами + ошибка df = ( k - 1) + ( n - 1) + (( n - k ) ( n - 1))

Что касается общей структуры F-статистики, ясно, что при разделении вариативности между субъектами, F-значение будет увеличиваться, потому что сумма квадратов ошибки будет меньше, что приведет к меньшей MSError. Примечательно, что разбиение вариативности снижает степень свободы от F-теста, поэтому вариабельность между субъектами должна быть достаточно значительной, чтобы компенсировать потерю степеней свободы. Если вариабельность между субъектами мала, этот процесс может фактически уменьшить F-значение. [4]

Предположения [ править ]

Как и при любом статистическом анализе, следует соблюдать определенные допущения, чтобы оправдать использование этого теста. Нарушения могут умеренно или серьезно повлиять на результаты и часто приводят к раздуванию ошибки типа 1 . При использовании rANOVA применяются стандартные одномерные и многомерные допущения. [5] Одномерные предположения:

  • Нормальность - для каждого уровня фактора внутри субъектов зависимая переменная должна иметь нормальное распределение .
  • Сферичность - баллы разницы, вычисленные между двумя уровнями фактора внутри субъектов, должны иметь одинаковую дисперсию для сравнения любых двух уровней. (Это предположение применимо только в том случае, если существует более двух уровней независимой переменной.)
  • Случайность - случаи должны быть получены на основе случайной выборки, а оценки разных участников не должны зависеть друг от друга.

RANOVA также требует, чтобы выполнялись некоторые многомерные допущения, потому что многомерный тест проводится по разностным оценкам. Эти предположения включают:

  • Многомерная нормальность - баллы разницы обычно многомерно распределяются в популяции.
  • Случайность. Индивидуальные случаи должны быть получены на основе случайной выборки, а баллы разницы для каждого участника не зависят от баллов другого участника.

F test [ править ]

Как и в случае с другим анализом дисперсионных тестов, rANOVA использует F-статистику для определения значимости. В зависимости от количества внутрисубъектных факторов и нарушений предположений необходимо выбрать наиболее подходящий из трех тестов: [5]

  • Стандартный одномерный тест ANOVA F - этот тест обычно используется, учитывая только два уровня фактора внутри субъектов (т.е. временная точка 1 и временная точка 2). Этот тест не рекомендуется при более чем двух уровнях внутрисубъектного фактора, поскольку в таких случаях обычно нарушается допущение о сферичности.
  • Альтернативный одномерный тест [6] - эти тесты учитывают нарушения предположения о сферичности и могут использоваться, когда фактор внутри субъектов превышает 2 уровня. F-статистика такая же, как и в стандартном одномерном ANOVA F-тесте, но связана с более точным p-значением. Эта коррекция выполняется путем уменьшения степени свободы для определения критического значения F. Обычно используются две поправки: поправка Гринхауса – Гейссера и поправка Хюйна – Фельдта. Поправка Гринхауса – Гейссера более консервативна, но решает общую проблему увеличения изменчивости с течением времени в плане повторных измерений. [7] Поправка Хюйна – Фельдта менее консервативна, но не решает проблемы увеличения изменчивости. Было предложено использовать нижнюю часть Huynh – Feldt с меньшими отклонениями от сферичности, в то время как Greenhouse – Geisser использовать при больших отклонениях.
  • Многомерный тест - этот тест не предполагает сферичности, но также является очень консервативным.

Размер эффекта [ править ]

Одной из наиболее часто встречающихся статистических данных по величине эффекта для rANOVA является частичное возведение в квадрат этажа (η p 2 ). Также обычно используется многомерная η 2, когда предположение о сферичности было нарушено, и сообщается статистика многомерного теста. Третья статистика величины эффекта, о которой сообщается, представляет собой обобщенное значение η 2 , которое сравнимо с η p 2 в однофакторном дисперсионном анализе с повторными измерениями. Было показано, что это лучшая оценка величины эффекта с другими тестами внутри субъектов. [8] [9]

Предостережения [ править ]

RANOVA - не всегда лучший статистический анализ для планов с повторными измерениями. RANOVA уязвим для эффектов от пропущенных значений, вменения, неодинаковых моментов времени между объектами и нарушений сферичности. [10] Эти проблемы могут привести к смещению выборки и завышению частоты ошибок типа I. [11] В таких случаях может быть лучше рассмотреть использование линейной смешанной модели . [12]

См. Также [ править ]

  • Дисперсионный анализ
  • Протокол клинических испытаний
  • Кроссовер исследование
  • Дизайн экспериментов
  • Ожидаемые средние квадраты
  • Глоссарий экспериментального дизайна
  • Длительное обучение
  • Кривая роста
  • Отсутствующие данные
  • Смешанные модели
  • Многомерный анализ
  • Наблюдательное исследование
  • Оптимальный дизайн
  • Панельный анализ
  • Данные панели
  • Панельное исследование
  • Рандомизация
  • Рандомизированное контролируемое исследование
  • Дизайн повторных мероприятий
  • Последовательность
  • Статистические выводы
  • Эффект лечения

Заметки [ править ]

  1. ^ Salkind, Нил Дж. «Дизайн повторяющихся мер» . Методы исследования SAGE . Шалфей . Проверено 8 января 2019 .
  2. ^ Баррет, Джулия Р. (2013). «Твердые частицы и сердечно-сосудистые заболевания: исследователи обращают внимание на микрососудистые изменения» . Перспективы гигиены окружающей среды . 121 (9): а282. DOI : 10.1289 / ehp.121-A282 . PMC 3764084 . PMID 24004855 .  
  3. ^ Георгиев; Кристал (2004). «Перемещение ANOVA». Arch Gen Psychiatry . 61 (3): 310–7. DOI : 10,1001 / archpsyc.61.3.310 . PMID 14993119 . 
  4. ^ a b Хауэлл, Дэвид С. (2010). Статистические методы психологии (7-е изд.). Бельмонт, Калифорния: Томсон Уодсворт. ISBN 978-0-495-59784-1.
  5. ^ a b Салкинд, Сэмюэл Б. Грин, Нил Дж. (2011). Использование SPSS для Windows и Macintosh: анализ и понимание данных (6-е изд.). Бостон: Прентис Холл. ISBN 978-0-205-02040-9.
  6. ^ Васи; Тайер (1987). «Постоянная проблема ложных срабатываний при повторных измерениях ANOVA в психофизиологии: многомерное решение». Психофизиология . 24 (4): 479–486. DOI : 10.1111 / j.1469-8986.1987.tb00324.x . PMID 3615759 . 
  7. ^ Парк (1993). «Сравнение подхода обобщенного оценочного уравнения с подходом максимального правдоподобия для повторных измерений». Stat Med . 12 (18): 1723–1732. DOI : 10.1002 / sim.4780121807 . PMID 8248664 . 
  8. ^ Bakeman (2005). «Рекомендуемая статистика размера эффекта для планов с повторными измерениями» . Методы исследования поведения . 37 (3): 379–384. DOI : 10.3758 / bf03192707 . PMID 16405133 . 
  9. ^ Олейник; Альгина (2003). «Обобщенная статистика в квадрате эта и омега: меры величины эффекта для некоторых распространенных исследовательских проектов». Психологические методы . 8 (4): 434–447. DOI : 10.1037 / 1082-989x.8.4.434 . PMID 14664681 . 
  10. ^ Георгиев; Кристал (2004). «Перемещение ANOVA». Arch Gen Psychiatry . 61 (3): 310–317. DOI : 10,1001 / archpsyc.61.3.310 . PMID 14993119 . 
  11. ^ Мюллер; Бартон (1989). «Приблизительная мощность для дисперсионного анализа с повторными измерениями без сферичности». Журнал Американской статистической ассоциации . 84 (406): 549–555. DOI : 10.1080 / 01621459.1989.10478802 .
  12. ^ Крюгер; Тиан (2004). «Сравнение общей линейной смешанной модели и ANOVA с повторными измерениями с использованием набора данных с несколькими пропущенными точками данных». Биологические исследования для медсестер . 6 (2): 151–157. DOI : 10.1177 / 1099800404267682 . PMID 15388912 . 

Ссылки [ править ]

Планирование и анализ экспериментов [ править ]

  • Джонс, Байрон; Кенвард, Майкл Г. (2003). Дизайн и анализ перекрестных испытаний (второе изд.). Лондон: Чепмен и Холл.
  • Вонеш, Эдвард Ф. и Чинчилли, Вернон Г. (1997). Линейные и нелинейные модели для анализа повторных измерений . Лондон: Чепмен и Холл.

Исследование продольных данных [ править ]

  • Давидиан, Мари ; Дэвид М. Гилтинан (1995). Нелинейные модели для данных повторных измерений . Монографии Chapman & Hall / CRC по статистике и прикладной вероятности. ISBN 978-0-412-98341-2.
  • Фитцморис, Гарретт; Давидиан, Мари; Вербеке, Герт; Molenberghs, Geert, eds. (2008). Продольный анализ данных . Бока-Ратон, Флорида: Чепмен и Холл / CRC. ISBN 978-1-58488-658-7.
  • Джонс, Байрон; Кенвард, Майкл Г. (2003). Дизайн и анализ перекрестных испытаний (второе изд.). Лондон: Чепмен и Холл.
  • Ким, Кевин и Тимм, Нил (2007). « « Ограниченная MGLM и модель кривой роста »(Глава 7)». Одномерные и многомерные общие линейные модели: теория и приложения с SAS (с 1 CD-ROM для Windows и UNIX) . Статистика: Учебники и монографии (2-е изд.). Бока-Ратон, Флорида: Chapman & Hall / CRC. ISBN 978-1-58488-634-1.
  • Колло, Тыну и фон Розен, Дитрих (2005). « « Многомерные линейные модели »(глава 4), особенно« Модель кривой роста и расширения »(глава 4.1)». Расширенная многомерная статистика с матрицами . Математика и ее приложения. 579 . Нью-Йорк: Спрингер. ISBN 978-1-4020-3418-3.
  • Кширсагар, Анант М. и Смит, Уильям Бойс (1995). Кривые роста . Статистика: учебники и монографии. 145 . Нью-Йорк: ISBN Marcel Dekker, Inc. 0-8247-9341-2.
  • Пан, Цзянь-Синь и Фанг, Кай-Тай (2002). Модели кривой роста и статистическая диагностика . Серии Спрингера в статистике. Нью-Йорк: Springer-Verlag. ISBN 0-387-95053-2.
  • Себер, GAF & Wild, CJ (1989). « « Модели роста (Глава 7) » ». Нелинейная регрессия . Ряд Уайли в вероятности и математической статистике: вероятность и математическая статистика. Нью-Йорк: John Wiley & Sons, Inc., стр. 325–367. ISBN 0-471-61760-1.
  • Тимм, Нил Х. (2002). « « Общая модель MANOVA (GMANOVA) »(Глава 3.6.d)». Прикладной многомерный анализ . Тексты Springer в статистике. Нью-Йорк: Springer-Verlag. ISBN 0-387-95347-7.
  • Вонеш, Эдвард Ф. и Чинчилли, Вернон Г. (1997). Линейные и нелинейные модели для анализа повторных измерений . Лондон: Чепмен и Холл. (Комплексное изложение теории и практики)
  • Конавей, М. (1999, 11 октября). Дизайн повторных мероприятий. Получено 18 февраля 2008 г. с http://biostat.mc.vanderbilt.edu/twiki/pub/Main/ClinStat/repmeas.PDF.
  • Минке, А. (1997, январь). Проведение анализа повторных измерений: соображения экспериментального дизайна. Получено 18 февраля 2008 г. с сайта Ericae.net: http://ericae.net/ft/tamu/Rm.htm.
  • Шонесси, JJ (2006). Методы исследования в психологии. Нью-Йорк: Макгроу-Хилл.

Внешние ссылки [ править ]

  • Примеры всех моделей ANOVA и ANCOVA с тремя факторами обработки, включая рандомизированный блок, разделенный график, повторные измерения и латинские квадраты, и их анализ в R (Университет Саутгемптона)