Ступенчатым клином испытание (или SWT ) представляет собой тип рандомизированных контролируемых испытаний (РКИ или), научный эксперимент , который построен так, чтобы уменьшить смещение при тестировании новых медицинских методов лечения, социальные мероприятия или другие проверяемые гипотезы. В традиционном РКИ часть участников эксперимента одновременно и случайным образом распределяется в группу, которая получает лечение (« лечебная группа »), а другая часть - в группу, которая этого не делает (« контрольная группа »). В SWT логистические ограничения обычно препятствуют одновременному лечению некоторых участников, и вместо этого все или большинство участников получают лечение волнообразно или «ступенчато».
Например, предположим, что исследователь хотел измерить, увеличивает ли обучение студентов колледжа тому, как готовить несколько приемов пищи, их склонность готовить дома вместо еды вне дома. В традиционном РКИ будет выбрана выборка студентов, и некоторые из них будут обучены тому, как готовить эти блюда, а некоторые - нет. Обе группы будут контролироваться, чтобы видеть, как часто они ели вне дома. В конце концов, количество раз, когда экспериментальная группа ела без еды, будет сравниваться с количеством раз, когда контрольная группа поела, скорее всего, с помощью t-теста или какого - либо варианта. Если, однако, исследователь мог бы обучать только ограниченное количество студентов каждую неделю, тогда исследователь мог бы использовать SWT, случайным образом назначая студентам, на какой неделе они будут обучаться.
Термин «ступенчатый клин» был введен в обращение в Гамбийском исследовании по борьбе с гепатитом из-за формы ступенчатого клина, которая очевидна из схематической иллюстрации конструкции. [1] Переход происходит в одном направлении, обычно от контроля к вмешательству, при этом вмешательство не удаляется после его реализации. План ступенчатого клина можно использовать для индивидуально рандомизированных испытаний [2] [3], т. Е. Испытаний, в которых каждый человек лечится последовательно, но чаще используется как кластерное рандомизированное исследование (CRT) . [4]
Дизайн эксперимента
План ступенчатого клина включает в себя сбор наблюдений в течение базового периода, в течение которого никакие кластеры не подвергаются вмешательству. После этого с регулярными интервалами или шагами кластер (или группа кластеров) рандомизируется для получения вмешательства [4] [5], и все участники снова измеряются. [6] Этот процесс продолжается до тех пор, пока все кластеры не получат вмешательство. Наконец, еще одно измерение проводится после того, как все кластеры получили вмешательство.
Соответствие
Харгривс и его коллеги предлагают серию из пяти вопросов, на которые исследователи должны ответить, чтобы решить, действительно ли SWT является оптимальным дизайном, и как действовать на каждом этапе исследования. [7] В частности, исследователи должны уметь идентифицировать:
- Причины, по которым SWT является предпочтительным дизайном
- Если измерение лечебного эффекта является основной целью исследования, SWT не может быть оптимальным дизайном. SWT уместны, когда исследование сосредоточено на эффективности лечения, а не на его простом существовании. В целом, если исследование носит прагматичный характер (т. Е. Направлено в первую очередь на реализацию определенной политики), логистические и другие практические вопросы считаются лучшими причинами для перехода к конструкции ступенчатого клина. Напротив, если исследование носит пояснительный характер (т. Е. Направлено на изучение причины эффекта), преимущества значительны, но не менее важны и проблемы. Повторные вмешательства и связанная с этим рабочая нагрузка интервьюеров с течением времени, минимизация выбытия и обеспечение соблюдения требований, могут увеличить расходы и подорвать непредвзятость и эффективность. Кроме того, решающее значение имеет решение этических вопросов, связанных с отложением вмешательства для некоторых кластеров.
- Какой дизайн SWT больше подходит
- SWT могут включать три основных дизайна, использующих закрытую когорту, открытую когорту и непрерывный набор с коротким воздействием. [8] Как правило, в первом дизайне все субъекты участвуют с начала эксперимента и до его завершения, а результаты многократно измеряются в фиксированные моменты времени, которые могут быть связаны или не связаны с каждым шагом. В открытом когортном дизайне результаты измеряются аналогично предыдущему дизайну, но в исследование могут входить новые субъекты, а некоторые участники с ранней стадии могут уйти до завершения. Только часть объектов экспонируется с самого начала, а на последующих этапах постепенно раскрывается больше. Таким образом, время воздействия варьируется для каждого предмета. При непрерывном наборе с коротким воздействием очень мало субъектов или совсем не участвует в начале эксперимента, но больше становятся подходящими и постепенно подвергаются краткосрочному вмешательству. В этом дизайне каждому субъекту назначается лечение или контрольное состояние. Поскольку участники назначаются либо в группу лечения, либо в контрольную группу, риск эффекта переноса, который может быть проблемой для закрытых и открытых когортных дизайнов, минимален.
- Какая стратегия анализа подходит
- Линейные смешанные модели (LMM), обобщенные линейные смешанные модели (GLMM) и обобщенные оценочные уравнения (GEE) являются основными оценочными модулями, которые рекомендуются для анализа результатов. Хотя LMM предлагает более высокую мощность, чем GLMM и GEE, он может быть неэффективным, если размер кластеров меняется, а ответ не является непрерывным и нормально распределенным. Если какое-либо из этих предположений нарушается, предпочтение отдается GLMM и GEE.
- Насколько большим должен быть образец
- Доступны анализ мощности и расчет размера выборки. Как правило, SWT требует меньшего размера выборки для обнаружения эффектов, поскольку они используют как сравнения между кластерами, так и внутри кластера. [9] [10]
- Рекомендации по составлению отчетов о дизайне и результатах исследования
- Сообщение о дизайне, профиле выборки и результатах может быть сложной задачей, поскольку для SWT не были разработаны сводные стандарты отчетности об испытаниях ( CONSORT). Однако в некоторых исследованиях представлены как формализации, так и блок-схемы, которые помогают сообщать результаты и поддерживать сбалансированную выборку по всем волнам. [11]
Модель
Хотя существует несколько других потенциальных методов моделирования результатов в SWT, [12] работа Хасси и Хьюза [6] «впервые описала методы для определения статистической мощности, доступной при использовании ступенчатой конструкции клина». [12] Далее следует их дизайн.
Предположим, есть образцы разделены на кластеры. В каждый момент времени, предпочтительно с равным интервалом в реальном времени, обрабатывается некоторое количество кластеров. Позволять быть если кластер лечился в свое время а также иначе. В частности, отметим, что если тогда .
Для каждого участника в кластере , измерить результат, который нужно изучить вовремя . Обратите внимание, что обозначение допускает кластеризацию, включая в нижнем индексе , , , а также . Мы моделируем эти результаты как:
- это великое средство ,
- - это случайное влияние на результат на уровне кластера,
- фиксированный эффект, зависящий от момента времени,
- - измеренный эффект лечения, и
- остаточный шум.
Эту модель можно рассматривать как иерархическую линейную модель, где на самом низком уровне где - среднее значение данного кластера в данный момент времени, а на уровне кластера среднее значение каждого кластера .
Оценка дисперсии
Эффект схемы (оценка отклонения единицы) конструкции ступенчатого клина определяется формулой: [9]
- ρ - внутрикластерная корреляция (ICC) ,
- n - количество субъектов в кластере (которое предполагается постоянным),
- k - количество шагов,
- t - количество измерений после каждого шага, а
- bi s количество базовых измерений.
Для расчета объема выборки необходимо применить простую формулу: [9]
где:
- N sw - необходимый размер выборки для SWT
- N u - это общий нескорректированный размер выборки, который потребуется для традиционного РКИ.
Обратите внимание, что увеличение k , t или b приведет к уменьшению требуемого размера выборки для SWT.
Кроме того, требуемый размер кластера c определяется выражением: [9]
Чтобы вычислить , сколько кластеров с ы необходимость перехода от управления в состоянии обработки, следующая формула доступна: [9]
Если c и c s не являются целыми числами, их необходимо округлить до следующего большего целого числа и распределить как можно более равномерно среди k.
Преимущества
Конструкция со ступенчатым клином имеет множество сравнительных преимуществ по сравнению с традиционными РКИ. Во-первых, SWT наиболее подходят как с этической, так и с практической точки зрения, когда ожидается, что вмешательство приведет к положительному результату. Поскольку все субъекты в конечном итоге получат пользу от вмешательства, этические проблемы могут быть устранены, и набор участников может упроститься. [9] Во-вторых, SWT «могут согласовать потребность в надежных оценках с политическими или логистическими ограничениями». [12] В частности, его можно использовать для измерения эффектов лечения, когда ресурсы для выполнения вмешательства ограничены.
В-третьих, поскольку к концу испытания каждый кластер получает как контроль, так и условия лечения, возможны сравнения как между кластерами, так и внутри кластеров. Таким образом, статистическая мощность увеличивается, при этом выборка остается значительно меньшей, чем это было бы необходимо в традиционном РКИ. [9] Наконец, поскольку каждый кластер случайным образом переключается с контроля на режим лечения в разные моменты времени, можно исследовать временные эффекты. [9] Например, можно изучить, как повторное или длительное воздействие экспериментальных стимулов влияет на эффективность лечения. Повторные измерения в регулярные промежутки времени могут усреднить шум, что, в свою очередь, увеличивает точность оценок. Это преимущество становится наиболее очевидным, когда измерения зашумлены, а автокорреляция результатов низкая. [13]
Недостатки
SWT может иметь определенные недостатки. Во-первых, поскольку в SWT период исследования длится дольше и все пациенты в конечном итоге получают лечение, затраты могут значительно возрасти. [9] Поскольку конструкция может быть дорогостоящей, SWT не могут быть оптимальным решением, когда точность измерения и автокорреляция результатов высоки. [13] Более того, поскольку все в конечном итоге проходят лечение, SWT не облегчают последующий анализ .
Во-вторых, в SWT больше кластеров подвергаются вмешательству позже, чем в более ранние периоды времени. Таким образом, возможно, что лежащая в основе временная тенденция может искажать эффект вмешательства, и поэтому смешивающий эффект времени должен быть учтен как в расчетах мощности до судебного разбирательства, так и в анализе после судебного разбирательства. [4] [14] [12] В частности, при анализе после испытаний рекомендуется использовать обобщенные линейные смешанные модели или обобщенные оценочные уравнения . [9]
И, наконец, дизайн и анализ клинических испытаний «ступенчатого клина» более сложны, чем для других типов рандомизированных испытаний. Предыдущие систематические обзоры выявили плохую отчетность о расчетах размера выборки и непоследовательность в анализе таких испытаний. [4] [5] Хасси и Хьюз были первыми авторами, предложившими структуру и формулу для оценки мощности в исследованиях ступенчатого клина, в которых данные собирались на каждом этапе. [6] Теперь это было расширено для проектов, в которых наблюдения не производятся на каждом этапе, а также для нескольких уровней кластеризации. [15] Кроме того, был установлен эффект дизайна (используемый для увеличения размера выборки индивидуально рандомизированного исследования до размера, необходимого для кластерного исследования), [9] который показал, что ступенчатая ЭЛТ-клин может уменьшить количество необходимых пациентов. в испытании по сравнению с другими конструкциями. [9] [16]
Продолжающаяся работа
Число исследований, использующих этот дизайн, растет. В 2015 году в журнале Trials вышла тематическая серия. [17] В 2016 году в Йоркском университете прошла первая международная конференция, посвященная этой теме. [18] [19]
Рекомендации
- ^ Гамбия Гепатит Study Group (ноябрь 1987). «Исследование интервенции гепатита в Гамбии» . Исследования рака . 47 (21): 5782–7. PMID 2822233 .
- ^ Ratanawongsa N, Handley MA, Quan J, Sarkar U, Pfeifer K, Soria C, Schillinger D (январь 2012 г.). «Квазиэкспериментальное испытание автоматической поддержки самоконтроля диабета и телефонной поддержки в реальном времени (SMARTSteps) в плане управляемого медицинского обслуживания Medicaid: протокол исследования» . BMC Health Services Research . 12 : 22. DOI : 10,1186 / 1472-6963-12-22 . PMC 3276419 . PMID 22280514 .
- ^ Løhaugen GC, Beneventi H, Andersen GL, Sundberg C, Østgård HF, Bakkan E, Walther G, Vik T, Skranes J (июль 2014 г.). «Польза детей с церебральным параличом от компьютеризированной тренировки рабочей памяти? Протокол исследования для рандомизированного контролируемого исследования» . Испытания . 15 : 269. DOI : 10,1186 / 1745-6215-15-269 . PMC 4226979 . PMID 24998242 .
- ^ а б в г Brown CA, Lilford RJ (ноябрь 2006 г.). «Ступенчатый дизайн исследования клина: систематический обзор» . BMC Medical Research Methodology . 6 : 54. DOI : 10,1186 / 1471-2288-6-54 . PMC 1636652 . PMID 17092344 .
- ^ а б Mdege ND, Man MS, Taylor Nee Brown CA, Torgerson DJ (сентябрь 2011 г.). «Систематический обзор ступенчатых кластерных рандомизированных исследований показывает, что дизайн особенно используется для оценки вмешательств во время рутинного внедрения». Журнал клинической эпидемиологии . 64 (9): 936–48. DOI : 10.1016 / j.jclinepi.2010.12.003 . PMID 21411284 .
- ^ а б в Hussey MA, Hughes JP (февраль 2007 г.). «Дизайн и анализ ступенчатых кластерных рандомизированных исследований». Современные клинические испытания . 28 (2): 182–91. DOI : 10.1016 / j.cct.2006.05.007 . PMID 16829207 .
- ^ Харгривз Дж. Р., Копас А. Дж., Борода Э., Осрин Д., Льюис Дж. Дж., Дэйви С., Томпсон Дж. А., Байо Дж., Филдинг К. Л., Прост А. (август 2015 г.). «Пять вопросов, которые следует рассмотреть перед проведением ступенчатого испытания клином» . Испытания . 16 (1): 350. DOI : 10,1186 / s13063-015-0841-8 . PMC 4538743 . PMID 26279013 .
- ^ Копас А. Дж., Льюис Дж. Дж., Томпсон Дж. А., Дэйви С., Байо Дж., Харгривз Дж. Р. (август 2015 г.). «Разработка ступенчатого исследования клина: три основных дизайна, переходящие эффекты и подходы рандомизации» . Испытания . 16 (1): 352. DOI : 10,1186 / s13063-015-0842-7 . PMC 4538756 . PMID 26279154 .
- ^ Б с д е е г ч я J K L Вертман В., де Хооп Е., Мербик М., Зуидема С.У., Герритсен Д.Л., Тиренстра С. (июль 2013 г.). «Ступенчатые клиновые конструкции могут уменьшить требуемый размер выборки в кластерных рандомизированных исследованиях» . Журнал клинической эпидемиологии . 66 (7): 752–8. DOI : 10.1016 / j.jclinepi.2013.01.009 . PMID 23523551 .
- ^ Байо Дж., Копас А., Эмблер Дж., Харгривз Дж., Борода Е., Омар Р. З. (август 2015 г.). «Расчет размера выборки для испытания ступенчатым клином» . Испытания . 16 (1): 354. DOI : 10,1186 / s13063-015-0840-9 . PMC 4538764 . PMID 26282553 .
- ^ Грубер Дж. С., Рейгадас Ф, Арнольд Б. Ф., Луч I, Нельсон К., Колфорд Дж. М. (август 2013 г.). «Ступенчатое, кластерно-рандомизированное испытание бытовой УФ-дезинфекции и безопасного хранения питьевой воды в сельской местности Нижняя Калифорния, Мексика» . Американский журнал тропической медицины и гигиены . 89 (2): 238–45. DOI : 10.4269 / ajtmh.13-0017 . PMC 3741243 . PMID 23732255 .
- ^ а б в г Хемминг К., Хейнс Т.П., Чилтон П.Дж., Гирлинг А.Дж., Лилфорд Р.Дж. (февраль 2015 г.). «Кластерное рандомизированное исследование ступенчатого клина: обоснование, дизайн, анализ и отчетность» . BMJ . 350 : h391. DOI : 10.1136 / bmj.h391 . PMID 25662947 .
- ^ а б Маккензи Д. (ноябрь 2012 г.). «За пределами исходного уровня и последующих действий: аргументы в пользу большего количества экспериментов. Автор ссылается на открытую панель наложения» (PDF) . Журнал экономики развития . 99 (2): 210–221. DOI : 10.1016 / j.jdeveco.2012.01.002 . ЛВП : 10986/3403 .
- ^ Van den Heuvel ER, Zwanenburg RJ, Van Ravenswaaij-Arts CM (апрель 2017 г.). «Конструкция ступенчатого клина для тестирования влияния интраназального инсулина на когнитивное развитие детей с синдромом Фелана-Макдермида: сравнение различных дизайнов». Статистические методы в медицинских исследованиях . 26 (2): 766–775. DOI : 10.1177 / 0962280214558864 . PMID 25411323 .
- ^ Хемминг К., Лилфорд Р., Гирлинг А. Дж. (Январь 2015 г.). «Ступенчатые кластерные рандомизированные контролируемые испытания: общая структура, включающая параллельные и многоуровневые дизайны» . Статистика в медицине . 34 (2): 181–96. DOI : 10.1002 / sim.6325 . PMC 4286109 . PMID 25346484 .
- ^ Keriel-Gascou M, Buchet-Poyau K, Rabilloud M, Duclos A, Colin C (июль 2014 г.). «Для оценки комплексных медицинских вмешательств предпочтительнее использовать ступенчатое кластерное рандомизированное исследование». Журнал клинической эпидемиологии . 67 (7): 831–3. DOI : 10.1016 / j.jclinepi.2014.02.016 . PMID 24774471 .
- ^ Торгерсон Д (2015). «Рандомизированные контролируемые испытания ступенчатого клина» . Испытания . 16 : 350 . Проверено 17 февраля 2017 года .
- ^ «Первая международная конференция по дизайну испытаний с использованием ступенчатого клина» . Йоркский университет.
- ^ Канаан М., Кединг А., Мдеге Н., Торгерсон Д. (2016). "Труды Первой международной конференции по дизайну испытаний с использованием ступенчатого клина" . Испытания . 17 (Suppl 1): 311. DOI : 10,1186 / s13063-016-1436-8 . PMC 4959349 . PMID 27454562 .