Рандомизированный эксперимент

Блок-схема четырех этапов (включение, распределение вмешательств, последующее наблюдение и анализ данных) параллельного рандомизированного исследования двух групп, измененная на основе заявления CONSORT 2010 ^[1]

В науке , рандомизированные эксперименты являются экспериментами , которые позволяют наибольшую надежность и достоверность статистических оценок результатов лечения. Вывод, основанный на рандомизации, особенно важен при планировании экспериментов и при выборке обследований .

Обзор [ править ]

В статистической теории планирования экспериментов рандомизация включает случайное распределение экспериментальных единиц по группам лечения . Например, если в эксперименте сравнивается новое лекарство со стандартным лекарством, тогда пациентов следует распределить либо на новое лекарство, либо на стандартный контроль лекарств с помощью рандомизации.

Рандомизированные эксперименты не случайны. Рандомизация снижает систематическую ошибку , уравновешивая другие факторы, которые не были явно учтены в дизайне эксперимента (в соответствии с законом больших чисел ). Рандомизация также дает игнорируемые планы , которые ценны для статистических выводов на основе моделей , особенно байесовских или вероятностных . При планировании экспериментов самым простым способом сравнения лечения является «полностью рандомизированный дизайн». Некоторое «ограничение на рандомизацию» может возникнуть при блокировке и эксперименты с трудноизменяемыми факторами; дополнительные ограничения на рандомизацию могут иметь место, когда полная рандомизация невозможна или когда желательно уменьшить дисперсию оценок выбранных эффектов.

Рандомизация лечения в клинических испытаниях создает этические проблемы. В некоторых случаях рандомизация сокращает терапевтические возможности как для врача, так и для пациента, и поэтому рандомизация требует клинического равновесия в отношении лечения.

Интернет-рандомизированные контролируемые эксперименты [ править ]

Веб-сайты могут проводить рандомизированные контролируемые эксперименты ^[2] для создания цикла обратной связи. ^[3] Ключевые различия между офлайн-экспериментами и онлайн-экспериментами включают: ^[3]^[4]

Ведение журнала: взаимодействия пользователей могут надежно регистрироваться.
Количество пользователей: крупные сайты, такие как Amazon, Bing / Microsoft и Google, проводят эксперименты, на каждом более миллиона пользователей.
Количество одновременных экспериментов: на крупных сайтах проводятся десятки перекрывающихся или одновременных экспериментов. ^[5]
Роботы, будь то поисковые роботы из достоверных источников или вредоносные интернет-боты . ^{[ требуется разъяснение ]}
Возможность наращивать эксперименты с низких процентов до более высоких.
Скорость / производительность существенно влияют на ключевые показатели. ^[3]^[6]

Возможность использовать предэкспериментальный период как A / A-тест для уменьшения дисперсии. ^[7]

История [ править ]

Контролируемый эксперимент, по-видимому, был предложен в ветхозаветной книге Даниила. Царь Навуходоносор предложил некоторым израильтянам съесть «ежедневное количество еды и вина со стола царя». Даниил предпочитал вегетарианскую диету, но чиновник был обеспокоен тем, что король «увидит, что ты выглядишь хуже, чем другие молодые люди твоего возраста? Тогда король заберет мою голову из-за тебя». Затем Даниил предложил следующий управляемый эксперимент: «Испытайте своих слуг в течение десяти дней. Дайте нам ничего, кроме овощей для еды и воды для питья. Затем сравните нашу внешность с внешностью молодых людей, которые едят царскую пищу, и относитесь к своим слугам соответственно с тем, что вы видите ". (Даниил 1, 12–13). ^[8]^[9]

Рандомизированные эксперименты были институционализированы в психологии и образовании в конце XVIII века, после изобретения рандомизированных экспериментов К.С. Пирсом . ^[10]^[11]^[12]^[13] Помимо психологии и образования, рандомизированные эксперименты были популяризированы Р. А. Фишером в его книге « Статистические методы для научных работников» , в которой также были представлены дополнительные принципы экспериментального дизайна.

Статистическая интерпретация [ править ]

Этот раздел нуждается в расширении . Вы можете помочь, добавив к нему . ( Сентябрь 2012 г. )

Рубин Причинная модель обеспечивает общий способ описания рандомизированного эксперимента. В то время как причинно-следственная модель Рубина обеспечивает основу для определения причинных параметров (т. Е. Влияния рандомизированного лечения на результат), анализ экспериментов может принимать различные формы. Чаще всего рандомизированные эксперименты анализируются с использованием ANOVA , t-критерия Стьюдента , регрессионного анализа или аналогичного статистического теста .

Эмпирические доказательства того, что рандомизация имеет значение [ править ]

Эмпирически различия между рандомизированными и нерандомизированными исследованиями ^[14], а также между адекватно и неадекватно рандомизированными исследованиями выявить трудно. ^[15]^[16]

См. Также [ править ]

A / B тестирование
Сокрытие распределения
Случайное назначение
Рандомизированный блочный дизайн
Рандомизированное контролируемое исследование

Ссылки [ править ]

^ Шульц К.Ф., Альтман Д.Г., Мохер Д. для CONSORT Group (2010). «Заявление CONSORT 2010: обновленное руководство по составлению отчетов о рандомизированных исследованиях в параллельных группах» . BMJ . 340 : c332. DOI : 10.1136 / bmj.c332 . PMC 2844940 . PMID 20332509 .CS1 maint: несколько имен: список авторов ( ссылка )
^ Кохави, Рон; Лонгботэм, Роджер (2015). «Контролируемые онлайн-эксперименты и A / B-тесты» (PDF) . В Саммуте, Клод; Уэбб, Джефф (ред.). Энциклопедия машинного обучения и интеллектуального анализа данных . Springer. стр., чтобы появиться.
^ a b c Кохави, Рон; Лонгботэм, Роджер; Соммерфилд, Дэн; Хенне, Рэндал М. (2009). «Управляемые эксперименты в сети: обзор и практическое руководство» . Интеллектуальный анализ данных и обнаружение знаний . 18 (1): 140–181. DOI : 10.1007 / s10618-008-0114-1 . ISSN 1384-5810 .
^ Кохави, Рон; Дэн, Алекс; Фраска, Брайан; Лонгботэм, Роджер; Уокер, Тоби; Сюй Я (2012). «Надежные контролируемые эксперименты в Интернете: объяснение пяти загадочных результатов» . Материалы 18-й конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных .
^ Кохави, Рон; Дэн Алекс; Фраска Брайан; Уокер Тоби; Сюй Я; Нильс Польманн (2013). Крупномасштабные онлайн-контролируемые эксперименты . Труды 19-й конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных . 19 . Чикаго, Иллинойс, США: ACM. С. 1168–1176. DOI : 10.1145 / 2487575.2488217 .
^ Кохави, Рон; Дэн Алекс; Лонгботэм Роджер; Сюй Я (2014). Семь практических правил для экспериментаторов веб-сайтов . Материалы 20-й конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных . 20 . Нью-Йорк, Нью-Йорк, США: ACM. С. 1857–1866. DOI : 10.1145 / 2623330.2623341 .
^ Дэн, Алекс; Сюй, Я; Кохави, Рон; Уокер, Тоби (2013). «Повышение чувствительности онлайн-контролируемых экспериментов за счет использования данных до эксперимента» . WSDM 2013: Шестая международная конференция ACM по веб-поиску и интеллектуальному анализу данных .
^ Neuhauser, D; Диаз, М. (2004). «Даниил: использование Библии для обучения методам повышения качества» . Качество и безопасность в здравоохранении . 13 (2): 153–155. DOI : 10.1136 / qshc.2003.009480 . PMC 1743807 . PMID 15069225 .
^ Angrist, Joshua; Пишке Йорн-Штеффен (2014). Освоение показателей: путь от причины к следствию . Издательство Принстонского университета. п. 31.
^ Чарльз Сандерс Пирс и Джозеф Джастроу (1885). «О малых различиях в ощущениях» . Воспоминания Национальной академии наук . 3 : 73–83. http://psychclassics.yorku.ca/Peirce/small-diffs.htm
Перейти ↑ Hacking, Ian (сентябрь 1988 г.). «Телепатия: истоки рандомизации в экспериментальном дизайне». Исида . 79 (3): 427–451. DOI : 10.1086 / 354775 . JSTOR 234674 . Руководство по ремонту 1013489 .
^ Стивен М. Стиглер (ноябрь 1992 г.). «Исторический взгляд на статистические концепции в психологии и образовательных исследованиях». Американский журнал образования . 101 (1): 60–70. DOI : 10.1086 / 444032 .
^ Труды Dehue (декабрь 1997). «Обман, эффективность и случайные группы: психология и постепенное возникновение дизайна случайных групп» (PDF) . Исида . 88 (4): 653–673. DOI : 10.1086 / 383850 . PMID 9519574 .
^ Anglemyer A, Хорват HT, Беро L (апрель 2014). «Результаты здравоохранения, оцененные с помощью обсервационных исследований, по сравнению с результатами, оцененными в рандомизированных исследованиях». Cochrane Database Syst Rev . 4 (4): MR000034. DOI : 10.1002 / 14651858.MR000034.pub2 . PMID 24782322 .
^ Odgaard-Jensen J, Vist G и др. (Апрель 2011 г.). «Рандомизация для защиты от систематической ошибки отбора в медицинских исследованиях» . Кокрановская база данных Syst Rev (4): MR000012. DOI : 10.1002 / 14651858.MR000012.pub3 . PMC 7150228 . PMID 21491415 .
^ Ховик Дж, Мебиус А (2014). «В поисках оправдания парадоксу непредсказуемости» . Испытания . 15 : 480. DOI : 10,1186 / 1745-6215-15-480 . PMC 4295227 . PMID 25490908 .

Калински, Тадеуш и Кагеяма, Санпей (2000). Блочные конструкции: подход рандомизации, Том I : Анализ . Конспект лекций по статистике. 150 . Нью-Йорк: Springer-Verlag. ISBN 978-0-387-98578-7.
Калински, Тадеуш и Кагеяма, Санпей (2003). Блочные конструкции: подход рандомизации, Том II : Дизайн . Конспект лекций по статистике. 170 . Нью-Йорк: Springer-Verlag. ISBN 978-0-387-95470-7.
Взлом, Ян (сентябрь 1988 г.). «Телепатия: истоки рандомизации в экспериментальном дизайне». Исида . 79 (3): 427–451. DOI : 10.1086 / 354775 . JSTOR 234674 . Руководство по ремонту 1013489 .
Хинкельманн, Клаус; Кемпторн, Оскар (2008). Планирование и анализ экспериментов, Том I: Введение в экспериментальный дизайн (второе изд.). Вайли. ISBN 978-0-471-72756-9. Руководство по ремонту 2363107 .
Кемпторн, Оскар (1992). «Интервенционные эксперименты, рандомизация и вывод» . В малайском гош и Прамод К. Патхак (ред.). Актуальные вопросы статистического вывода - Очерки в честь Д. Басу . Конспект лекций Института математической статистики - Серия монографий. Хейворд, Калифорния: Институт математической статистики. С. 13–31. DOI : 10.1214 / lnms / 1215458836 . ISBN 978-0-940600-24-9. Руководство по ремонту 1194407 .

[Schulz-2010-1] Шульц К.Ф., Альтман Д.Г., Мохер Д. для CONSORT Group (2010). «Заявление CONSORT 2010: обновленное руководство по составлению отчетов о рандомизированных исследованиях в параллельных группах» . BMJ . 340 : c332. DOI : 10.1136 / bmj.c332 . PMC 2844940 . PMID 20332509 .CS1 maint: несколько имен: список авторов ( ссылка )

[2] Кохави, Рон; Лонгботэм, Роджер (2015). «Контролируемые онлайн-эксперименты и A / B-тесты» (PDF) . В Саммуте, Клод; Уэбб, Джефф (ред.). Энциклопедия машинного обучения и интеллектуального анализа данных . Springer. стр., чтобы появиться.

[surveyarticle-3] Кохави, Рон; Лонгботэм, Роджер; Соммерфилд, Дэн; Хенне, Рэндал М. (2009). «Управляемые эксперименты в сети: обзор и практическое руководство» . Интеллектуальный анализ данных и обнаружение знаний . 18 (1): 140–181. DOI : 10.1007 / s10618-008-0114-1 . ISSN 1384-5810 .

[puzzlingResults-4] Кохави, Рон; Дэн, Алекс; Фраска, Брайан; Лонгботэм, Роджер; Уокер, Тоби; Сюй Я (2012). «Надежные контролируемые эксперименты в Интернете: объяснение пяти загадочных результатов» . Материалы 18-й конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных .

[ExPScale-5] Кохави, Рон; Дэн Алекс; Фраска Брайан; Уокер Тоби; Сюй Я; Нильс Польманн (2013). Крупномасштабные онлайн-контролируемые эксперименты . Труды 19-й конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных . 19 . Чикаго, Иллинойс, США: ACM. С. 1168–1176. DOI : 10.1145 / 2487575.2488217 .

[ExPRulesOfThumb-6] Кохави, Рон; Дэн Алекс; Лонгботэм Роджер; Сюй Я (2014). Семь практических правил для экспериментаторов веб-сайтов . Материалы 20-й конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных . 20 . Нью-Йорк, Нью-Йорк, США: ACM. С. 1857–1866. DOI : 10.1145 / 2623330.2623341 .

[cuped-7] Дэн, Алекс; Сюй, Я; Кохави, Рон; Уокер, Тоби (2013). «Повышение чувствительности онлайн-контролируемых экспериментов за счет использования данных до эксперимента» . WSDM 2013: Шестая международная конференция ACM по веб-поиску и интеллектуальному анализу данных .

[8] Neuhauser, D; Диаз, М. (2004). «Даниил: использование Библии для обучения методам повышения качества» . Качество и безопасность в здравоохранении . 13 (2): 153–155. DOI : 10.1136 / qshc.2003.009480 . PMC 1743807 . PMID 15069225 .

[9] Angrist, Joshua; Пишке Йорн-Штеффен (2014). Освоение показателей: путь от причины к следствию . Издательство Принстонского университета. п. 31.

[10] Чарльз Сандерс Пирс и Джозеф Джастроу (1885). «О малых различиях в ощущениях» . Воспоминания Национальной академии наук . 3 : 73–83. http://psychclassics.yorku.ca/Peirce/small-diffs.htm

[11] Перейти ↑ Hacking, Ian (сентябрь 1988 г.). «Телепатия: истоки рандомизации в экспериментальном дизайне». Исида . 79 (3): 427–451. DOI : 10.1086 / 354775 . JSTOR 234674 . Руководство по ремонту 1013489 .

[12] Стивен М. Стиглер (ноябрь 1992 г.). «Исторический взгляд на статистические концепции в психологии и образовательных исследованиях». Американский журнал образования . 101 (1): 60–70. DOI : 10.1086 / 444032 .

[13] Труды Dehue (декабрь 1997). «Обман, эффективность и случайные группы: психология и постепенное возникновение дизайна случайных групп» (PDF) . Исида . 88 (4): 653–673. DOI : 10.1086 / 383850 . PMID 9519574 .

[14] Anglemyer A, Хорват HT, Беро L (апрель 2014). «Результаты здравоохранения, оцененные с помощью обсервационных исследований, по сравнению с результатами, оцененными в рандомизированных исследованиях». Cochrane Database Syst Rev . 4 (4): MR000034. DOI : 10.1002 / 14651858.MR000034.pub2 . PMID 24782322 .

[15] Odgaard-Jensen J, Vist G и др. (Апрель 2011 г.). «Рандомизация для защиты от систематической ошибки отбора в медицинских исследованиях» . Кокрановская база данных Syst Rev (4): MR000012. DOI : 10.1002 / 14651858.MR000012.pub3 . PMC 7150228 . PMID 21491415 .

[16] Ховик Дж, Мебиус А (2014). «В поисках оправдания парадоксу непредсказуемости» . Испытания . 15 : 480. DOI : 10,1186 / 1745-6215-15-480 . PMC 4295227 . PMID 25490908 .

[1]

vтеДизайн экспериментов
Научный метод	Научный эксперимент Статистический дизайн Контроль Внутренняя и внешняя действительность Экспериментальная установка Ослепление Оптимальный дизайн : байесовский Случайное назначение Рандомизация Ограниченная рандомизация Репликация против субдискретизации Размер образца
Лечение и блокировка	Уход Размер эффекта Контраст Взаимодействие Сбивает с толку Ортогональность Блокировка Ковариантный Мешающая переменная
Модели и выводы	Линейная регрессия Обычный метод наименьших квадратов Байесовский Случайный эффект Смешанная модель Иерархическая модель: байесовская Дисперсионный анализ (Anova) Теорема Кохрана Манова ( многомерный ) Анкова ( ковариация ) Сравнить средства Множественное сравнение
Дизайн полностью рандомизирован	Факториал Дробный факториал Плакетт-Берман Тагучи Методология поверхности отклика Полиномиальное и рациональное моделирование Бокс-Бенкен Центральный композит Блокировать Обобщенный рандомизированный блочный дизайн (GRBD) Латинский квадрат Греко-латинский квадрат Ортогональный массив Латинский гиперкуб Дизайн повторяющихся мер Кроссовер исследование Рандомизированное контролируемое исследование Последовательный анализ Тест последовательного отношения вероятностей
Глоссарий Категория Математический портал Статистический обзор Статистические темы