Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В статистике , ограничено рандомизации происходит в проектировании экспериментов и , в частности , в контексте рандомизированных экспериментов и рандомизированных контролируемых испытаний . Ограниченная рандомизация позволяет избежать интуитивно плохого распределения лечения по экспериментальным единицам, сохраняя при этом теоретические преимущества рандомизации. [1] [2] Например, в клиническом испытании нового предлагаемого лечения ожирения по сравнению с контролем экспериментатор хотел бы избежать результатов рандомизации, в которой новое лечение назначалось только самым тяжелым пациентам.

Эта концепция была введена Фрэнком Йейтсом (1948) [ требуется полная ссылка ] и Уильямом Дж. Юденом (1972) [ требуется полная ссылка ] «как способ избежать неправильных пространственных схем лечения в запланированных экспериментах». [3]

Пример вложенных данных [ править ]

Рассмотрим пакетный процесс, при каждом запуске которого используются 7 пластин монитора. План также предусматривает измерение переменной отклика на каждой пластине на каждом из 9 участков. Организация плана выборки имеет иерархическую или вложенную структуру: запуск партии - это самый верхний уровень, второй уровень - это отдельная пластина, а третий уровень - это место на пластине.

Общий объем данных, сгенерированных за один запуск пакета, составит 7 · 9 = 63 наблюдения. Один из подходов к анализу этих данных - вычислить среднее значение всех этих точек, а также их стандартное отклонение и использовать эти результаты в качестве ответов для каждого прогона.

Предлагаемый выше анализ данных не является абсолютно неправильным, но при этом теряется информация, которую можно было бы получить в противном случае. Например, сайт 1 на пластине 1 физически отличается от сайта 1 на пластине 2 или на любой другой пластине. То же верно и для любого из сайтов на любой из вафель. Точно так же пластина 1 в прогоне 1 физически отличается от пластины 1 в прогоне 2 и так далее. Чтобы описать эту ситуацию, говорят, что сайты вложены в пластины, а пластины вложены в прогоны.

Вследствие такой вложенности существуют ограничения на рандомизацию, которая может иметь место в эксперименте. Такая ограниченная рандомизация всегда приводит к вложенным источникам вариации. Примерами вложенных вариаций или ограниченной рандомизации, обсуждаемых на этой странице, являются схемы с разделенными и полосовыми диаграммами .

Целью эксперимента с этим типом плана отбора проб обычно является уменьшение вариабельности из-за участков на пластинах и пластинах в циклах (или партиях) в процессе. Участки на пластинах и пластины в партии становятся источниками нежелательных отклонений, и исследователь стремится сделать систему устойчивой к этим источникам - другими словами, в таком эксперименте можно рассматривать пластины и площадки как факторы шума.

Поскольку пластины и площадки представляют собой нежелательные источники вариаций, и поскольку одна из целей состоит в том, чтобы снизить чувствительность процесса к этим источникам вариаций, рассмотрение пластин и площадок как случайных эффектов при анализе данных является разумным подходом. Другими словами, вложенная вариация часто является другим способом обозначить вложенные случайные эффекты или вложенные источники шума. Если факторы «пластины» и «узлы» рассматриваются как случайные эффекты, то можно оценить компонент дисперсии, обусловленный каждым источником вариации, посредством дисперсионного анализа.техники. После получения оценок компонентов дисперсии исследователь может определить самый большой источник вариации в экспериментальном процессе, а также определить величины других источников вариации по отношению к самому большому источнику.

Вложенные случайные эффекты [ править ]

Если эксперимент или процесс имеют вложенные вариации, эксперимент или процесс имеет несколько источников случайных ошибок, которые влияют на его результат. Наличие вложенных случайных эффектов в модели - это то же самое, что наличие вложенных вариаций в модели.

Раздельные дизайны [ править ]

Планы с разделенным графиком являются результатом, когда в ходе эксперимента произошел определенный тип ограниченной рандомизации. Простой факторный эксперимент может привести к схеме с разделенным графиком из-за того, как эксперимент действительно проводился.

Во многих промышленных экспериментах часто возникают три ситуации:

  1. некоторые из представляющих интерес факторов может быть «трудно изменить», в то время как остальные факторы легко изменить. В результате порядок, в котором запускаются комбинации лечения для эксперимента, определяется порядком этих «трудноизменяемых» факторов.
  2. экспериментальные единицы обрабатываются вместе как партия для одного или нескольких факторов в конкретной комбинации лечения
  3. экспериментальные единицы обрабатываются индивидуально, одна за другой, для одной и той же комбинации лечения без сброса настроек коэффициента для этой комбинации лечения.

Экспериментальные примеры с разделенным сюжетом [ править ]

Эксперимент, проводимый в одной из трех вышеперечисленных ситуаций, обычно приводит к дизайну с разделенным графиком. Рассмотрим эксперимент по изучению гальванического покрытия алюминия (неводного) на медных полосках. Три представляющих интерес фактора: ток (А); температура раствора (Т); и концентрацию раствора гальванического агента (S). Скорость покрытия - это измеренный отклик. Всего для эксперимента доступно 16 медных полосок. Комбинации лечения, которые будут запускаться (ортогонально масштабированные), перечислены ниже в стандартном порядке (т. Е. Они не были рандомизированы):

Пример: некоторые факторы трудно изменить [ править ]

Рассмотрите возможность проведения эксперимента при первом из перечисленных выше условий, при этом факторную концентрацию раствора гальванического агента (S) трудно изменить. Поскольку этот фактор трудно изменить, экспериментатор хотел бы рандомизировать комбинации обработки, чтобы коэффициент концентрации раствора имел минимальное количество изменений. Другими словами, рандомизация циклов обработки до некоторой степени ограничивается уровнем коэффициента концентрации раствора.

В результате комбинации обработки могут быть рандомизированы таким образом, чтобы сначала выполнялись циклы лечения, соответствующие одному уровню концентрации (-1). На каждую медную полоску наносят индивидуальное покрытие, что означает, что только одна полоска за раз помещается в раствор для данной комбинации обработки. После завершения четырех прогонов с низким уровнем концентрации раствора раствор изменяется на высокий уровень концентрации (1), и выполняются оставшиеся четыре цикла эксперимента (где снова каждая полоска наносится на пластинки индивидуально).

После завершения одной полной реплики эксперимента выполняется вторая реплика с набором из четырех медных полосок, обработанных для заданного уровня концентрации раствора перед изменением концентрации и обработкой оставшихся четырех полосок. Обратите внимание, что уровни для оставшихся двух факторов все еще могут быть рандомизированы. Кроме того, может быть рандомизирован уровень концентрации, который запускается первым в циклах репликации.

Проведение эксперимента таким образом приводит к дизайну с разделением на участки . Концентрация раствора известна как фактор всего графика, а факторы подграфика - это текущая температура и температура раствора.

Дизайн с разделенным участком включает более одной экспериментальной единицы размера . В этом эксперименте экспериментальная единица одного размера представляет собой отдельную медную полоску. Обработки или факторы, которые применялись к отдельным полоскам, - это температура раствора и сила тока (эти факторы менялись каждый раз, когда в раствор помещалась новая полоска). Другая экспериментальная установка большего размера представляет собой набор из четырех медных полос. Обработка или фактор, который был применен к набору из четырех полосок, - это концентрация раствора (этот коэффициент был изменен после обработки четырех полосок). Экспериментальная единица меньшего размера упоминается как экспериментальная единица подзаголовка , тогда как экспериментальная единица большего размера упоминается как единица всего участка .

Для этого эксперимента есть 16 экспериментальных единиц подсюжета. Температура раствора и ток являются факторами подзаграждения в этом эксперименте. В этом эксперименте есть четыре экспериментальных единицы для всего участка. Концентрация раствора является фактором всего участка в этом эксперименте. Поскольку существует два размера экспериментальных единиц, в модели есть два члена ошибки, один, который соответствует ошибке всего графика или экспериментальной единице всего графика, а другой соответствует ошибке части графика или экспериментальной единице части графика.

Таблица ANOVA для этого эксперимента отчасти будет выглядеть следующим образом:

Первые три источника относятся к уровню всего участка, а следующие 12 - к частям участка. Для поиска статистически значимых терминов можно использовать нормальный график вероятности оценок 12 частей графика .

Пример: пакетный процесс [ править ]

Рассмотрите возможность проведения эксперимента при втором перечисленном выше условии (т. Е. Периодическом процессе), при котором в раствор одновременно помещаются четыре медные полоски. Определенный уровень тока может быть приложен к отдельной полосе в растворе. Те же 16 лечебных комбинаций (повторение 2 3factorial) запускаются так же, как и в первом сценарии. Однако способ проведения эксперимента будет другим. Существует четыре комбинации обработки температуры раствора и концентрации раствора: (-1, -1), (-1, 1), (1, -1), (1, 1). Экспериментатор случайным образом выбирает одну из этих четырех процедур для настройки первой. В раствор помещают четыре медные полоски. Две из четырех полосок случайным образом назначаются низкому уровню тока. Остальные две полосы назначены на высокий уровень тока. Покрытие выполняется и измеряется отклик. Выбирается вторая комбинация обработки температуры и концентрации, и выполняется та же процедура. Это сделано для всех четырех комбинаций температуры / концентрации.

Проведение эксперимента таким образом также приводит к дизайну с разделенным графиком, в котором факторами всего графика теперь являются концентрация раствора и температура раствора, а фактором подзаголовка является текущий.

В этом эксперименте экспериментальная единица одного размера снова представляет собой отдельную медную полоску. Обработка или фактор, который применялся к отдельным полоскам, является текущим (этот коэффициент менялся каждый раз для другой полоски в растворе). Другой экспериментальный блок большего размера, опять же, представляет собой набор из четырех медных полос. Обработки или факторы, которые были применены к набору из четырех полосок, включают концентрацию раствора и температуру раствора (эти факторы были изменены после обработки четырех полосок).

Экспериментальная единица меньшего размера снова упоминается как экспериментальная единица участка. Для этого эксперимента есть 16 экспериментальных единиц подсюжета. Текущий - фактор подзаговора в этом эксперименте.

Экспериментальная единица большего размера - это экспериментальная единица всего участка. В этом эксперименте есть четыре экспериментальных единицы целого графика, и концентрация раствора и температура раствора являются факторами всего графика в этом эксперименте.

Есть два размера экспериментальных единиц, и в модели есть два члена ошибки: один, который соответствует ошибке всего графика или экспериментальной единице всего графика, и другой, который соответствует ошибке части графика или экспериментальной единице части графика.

ANOVA для этого эксперимента частично выглядит следующим образом:

Первые три источника поступают с уровня всего участка, а следующие 5 - с уровня подзаговора. Поскольку существует 8 степеней свободы для члена ошибки подзаголовка, эту MSE можно использовать для проверки каждого эффекта, который включает ток.

Пример: экспериментальные единицы обрабатываются индивидуально [ править ]

Рассмотрите возможность проведения эксперимента по третьему сценарию, указанному выше. В растворе одновременно находится только одна медная полоска. Однако две полоски, одна при низком токе и одна при высоком токе, обрабатываются одна за другой при одинаковых настройках температуры и концентрации. После обработки двух полосок концентрация изменяется, а температура сбрасывается на другую комбинацию. Две полоски снова обрабатываются одна за другой при заданной температуре и концентрации. Этот процесс продолжается до тех пор, пока не будут обработаны все 16 медных полос.

Проведение эксперимента таким образом также приводит к дизайну с разделенным графиком, в котором факторами целого участка снова являются концентрация раствора и температура раствора, а фактор подграфика является текущим. В этом эксперименте экспериментальная единица одного размера представляет собой отдельную медную полоску. Обработка или фактор, который применялся к отдельным полоскам, является текущим (этот коэффициент менялся каждый раз для другой полоски в растворе). Другая или более крупная экспериментальная установка представляет собой набор из двух медных полос. Обработки или факторы, которые были применены к паре из двух полосок, - это концентрация раствора и температура раствора (эти факторы были изменены после обработки двух полосок). Экспериментальная единица меньшего размера называется экспериментальной единицей подзаговора.

Для этого эксперимента есть 16 экспериментальных единиц подсюжета. Текущий - это фактор подзаговора в эксперименте. В этом эксперименте восемь экспериментальных единиц с целым участком. Концентрация раствора и температура раствора являются факторами всего графика. В модели есть два члена ошибки: один соответствует ошибке всего графика или экспериментальной единице всего графика, а второй соответствует ошибке подзаголовка или экспериментальной единице подзаголовка.

ANOVA для этого (третьего) подхода частично выглядит следующим образом:

Первые четыре члена берутся из анализа всего участка, а следующие 5 членов берутся из анализа подзаговора. Обратите внимание, что у нас есть отдельные условия ошибок как для всего графика, так и для эффектов подзаголовка, каждый из которых основан на 4 степенях свободы.

Как видно из этих трех сценариев, одно из основных различий между планами с разделенным графиком и простыми факторными планами - это количество экспериментальных единиц разного размера в эксперименте. Планы с разделенным графиком имеют более одной экспериментальной единицы размера, т. Е. Более одного члена ошибки. Поскольку эти планы включают разные размеры экспериментальных единиц и разные дисперсии, стандартные ошибки различных сравнений средних включают одну или несколько дисперсий. Определение подходящей модели для плана с разделенным участком включает возможность идентифицировать каждый размер экспериментальной единицы. Способ определения экспериментальной единицы относительно структуры дизайна (например, полностью рандомизированный план по сравнению с рандомизированным полным планом блока) и структуру лечения (например, полный факторный анализ 2 3 , половинную фракцию разрешения V, двустороннюю структуру лечения с контрольной группой и т. д.). В результате наличия более чем одной экспериментальной единицы размера подходящей моделью, используемой для анализа планов с разделенными участками, является смешанная модель .

Если данные эксперимента анализируются с использованием только одного члена ошибки в модели, из результатов можно сделать вводящие в заблуждение и неверные выводы.

Полосовые рисунки [ править ]

Подобно дизайну с разделенным участком, дизайн с полосойможет возникнуть, когда во время эксперимента произошла некоторая ограниченная рандомизация. Простой факторный план может привести к плану полосовой в зависимости от того, как проводился эксперимент. Планы ленточных диаграмм часто являются результатом экспериментов, которые проводятся на двух или более этапах процесса, в которых каждый этап процесса является периодическим, т. Е. Завершение каждой комбинации обработки в эксперименте требует более одного этапа обработки, при этом экспериментальные единицы обрабатываются вместе в каждом процессе шаг. Как и в случае с разделенным графиком, планы с ленточным графиком возникают, когда рандомизация в эксперименте каким-либо образом ограничена. В результате ограниченной рандомизации, которая имеет место в планах с ленточным графиком, существует несколько размеров экспериментальных единиц. Следовательно,Существуют разные термины ошибок или разные дисперсии ошибок, которые используются для проверки факторов, представляющих интерес в проекте. В традиционном дизайне полосового участка используются экспериментальные единицы трех размеров.

Пример ленточного графика: два шага и три факторных переменных [ править ]

Рассмотрим следующий пример из полупроводниковой промышленности. Для эксперимента требуется этап имплантации и этап отжига. Как на этапе отжига, так и на этапе имплантации необходимо проверить три фактора. Процесс имплантации включает 12 пластин в партии, и имплантация одной пластины при заданном наборе условий нецелесообразна и не представляет собой экономичное использование имплантера. В печи отжига можно обрабатывать до 100 пластин.

Настройки двухуровневого факторного плана для трех факторов на этапе имплантации обозначены (A, B, C), а двухуровневый факторный план для трех факторов на этапе отжига обозначены (D, E, F ). Также присутствуют эффекты взаимодействия между факторами имплантата и факторами отжига. Таким образом, этот эксперимент содержит три размера экспериментальных единиц, каждая из которых имеет уникальный член ошибки для оценки значимости эффектов.

Чтобы придать реальный физический смысл каждой из экспериментальных единиц в приведенном выше примере, рассмотрите каждую комбинацию этапов имплантации и отжига как отдельную пластину. Партия из восьми пластин сначала проходит этап имплантации. Комбинация лечения 3 в факторах A, B и C является первым запуском лечения имплантатом. Эта обработка имплантата применяется ко всем восьми пластинам одновременно. После завершения первого имплантационного лечения другой набор из восьми пластин имплантируется с лечебной комбинацией 5 факторов A, B и C. Это продолжается до тех пор, пока последняя партия из восьми пластин не имплантируется с лечебной комбинацией 6 факторов A, B и C. После того, как все восемь комбинаций лечения факторов имплантата были выполнены, начинается этап отжига. Первая комбинация лечения отжига, которую нужно запустить, - это комбинация 5 обработки факторов D, E и F.Эта комбинация обработки отжигом применяется к набору из восьми пластин, каждая из этих восьми пластин получается из одной из восьми комбинаций обработки имплантата. После того, как эта первая партия пластин была отожжена, вторая обработка отжигом применяется ко второй партии из восьми пластин, причем эти восемь пластин поступают из каждой из восьми комбинаций имплантационной обработки. Это продолжается до тех пор, пока последней партии из восьми пластин не будет имплантирована определенная комбинация факторов D, E и F.с этими восемью пластинами из каждой из восьми комбинаций имплантации. Это продолжается до тех пор, пока последней партии из восьми пластин не будет имплантирована определенная комбинация факторов D, E и F.с этими восемью пластинами из каждой из восьми комбинаций имплантации. Это продолжается до тех пор, пока последней партии из восьми пластин не будет имплантирована определенная комбинация факторов D, E и F.

Проведение эксперимента таким образом приводит к дизайну полосового участка с тремя размерами экспериментальных единиц. Набор из восьми пластин, которые имплантируются вместе, является экспериментальной единицей для факторов имплантации A, B и C и для всех их взаимодействий. Есть восемь экспериментальных единиц для факторов имплантата. Другой набор из восьми пластин отжигается вместе. Этот другой набор из восьми пластин является экспериментальной единицей второго размера и экспериментальной единицей для факторов отжига D, E и F и для всех их взаимодействий. Экспериментальная установка третьего размера представляет собой отдельную пластину. Это экспериментальная единица для всех эффектов взаимодействия между факторами имплантата и факторами отжига.

Фактически, приведенное выше описание схемы ленточной диаграммы представляет один блок или одну копию этого эксперимента. Если эксперимент не содержит репликации, а модель имплантата содержит только основные эффекты и двухфакторные взаимодействия, член трехфакторного взаимодействия A * B * C (1 степень свободы) обеспечивает член ошибки для оценки эффектов в пределах экспериментальная установка имплантата. Использование аналогичной модели для экспериментальной установки отжига дает член трехфакторного взаимодействия D * E * F для члена ошибки (1 степень свободы) для эффектов в экспериментальной установке отжига.

См. Также [ править ]

  • Иерархическое линейное моделирование
  • Смешанный дизайн дисперсионного анализа
  • Многоуровневая модель
  • Вложенное исследование случай-контроль

Ссылки [ править ]

  1. Перейти ↑ Dodge, Y. (2006). Оксфордский словарь статистических терминов . ОУП. ISBN 978-0-19-920613-1.
  2. ^ Гранди, PM; Хили, MJR «Ограниченная рандомизация и квазилатинские квадраты». Журнал Королевского статистического общества, Series B . 12 : 286–291.
  3. Перейти ↑ Bailey, RA (1987). «Ограниченная рандомизация: практический пример». Журнал Американской статистической ассоциации . 82 (399): 712–719. DOI : 10.1080 / 01621459.1987.10478487 . JSTOR 2288775 . 
  • «Как я могу учесть вложенные вариации (ограниченная рандомизация)?» . (США) Национальный институт стандартов и технологий: лаборатория информационных технологий . Проверено 26 марта 2012 года .

Дальнейшее чтение [ править ]

Для более подробного обсуждения этих конструкций и соответствующих процедур анализа см .:

  • Милликен, Джорджия; Джонсон, DE (1984). Анализ беспорядочных данных . 1 . Нью-Йорк: Ван Ностранд Рейнхольд.
  • Миллер, А. (1997). «Конфигурация полосового графика дробных факториалов». Технометрика . 39 (2): 153–161. DOI : 10.2307 / 1270903 . JSTOR  1270903 .

Внешние ссылки [ править ]

  • Примеры всех моделей ANOVA и ANCOVA с тремя факторами обработки, включая рандомизированный блок, разделенный график, повторные измерения и латинские квадраты, а также их анализ в R

 Эта статья включает материалы, являющиеся  общественным достоянием, с веб-сайта Национального института стандартов и технологий https://www.nist.gov .