Псевдорепликация

Эта статья может быть слишком технической для понимания большинством читателей . Пожалуйста, помогите улучшить его, чтобы он был понятен неспециалистам , не удаляя технические детали. ( Март 2016 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения )

Псевдорепликация - это процесс искусственного увеличения количества образцов или повторов. ^[1] В результате статистические тесты, выполненные с данными, становятся недействительными.

Псевдорепликация была первоначально определена в 1984 году Стюартом Х. Херлбертом ^[2] как частный случай неадекватной спецификации случайных факторов, когда присутствуют как случайные, так и фиксированные факторы. ^[3] Проблема неадекватной спецификации возникает, когда обработки назначаются единицам, которые включены в подвыборку, а F-отношение обработки в таблице дисперсионного анализа ( ANOVA ) формируется относительно среднего квадрата остатка, а не относительно единиц измерения. средний квадрат. Отношение F по отношению к среднему квадрату в пределах единицы уязвимо для искажающих факторов.эффектов обработки и единиц, особенно когда количество экспериментальных единиц невелико (например, четыре единицы резервуара, два резервуара обрабатываются, два не обрабатываются, несколько подвыборок на резервуар). Проблема устраняется путем формирования отношения F относительно правильного среднего квадрата в таблице ANOVA (резервуар по обработке MS в приведенном выше примере), где это возможно. Проблема решается за счет использования смешанных моделей. ^[3]

Херлберт сообщил о «псевдорепликации» в 48% исследованных им исследований, в которых использовалась логическая статистика. ^[2] Несколько исследований, посвященных изучению научных статей, опубликованных до 2016 года, также обнаружили, что около половины статей подозреваются в псевдорепликации. ^[1] Когда время и ресурсы ограничивают количество экспериментальных единиц , а эффекты единиц не могут быть устранены статистически путем тестирования дисперсии единиц, важно использовать другие источники информации для оценки степени, в которой F-отношение искажается единичные эффекты.

Репликация [ править ]

Репликация увеличивает точность оценки, в то время как рандомизация обращается к более широкой применимости выборки к генеральной совокупности. Репликация должна быть подходящей: необходимо учитывать репликацию на уровне экспериментальной единицы в дополнение к репликации внутри единиц.

Проверка гипотез [ править ]

Статистические тесты (например, t-критерий и родственное семейство тестов ANOVA) полагаются на соответствующую репликацию для оценки статистической значимости . Тесты, основанные на распределениях t и F, предполагают однородные, нормальные и независимые ошибки. Коррелированные ошибки могут привести к ложной точности и слишком маленьким p-значениям. ^[4]

Типы [ править ]

Hurlbert (1984) определил четыре типа псевдорепликации.

Простая псевдорепликация (рис. 5a в Hurlbert 1984) возникает, когда на лечение приходится одна экспериментальная единица. Статистические данные не могут отделить изменчивость из-за обработки от изменчивости из-за экспериментальных единиц, когда есть только одно измерение на единицу.
Временная псевдорепликация (рис. 5c в Hurlbert 1984) возникает, когда экспериментальные единицы достаточно различаются во времени, так что временные эффекты среди единиц вероятны, а эффекты лечения коррелируют с временными эффектами. Статистические данные не могут отделить изменчивость из-за обработки от изменчивости из-за экспериментальных единиц, когда есть только одно измерение на единицу.
Жертвенная псевдорепликация (рис. 5b в Hurlbert 1984) происходит, когда в анализе используются средние значения в рамках лечения, и эти средства проверяются на дисперсии в пределах единицы. На рисунке 5b ошибочное отношение F будет иметь 1 df в числителе (обработка) среднего квадрата и 4 df в среднем квадрате знаменателя (2-1 = 1 df для каждой экспериментальной единицы). Правильное F-соотношение будет иметь 1 df в числителе (обработка) и 2 df в знаменателе (2-1 = 1 df для каждой обработки). Правильный F-коэффициент контролирует эффекты экспериментальных единиц, но с 2 df в знаменателе у него будет мало возможностей для обнаружения различий в лечении.
Неявная псевдорепликация возникает, когда стандартные ошибки (или доверительные границы) оцениваются в экспериментальных единицах. Как и в случае с другими источниками псевдорепликации, эффекты лечения нельзя статистически отделить от эффектов из-за различий между экспериментальными единицами.

Ссылки [ править ]

^ ^a ^b Голипур, Бахар (2018-03-15). «Статистические ошибки могут испортить до половины исследований на мышах» . Спектр | Новости исследования аутизма . Проверено 24 марта 2018 .
^ ^a ^b Hurlbert, Стюарт Х. (1984). «Псевдорепликация и дизайн экологических полевых экспериментов» (PDF) . Экологические монографии . Экологическое общество Америки. 54 (2): 187–211. DOI : 10.2307 / 1942661 . JSTOR 1942661 .
^ ^a ^b Миллар, РБ; Андерсон, MR (2004). «Средства от псевдорепликации». Рыболовные исследования . 70 (2–3): 397–407. DOI : 10.1016 / j.fishres.2004.08.016 .
^ Лазич, SE (2010). «Проблема псевдорепликации в нейробиологических исследованиях: влияет ли это на ваш анализ?» . BMC Neuroscience . 11: 5 : 5. DOI : 10,1186 / 1471-2202-11-5 . PMC 2817684 . PMID 20074371 .

[:0-1] Голипур, Бахар (2018-03-15). «Статистические ошибки могут испортить до половины исследований на мышах» . Спектр | Новости исследования аутизма . Проверено 24 марта 2018 .

[Hurlbert-2] Hurlbert, Стюарт Х. (1984). «Псевдорепликация и дизайн экологических полевых экспериментов» (PDF) . Экологические монографии . Экологическое общество Америки. 54 (2): 187–211. DOI : 10.2307 / 1942661 . JSTOR 1942661 .

[MillarAnderson-3] Миллар, РБ; Андерсон, MR (2004). «Средства от псевдорепликации». Рыболовные исследования . 70 (2–3): 397–407. DOI : 10.1016 / j.fishres.2004.08.016 .

[Lazic-4] Лазич, SE (2010). «Проблема псевдорепликации в нейробиологических исследованиях: влияет ли это на ваш анализ?» . BMC Neuroscience . 11: 5 : 5. DOI : 10,1186 / 1471-2202-11-5 . PMC 2817684 . PMID 20074371 .

[1]