Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Псевдорепликация - это процесс искусственного увеличения количества образцов или повторов. [1] В результате статистические тесты, выполненные с данными, становятся недействительными.

Псевдорепликация была первоначально определена в 1984 году Стюартом Х. Херлбертом [2] как частный случай неадекватной спецификации случайных факторов, когда присутствуют как случайные, так и фиксированные факторы. [3] Проблема неадекватной спецификации возникает, когда обработки назначаются единицам, которые включены в подвыборку, а F-отношение обработки в таблице дисперсионного анализа ( ANOVA ) формируется относительно среднего квадрата остатка, а не относительно единиц измерения. средний квадрат. Отношение F по отношению к среднему квадрату в пределах единицы уязвимо для искажающих факторов.эффектов обработки и единиц, особенно когда количество экспериментальных единиц невелико (например, четыре единицы резервуара, два резервуара обрабатываются, два не обрабатываются, несколько подвыборок на резервуар). Проблема устраняется путем формирования отношения F относительно правильного среднего квадрата в таблице ANOVA (резервуар по обработке MS в приведенном выше примере), где это возможно. Проблема решается за счет использования смешанных моделей. [3]

Херлберт сообщил о «псевдорепликации» в 48% исследованных им исследований, в которых использовалась логическая статистика. [2] Несколько исследований, посвященных изучению научных статей, опубликованных до 2016 года, также обнаружили, что около половины статей подозреваются в псевдорепликации. [1] Когда время и ресурсы ограничивают количество экспериментальных единиц , а эффекты единиц не могут быть устранены статистически путем тестирования дисперсии единиц, важно использовать другие источники информации для оценки степени, в которой F-отношение искажается единичные эффекты.

Репликация [ править ]

Репликация увеличивает точность оценки, в то время как рандомизация обращается к более широкой применимости выборки к генеральной совокупности. Репликация должна быть подходящей: необходимо учитывать репликацию на уровне экспериментальной единицы в дополнение к репликации внутри единиц.

Проверка гипотез [ править ]

Статистические тесты (например, t-критерий и родственное семейство тестов ANOVA) полагаются на соответствующую репликацию для оценки статистической значимости . Тесты, основанные на распределениях t и F, предполагают однородные, нормальные и независимые ошибки. Коррелированные ошибки могут привести к ложной точности и слишком маленьким p-значениям. [4]

Типы [ править ]

Hurlbert (1984) определил четыре типа псевдорепликации.

  • Простая псевдорепликация (рис. 5a в Hurlbert 1984) возникает, когда на лечение приходится одна экспериментальная единица. Статистические данные не могут отделить изменчивость из-за обработки от изменчивости из-за экспериментальных единиц, когда есть только одно измерение на единицу.
  • Временная псевдорепликация (рис. 5c в Hurlbert 1984) возникает, когда экспериментальные единицы достаточно различаются во времени, так что временные эффекты среди единиц вероятны, а эффекты лечения коррелируют с временными эффектами. Статистические данные не могут отделить изменчивость из-за обработки от изменчивости из-за экспериментальных единиц, когда есть только одно измерение на единицу.
  • Жертвенная псевдорепликация (рис. 5b в Hurlbert 1984) происходит, когда в анализе используются средние значения в рамках лечения, и эти средства проверяются на дисперсии в пределах единицы. На рисунке 5b ошибочное отношение F будет иметь 1 df в числителе (обработка) среднего квадрата и 4 df в среднем квадрате знаменателя (2-1 = 1 df для каждой экспериментальной единицы). Правильное F-соотношение будет иметь 1 df в числителе (обработка) и 2 df в знаменателе (2-1 = 1 df для каждой обработки). Правильный F-коэффициент контролирует эффекты экспериментальных единиц, но с 2 df в знаменателе у него будет мало возможностей для обнаружения различий в лечении.
  • Неявная псевдорепликация возникает, когда стандартные ошибки (или доверительные границы) оцениваются в экспериментальных единицах. Как и в случае с другими источниками псевдорепликации, эффекты лечения нельзя статистически отделить от эффектов из-за различий между экспериментальными единицами.

Ссылки [ править ]

  1. ^ a b Голипур, Бахар (2018-03-15). «Статистические ошибки могут испортить до половины исследований на мышах» . Спектр | Новости исследования аутизма . Проверено 24 марта 2018 .
  2. ^ a b Hurlbert, Стюарт Х. (1984). «Псевдорепликация и дизайн экологических полевых экспериментов» (PDF) . Экологические монографии . Экологическое общество Америки. 54 (2): 187–211. DOI : 10.2307 / 1942661 . JSTOR 1942661 .  
  3. ^ a b Миллар, РБ; Андерсон, MR (2004). «Средства от псевдорепликации». Рыболовные исследования . 70 (2–3): 397–407. DOI : 10.1016 / j.fishres.2004.08.016 .
  4. ^ Лазич, SE (2010). «Проблема псевдорепликации в нейробиологических исследованиях: влияет ли это на ваш анализ?» . BMC Neuroscience . 11: 5 : 5. DOI : 10,1186 / 1471-2202-11-5 . PMC 2817684 . PMID 20074371 .