Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В статистической проверке гипотез , р-рем или р респ была предложена в качестве статистической альтернативы для классического значения р . [1] В то время как p-значение - это вероятность получения результата при нулевой гипотезе, p-rep предназначен для вычисления вероятности воспроизведения эффекта. Вывод p-rep содержал значительные математические ошибки.

Некоторое время Ассоциация психологической науки рекомендовала, чтобы статьи, представленные в Psychological Science и другие их журналы, сообщали о p-rep, а не о классическом p-значении [2], но это уже не так. [3]

Расчет [ править ]

Функция P-rep (в логарифмическом масштабе)

Значение p-rep ( p rep ) может быть приблизительно определено на основе p-value ( p ) следующим образом:

Критика [ править ]

Тот факт, что p-rep имеет однозначное соответствие с p-значением, ясно дает понять, что эта новая мера не приносит никакой дополнительной информации, кроме той, которая передается значимостью результата. Киллин признает этот недостаток информации, но предполагает, что p-rep лучше отражает то, как наивные экспериментаторы концептуализируют p-значения и статистическую проверку гипотез .

Среди критических замечаний в отношении p-rep является тот факт, что, хотя он пытается оценить воспроизводимость, он игнорирует результаты других исследований, которые могут точно определить эту оценку. [4]Например, эксперимент с каким-то маловероятным паранормальным явлением может дать p-rep 0,75. Большинство людей все еще не пришли к выводу, что вероятность репликации составляет 75%. Скорее, они пришли бы к выводу, что это намного ближе к 0: экстраординарные утверждения требуют экстраординарных доказательств, а p-rep игнорирует это. Из-за этого p-rep может быть труднее интерпретировать, чем классическое p-значение. Тот факт, что p-rep требует допущений об априорных вероятностях, чтобы быть действительным, усложняет его интерпретацию. Киллин утверждает, что новые результаты должны оцениваться сами по себе, без «бремени истории», с плоскими априорными значениями: это то, что дает p-rep. Более прагматическая оценка воспроизводимости будет включать предварительные знания, например, посредством метаанализа .

Критики также подчеркнули математические ошибки в оригинальной статье Киллина. Так , например, формула , связывающая величины эффектов от двух повторностей данного эксперимента ошибочно использует один из этих случайных величин в качестве параметра из распределения вероятностей других , пока он ранее предположил , эти две переменных , чтобы быть независимыми , [5] критика рассматривается в Ответ Киллина. [6]

Дальнейшая критика статистики p-rep связана с логикой экспериментирования. Научная ценность воспроизводимых данных заключается в адекватном учете ранее неизмеряемых факторов (например, неизмеряемых переменных участников, предвзятости экспериментатора и т. Д.). Идея о том, что одно исследование может зафиксировать логическую вероятность таких неизмеряемых факторов, влияющих на результат, и, таким образом, вероятность воспроизводимости является логической ошибкой. [ необходима цитата ]

Ссылки [ править ]

  1. Перейти ↑ Killeen PR (2005). «Альтернатива тестам значимости нулевой гипотезы» . Психологическая наука . 16 (5): 345–53. DOI : 10.1111 / j.0956-7976.2005.01538.x . PMC  1473027 . PMID  15869691 .
  2. ^ Архивная версия "Psychological Science Journal, Author Guidelines"
  3. ^ Психологический научный журнал, Руководство для авторов.
  4. ^ Макдональд, Р.Р. (2005) «Почему вероятности репликации зависят от априорных распределений вероятностей» Психологическая наука , 2005, 16, 1006–1008 [1] [ мертвая ссылка ]
  5. ^ "p-rep" в Pro Bono Statistics
  6. ^ Килин, PR (2005) "воспроизводимость, уверенность и Приоры", Психологическая наука , 2005, 16, 1009-1012 [2]

Внешние ссылки [ править ]