Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В основах статистиков касаются гносеологических дебатов в статистике над тем, как следует проводить индуктивный вывод из данных. Среди вопросов , рассматриваемых в статистических выводах являются вопрос о байесовском выводе по сравнению частотный выводе , различие между Фишером «s„значением тестирования“и Нейманом - Пирсон „проверкой гипотез“, и является ли принцип правдоподобия следует придерживаться. Некоторые из этих вопросов безрезультатно обсуждались на протяжении 200 лет. [1]

Bandyopadhyay и Forster [2] описывают четыре статистические парадигмы: «(i) классическая статистика или статистика ошибок, (ii) байесовская статистика, (iii) статистика, основанная на правдоподобии, и (iv) статистика на основе информационных критериев Акаике ».

Текст Сэвиджа « Основы статистики » был процитирован в Google Scholar более 15000 раз . [3] В нем говорится следующее.

Все согласны с тем, что статистика так или иначе зависит от вероятности. Но что касается того, что такое вероятность и как она связана со статистикой, то со времен Вавилонской башни редко было такое полное разногласие и нарушение связи. Несомненно, большая часть разногласий носит чисто терминологический характер и исчезнет при достаточно тщательном анализе. [4]

«Проверка значимости» Фишера против «проверки гипотезы» Неймана – Пирсона [ править ]

В процессе развития классической статистики во второй четверти 20 века были разработаны две конкурирующие модели индуктивного статистического тестирования. [5] [6] Их относительные достоинства горячо обсуждались [7] (более 25 лет) до самой смерти Фишера. В то время как гибрид этих двух методов широко преподается и используется, философские вопросы, поднятые в ходе дебатов, так и не решены.

Проверка значимости [ править ]

Фишер популяризировал тестирование значимости, прежде всего в двух популярных и очень влиятельных книгах. [8] [9] Стиль письма Фишера в этих книгах был основан на примерах и относительно слаб на объяснениях. В книгах не хватало доказательств или выводов статистических критериев значимости (которые ставили статистическую практику выше статистической теории). Более пояснительные и философские работы Фишера были написаны намного позже. [10] Кажется, есть некоторые различия между его более ранними практиками и его более поздними взглядами.

Фишер был мотивирован на получение научных экспериментальных результатов без явного влияния предшествующего мнения. Тест значимости представляет собой вероятностную версию Modus tollens., классическая форма дедуктивного вывода. Тест значимости можно было бы упрощенно сформулировать: «Если свидетельство в достаточной степени расходится с гипотезой, отвергните гипотезу». В приложении статистика рассчитывается на основе экспериментальных данных, определяется вероятность превышения этой статистики, и вероятность сравнивается с пороговым значением. Порог (числовая версия слова «достаточно несогласованный») является произвольным (обычно определяется по соглашению). Обычное применение метода - решение о том, имеет ли лечение отчетный эффект, на основе сравнительного эксперимента. Статистическая значимость - это мера вероятности, а не практического значения. Это можно рассматривать как требование к статистическому сигналу / шуму.Метод основан на предположении о существовании воображаемой бесконечной популяции, соответствующей нулевой гипотезе.

Для проверки значимости требуется только одна гипотеза. Результат проверки - отклонить гипотезу (или нет), простая дихотомия. Тест различает истинность гипотезы и недостаточность доказательств для опровержения гипотезы; так что это похоже на уголовный процесс, в котором вина подсудимого оценивается по нулевой гипотезе, где обвиняемый считается невиновным до тех пор, пока его вина не будет доказана.

Проверка гипотез [ править ]

Нейман и Пирсон совместно работали над другой, но связанной проблемой - выбором среди конкурирующих гипотез, основываясь только на экспериментальных данных. Из их совместных работ наиболее цитируемой была работа 1933 года. [11] Знаменитым результатом этой статьи является лемма Неймана – Пирсона . В лемме говорится, что отношение вероятностей - отличный критерий для выбора гипотезы (при произвольном пороге сравнения). В статье доказана оптимальность t-критерия Стьюдента (одного из критериев значимости). Нейман выразил мнение, что проверка гипотез является обобщением и улучшением проверки значимости. Обоснование их методов можно найти в их совместных статьях. [12]

Проверка гипотез требует нескольких гипотез. Всегда выбирается гипотеза, множественный выбор. Недостаток доказательств - это не вопрос немедленного рассмотрения. Метод основан на предположении о повторной выборке одной и той же совокупности (классическое частотное допущение), хотя это предположение подверглось критике со стороны Фишера (Рубин, 2020). [13]

Основания для несогласия [ править ]

Продолжительность спора позволила обсудить широкий круг вопросов, которые считаются основополагающими для статистики.

В ходе этого обмена мнениями Фишер также обсудил требования к индуктивному выводу с конкретной критикой функций затрат, наказывающих за ошибочные суждения. Нейман возразил, что их использовали Гаусс и Лаплас. Этот обмен аргументами произошел через 15 лет после того, как в учебниках начали преподавать гибридную теорию статистического тестирования.

Фишер и Нейман разошлись во мнениях относительно основ статистики (хотя и были едины в яростном противодействии байесовской точке зрения [16] ):

  • Интерпретация вероятности
    • Разногласия по поводу индуктивных рассуждений Фишера и индуктивного поведения Неймана содержали элементы разделения байесовского / частотного. Фишер был готов изменить свое мнение (придя к предварительному заключению) на основе вычисленной вероятности, в то время как Нейман был более склонен изменить свое наблюдаемое поведение (принятие решения) на основе вычисленных затрат.
  • Правильная постановка научных вопросов с особым вниманием к моделированию [7] [17]
  • Разумно ли отвергать гипотезу, основанную на низкой вероятности, не зная вероятности альтернативы
  • Можно ли когда-нибудь принять гипотезу на основе данных
    • В математике дедукция доказывает, контрпримеры опровергают
    • В попперовской философии науки успехи достигаются, когда теории опровергаются.
  • Субъективность. Хотя Фишер и Нейман пытались свести к минимуму субъективность, оба признали важность «здравого смысла». Каждый обвинял другого в субъективности.
    • Фишер субъективно выбрал нулевую гипотезу.
    • Нейман – Пирсон субъективно выбрала критерий отбора (который не ограничивался вероятностью).
    • Оба субъективно определяли числовые пороги.

Фишера и Неймана разделяли взгляды и, возможно, язык. Фишер был ученым и интуитивным математиком. Индуктивное рассуждение было естественным. Нейман был строгим математиком. Его убедили дедуктивные рассуждения, а не расчет вероятности, основанный на эксперименте. [5] Таким образом, в основе лежало столкновение между прикладным и теоретическим, между наукой и математикой.

Связанная история [ править ]

Нейман, который занимал то же здание в Англии, что и Фишер, принял должность на западном побережье Соединенных Штатов Америки в 1938 году. Его шаг фактически положил конец его сотрудничеству с Пирсоном и их разработке проверки гипотез. [5] Дальнейшее развитие было продолжено другими.

К 1940 году в учебниках была представлена ​​гибридная версия значимости и проверки гипотез [18]. Ни один из руководителей не принимал личного участия в дальнейшем развитии гибрида, которому сегодня обучают во вводной статистике. [6]

Позже статистика развивалась в различных направлениях, включая теорию принятия решений (и, возможно, теорию игр), байесовскую статистику, исследовательский анализ данных, надежную статистику и непараметрическую статистику. Проверка гипотез Неймана – Пирсона внесла большой вклад в теорию принятия решений, которая очень широко используется (например, в статистическом контроле качества). Проверка гипотез легко обобщается для принятия априорных вероятностей, что придает ей байесовский оттенок. Проверка гипотез Неймана – Пирсона стала абстрактным математическим предметом, изучаемым в статистике аспирантов [19], в то время как большая часть того, что преподается студентам и используется под лозунгом проверки гипотез, принадлежит Фишеру.

Современное мнение [ править ]

Никаких серьезных сражений между двумя классическими школами тестирования не возникало в течение десятилетий, но снайперская стрельба продолжается (возможно, поощряемая сторонниками других противоречий). После поколений споров практически нет шансов, что одна из теорий статистического тестирования заменит другую в обозримом будущем.

Гибрид двух конкурирующих школ тестирования можно рассматривать совершенно по-разному - как несовершенный союз двух математически дополняющих идей [16] или как фундаментально ошибочный союз философски несовместимых идей. [20] Фишер пользовался некоторыми философскими преимуществами, в то время как Нейман и Пирсон использовали более строгую математику. Проверка гипотез вызывает споры среди некоторых пользователей, но самая популярная альтернатива (доверительные интервалы) основана на той же математике.

История развития оставила тестирование без единого цитируемого авторитетного источника гибридной теории, отражающей общепринятую статистическую практику. Объединенная терминология также несколько противоречива. Существуют убедительные эмпирические доказательства того, что выпускники (и преподаватели) вводного курса статистики плохо понимают значение проверки гипотез. [21]

Резюме [ править ]

  • Интерпретация вероятности не решена (но фидуциальная вероятность - сирота).
  • Ни один из методов испытаний не был отклонен. Оба широко используются для разных целей.
  • Тексты объединили два метода тестирования под термином «проверка гипотез».
    • Математики утверждают (за некоторыми исключениями), что проверка значимости - это частный случай проверки гипотез.
    • Другие рассматривают проблемы и методы как отдельные (или несовместимые).
  • Спор отрицательно сказался на статистическом образовании.

Байесовский вывод против частотного вывода [ править ]

Две разные интерпретации вероятности (основанные на объективных свидетельствах и субъективных степенях веры) существуют уже давно. Гаусс и Лаплас могли обсуждать альтернативы более 200 лет назад. В результате возникли две конкурирующие школы статистики. Классическая логическая статистика была в значительной степени разработана во второй четверти 20-го века [6], во многом как реакция на (байесовскую) вероятность того времени, в котором использовался противоречивый принцип безразличия.установить априорные вероятности. Восстановление байесовского вывода было реакцией на ограничения частотной вероятности. Последовали новые реакции. Хотя философские интерпретации устарели, статистическая терминология - нет. Текущие статистические термины «байесовский» и «частотный» стабилизировались во второй половине 20 века. [22] Терминология (философская, математическая, научная, статистическая) сбивает с толку: «классическая» интерпретация вероятности - байесовская, а «классическая» статистика - частотная. «Frequentist» также имеет разные интерпретации - разные в философии, чем в физике.

Нюансы философских интерпретаций вероятностей обсуждаются в другом месте. В статистике альтернативные интерпретации позволяют анализировать разные данные с использованием разных методов, основанных на разных моделях, для достижения немного разных целей. Любое статистическое сравнение конкурирующих школ учитывает прагматические критерии, выходящие за рамки философских.

Основные участники [ править ]

Двумя основными разработчиками частотных (классических) методов были Фишер и Нейман . [5] Интерпретация вероятности Фишером была своеобразной (но сильно небайесовской). Взгляды Неймана были строго частыми. Три главных двадцатого века байесовской статистической философии, математики и методы были Финетти , [23] Джеффрис [24] и Savage . [25]Сэвидж популяризировал идеи де Финетти в англоязычном мире и сделал байесовскую математику строгой. В 1965 году двухтомник Денниса Линдли «Введение в вероятность и статистику с байесовской точки зрения» познакомил широкую аудиторию с байесовскими методами. Статистика улучшилась за последние три поколения; «Авторитетные» взгляды первых участников не совсем актуальны.

Контрастные подходы [ править ]

Заключение Frequentist [ править ]

Вывод частичного и лаконичного характера описан выше в («проверка значимости» Фишера против «проверки гипотезы Неймана-Пирсона»). Заключение Frequentist объединяет несколько различных точек зрения. Результат может подтверждать научные выводы, принимать оперативные решения и оценивать параметры с доверительными интервалами или без них . Вывод частоконвенциала основан исключительно на (одном наборе) свидетельств.

Байесовский вывод [ править ]

Классическое частотное распределение описывает вероятность данных. Использование теоремы Байеса позволяет использовать более абстрактное понятие - вероятность гипотезы (соответствующей теории) с учетом данных. Эта концепция когда-то была известна как «обратная вероятность». Байесовский вывод обновляет оценку вероятности гипотезы по мере получения дополнительных доказательств. Байесовский вывод явно основан на доказательствах и предшествующем мнении, что позволяет ему основываться на множестве наборов доказательств.

Сравнения характеристик [ править ]

Частиквентисты и байесовцы используют разные вероятностные модели. Специалисты по частотности часто считают параметры фиксированными, но неизвестными, в то время как байесовцы назначают распределения вероятностей аналогичным параметрам. Следовательно, байесовцы говорят о вероятностях, которые не существуют для частотников; Байесовец говорит о вероятности теории, в то время как истинный частотник может говорить только о согласованности свидетельств с теорией. Пример: частотный специалист не говорит, что существует 95% -ная вероятность того, что истинное значение параметра находится в пределах доверительного интервала, вместо этого заявляя, что 95% доверительных интервалов содержат истинное значение.

Математические результаты [ править ]

Ни одна из школ не застрахована от математической критики и не принимает ее без борьбы. Парадокс Стейна (например) иллюстрирует, что найти «плоское» или «неинформативное» априорное распределение вероятностей в больших измерениях сложно. [1] Байесовцы считают это второстепенным по отношению к сердцевине своей философии, в то же время находя частотный подход пронизанным несоответствиями, парадоксами и плохим математическим поведением. Фраквенционисты могут объяснить многое. Некоторые из «плохих» примеров - это экстремальные ситуации, такие как оценка веса стада слонов по измерению веса одного («слонов Басу»), что не позволяет статистически оценить изменчивость весов. Принцип вероятности стал полем битвы.

Статистические результаты [ править ]

Обе школы достигли впечатляющих результатов в решении реальных задач. Классическая статистика имеет более длительный рекорд, поскольку многочисленные результаты были получены с помощью механических калькуляторов и распечатанных таблиц специальных статистических функций. Байесовские методы оказались очень успешными при анализе информации, которая естественно последовательно отбирается (радар и гидролокатор). Многие байесовские методы и некоторые недавние частотные методы (такие как бутстрап) требуют вычислительной мощности, широко доступной только в последние несколько десятилетий. Активно обсуждается сочетание байесовских и частотных методов [29] [27], но высказываются оговорки относительно значения результатов и уменьшения разнообразия подходов.

Философские результаты [ править ]

Байесовцы объединены в противовес ограничениям частотности, но с философской точки зрения разделены на многочисленные лагеря (эмпирические, иерархические, объективные, личные, субъективные), каждый из которых имеет свой акцент. Один (частотный) философ статистики отметил отход от области статистики к философским интерпретациям вероятностей в течение последних двух поколений. [30] Бытует мнение, что успехи в байесовских приложениях не оправдывают поддерживающую философию. [31] Байесовские методы часто создают полезные модели, которые не используются для традиционных выводов и которые мало связаны с философией. [32]Ни одна из философских интерпретаций вероятности (частотная или байесовская) не кажется надежной. Частотный взгляд слишком жесткий и ограничивающий, в то время как байесовский взгляд может быть одновременно объективным и субъективным и т. Д.

Иллюстративные цитаты [ править ]

  • «при тщательном использовании частотный подход дает широко применимые, хотя иногда и неуклюжие ответы» [33]
  • «Настаивание на беспристрастных [частотных] методах может привести к отрицательным (но беспристрастным) оценкам дисперсии; использование p-значений в нескольких тестах может привести к вопиющим противоречиям; обычные доверительные интервалы 0,95 могут фактически состоять из целой реальной линии. Неудивительно, что математикам часто трудно поверить в то, что традиционные статистические методы являются разделом математики ». [34]
  • «Байесовство - это четкая и полностью принципиальная философия, а частотный подход - это набор оппортунистических, индивидуально оптимальных методов». [26]
  • «в многопараметрических задачах плоские априорные значения могут дать очень плохие ответы» [33]
  • «[Правило Байеса] гласит, что существует простой и элегантный способ объединить текущую информацию с предыдущим опытом, чтобы определить, сколько известно. Это означает, что достаточно надежные данные приведут к согласию ранее разрозненных наблюдателей. информации, и это дает решения с наименьшим возможным уровнем ошибок ». [35]
  • «Байесовская статистика - это утверждения вероятности, частотная статистика - оценка вероятностных утверждений». [36]
  • «[S] татистов часто помещают в обстановку, напоминающую парадокс Эрроу, где нас просят предоставить информативные и непредвзятые оценки, а также достоверные утверждения, правильные при условии наличия данных, а также лежащего в их основе истинного параметра». [36] (Это противоречивые требования.)
  • «формальные логические аспекты часто составляют относительно небольшую часть статистического анализа» [33]
  • «Две философии, байесовская и частотная, скорее ортогональны, чем противоположны». [26]
  • «Гипотеза, которая может быть верной, отвергается, потому что она не смогла предсказать наблюдаемые результаты, которых не было. Это кажется замечательной процедурой». [24]

Резюме [ править ]

  • У байесовской теории есть математическое преимущество
    • У вероятностной вероятности есть проблемы с существованием и непротиворечивостью
    • Но найти хорошие априорные решения для применения байесовской теории остается (очень?) Сложно.
  • Обе теории имеют впечатляющие записи об успешном применении.
  • Ни одна из поддерживающих философских интерпретаций вероятности не является надежной.
  • Растет скептицизм в отношении связи между приложением и философией.
  • Некоторые статистики рекомендуют активное сотрудничество (помимо прекращения огня)

Принцип правдоподобия [ править ]

Вероятность - это синоним вероятности в обычном употреблении. В статистике это не так. Вероятность относится к переменным данным для фиксированной гипотезы, в то время как вероятность относится к переменным гипотезам для фиксированного набора данных. Повторные измерения фиксированной длины с помощью линейки генерируют набор наблюдений. Каждый фиксированный набор условий наблюдений связан с распределением вероятностей, и каждый набор наблюдений можно интерпретировать как выборку из этого распределения - частотный подход к вероятности. В качестве альтернативы набор наблюдений может быть результатом выборки любого из множества распределений (каждое из которых является результатом набора условий наблюдений). Вероятностная связь между фиксированной выборкой и переменным распределением (в результате гипотезы переменной) называется правдоподобием - байесовским взглядом на вероятность.Набор измерений длины может включать показания, снятые осторожными, трезвыми, отдохнувшими, целеустремленными наблюдателями при хорошем освещении.

Вероятность - это вероятность (или нет) по другому имени, которая существует из-за ограниченного частотного определения вероятности. Вероятность - это концепция, введенная и продвигаемая Фишером более 40 лет (хотя предыдущие ссылки на эту концепцию существуют и поддержка Фишера была нерешительной). [37] Концепция была принята и существенно изменена Джеффрисом . [38] В 1962 году Бирнбаум «доказал» принцип правдоподобия, исходя из допущений, приемлемых для большинства статистиков. [39] «Доказательство» оспаривается статистиками и философами. Принцип гласит, что вся информация в выборке содержится в функции правдоподобия., которое считается допустимым распределением вероятностей байесовцами (но не частотниками).

Некоторые (частотные) критерии значимости не соответствуют принципу правдоподобия. Байесовцы принимают принцип, который согласуется с их философией (возможно, поощряемый замешательством частотников). «[Т] подход правдоподобия совместим с байесовским статистическим выводом в том смысле, что апостериорное байесовское распределение для параметра по теореме Байеса находится путем умножения априорного распределения на функцию правдоподобия». [37] Частые сторонники истолковывают этот принцип отрицательно для байесовцев, поскольку он не предполагает заботы о надежности доказательств. «Принцип правдоподобия байесовской статистики подразумевает, что информация о дизайне эксперимента, из которого собираются доказательства, не входит в статистический анализ данных». [40]Многие байесовцы (например, Сэвидж) [41] признают этот подтекст как уязвимость.

Принцип правдоподобия ставит в затруднительное положение обе основные философские школы статистики; Это ослабило их обоих, а не благоприятствовало ни одному из них. Его самые решительные сторонники утверждают, что он предлагает лучшую основу для статистики, чем любая из двух школ. «Вероятность [L] действительно выглядит очень хорошо по сравнению с этими [байесовскими и частотными] альтернативами». [42] Среди этих сторонников - статистики и философы науки. [43] Хотя байесовцы признают важность вероятности для вычислений, они считают, что апостериорное распределение вероятностей является надлежащей основой для вывода. [44]

Моделирование [ править ]

Выводная статистика основана на статистических моделях . Например, большая часть классической проверки гипотез основывалась на предполагаемой нормальности данных. Для уменьшения зависимости от этого предположения была разработана надежная и непараметрическая статистика. Байесовская статистика интерпретирует новые наблюдения с точки зрения предшествующих знаний, предполагая смоделированную преемственность между прошлым и настоящим. План экспериментов предполагает наличие определенных знаний об этих факторах, которые необходимо контролировать, варьировать, рандомизировать и наблюдать. Статистики хорошо осведомлены о трудностях доказательства причинности (в большей степени ограничение моделирования, чем математическое), говоря, что « корреляция не подразумевает причинно-следственную связь ».

Более сложная статистика использует более сложные модели, часто с целью поиска скрытой структуры, лежащей в основе набора переменных. По мере того, как модели и наборы данных усложнялись, возникали [a] [b] основополагающие вопросы об обоснованности моделей и обоснованности выводов, сделанных на их основе. Диапазон противоречивых мнений о моделировании велик.

  • Модели могут быть основаны на научной теории или на специальном анализе данных. Подходы используют разные методы. У каждого есть защитники. [46]
  • Сложность модели - это компромисс. Информационный критерий Акаике и байесовский информационный критерий - это два менее субъективных подхода к достижению этого компромисса. [47]
  • Высказываются фундаментальные оговорки даже в отношении простых регрессионных моделей, используемых в социальных науках. Длинный список допущений, присущих действительности модели, обычно не упоминается и не проверяется. Благоприятное сравнение между наблюдениями и моделью часто считается достаточным. [48]
  • Байесовская статистика так сильно фокусируется на апостериорной вероятности, что игнорирует фундаментальное сравнение наблюдений и модели. [32]
  • Традиционные модели, основанные на наблюдениях, не подходят для решения многих важных проблем. Необходимо использовать гораздо более широкий спектр моделей, включая алгоритмические модели. «Если модель плохо имитирует природу, выводы могут быть неверными». [49]
  • Моделирование часто выполняется плохо (используются неправильные методы) и плохо сообщается. [50]

В отсутствие строгого философского консенсуса в обзоре статистического моделирования многие статистики принимают предостерегающие слова статистика Джорджа Бокса : « Все модели ошибочны , но некоторые полезны ».

Другое чтение [ править ]

Краткое введение в основы статистики см. Stuart, A .; Орд, Дж. К. (1994). «Глава 8 - Вероятность и статистический вывод». Продвинутая теория статистики Кендалла . Vol. I: теория распределения (6-е изд.). Эдвард Арнольд. |volume= has extra text (help)

В своей книге статистики как аргумент принципиального , Роберт П. Абельсон артикулирует позицию , что статистика служит в качестве стандартизированных средств разрешения споров между учеными , которые могли бы в противном случае каждые поспорят достоинство своих позиций до бесконечности . С этой точки зрения статистика - это форма риторики; Как и в случае с любыми средствами разрешения споров, статистические методы могут быть успешными только в том случае, если все стороны согласны с используемым подходом. [51]

См. Также [ править ]

  • Философия статистики
  • История статистики
  • Философия вероятности
  • Философия математики
  • Философия науки
  • Свидетельство
  • Статистика правдоподобия
  • Вероятностные интерпретации
  • Основоположники статистики

Сноски [ править ]

  1. ^ Некоторые большие модели пытаются предсказать поведение избирателей в Соединенных Штатах Америки. Население составляет около 300 миллионов человек. На каждого избирателя может влиять множество факторов. О некоторых осложнениях поведения избирателей (которые легче всего понять местным жителям) см .: Гельман [45]
  2. ^ Efron (2013) упоминает миллионы точек данных и тысячи параметров из научных исследований. [26]

Цитаты [ править ]

  1. ^ а б Эфрон 1978 .
  2. ^ Bandyopadhyay & Forster 2011 .
  3. ^ "цитаты Сэвиджа (1972)" . Google Scholar .
  4. ^ Savage 1972.
  5. ^ a b c d Lehmann 2011.
  6. ^ a b c Gigerenzer et al. 1989.
  7. ^ a b Louçã 1993.
  8. ^ Fisher 1925.
  9. ^ Fisher 1935.
  10. ^ Fisher 1956.
  11. ^ Neyman & Pearson 1933.
  12. ^ Neyman & Pearson 1967.
  13. ^ Rubin, M (2020). ""Repeated sampling from the same population?" A critique of Neyman and Pearson's responses to Fisher". European Journal for Philosophy of Science. 10 (42): 1–15. doi:10.1007/s13194-020-00309-6. S2CID 221939887.
  14. ^ Fisher 1955.
  15. ^ Neyman 1956.
  16. ^ a b c Lehmann 1993.
  17. ^ Lenhard 2006.
  18. ^ Halpin & Stam 2006.
  19. ^ Lehmann & Romano 2005.
  20. ^ Hubbard & Bayarri c. 2003.
  21. ^ Sotos et al. 2007.
  22. ^ Fienberg 2006.
  23. ^ de Finetti 1964.
  24. ^ a b Jeffreys 1939.
  25. ^ Savage 1954.
  26. ^ a b c d Efron 2013.
  27. ^ a b Little 2005.
  28. ^ Yu 2009.
  29. ^ Berger 2003.
  30. ^ Mayo 2013.
  31. ^ Senn 2011.
  32. ^ a b Gelman & Shalizi 2012.
  33. ^ a b c Cox 2005.
  34. ^ Bernardo 2008.
  35. ^ Kass c. 2012.
  36. ^ a b Gelman 2008.
  37. ^ a b Edwards 1999.
  38. ^ Aldrich 2002.
  39. ^ Birnbaum 1962.
  40. ^ Backe 1999.
  41. ^ Savage 1960, p. 585.
  42. ^ Forster & Sober 2001.
  43. ^ Royall 1997.
  44. ^ Lindley 2000.
  45. ^ Gelman. "Red-blue talk UBC" (PDF). Statistics. Columbia U.
  46. ^ Tabachnick & Fidell 1996.
  47. ^ Forster & Sober 1994.
  48. ^ Freedman 1995.
  49. ^ Breiman 2001.
  50. ^ Chin n.d.
  51. ^ Abelson, Robert P. (1995). Statistics as Principled Argument. Lawrence Erlbaum Associates. ISBN 978-0-8058-0528-4. ... the purpose of statistics is to organize a useful argument from quantitative evidence, using a form of principled rhetoric.

References[edit]

  • Aldrich, John (2002). "How likelihood and identification went Bayesian" (PDF). International Statistical Review. 70 (1): 79–98. doi:10.1111/j.1751-5823.2002.tb00350.x.
  • Backe, Andrew (1999). "The likelihood principle and the reliability of experiments". Philosophy of Science. 66: S354–S361. doi:10.1086/392737. S2CID 15822883.
  • Bandyopadhyay, Prasanta; Forster, Malcolm, eds. (2011). Philosophy of statistics. Handbook of the Philosophy of Science. 7. Oxford: North-Holland. ISBN 978-0444518620. The text is a collection of essays.
  • Berger, James O. (2003). "Could Fisher, Jeffreys and Neyman Have Agreed on Testing?". Statistical Science. 18 (1): 1–32. doi:10.1214/ss/1056397485.
  • Bernardo, Jose M. (2008). "Comment on Article by Gelman". Bayesian Analysis. 3 (3): 453. doi:10.1214/08-BA318REJ.
  • Birnbaum, A. (1962). "On the foundations of statistical inference". J. Amer. Statist. Assoc. 57 (298): 269–326. doi:10.1080/01621459.1962.10480660.
  • Breiman, Leo (2001). "Statistical Modeling: The Two Cultures". Statistical Science. 16 (3): 199–231. doi:10.1214/ss/1009213726.
  • Chin, Wynne W. (n.d.). "Structural Equation Modeling in IS Research - Understanding the LISREL and PLS perspective". Archived from the original on 2011-07-20. Retrieved 2013-09-16. University of Houston lecture notes?
  • Cox, D. R. (2005). "Frequentist and Bayesian Statistics: a Critique". Statistical Problems in Particle Physics, Astrophysics and Cosmology. PHYSTAT05. CiteSeerX 10.1.1.173.4608.
  • de Finetti, Bruno (1964). "Foresight: its Logical laws, its Subjective Sources". In Kyburg, H. E. (ed.). Studies in Subjective Probability. H. E. Smokler. New York: Wiley. pp. 93–158. CS1 maint: discouraged parameter (link) Translation of the 1937 French original with later notes added.
  • Edwards, A.W.F. (1999). "Likelihood". Preliminary version of an article for the International Encyclopedia of the Social and Behavioral Sciences.
  • Efron, Bradley (2013). "A 250 year argument: Belief, behavior, and the bootstrap". Bulletin of the American Mathematical Society. New Series. 50 (1): 129–146. doi:10.1090/s0273-0979-2012-01374-5.
  • Efron, Bradley (1978). "Controversies in the foundations of statistics" (PDF). The American Mathematical Monthly. 85 (4): 231–246. doi:10.2307/2321163. JSTOR 2321163. Archived from the original (PDF) on 14 July 2010. Retrieved 1 November 2012.
  • Fienberg, Stephen E. (2006). "When did Bayesian inference become "Bayesian"?". Bayesian Analysis. 1 (1): 1–40. doi:10.1214/06-ba101.
  • Fisher, R.A. (1925). Statistical Methods for Research Workers. Edinburgh: Oliver and Boyd.
  • Fisher, Ronald A., Sir (1935). Design of Experiments. Edinburgh: Oliver and Boyd.
  • Fisher, R. (1955). "Statistical Methods and Scientific Induction" (PDF). Journal of the Royal Statistical Society, Series B. 17 (1): 69–78.
  • Fisher, Ronald A., Sir (1956). The logic of scientific inference. Edinburgh: Oliver and Boyd.
  • Forster, Malcolm; Sober, Elliott (1994). "How to tell when simpler, more unified, or less ad-hoc theories will provide more accurate predictions". British Journal for the Philosophy of Science. 45 (1): 1–36. doi:10.1093/bjps/45.1.1.
  • Forster, Malcolm; Sober, Elliott (2001). "Why likelihood". Likelihood and Evidence: 89–99.
  • Freedman, David (March 1995). "Some issues in the foundation of statistics". Foundations of Science. 1 (1): 19–39. doi:10.1007/BF00208723.
  • Gelman, Andrew (2008). "Rejoinder". Bayesian Analysis. 3 (3): 467–478. doi:10.1214/08-BA318REJ. – A joke escalated into a serious discussion of Bayesian problems by 5 authors (Gelman, Bernardo, Kadane, Senn, Wasserman) on pages 445-478.
  • Gelman, Andrew; Shalizi, Cosma Rohilla (2012). "Philosophy and the practice of Bayesian statistics". British Journal of Mathematical and Statistical Psychology. 66 (1): 8–38. arXiv:1006.3868. doi:10.1111/j.2044-8317.2011.02037.x. PMC 4476974. PMID 22364575.
  • Gigerenzer, Gerd; Swijtink, Zeno; Porter, Theodore; Daston, Lorraine; Beatty, John; Kruger, Lorenz (1989). "Part 3: The Inference Experts". The Empire of Chance: How Probability Changed Science and Everyday Life. Cambridge University Press. pp. 70–122. ISBN 978-0-521-39838-1.
  • Halpin, P.F.; Stam, H.J. (Winter 2006). "Inductive Inference or Inductive Behavior: Fisher and Neyman: Pearson Approaches to Statistical Testing in Psychological Research (1940–1960)". The American Journal of Psychology. 119 (4): 625–653. doi:10.2307/20445367. JSTOR 20445367. PMID 17286092.
  • Hubbard, Raymond; Bayarri, M.J. (c. 2003). "P-values are not error probabilities" (PDF). Archived from the original (PDF) on 4 September 2013. Retrieved 3 September 2013. – A working paper that explains the difference between Fisher's evidential p-value and the Neyman–Pearson type I error rate .
  • Jeffreys, H. (1939). The theory of probability. Oxford University Press.
  • Kass (c. 2012). "Why is it that Bayes' rule has not only captured the attention of so many people but inspired a religious devotion and contentiousness, repeatedly, across many years?" (PDF).
  • Lehmann, E. L. (December 1993). "The Fisher, Neyman–Pearson theories of testing hypotheses: One theory or two?". Journal of the American Statistical Association. 88 (424): 1242–1249. doi:10.1080/01621459.1993.10476404.
  • Lehmann, E. L. (2011). Fisher, Neyman, and the creation of classical statistics. New York: Springer. ISBN 978-1441994998.
  • Lehmann, E.L.; Romano, Joseph P. (2005). Testing Statistical Hypotheses (3rd ed.). New York: Springer. ISBN 978-0-387-98864-1.
  • Lenhard, Johannes (2006). "Models and Statistical Inference: The Controversy between Fisher and Neyman–Pearson". Br. J. Philos. Sci. 57: 69–91. doi:10.1093/bjps/axi152.
  • Lindley, D.V. (2000). "The philosophy of statistics". Journal of the Royal Statistical Society, Series D. 49 (3): 293–337. doi:10.1111/1467-9884.00238.
  • Little, Roderick J. (2006). "Calibrated Bayes: A Bayes / frequentist roadmap". 60 (3). Cite journal requires |journal= (help)
  • Louçã, Francisco (2008). "Should The Widest Cleft in Statistics-How and Why Fisher opposed Neyman and Pearson" (PDF). Working paper contains numerous quotations from the original sources of the dispute.
  • Mayo, Deborah G. (February 2013). "Discussion: Bayesian Methods: Applied? Yes. Philosophical Defense? In Flux". The American Statistician. 67 (1): 11–15. doi:10.1080/00031305.2012.752410. S2CID 11215443.
  • Neyman, J.; Pearson, E. S. (January 1, 1933). "On the problem of the most efficient tests of statistical hypotheses". Phil. Trans. R. Soc. Lond. A. 231 (694–706): 289–337. Bibcode:1933RSPTA.231..289N. doi:10.1098/rsta.1933.0009.
  • Neyman, J. (1967). Joint statistical papers of J. Neyman and E.S. Pearson. Cambridge University Press.
  • Neyman, Jerzy (1956). "Note on an Article by Sir Ronald Fisher". Journal of the Royal Statistical Society, Series B. 18 (2): 288–294.
  • Royall, Richard (1997). Statistical Evidence: a likelihood paradigm. Chapman & Hall. ISBN 978-0412044113.
  • Savage, L.J. (1972). Foundations of Statistics (second ed.).
  • Senn, Stephen (2011). "You may believe you are a Bayesian but you are probably wrong". RMM. 2: 48–66.
  • Sotos, Ana Elisa Castro; van Hoof, Stijn; van den Noortgate, Wim; Onghena, Patrick (2007). "Students' misconceptions of statistical inference: A review of the empirical evidence from research on statistics education". Educational Research Review. 2 (2): 98–113. doi:10.1016/j.edurev.2007.04.001.
  • Stuart, A.; Ord, J.K. (1994). Kendall's Advanced Theory of Statistics. Vol. I: Distribution Theory. Edward Arnold. |volume= has extra text (help)
  • Tabachnick, Barbara G.; Fidell, Linda S. (1996). Using Multivariate Statistics (3rd ed.). ISBN 978-0-673-99414-1. Principal components is an empirical approach while factor analysis and structural equation modeling tend to be theoretical approaches.(p 27)
  • Yu, Yue (2009). "Bayesian vs. Frequentist" (PDF). – Lecture notes? University of Illinois at Chicago

Further reading[edit]

  • Barnett, Vic (1999). Comparative Statistical Inference (3rd ed.). Wiley. ISBN 978-0-471-97643-1.
  • Cox, David R. (2006). Principles of Statistical Inference. Cambridge University Press. ISBN 978-0-521-68567-2.
  • Efron, Bradley (1986), "Why isn't everyone a Bayesian? (with discussion)", The American Statistician, 40 (1): 1–11, doi:10.2307/2683105, JSTOR 2683105.
  • Good, I. J. (1988), "The interface between statistics and philosophy of science", Statistical Science, 3 (4): 386–397, doi:10.1214/ss/1177012754, JSTOR 2245388
  • Kadane, J.B.; Schervish, M.J.; Seidenfeld, T. (1999). Rethinking the Foundations of Statistics. Cambridge University Press. – Bayesian.
  • Mayo, Deborah G. (1992), "Did Pearson reject the Neyman–Pearson philosophy of statistics?", Synthese, 90 (2): 233–262, doi:10.1007/BF00485352, S2CID 14236921.

External links[edit]

  • "Probability interpretation". Stanford Encyclopedia of Philosophy. Palo Alto, CA: Stanford University.
  • "Philosophy of statistics". Stanford Encyclopedia of Philosophy. Palo Alto, CA: Stanford University.