Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Статистический вывод - это процесс использования анализа данных для вывода свойств основного распределения вероятности . [1] Логический статистический анализ позволяет сделать вывод о свойствах совокупности , например, путем проверки гипотез и получения оценок. Предполагается, что набор наблюдаемых данных взят из более широкой совокупности.

Статистику вывода можно противопоставить описательной статистике . Описательная статистика касается исключительно свойств наблюдаемых данных и не основывается на предположении, что данные поступают от более широкой совокупности. В машинном обучении термин « вывод» иногда используется вместо того, чтобы означать «сделать прогноз путем оценки уже обученной модели»; [2] в этом контексте вывод свойств модели называется обучением или обучением (а не выводом ), а использование модели для прогнозирования называется выводом (вместо прогнозирования ); смотрите такжепрогнозный вывод .

Введение [ править ]

Статистический вывод делает предположения о совокупности, используя данные, полученные от совокупности с некоторой формой выборки . Учитывая гипотезу о населении, для которого мы хотим сделать выводы, статистический вывод состоит из (первого) выбора в статистической модели процесса , который генерирует данные и (второй) Выведение предложения от модели. [ необходима цитата ]

Кониси и Китагава заявляют: «Большинство проблем статистического вывода можно рассматривать как проблемы, связанные со статистическим моделированием». [3] В этой связи сэр Дэвид Кокс сказал: «Как [] перевод предметной проблемы в статистическую модель часто является наиболее важной частью анализа». [4]

Вывод статистического вывода является статистическим суждением . [5] Вот некоторые распространенные формы статистических предложений:

  • точечная оценка , то есть конкретное значение , которое лучше аппроксимирует некоторый параметр , представляющий интерес;
  • интервал оценка , например, доверительный интервал (или множество оценки), т.е. интервал построен с использованием набора данных , выбираемые из популяции , так что, при повторном отборе проб из таких наборов данных, такие интервалы будут содержать истинное значение параметра с вероятностью в заявленной уверенности уровень ;
  • доверия интервала , то есть набор значений , содержащих, например, 95% от задней веры;
  • отказ от гипотезы ; [примечание 1]
  • кластеризация или классификация точек данных по группам.

Модели и предположения [ править ]

Любой статистический вывод требует некоторых предположений. Статистическая модель представляет собой набор предположений о генерации наблюдаемых данных и аналогичных данных. В описаниях статистических моделей обычно подчеркивается роль представляющих интерес количеств населения, о которых мы хотим сделать вывод. [6] Описательная статистика обычно используется в качестве предварительного шага перед тем, как делать более формальные выводы. [7]

Степень моделей / предположений [ править ]

Статистики различают три уровня допущений моделирования;

  • Полностью параметрический : предполагается, что распределения вероятностей, описывающие процесс генерации данных, полностью описываются семейством распределений вероятностей, включающим только конечное число неизвестных параметров. [6] Например, можно предположить, что распределение значений совокупности действительно нормальное, с неизвестным средним значением и дисперсией, и что наборы данных генерируются с помощью «простой» случайной выборки . Семейство обобщенных линейных моделей - это широко используемый и гибкий класс параметрических моделей.
  • Непараметрические : предположения, сделанные о процессе, генерирующем данные, намного меньше, чем в параметрической статистике, и могут быть минимальными. [8] Например, у каждого непрерывного распределения вероятностей есть медиана, которую можно оценить с помощью медианы выборки или оценки Ходжеса – Леманна – Сена , которая имеет хорошие свойства, когда данные возникают в результате простой случайной выборки.
  • Полупараметрический : этот термин обычно подразумевает промежуточные допущения между полностью и непараметрическими подходами. Например, можно предположить, что распределение населения имеет конечное среднее значение. Более того, можно предположить, что средний уровень ответа в популяции действительно линейно зависит от некоторой ковариаты (параметрическое предположение), но не делать никаких параметрических предположений, описывающих дисперсию вокруг этого среднего значения (т.е. о наличии или возможной форме любой гетероскедастичности). ). В более общем плане полупараметрические модели часто можно разделить на «структурные» и «случайные вариации» компоненты. Один компонент обрабатывается параметрически, а другой - непараметрически. Хорошо известная модель Кокса представляет собой набор полупараметрических предположений.

Важность достоверных моделей / предположений [ править ]

Какой бы уровень предположения ни был сделан, правильно откалиброванный вывод в целом требует, чтобы эти предположения были правильными; т.е. что механизмы генерации данных действительно указаны правильно.

Неправильные предположения о «простой» случайной выборке могут сделать статистический вывод недействительным. [9] Более сложные полу- и полностью параметрические допущения также вызывают озабоченность. Например, неправильное предположение о модели Кокса в некоторых случаях может привести к ошибочным выводам. [10] Неправильные предположения о нормальности в популяции также делают недействительными некоторые формы вывода на основе регрессии. [11] Использование любыхПараметрическая модель скептически рассматривается большинством экспертов по выборке человеческих популяций: «большинство статистиков, занимающихся выборкой, когда они вообще имеют дело с доверительными интервалами, ограничиваются утверждениями об [оценках], основанных на очень больших выборках, где центральная предельная теорема гарантирует, что эти [ оценки] будут иметь почти нормальные распределения ". [12] В частности, нормальное распределение «было бы совершенно нереалистичным и катастрофически неразумным предположением, если бы мы имели дело с любым типом экономического населения». [12] Здесь центральная предельная теорема утверждает, что распределение выборочного среднего «для очень больших выборок» приблизительно нормально распределено, если распределение не является тяжелым хвостом.

Примерные распределения [ править ]

Учитывая сложность определения точных распределений выборочной статистики, было разработано множество методов для их аппроксимации.

В случае конечных выборок результаты аппроксимации измеряют, насколько близко предельное распределение приближается к выборочному распределению статистики : например, с 10000 независимых выборок нормальное распределение аппроксимирует (с точностью до двух знаков) распределение выборочного среднего для многих распределений совокупности с помощью метода Берри. –Теорема Эссеена . [13] Тем не менее, для многих практических целей нормальное приближение обеспечивает хорошее приближение к распределению выборочного среднего, когда имеется 10 (или более) независимых выборок, согласно исследованиям моделирования и опыту статистиков. [13] Вслед за работой Колмогорова в 1950-х годах передовая статистика используеттеория приближений и функциональный анализ для количественной оценки ошибки приближения. В этом подходе, метрическая геометрия из распределений вероятностей изучаются; этот подход квантифицирует ошибку аппроксимации с, например, Кульбаком-Либлер дивергенция , Брегман расходимость , а расстояние Хеллингера . [14] [15] [16]

При неограниченно больших выборках ограничивающие результаты, такие как центральная предельная теорема, описывают предельное распределение выборочной статистики, если оно существует. Предельные результаты не являются утверждениями о конечных выборках и действительно не имеют отношения к конечным выборкам. [17] [18] [19] Однако асимптотическая теория предельных распределений часто используется для работы с конечными выборками. Например, ограничивающие результаты часто используются для обоснования обобщенного метода моментов и использования обобщенных оценочных уравнений , которые популярны в эконометрике и биостатистике.. Величину разницы между предельным распределением и истинным распределением (формально «ошибка» приближения) можно оценить с помощью моделирования. [20] Эвристическое применение ограничения результатов конечными выборками является обычной практикой во многих приложениях, особенно с низкоразмерными моделями с логарифмически вогнутыми вероятностями (например, с однопараметрическими экспоненциальными семействами ).

Модели на основе рандомизации [ править ]

Для данного набора данных, созданного с помощью плана рандомизации, распределение статистики при рандомизации (при нулевой гипотезе) определяется путем оценки статистики теста для всех планов, которые могли быть сгенерированы с помощью плана рандомизации. Согласно частотному выводу, рандомизация позволяет выводам основываться на распределении рандомизации, а не на субъективной модели, и это важно, особенно при выборке обследований и планировании экспериментов. [21] [22] Статистические выводы из рандомизированных исследований также более просты, чем во многих других ситуациях. [23] [24] [25] С точки зрения байесовского вывода , рандомизация также важна: при выборке обследования использованиевыборка без замены обеспечивает возможность обмена выборки с генеральной совокупностью; в рандомизированных экспериментах рандомизация гарантирует случайное отсутствие допущения для ковариантной информации. [26]

Объективная рандомизация позволяет правильно проводить индукционные процедуры. [27] [28] [29] [30] [31] Многие статистики предпочитают основанный на рандомизации анализ данных, которые были получены с помощью четко определенных процедур рандомизации. [32] (Однако верно, что в областях науки с развитыми теоретическими знаниями и экспериментальным контролем, рандомизированные эксперименты могут увеличить стоимость экспериментов без улучшения качества выводов. [33] [34] ) Аналогичным образом, результаты рандомизированных экспериментов рекомендуются ведущими статистическими органами как позволяющие делать выводы с большей надежностью, чем наблюдения за теми же явлениями. [35]Однако хорошее наблюдательное исследование может быть лучше плохого рандомизированного эксперимента.

Статистический анализ рандомизированного эксперимента может быть основан на схеме рандомизации, указанной в протоколе эксперимента, и не требует субъективной модели. [36] [37]

Однако в любое время некоторые гипотезы нельзя проверить с помощью объективных статистических моделей, которые точно описывают рандомизированные эксперименты или случайные выборки. В некоторых случаях такие рандомизированные исследования неэкономичны или неэтичны.

Модельный анализ рандомизированных экспериментов [ править ]

При анализе данных рандомизированных экспериментов стандартной практикой является обращение к статистической модели, например линейной или логистической модели. [38] Однако схема рандомизации определяет выбор статистической модели. Невозможно выбрать подходящую модель, не зная схемы рандомизации. [22] Серьезно вводящие в заблуждение результаты могут быть получены при анализе данных рандомизированных экспериментов при игнорировании протокола эксперимента; Общие ошибки включают забвение блокирования, используемого в эксперименте, и путаницу повторных измерений на одной и той же экспериментальной установке с независимыми повторениями обработки, применяемой к различным экспериментальным единицам. [39]

Вывод рандомизации без модели [ править ]

Безмодельные методы дополняют основанные на моделях методы, в которых используются редукционистские стратегии упрощения реальности. Первые объединяют, развивают, объединяют и обучают алгоритмы, динамически адаптируясь к контекстуальным особенностям процесса и изучая внутренние характеристики наблюдений. [38] [40]

Например, простая линейная регрессия без модели основана либо на

  • случайная конструкция , где пары наблюдений являются независимыми и одинаково распределенными (IID), или
  • детерминированная конструкция , где переменные являются детерминированными, но соответствующим переменным откликом является случайной и независимой с общим условным распределением, то есть , которое не зависит от индекса .

В любом случае вывод рандомизации без модели для характеристик общего условного распределения основывается на некоторых условиях регулярности, например, функциональной гладкости. Например, безмодельное умозаключение рандомизации для функции населения условного среднего , можно последовательно оценить с помощью локального усреднения или локальной полиномиальной аппроксимации, при условии , что гладкие. Кроме того , опираясь на асимптотической нормальности или передискретизации, мы можем построить доверительные интервалы для функции населения, в данном случае, в условном среднем , . [41]

Парадигмы для вывода [ править ]

Установились различные школы статистических выводов. Эти школы - или «парадигмы» - не исключают друг друга, и методы, которые хорошо работают в рамках одной парадигмы, часто имеют привлекательные интерпретации в других парадигмах.

Bandyopadhyay и Forster [42] описывают четыре парадигмы: «(i) классическая статистика или статистика ошибок, (ii) байесовская статистика, (iii) статистика, основанная на правдоподобии, и (iv) статистика на основе информационных критериев Акаике». Классическая (или частотная ) парадигма, байесовская парадигма, парадигма правдоподобия и парадигма, основанная на AIC , кратко излагаются ниже.

Заключение Frequentist [ править ]

Эта парадигма калибрует правдоподобие предположений, рассматривая (условно) повторяющуюся выборку распределения населения для получения наборов данных, подобных тому, который имеется в наличии. Рассматривая характеристики набора данных при повторной выборке, частотные свойства статистического предложения могут быть определены количественно, хотя на практике такая количественная оценка может быть сложной задачей.

Примеры частотного вывода [ править ]

  • p -значение
  • Доверительный интервал
  • Проверка значимости нулевой гипотезы

Частые выводы, объективность и теория принятия решений [ править ]

Одна интерпретация частотного вывода (или классического вывода) состоит в том, что он применим только с точки зрения вероятности частоты ; то есть с точки зрения повторной выборки из совокупности. Однако подход Неймана [43]разрабатывает эти процедуры с точки зрения предэкспериментальных вероятностей. То есть, перед проведением эксперимента, каждый выбирает правило для прихода к выводу, чтобы вероятность правильности контролировалась подходящим образом: такая вероятность не обязательно должна иметь частотную интерпретацию или интерпретацию повторной выборки. Напротив, байесовский вывод работает в терминах условных вероятностей (т.е. вероятностей, обусловленных наблюдаемыми данными) по сравнению с предельными (но обусловленными неизвестными параметрами) вероятностями, используемыми в частотном подходе.

Частотные процедуры проверки значимости и доверительных интервалов могут быть построены без учета функций полезности . Однако некоторые элементы частотной статистики, такие как теория статистических решений , действительно включают функции полезности . [ необходимая цитата ] В частности, частотные разработки оптимального вывода (такие как несмещенные оценки с минимальной дисперсией или наиболее мощное тестирование ) используют функции потерь , которые играют роль (отрицательных) функций полезности. Для статистиков-теоретиков нет необходимости явно указывать функции потерь, чтобы доказать, что статистическая процедура обладает свойством оптимальности.[44] Однако функции потерь часто полезны для определения свойств оптимальности: например, несмещенные по медиане оценки оптимальны дляфункций потерь абсолютного значения , поскольку они минимизируют ожидаемые потери, аоценки по методу наименьших квадратов оптимальны для функций квадратичных ошибок потерь, в этом они минимизируют ожидаемые убытки.

В то время как статистики, использующие частотный вывод, должны сами выбирать интересующие параметры и используемые оценки / тестовые статистические данные , отсутствие явно явных утилит и априорных распределений помогло частотным процедурам стать широко «объективными». [45]

Байесовский вывод [ править ]

Байесовское исчисление описывает степени веры, используя «язык» вероятности; убеждения положительны, объединяются в одно и подчиняются аксиомам вероятности. Байесовский вывод использует доступные апостериорные убеждения в качестве основы для статистических предположений. Есть несколько различных оправданий использования байесовского подхода.

Примеры байесовского вывода [ править ]

  • Достоверный интервал для интервальной оценки
  • Коэффициенты Байеса для сравнения моделей

Байесовский вывод, теория субъективности и принятия решений [ править ]

Многие неформальные байесовские выводы основаны на «интуитивно разумных» обобщениях апостериорного анализа. Например, апостериорное среднее, медиана и мода, интервалы наивысшей апостериорной плотности и байесовские факторы могут быть мотивированы таким образом. Хотя для такого рода выводов не требуется указывать функцию полезности пользователя , все эти сводные данные зависят (в некоторой степени) от заявленных ранее представленных убеждений и обычно рассматриваются как субъективные выводы. (Методы предварительного строительства, которые не требуют внешнего ввода, были предложены, но еще не полностью разработаны.)

Формально байесовский вывод калибруется со ссылкой на явно заявленную полезность или функцию потерь; «Правило Байеса» - это правило, которое максимизирует ожидаемую полезность, усредненную по апостериорной неопределенности. Таким образом, формальный байесовский вывод автоматически обеспечивает оптимальные решения в теоретическом смысле принятия решений . Учитывая предположения, данные и полезность, байесовский вывод может быть сделан практически для любой проблемы, хотя не каждый статистический вывод должен иметь байесовскую интерпретацию. Анализы, которые формально не являются байесовскими, могут быть (логически) бессвязными ; особенность байесовских процедур, которые используют правильные априорные значения (т. е. те, которые интегрируются в один), состоит в том, что они гарантированно согласованы . Некоторые сторонникиБайесовский вывод утверждает, что вывод должен иметь место в этой теоретической структуре принятия решений, и что байесовский вывод не должен заканчиваться оценкой и обобщением апостериорных убеждений.

Вывод на основе правдоподобия [ править ]

Правдоподобие подходит к статистике с помощью функции правдоподобия . Некоторые правдоподобные люди отвергают умозаключения, считая статистику лишь вычислительной поддержкой свидетельств. Другие, однако, предлагают вывод, основанный на функции правдоподобия, из которых наиболее известной является оценка максимального правдоподобия .

Вывод на основе AIC [ править ]

Информационный критерий Akaike (АИК) является оценкой относительного качества статистических моделей для данного набора данных. Учитывая набор моделей для данных, AIC оценивает качество каждой модели относительно каждой из других моделей. Таким образом, AIC предоставляет средства для выбора модели .

AIC основан на теории информации : он предлагает оценку относительной информации, потерянной, когда данная модель используется для представления процесса, который генерировал данные. (При этом речь идет о компромиссе между точностью соответствия модели и простотой модели.)

Другие парадигмы вывода [ править ]

Минимальная длина описания [ править ]

Принцип минимальной длины описания (MDL) был разработан на основе идей теории информации [46] и теории колмогоровской сложности . [47] Принцип (MDL) выбирает статистические модели, которые максимально сжимают данные; вывод происходит без допущения контрфактических или нефальсифицируемых «механизмов генерации данных» или вероятностных моделей для данных, как это могло бы быть сделано в частотном или байесовском подходах.

Однако, если «механизм генерации данных» действительно существует, то в соответствии с теоремой Шеннона о кодировании источника он обеспечивает MDL-описание данных в среднем и асимптотически. [48] В минимизации длины описания (или описательной сложности) оценка MDL аналогична оценке максимального правдоподобия и максимальной апостериорной оценке (с использованием байесовских априорных значений максимальной энтропии ). Однако MDL избегает предположения, что основная вероятностная модель известна; принцип MDL также может применяться без предположений о том, что, например, данные были получены в результате независимой выборки. [48] [49]

Принцип MDL был применен в Связь- теории кодирования в теории информации , в линейной регрессии , [49] и в горнодобывающей промышленности данных . [47]

При оценке процедур вывода на основе MDL часто используются методы или критерии теории сложности вычислений . [50]

Фидуциальный вывод [ править ]

Фидуциарный вывод - это подход к статистическому выводу, основанный на фидуциарной вероятности , также известный как «фидуциальное распределение». В последующих работах этот подход был назван плохо определенным, крайне ограниченным в применимости и даже ошибочным. [51] [52] Однако этот аргумент совпадает с аргументом, показывающим [53], что так называемое доверительное распределение не является допустимым распределением вероятностей и, поскольку это не делает недействительным применение доверительных интервалов , оно не обязательно делает недействительным выводы, сделанные на основе достоверных аргументов. Была сделана попытка переосмыслить раннюю работу фидуциального аргумента Фишера.как частный случай теории вывода с использованием верхней и нижней вероятностей . [54]

Структурный вывод [ править ]

Развивая идеи Фишера и Питмана с 1938 по 1939 год [55], Джордж А. Барнард разработал «структурный вывод» или «основной вывод» [56] , подход, использующий инвариантные вероятности для групповых семейств . Барнард переформулировал аргументы, лежащие в основе реперного вывода для ограниченного класса моделей, на которых «реперные» процедуры были бы хорошо определены и полезны.

Темы вывода [ править ]

Приведенные ниже темы обычно относятся к области статистических выводов .

  1. Статистические допущения
  2. Статистическая теория принятия решений
  3. Теория оценок
  4. Статистическая проверка гипотез
  5. Пересмотр мнений в статистике
  6. Планирование экспериментов , дисперсионный анализ и регрессия
  7. Выборка опроса
  8. Обобщение статистических данных

История [ править ]

Аль-Кинди , арабский математик IX века, впервые применил статистический вывод в своей « Рукописи по расшифровке криптографических сообщений» , работе по криптоанализу и частотному анализу . [57]

См. Также [ править ]

  • Алгоритмический вывод
  • Индукция (философия)
  • Неформальное логическое рассуждение
  • Доля населения
  • Философия статистики
  • Прогнозный вывод
  • Теория информационного поля

Заметки [ править ]

  1. ^ Согласно Пирсу, принятие означает, что исследование этого вопроса на время прекращается. В науке можно пересматривать все научные теории.

Ссылки [ править ]

Цитаты [ править ]

  1. ^ Аптон, Г., Кук, И. (2008) Оксфордский статистический словарь , OUP. ISBN  978-0-19-954145-4 .
  2. ^ «Вывод TensorFlow Lite» . Термин « вывод» относится к процессу выполнения модели TensorFlow Lite на устройстве, чтобы делать прогнозы на основе входных данных.
  3. Кониси и Китагава (2008), стр. 75.
  4. ^ Кокс (2006), стр. 197.
  5. ^ «Статистический вывод - математическая энциклопедия» . www.encyclopediaofmath.org . Проверено 23 января 2019 .
  6. ^ a b Кокс (2006) стр.2
  7. ^ Эванс, Майкл; и другие. (2004). Вероятность и статистика: наука о неопределенности . Фримен и компания. п. 267. ISBN. 9780716747420.
  8. ^ Ван дер Ваарт, AW (1998) Асимптотическая статистика Cambridge University Press. ISBN 0-521-78450-6 (стр. 341) 
  9. ^ Крускал 1988
  10. ^ Фридман, Д.А. (2008) «Анализ выживаемости: эпидемиологическая опасность?». Американский статистик (2008) 62: 110-119. (Перепечатано как Глава 11 (страницы 169–192) Freedman (2010)).
  11. ^ Берк, Р. (2003) Регрессионный анализ: конструктивная критика (передовые количественные методы в социальных науках) (v. 11) Sage Publications. ISBN 0-7619-2904-5 
  12. ^ a b Брюэр, Кен (2002). Вывод комбинированной выборки обследования: взвешивание слонов Басу . Ходдер Арнольд. п. 6. ISBN 978-0340692295.
  13. ^ a b Вероятность Йоргена Хоффмана-Йоргенсена с точки зрения статистики , Том I. Стр. 399 [ требуется полная ссылка ]
  14. Le Cam (1986) [ необходима страница ]
  15. ^ Эрик Торгерсон (1991) Сравнение статистических экспериментов , том 36 Энциклопедии математики. Издательство Кембриджского университета. [ требуется полная цитата ]
  16. ^ Liese, Фридрих & Miescke, Клаус-J. (2008). Статистическая теория принятия решений: оценка, тестирование и выбор . Springer. ISBN 978-0-387-73193-3.
  17. Колмогоров (1963, стр. 369): «Концепция частоты, основанная на понятии предельной частоты по мере того, как число попыток увеличивается до бесконечности, ничего не способствует обоснованию применимости результатов теории вероятностей к реальным практическим задачам, где нам всегда приходится иметь дело с конечным числом испытаний ".
  18. ^ «Действительно, предельные теоремы« стремящиеся к бесконечности »логически лишены содержания о том, что происходит в каком-либо конкретном случае . Все, что они могут сделать, это предложить определенные подходы, эффективность которых затем должна быть проверена в конкретном случае». - Ле Кам (1986) (стр. Xiv)
  19. ^ Pfanzagl (1994): «Ключевой недостаток асимптотической теории: от асимптотической теории мы ожидаем результатов, которые приблизительно выполняются ... Асимптотическая теория может предложить предельные теоремы» (стр. Ix) «Что имеет значение для приложений, так это приближения, а не пределы ". (стр.188)
  20. ^ Pfanzagl (1994): «Принимая предельную теорему как приблизительно верную для больших размеров выборки, мы допускаем ошибку, размер которой неизвестен. [...] Реалистичная информация об оставшихся ошибках может быть получена путем моделирования». (стр. ix)
  21. ^ Нейман, Дж. (1934) «О двух различных аспектах репрезентативного метода: метод стратифицированной выборки и метод целенаправленного отбора», Журнал Королевского статистического общества , 97 (4), 557–625 JSTOR  2342192
  22. ^ a b Хинкельманн и Кемпторн (2008) [ необходима страница ]
  23. ^ Рекомендации ASA для первого курса статистики для не статистиков. (доступно на сайте ASA)
  24. ^ Статистика Дэвида А. Фридмана и др.
  25. ^ Мур и др. (2015).
  26. ^ Гельман А. и др. (2013). Байесовский анализ данных ( Чепмен и Холл ).
  27. Пирс (1877-1878)
  28. ^ Пирс (1883)
  29. Перейти ↑ Freedman, Pisani & Purves 1978 .
  30. ^ Дэвид А. Фридман Статистические модели .
  31. Rao, CR (1997) Статистика и правда: использование шансов в работе , World Scientific. ISBN 981-02-3111-3 
  32. ^ Пирс; Вольноотпущенник; Мур и др. (2015). [ необходима цитата ]
  33. ^ Box, GEP и друзья (2006) Улучшение почти всего: идеи и эссе, исправленное издание , Wiley. ISBN 978-0-471-72755-2 
  34. ^ Кокс (2006), стр. 196.
  35. ^ Рекомендации ASA для первого курса статистики для не статистиков. (доступно на сайте ASA)
    • Статистика Дэвида А. Фридмана и других .
    • Мур и др. (2015).
  36. ^ Нейман, Ежи. 1923 [1990]. «О применении теории вероятностей к сельскохозяйственным экспериментам. Очерк принципов. Раздел 9». Статистическая наука 5 (4): 465–472. Пер. Дорота М. Домбровска и Теренс П. Спид.
  37. ^ Hinkelmann & Kempthorne (2008) [ нужная страница ]
  38. ^ a b Динов, Иво; Паланималаи, Сельвам; Кхаре, Ашвини; Кристу, Николас (2018). «Статистический вывод на основе рандомизации: инфраструктура повторной выборки и моделирования» . Статистика обучения . 40 (2): 64–73. DOI : 10.1111 / test.12156 . PMC 6155997 . PMID 30270947 .  
  39. ^ Хинкельманн и Кемпторн (2008) Глава 6.
  40. ^ Тан, Мин; Гао, Чао; Гутман, Стивен; Калинин, Александр; Мукерджи, Бхрамар; Гуань, Юаньфан; Динов, Иво (2019). «Модельные и безмодельные методы диагностики бокового амиотрофического склероза и кластеризации пациентов» . Нейроинформатика . 17 (3): 407–421. DOI : 10.1007 / s12021-018-9406-9 . PMC 6527505 . PMID 30460455 .  
  41. ^ Политис, DN (2019). «Безмодельный вывод в статистике: как и почему» . Бюллетень IMS . 48 .
  42. ^ Bandyopadhyay & Forster (2011). Цитата взята из введения к книге (стр.3). См. Также «Раздел III: Четыре парадигмы статистики».
  43. ^ Нейман Дж (1937). «Очерк теории статистического оценивания на основе классической теории вероятностей» . Философские труды Королевского общества Лондона A . 236 (767): 333–380. Bibcode : 1937RSPTA.236..333N . DOI : 10,1098 / rsta.1937.0005 . JSTOR 91337 . 
  44. ^ Предисловие к Pfanzagl.
  45. Перейти ↑ Little, Roderick J. (2006). «Калиброванный Байесовский кодекс: дорожная карта Байеса / Frequentist». Американский статистик . 60 (3): 213–223. DOI : 10.1198 / 000313006X117837 . ISSN 0003-1305 . JSTOR 27643780 . S2CID 53505632 .   
  46. ^ Суфи (2000)
  47. ^ a b Хансен и Ю (2001)
  48. ^ a b Хансен и Ю (2001), стр. 747.
  49. ^ a b Риссанен (1989), стр. 84
  50. ^ Джозеф Ф. Трауб, GW Васильковский и Х. Возняковский. (1988) [ необходима страница ]
  51. ^ Нейман (1956)
  52. ^ Zabell (1992)
  53. Cox (2006), стр.66
  54. ^ Хампел 2003 .
  55. ^ Дэвисон, страница 12. [ требуется полная ссылка ]
  56. ^ Барнард, Г. А. (1995) "Pivotal Модели и Fiducial Довод", Международный статистический обзор, 63 (3), 309-323. JSTOR  1403482
  57. ^ Broemeling, Лайл Д. (1 ноября 2011). «Отчет о ранних статистических выводах в арабской криптологии». Американский статистик . 65 (4): 255–257. DOI : 10.1198 / tas.2011.10191 . S2CID 123537702 . 

Источники [ править ]

  • Bandyopadhyay, PS; Форстер, М. Р., ред. (2011), Философия статистики , Elsevier.
  • Бикель, Питер Дж .; Доксум, Челл А. (2001). Математическая статистика: основные и избранные темы . 1 (Второе (обновленное издание 2007 г.) изд.). Прентис Холл . ISBN 978-0-13-850363-5. Руководство по ремонту  0443141 .
  • Кокс, Д.Р. (2006). Принципы статистического вывода , Cambridge University Press . ISBN 0-521-68567-2 . 
  • Фишер Р.А. (1955), «Статистические методы и научная индукция», Журнал Королевского статистического общества , серия B , 17, 69–78. (критика статистических теорий Ежи Неймана и Абрахама Вальда )
  • Фридман, Д.А. (2009). Статистические модели: теория и практика (перераб.). Издательство Кембриджского университета . стр. xiv + 442 с. ISBN 978-0-521-74385-3. Руководство по ремонту  2489600 .
  • Фридман, Д.А. (2010). Статистические модели и причинные выводы: диалог с общественными науками (под редакцией Дэвида Коллиера, Джасджита Секхона и Филипа Б. Старка), Cambridge University Press .
  • Хэмпел, Фрэнк (февраль 2003 г.). «Правильный реперный аргумент» (PDF) (Отчет об исследовании № 114) . Проверено 29 марта 2016 года . Cite journal requires |journal= (help)
  • Hansen, Mark H .; Ю, Бин (июнь 2001 г.). «Выбор модели и принцип минимальной длины описания: обзорная статья» . Журнал Американской статистической ассоциации . 96 (454): 746–774. CiteSeerX  10.1.1.43.6581 . DOI : 10.1198 / 016214501753168398 . JSTOR  2670311 . MR  1939352 . S2CID  14460386 . Архивировано из оригинала на 2004-11-16.
  • Хинкельманн, Клаус; Кемпторн, Оскар (2008). Введение в экспериментальный дизайн (второе изд.). Вайли. ISBN 978-0-471-72756-9.
  • Колмогоров, Андрей Н. (1963). «По таблицам случайных чисел». Sankhyā Ser. . 25 : 369–375. Руководство по ремонту  0178484 .Перепечатано как Колмогоров Андрей Н. (1998). «По таблицам случайных чисел». Теоретическая информатика . 207 (2): 387–395. DOI : 10.1016 / S0304-3975 (98) 00075-9 . Руководство по ремонту 1643414 . 
  • Кониси С., Китагава Г. (2008), Информационные критерии и статистическое моделирование , Springer.
  • Краскал, Уильям (декабрь 1988 г.). «Чудеса и статистика: случайное обретение независимости (Послание президента ASA)». Журнал Американской статистической ассоциации . 83 (404): 929–940. DOI : 10.2307 / 2290117 . JSTOR  2290117 .
  • Ле Кам, Люсьен . (1986) Асимптотические методы статистической теории принятия решений , Springer. ISBN 0-387-96307-3 
  • Мур, DS ; Маккейб, врач общей практики; Крейг, BA (2015), Введение в статистическую практику , восьмое издание, Macmillan.
  • Нейман, Ежи (1956). «Примечание к статье сэра Рональда Фишера». Журнал Королевского статистического общества, Series B . 18 (2): 288–294. DOI : 10.1111 / j.2517-6161.1956.tb00236.x . JSTOR  2983716 . (ответ Фишеру 1955 г.)
  • Пирс, CS (1877–1878), «Иллюстрации логики науки» (серия), Popular Science Monthly , тт. 12–13. Соответствующие отдельные документы:
    • (1878 март), "Учение о шансах", Popular Science в месяц , v. 12, выпуск март, стр. 604 -615. Интернет-архив Eprint .
    • (1878 апрель), "Вероятность Induction", Popular Science в месяц , т. 12, стр. 705 -718. Интернет-архив Eprint .
    • (1878 июнь), "Орден природы", Popular Science в месяц , т. 13, стр. 203 -217. Интернет-архив Eprint .
    • (1878 август), "дедукция, индукция и гипотеза", Popular Science в месяц , т. 13, стр. 470 -482. Интернет-архив Eprint .
  • Пирс, CS (1883), «Теория вероятного вывода», « Исследования в области логики» , стр. 126-181 , Little, Brown, and Company. (Перепечатано в 1983 г., издательство John Benjamins Publishing Company , ISBN 90-272-3271-7 ) 
  • Freedman, DA ; Pisani, R .; Purves, RA (1978). Статистика . Нью-Йорк: WW Norton & Company .
  • Пфанцагль, Иоганн; при содействии Р. Хамбёкера (1994). Параметрическая статистическая теория . Берлин: Вальтер де Грюйтер . ISBN 978-3-11-013863-4. Руководство по ремонту  1291393 .
  • Риссанен, Йорма (1989). Стохастическая сложность в статистических исследованиях . Серия по информатике. 15 . Сингапур: World Scientific . ISBN 978-9971-5-0859-3. Руководство по ремонту  1082556 .
  • Софи, Эхсан С. (декабрь 2000 г.). «Основные теоретико-информационные подходы (Виньетки за 2000 год: теория и методы, под ред. Джорджа Каселлы)». Журнал Американской статистической ассоциации . 95 (452): 1349–1353. DOI : 10.1080 / 01621459.2000.10474346 . JSTOR  2669786 . Руководство по ремонту  1825292 . S2CID  120143121 .
  • Трауб, Джозеф Ф .; Васильковски, GW; Возняковский, Х. (1988). Информационная сложность . Академическая пресса. ISBN 978-0-12-697545-1.
  • Забелл, С.Л. (август 1992 г.). "Р. А. Фишер и исходный аргумент" . Статистическая наука . 7 (3): 369–387. DOI : 10,1214 / сс / 1177011233 . JSTOR  2246073 .

Дальнейшее чтение [ править ]

  • Казелла, Г. , Бергер, Р.Л. (2002). Статистический вывод . Duxbury Press. ISBN 0-534-24312-6 
  • Фридман, Д.А. (1991). «Статистические модели и обувная кожа». Социологическая методология . 21 : 291–313. DOI : 10.2307 / 270939 . JSTOR  270939 .
  • Хелд Л., Бове Д.С. (2014). Прикладной статистический вывод - вероятность и Байес (Спрингер).
  • Ленхард, Йоханнес (2006). «Модели и статистический вывод: противоречие между Фишером и Нейманом – Пирсоном» (PDF) . Британский журнал философии науки . 57 : 69–91. DOI : 10.1093 / bjps / axi152 . S2CID  14136146 .
  • Линдли, Д. (1958). «Фидуциальное распределение и теорема Байеса». Журнал Королевского статистического общества, Series B . 20 : 102–7.
  • Ральф, Томас (2014). «Статистический вывод», Клод Дибольт и Майкл Хауперт (ред.), «Справочник по клиометрике (серия справочных материалов Springer)», Берлин / Гейдельберг: Springer. http://www.springerreference.com/docs/html/chapterdbid/372458.html
  • Reid, N .; Кокс, Д.Р. (2014). «О некоторых принципах статистического вывода». Международное статистическое обозрение . 83 (2): 293–308. DOI : 10.1111 / insr.12067 . HDL : 10.1111 / insr.12067 .
  • Янг, Г.А., Смит, Р.Л. (2005). Основы статистического вывода , CUP. ISBN 0-521-83971-8 

Внешние ссылки [ править ]

  • MIT OpenCourseWare : статистический вывод
  • Статистический вывод NPTEL , ссылка на YouTube
  • Статистическая индукция и прогноз