Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В статистике , передискретизации является любой из множества методов , выполнив одно из следующих действий :

  1. Оценка точности выборочной статистики ( медианы , дисперсии , процентили ) с использованием подмножеств доступных данных ( складывание ножей ) или случайное рисование с заменой из набора точек данных ( бутстреппинг )
  2. Обмен метками на точках данных при выполнении тестов значимости ( тесты перестановки , также называемые точными тестами , рандомизационными тестами или повторными рандомизационными тестами)
  3. Проверка моделей с использованием случайных подмножеств (бутстрэппинг, перекрестная проверка )

Bootstrap [ править ]

Лучший пример принципа плагина, метод самозагрузки.

Бутстрапирование представляет собой статистический метод оценки распределения выборки из с оценки путем отбора проб с заменой из исходного образца, чаще всего с целью получения устойчивых оценок стандартных ошибок и доверительных интервалов в качестве параметра популяции , как среднее , медианы , пропорция , коэффициенты коэффициент , коэффициент корреляции или коэффициент регрессии . Это было названо плагин в принципе , [1] , как это метод оценкифункционалов от распределения совокупности путем оценки тех же функционалов при эмпирическом распределении на основе выборки.

Например, [1] при оценке среднего по генеральной совокупности этот метод использует выборочное среднее; для оценки медианы совокупности используется медиана выборки; для оценки линии регрессии населения используется выборочная линия регрессии.

Его также можно использовать для построения тестов гипотез. Он часто используется в качестве надежной альтернативы логическому выводу, основанному на параметрических предположениях, когда эти предположения вызывают сомнения или когда параметрический вывод невозможен или требует очень сложных формул для вычисления стандартных ошибок. Методы начальной загрузки также используются в переходах «обновление-выбор» фильтров частиц , алгоритмах генетического типа и связанных методах повторной выборки / реконфигурации Монте-Карло, используемых в вычислительной физике . [2] [3] В этом контексте бутстрап используется для замены последовательно эмпирических взвешенных вероятностных мер эмпирическими.. Бутстрап позволяет заменять образцы с низким весом копиями образцов с большим весом.

Складной нож [ править ]

Метод складывания ножей, похожий на бутстрэппинг, используется в статистических выводах для оценки систематической ошибки и стандартной ошибки (дисперсии) статистики, когда для ее расчета используется случайная выборка наблюдений. Исторически этот метод предшествовал изобретению бутстрапа, когда Кенуй изобрел этот метод в 1949 году, а Тьюки расширил его в 1958 году. [4] [5] Этот метод был предвосхищен Махаланобисом, который в 1946 году предложил повторные оценки интересующей статистики с половиной меньшего. выборка выбрана случайным образом. [6] Он придумал для этого метода название «взаимопроникающие образцы».

Кенуй изобрел этот метод с целью уменьшения систематической ошибки выборочной оценки. Тьюки расширил этот метод, предположив, что если бы реплики можно было считать идентично и независимо распределенными, то можно было бы сделать оценку дисперсии параметра выборки, и что она будет приблизительно распределена как при вариации с n −1 степенями свободы ( n размер выборки).

Основная идея, лежащая в основе оценки дисперсии складного ножа, заключается в систематическом пересчете статистической оценки, исключая одно или несколько наблюдений за раз из выборки. Из этого нового набора повторений статистики можно рассчитать оценку систематической ошибки и оценку дисперсии статистики.

Вместо использования складного ножа для оценки дисперсии его можно применить к журналу дисперсии. Это преобразование может привести к более точным оценкам, особенно когда распределение самой дисперсии может быть ненормальным.

Для многих статистических параметров оценка дисперсии складным ножом почти наверняка асимптотически стремится к истинному значению. С технической точки зрения можно сказать, что оценка складного ножа согласована . Складного ножа соответствует для выборки средств , образец дисперсии , центральные и нецентральные т-статистики (с , возможно , не-нормальных популяций), образец коэффициент вариации , оценок максимального правдоподобия , Оценщики наименьших квадратов, коэффициенты корреляции и коэффициенты регрессии .

Это не соответствует медиане выборки . В случае унимодальной вариации отношение дисперсии складного ножа к дисперсии выборки имеет тенденцию распределяться как половина квадрата распределения хи-квадрат с двумя степенями свободы .

Складной нож, как и оригинальный бутстрап, зависит от независимости данных. Были предложены удлинители складного ножа, чтобы учесть зависимость в данных.

Другое расширение - это метод удаления группы, используемый в сочетании с пуассоновской выборкой .

Сравнение бутстрапа и складного ножа [ править ]

Оба метода, бутстрап и складной нож, оценивают изменчивость статистики на основе изменчивости этой статистики между подвыборками, а не на основе параметрических допущений. Для более общего складного ножа, складного ножа для наблюдений delete-m, бутстрап можно рассматривать как случайное приближение к нему. Оба дают аналогичные численные результаты, поэтому каждый из них можно рассматривать как приближение к другому. Несмотря на огромные теоретические различия в их математических представлениях, основное практическое отличие для пользователей статистики заключается в том, что бутстрапдает разные результаты при повторении на одних и тех же данных, тогда как складной нож дает каждый раз точно такой же результат. Из-за этого складной нож популярен, когда оценки необходимо проверять несколько раз перед публикацией (например, официальные статистические агентства). С другой стороны, когда эта функция проверки не имеет решающего значения и интересно иметь не число, а просто представление о его распределении, предпочтительнее использовать бутстрап (например, исследования в области физики, экономики, биологических наук).

Использование бутстрапа или складного ножа может больше зависеть от операционных аспектов, чем от статистических соображений обследования. Складной нож, первоначально использовавшийся для уменьшения систематической ошибки, является более специализированным методом и оценивает только дисперсию точечной оценки. Этого может быть достаточно для основных статистических выводов (например, проверки гипотез, доверительных интервалов). С другой стороны, бутстрап сначала оценивает все распределение (точечной оценки), а затем вычисляет отклонение от этого. Несмотря на то, что это мощный и простой способ, он может потребовать больших вычислительных ресурсов.

«Бутстрап может применяться как к задачам оценки дисперсии, так и к задачам распределения. Однако с точки зрения эмпирических результатов оценка дисперсии бутстрапа не так хороша, как складной нож или оценка дисперсии сбалансированной повторной репликации (BRR). обычно требует больше вычислений, чем складной нож или BRR. Таким образом, бутстрап в основном рекомендуется для оценки распределения ». [7]

Особое внимание следует уделять складному ножу, особенно складному ножу для наблюдения delete-1. Его следует использовать только с гладкими, дифференцируемыми статистическими данными (например, с итогами, средними значениями, пропорциями, отношениями, отношениями нечетных чисел, коэффициентами регрессии и т. Д.; Не с медианами или квантилями). Это могло стать практическим недостатком. Этот недостаток обычно является аргументом в пользу самозагрузки, а не складывания. Более общие складные ножи, чем delete-1, такие как складной нож delete-m или оценка Ходжеса – Лемана с удалением всех, кроме 2 , преодолевают эту проблему для медиан и квантилей, ослабляя требования гладкости для согласованной оценки дисперсии.

Обычно складной нож проще применять для сложных схем выборки, чем бутстрап. Сложные схемы выборки могут включать стратификацию, несколько этапов (кластеризацию), различные веса выборки (корректировка неполучения ответов, калибровка, постстратификация) и схемы выборки с неравной вероятностью. Теоретические аспекты как бутстрапа, так и складного ножа можно найти в Shao and Tu (1995), [8], тогда как базовое введение описано в Wolter (2007). [9] Бутстрапная оценка систематической ошибки предсказания модели более точна, чем оценки складного ножа с линейными моделями, такими как линейная дискриминантная функция или множественная регрессия. [10]

Подвыборка [ править ]

Субдискретизация - это альтернативный метод аппроксимации выборочного распределения оценщика. Два ключевых отличия от бутстрапа: (i) размер повторной выборки меньше, чем размер выборки, и (ii) повторная выборка выполняется без замены. Преимущество подвыборки в том, что она действительна в гораздо более слабых условиях по сравнению с бутстрапом. В частности, набор достаточных условий состоит в том, что скорость сходимости оценки известна и что предельное распределение является непрерывным; кроме того, размер повторной выборки (или подвыборки) должен стремиться к бесконечности вместе с размером выборки, но с меньшей скоростью, чтобы их отношение сходилось к нулю. Хотя подвыборка была первоначально предложена только для случая независимых и идентично распределенных (iid) данных, методология была расширена, чтобы охватить также данные временных рядов;в этом случае выполняется повторная выборка блоков последующих данных, а не отдельных точек данных. Есть много случаев, представляющих прикладной интерес, когда подвыборка приводит к правильному выводу, а бутстрэппинг - нет; например, такие случаи включают в себя примеры, когда скорость сходимости оценки не является квадратным корнем из размера выборки или когда ограничивающее распределение не является нормальным. Когда и подвыборка, и бутстрап согласованы, бутстрап обычно более точен.Когда и подвыборка, и бутстрап согласованы, бутстрап обычно более точен.Когда и подвыборка, и бутстрап согласованы, бутстрап обычно более точен.

Перекрестная проверка [ править ]

Перекрестная проверка - это статистический метод проверки прогнозной модели . Подмножества данных предназначены для использования в качестве проверочных наборов; модель соответствует оставшимся данным (обучающему набору) и используется для прогнозирования для проверочного набора. Усреднение качества прогнозов по наборам проверки дает общий показатель точности прогнозирования. Перекрестная проверка многократно используется при построении деревьев решений.

Одна форма перекрестной проверки не учитывает одно наблюдение за раз; это похоже на складной нож . Другая, K- кратная перекрестная проверка, разбивает данные на K подмножеств; каждый проводится по очереди как набор для проверки.

Это позволяет избежать «самовоздействия». Для сравнения, в методах регрессионного анализа, таких как линейная регрессия , каждое значение y рисует линию регрессии к самому себе, делая прогноз этого значения более точным, чем он есть на самом деле. Перекрестная проверка, применяемая к линейной регрессии, позволяет прогнозировать значение y для каждого наблюдения без использования этого наблюдения.

Это часто используется для решения, сколько переменных-предикторов использовать в регрессии. Без перекрестной проверки добавление предикторов всегда уменьшает остаточную сумму квадратов (или, возможно, оставляет ее без изменений). Напротив, перекрестно проверенная среднеквадратическая ошибка будет иметь тенденцию уменьшаться, если добавляются ценные предикторы, но увеличиваться, если добавляются бесполезные предикторы. [11]

Перестановочные тесты [ править ]

Тест перестановки (также называемый тестом рандомизации, тестом повторной рандомизации или точным тестом ) - это тип теста статистической значимости, в котором распределение тестовой статистики при нулевой гипотезе получается путем вычисления всех возможных значений тестовой статистики. при всех возможных перестановках наблюдаемых точек данных. Другими словами, метод, с помощью которого назначается лечение субъектам в экспериментальном дизайне, отражается в анализе этого плана. Если метки можно менять при нулевой гипотезе, то полученные тесты дают точные уровни значимости; см. также возможность обмена. Затем на основе тестов можно определить доверительные интервалы. Теория возникла из работ Рональда Фишера и Э. Дж. Питмана в 1930-х годах.

Чтобы проиллюстрировать основную идею теста перестановки, предположу , что мы собираем случайные величины и для каждого человека из двух групп и чьи образцы средства и , и что мы хотим знать , является ли и из того же распределения. Позвольте и быть размером выборки, взятой из каждой группы. Тест перестановки предназначен для определения того, достаточно ли велика наблюдаемая разница между средними выборками, чтобы отклонить на некотором уровне значимости нулевую гипотезу H о том, что данные, взятые из того же распределения, что и данные, взятые из .

Тест проходит следующим образом. Во- первых, разница в средств между двумя образцами рассчитывается следующим образом : это наблюдаемое значение тестовой статистики, .

Затем наблюдения групп и объединяются, и разница средних значений выборки вычисляется и записывается для всех возможных способов деления объединенных значений на две группы по размеру и (т. Е. Для каждой перестановки групповых меток A и B). Набор этих вычисленных различий является точным распределением возможных различий (для этой выборки) при нулевой гипотезе о том, что метки групп могут быть заменены (т. Е. Назначаются случайным образом).

Одностороннее p-значение теста рассчитывается как доля отобранных перестановок, в которых разница в средних была больше или равна . Двустороннее p-значение теста рассчитывается как доля выбранных перестановок, где абсолютная разница была больше или равна .

В качестве альтернативы, если единственной целью теста является отклонение или не отклонение нулевой гипотезы, можно отсортировать записанные различия, а затем наблюдать, содержится ли в среднем их % для некоторого уровня значимости . Если это не так, мы отвергаем гипотезу об идентичности кривых вероятности на уровне значимости.

Отношение к параметрическим тестам [ править ]

Перестановочные тесты - это подмножество непараметрической статистики . Предполагая, что наши экспериментальные данные получены на основе данных, измеренных в двух группах лечения, метод просто генерирует распределение средних различий в предположении, что две группы не отличаются друг от друга с точки зрения измеряемой переменной. Исходя из этого, затем можно использовать наблюдаемую статистику (см. Выше), чтобы увидеть, в какой степени эта статистика является особенной, т. Е. Вероятность наблюдения величины такого значения (или большего), если бы метки лечения были просто рандомизированы после лечения.

В отличие от тестов на перестановку, распределения, лежащие в основе многих популярных «классических» статистических тестов, таких как t- критерий , F- критерий , z- критерий и критерий χ 2 , получаются из теоретических распределений вероятностей. Точный тест Фишераявляется примером обычно используемого теста перестановки для оценки связи между двумя дихотомическими переменными. Когда размер выборки очень большой, критерий хи-квадрат Пирсона даст точные результаты. Для небольших выборок нельзя предположить, что эталонное распределение хи-квадрат дает правильное описание распределения вероятностей статистики теста, и в этой ситуации использование точного критерия Фишера становится более подходящим.

Перестановочные тесты существуют во многих ситуациях, когда параметрических тестов нет (например, при получении оптимального теста, когда потери пропорциональны размеру ошибки, а не ее квадрату). Все простые и многие относительно сложные параметрические тесты имеют соответствующую версию теста перестановки, которая определяется с использованием той же тестовой статистики, что и параметрический тест, но получает p-значение из распределения перестановок этой статистики для конкретной выборки, а не из теоретического распределение, полученное из параметрического предположения. Например, можно таким образом построить перестановки т -test , перестановка х 2 тестов ассоциации, перестановка версия теста Али для сравнения дисперсий и так далее.

Основные недостатки тестов на перестановку заключаются в том, что они

  • Может потребовать больших вычислительных ресурсов и может потребовать "специального" кода для трудно вычисляемой статистики. Это нужно переписывать для каждого случая.
  • В основном используются для определения p-значения. Инверсия теста для получения доверительных областей / интервалов требует еще большего количества вычислений.

Преимущества [ править ]

Перестановочные тесты существуют для любой тестовой статистики, независимо от того, известно ли ее распределение. Таким образом, всегда можно выбрать статистику, которая лучше всего различает гипотезу от альтернативы и минимизирует потери.

Перестановочные тесты могут использоваться для анализа несбалансированных планов [12] и для комбинирования зависимых тестов на смесях категориальных, порядковых и метрических данных (Pesarin, 2001) [ необходима цитата ] . Их также можно использовать для анализа качественных данных, которые были подвергнуты количественной оценке (т. Е. Преобразованы в числа). Перестановочные тесты могут быть идеальными для анализа количественных данных, которые не удовлетворяют статистическим предположениям, лежащим в основе традиционных параметрических тестов (например, t-тесты, ANOVA). [13]

До 1980-х годов бремя создания эталонного распределения было непосильным, за исключением наборов данных с небольшими размерами выборки.

С 1980-х годов сочетание относительно недорогих быстрых компьютеров и разработка новых сложных алгоритмов пути, применимых в особых ситуациях, сделало применение методов проверки перестановок практичным для широкого круга задач. Он также инициировал добавление опций точного тестирования в основные пакеты статистического программного обеспечения и появление специализированного программного обеспечения для выполнения широкого диапазона точных тестов с одним и несколькими переменными и вычисления «точных» доверительных интервалов на основе тестов.

Ограничения [ править ]

Важное предположение, лежащее в основе проверки перестановки, заключается в том, что наблюдения можно обменивать при нулевой гипотезе. Важным следствием этого предположения является то, что тесты на различие в местоположении (например, t-тест перестановки) требуют одинаковой дисперсии в предположении нормальности. В этом отношении t-критерий перестановки имеет ту же слабость, что и классический t-критерий Стьюдента ( проблема Беренса – Фишера ). Третья альтернатива в этой ситуации - использовать тест на основе начальной загрузки. Хорошо (2005) [ необходима цитата ]объясняет разницу между тестами перестановки и тестами начальной загрузки следующим образом: «Перестановки проверяют гипотезы, касающиеся распределений; гипотезы начальной загрузки, касающиеся параметров. В результате, бутстрап влечет за собой менее строгие предположения». Тесты начальной загрузки неточны. В некоторых случаях проверка перестановки, основанная на должным образом стьюдентизированной статистике, может быть асимптотически точной, даже когда нарушается предположение об обмене. [14]

Тестирование Монте-Карло [ править ]

Асимптотически эквивалентный тест перестановки может быть создан, когда существует слишком много возможных порядков данных, чтобы обеспечить полное перечисление удобным способом. Это делается путем создания эталонного распределения с помощью выборки Монте-Карло , которая берет небольшую (по отношению к общему количеству перестановок) случайную выборку возможных повторов. Осознание того, что это можно применить к любому тесту на перестановку в любом наборе данных, стало важным прорывом в области прикладной статистики. Самая ранняя известная ссылка на этот подход - это Dwass (1957). [15] Этот тип теста перестановки известен под разными названиями: приблизительный тест перестановок , тесты подстановок Монта - Карло илитесты на случайную перестановку . [16]

После случайных перестановок можно получить доверительный интервал для значения p на основе биномиального распределения. Например, если после случайных перестановок значение p оценивается как равное , то 99% доверительный интервал для истинного (тот, который был бы результатом попытки всех возможных перестановок) равен .

С другой стороны, цель оценки p-значения чаще всего состоит в том , чтобы решить , где это порог, при котором нулевая гипотеза будет отклонена (обычно ). В приведенном выше примере доверительный интервал говорит нам только о том, что существует примерно 50% -ная вероятность того, что значение p меньше 0,05, то есть совершенно неясно, следует ли отклонять нулевую гипотезу на каком-либо уровне .

Если важно только знать, является ли данное утверждение, логично продолжать моделирование до тех пор, пока утверждение не будет установлено как истинное или ложное с очень низкой вероятностью ошибки. Учитывая предел допустимой вероятности ошибки (вероятность обнаружить, что когда на самом деле или наоборот), вопрос о том, сколько перестановок нужно сгенерировать, можно рассматривать как вопрос о том, когда прекратить генерировать перестановки, исходя из результатов моделирования, чтобы гарантировать, что вывод (который является либо или ) верен с вероятностью, по крайней мере, такой же большой, как . ( обычно выбирается очень маленьким, например 1/1000.) Правила остановки для достижения этого были разработаны[17], которые могут быть включены с минимальными дополнительными вычислительными затратами. Фактически, в зависимости от истинного лежащего в основе p-значения часто обнаруживается, что количество требуемых имитаций чрезвычайно мало (например, всего 5, а часто не больше 100), прежде чем решение может быть принято с виртуальной достоверностью.

См. Также [ править ]

  • Агрегирование бутстрапа (упаковка)
  • Генетические алгоритмы
  • Методы Монте-Карло
  • Непараметрическая статистика
  • Фильтр твердых частиц
  • Случайная перестановка
  • Тестирование суррогатных данных

Ссылки [ править ]

  1. ^ а б Логан, Дж. Дэвид и Волесенский, Виллиан Р. Математические методы в биологии. Чистая и прикладная математика: серия текстов, монографий и трактатов Wiley-interscience. John Wiley & Sons, Inc. 2009. Глава 6: Статистический вывод. Раздел 6.6: Методы начальной загрузки
  2. ^ Дель Мораль, Пьер (2004). Формулы Фейнмана-Каца. Генеалогические и взаимодействующие приближения частиц . Springer. п. 575. Серия: Вероятность и приложения.
  3. ^ Дель Мораль, Пьер (2013). Моделирование среднего поля для интеграции Монте-Карло . Чепмен и Холл / CRC Press. п. 626. Монографии по статистике и прикладной теории вероятностей.
  4. ^ Quenouille, MH (1949). «Приближенные тесты корреляции во временных рядах». Журнал Королевского статистического общества, Series B . 11 (1): 68–84. DOI : 10.1111 / j.2517-6161.1949.tb00023.x . JSTOR 2983696 . 
  5. ^ Тьюки, JW (1958). «Предвзятость и уверенность в не очень больших выборках (предварительный отчет)». Анналы математической статистики . 29 (2): 614. JSTOR 2237363 . 
  6. ^ Махаланобиса, PC (1946). «Труды собрания Королевского статистического общества, состоявшегося 16 июля 1946 года». Журнал Королевского статистического общества . 109 (4): 325–370. JSTOR 2981330 . 
  7. Перейти ↑ Shao, J. and Tu, D. (1995). Складной нож и бутстрап. Springer-Verlag, Inc., с. 281.
  8. ^ Shao, J .; Ту, Д. (1995). Складной нож и бутстрап . Springer.
  9. ^ Вольтер, К. (2007). Введение в оценку дисперсии (второе изд.). Springer.
  10. ^ Verbyla, D .; Литвайтис, Дж. (1989). «Методы повторной выборки для оценки точности классификации моделей среды обитания диких животных». Экологический менеджмент . 13 (6): 783–787. Bibcode : 1989EnMan..13..783V . DOI : 10.1007 / bf01868317 . S2CID 153448048 . 
  11. ^ Verbyla, D. (1986). «Возможная ошибка прогноза в регрессионном и дискриминантном анализе». Канадский журнал исследований леса . 16 (6): 1255–1257. DOI : 10.1139 / x86-222 .
  12. ^ "Приглашенные статьи" (PDF) . Журнал современных прикладных статистических методов . 1 (2): 202–522. Осень 2011. Архивировано из оригинального (PDF) 5 мая 2003 года.
  13. ^ Collingridge, Dave S. (11 сентября 2012). «Учебник по количественному анализу данных и перестановочному тестированию». Журнал смешанных методов исследования . 7 (1): 81–97. DOI : 10.1177 / 1558689812454457 . S2CID 124618343 . 
  14. ^ Чанг, EY; Романо, JP. «Точные и асимптотически устойчивые перестановочные тесты» . Летопись статистики . 41 : 487–507. DOI : 10.1214 / 13-AOS1090 .
  15. ^ Dwass, Meyer (1957). «Модифицированные критерии рандомизации для непараметрических гипотез» . Анналы математической статистики . 28 (1): 181–187. DOI : 10.1214 / АОМ / 1177707045 . JSTOR 2237031 . 
  16. ^ Томас Э. Николс , Эндрю П. Холмс (2001). «Непараметрические тесты перестановки для функциональной нейровизуализации: учебник с примерами» (PDF) . Картирование человеческого мозга . 15 (1): 1–25. DOI : 10.1002 / hbm.1058 . ЛВП : 2027,42 / 35194 . PMC 6871862 . PMID 11747097 .   
  17. ^ Gandy, Аксель (2009). «Последовательная реализация тестов Монте-Карло с равномерно ограниченным риском передискретизации». Журнал Американской статистической ассоциации . 104 (488): 1504–1511. arXiv : математика / 0612488 . DOI : 10,1198 / jasa.2009.tm08368 . S2CID 15935787 . 
  • Хорошо, Филипп (2005), Перестановка, параметрические и бутстрап-тесты гипотез (3-е изд.), Springer

Библиография [ править ]

Вводная статистика [ править ]

  • Гуд П. (2005) Введение в статистику с помощью методов передискретизации и R / S-PLUS . Вайли. ISBN 0-471-71575-1 
  • Гуд П. (2005) Введение в статистику с помощью методов передискретизации и Microsoft Office Excel . Вайли. ISBN 0-471-73191-9 
  • Хестерберг, Т.С., Д.С. Мур, С. Монаган, А. Клипсон и Р. Эпштейн (2005). Методы начальной загрузки и тесты перестановок . [ требуется полная цитата ]
  • Вольтер, К.М. (2007). Введение в оценку дисперсии . Второе издание. Springer, Inc.

Bootstrap [ править ]

  • Эфрон, Брэдли (1979). «Методы начальной загрузки: еще один взгляд на складной нож» . Летопись статистики . 7 : 1–26. DOI : 10.1214 / aos / 1176344552 .
  • Эфрон, Брэдли (1981). «Непараметрические оценки стандартной ошибки: складной нож, бутстрап и другие методы». Биометрика . 68 (3): 589–599. DOI : 10.2307 / 2335441 . JSTOR  2335441 .
  • Эфрон, Брэдли (1982). Складной нож, бутстрап и другие планы повторной выборки , In Society of Industrial and Applied Mathematics CBMS-NSF Monographs , 38.
  • Diaconis, P .; Эфрон, Брэдли (1983), "Компьютерные методы в статистике", Scientific American , май, 116–130.
  • Эфрон, Брэдли ; Тибширани, Роберт Дж. (1993). Введение в программу начальной загрузки , New York: Chapman & Hall , программное обеспечение .
  • Дэвисон, AC и Хинкли, Д.В. (1997): методы начальной загрузки и их применение, программное обеспечение .
  • Муни, Ч.З. и Дюваль, Р.Д. (1993). Самостоятельная загрузка. Непараметрический подход к статистическому выводу. Серия работ Университета Сейдж о количественных приложениях в социальных науках, 07-095. Ньюбери-Парк, Калифорния: Сейдж .
  • Саймон, Дж. Л. (1997): Передискретизация: Новая статистика .
  • Райт, Д. Б., Лондон, К., Филд, А. П. Использование начальной загрузки и принцип подключаемого модуля для данных клинической психологии. 2011 Textrum Ltd. Интернет: https://www.researchgate.net/publication/236647074_Using_Bootstrap_Estimation_and_the_Plug-in_Principle_for_Clinical_Psychology_Data . Проверено 25 апреля 2016 г.
  • Введение в Bootstrap. Монографии по статистике и прикладной вероятности 57. Chapman & Hall / CHC. 1998. Интернет https://books.google.it/books?id=gLlpIUxRntoC&pg=PA35&lpg=PA35&dq=plug+in+principle&source=bl&ots=A8AsW5K6E2&sig=7WQVzL3ujAnWC8HDNyOzKlKVX0k&hl=en&sa=X&sqi=2&ved=0ahUKEwiU5c-Ho6XMAhUaOsAKHS_PDJMQ6AEIPDAG#v=onepage&q=plug % 20in% 20principle & f = false . Проверено 25 апреля 2016.

Складной нож [ править ]

  • Бергер, Ю.Г. (2007). «Оценка дисперсии складного ножа для одноэтапных стратифицированных выборок с неравными вероятностями». Биометрика . 94 (4): 953–964. DOI : 10.1093 / Biomet / asm072 .
  • Бергер, Ю. Г.; Рао, JNK (2006). «Отрегулированный складной нож для вменения при неравновероятной выборке без замены». Журнал Королевского статистического общества, Series B . 68 (3): 531–547. DOI : 10.1111 / j.1467-9868.2006.00555.x .
  • Бергер, Ю. Г.; Скиннер, CJ (2005). «Оценщик отклонения складного ножа для неравной вероятностной выборки». Журнал Королевского статистического общества, Series B . 67 (1): 79–89. DOI : 10.1111 / j.1467-9868.2005.00489.x .
  • Jiang, J .; Lahiri, P .; Ван, С.М. (2002). «Единая теория складного ножа для эмпирического наилучшего прогноза с M-оценкой» . Летопись статистики . 30 (6): 1782–810. DOI : 10.1214 / AOS / 1043351257 .
  • Джонс, HL (1974). «Складной метод оценки функций слоевых средств». Биометрика . 61 (2): 343–348. DOI : 10.2307 / 2334363 . JSTOR  2334363 .
  • Киш, Л .; Франкель, MR (1974). «Вывод из сложных образцов». Журнал Королевского статистического общества, Series B . 36 (1): 1–37.
  • Krewski, D .; Рао, JNK (1981). «Вывод из стратифицированных образцов: свойства линеаризации, складной нож и сбалансированные методы повторной репликации» . Летопись статистики . 9 (5): 1010–1019. DOI : 10.1214 / AOS / 1176345580 .
  • Кенуй, MH (1956). «Заметки о предвзятости в оценке». Биометрика . 43 (3–4): 353–360. DOI : 10.1093 / Biomet / 43.3-4.353 .
  • Рао, JNK; Шао, Дж. (1992). «Оценка дисперсии складного ножа с данными обследования при условном исчислении горячей палубы». Биометрика . 79 (4): 811–822. DOI : 10.1093 / Biomet / 79.4.811 .
  • Рао, JNK; Wu, CFJ; Юэ, К. (1992). «Некоторые недавние работы по методам повторной выборки для сложных опросов». Методология исследования . 18 (2): 209–217.
  • Шао, Дж. И Ту, Д. (1995). Складной нож и бутстрап. Springer-Verlag, Inc.
  • Тьюки, JW (1958). «Предвзятость и уверенность в не очень больших выборках (аннотация)». Летопись математической статистики . 29 (2): 614.
  • Ву, CFJ (1986). «Jackknife, Bootstrap и другие методы передискретизации в регрессионном анализе» (PDF) . Летопись статистики . 14 (4): 1261–1295. DOI : 10.1214 / AOS / 1176350142 .

Подвыборка [ править ]

  • Delgado, M .; Rodriguez-Poo, J .; Вольф, М. (2001). «Вывод субдискретизации в асимптотике кубического корня с приложением к оценщику максимального балла Мански». Письма по экономике . 73 (2): 241–250. DOI : 10.1016 / s0165-1765 (01) 00494-3 . ЛВП : 10016/2449 .
  • Gonzalo, J .; Вольф, М. (2005). «Вывод субдискретизации в пороговых авторегрессионных моделях». Журнал эконометрики . 127 (2): 201–224. DOI : 10.1016 / j.jeconom.2004.08.004 . ЛВП : 10016/3218 .
  • Политис, ДН; Романо, JP (1994). «Доверительные области для большой выборки, основанные на подвыборках при минимальных предположениях» . Летопись статистики . 22 (4): 2031–2050. DOI : 10.1214 / AOS / 1176325770 .
  • Политис, ДН; Романо, JP; Вольф, М. (1997). «Подвыборка для гетероскедастических временных рядов». Журнал эконометрики . 81 (2): 281–317. DOI : 10.1016 / s0304-4076 (97) 86569-4 .
  • Политис, Д. Н., Романо, Дж. П., и Вольф, М. (1999). Подвыборка . Спрингер, Нью-Йорк.
  • Романо, JP; Вольф, М. (2001). «Интервалы субдискретизации в моделях авторегрессии с линейным временным трендом». Econometrica . 69 (5): 1283–1314. DOI : 10.1111 / 1468-0262.00242 . ЛВП : 10016/6400 .

Методы Монте-Карло [ править ]

  • Джордж С. Фишман (1995). Монте-Карло: концепции, алгоритмы и приложения , Спрингер, Нью-Йорк. ISBN 0-387-94527-X . 
  • Джеймс Э. Джентл (2009). Вычислительная статистика , Спрингер, Нью-Йорк. Часть III: Методы вычислительной статистики. ISBN 978-0-387-98143-7 . 
  • Пьер Дель Мораль (2004). Формулы Фейнмана-Каца. Генеалогические и взаимодействующие системы частиц с приложениями, Springer, вероятностные серии и приложения. ISBN 978-0-387-20268-6 
  • Пьер Дель Мораль (2013). Дель Мораль, Пьер (2013). Моделирование среднего поля для интеграции Монте-Карло . Chapman & Hall / CRC Press, Монографии по статистике и прикладной вероятности. ISBN 9781466504059 
  • Дирк П. Крезе, Томас Таймре и Здравко И. Ботев. Справочник по методам Монте-Карло , John Wiley & Sons, Нью-Йорк. ISBN 978-0-470-17793-8 . 
  • Кристиан П. Роберт и Джордж Казелла (2004). Статистические методы Монте-Карло , второе издание, Спрингер, Нью-Йорк. ISBN 0-387-21239-6 . 
  • Шломо Савиловски и Гейл Фахум (2003). Статистика с помощью моделирования Монте-Карло с помощью Fortran. Рочестер-Хиллз, Мичиган: JMASM. ISBN 0-9740236-0-4 . 

Перестановочные тесты [ править ]

Исходные ссылки:

  • Фишер, Р. А. (1935) План экспериментов , Нью-Йорк: Хафнер
  • Pitman, EJG (1937) «Тесты значимости, которые могут быть применены к выборкам из любой популяции», Дополнение Королевского статистического общества , 4: 119-130 и 225-32 (части I и II). JSTOR  2984124 JSTOR  2983647
  • Питман, EJG (1938). «Тесты значимости, которые могут применяться к выборкам из любой популяции. Часть III. Тест дисперсионного анализа». Биометрика . 29 (3–4): 322–335. DOI : 10.1093 / Biomet / 29.3-4.322 .

Современные ссылки:

  • Коллингридж, Д.С. (2013). «Учебник по количественному анализу данных и перестановочному тестированию». Журнал смешанных методов исследования . 7 (1): 79–95. DOI : 10.1177 / 1558689812454457 . S2CID  124618343 .
  • Эджингтон. ES (1995) Рандомизационные тесты , 3-е изд. Нью-Йорк: Марсель-Деккер
  • Хорошо, Филипп I. (2005) Перестановка, параметрические и бутстрап-тесты гипотез , 3-е изд., Springer ISBN 0-387-98898-X 
  • Хорошо, П (2002). «Расширения концепции взаимозаменяемости и их приложения» . Журнал современных прикладных статистических методов . 1 (2): 243–247. DOI : 10.22237 / jmasm / 1036110240 .
  • Луннеборг, Клифф. (1999) Анализ данных путем повторной выборки , Duxbury Press. ISBN 0-534-22110-6 . 
  • Пезарин, Ф. (2001). Многофакторные перестановочные тесты: с приложениями в биостатистике , John Wiley & Sons . ISBN 978-0471496700 
  • Уэлч, WJ (1990). «Построение перестановочных тестов». Журнал Американской статистической ассоциации . 85 (411): 693–698. DOI : 10.1080 / 01621459.1990.10474929 .

Вычислительные методы:

  • Mehta, CR; Патель, Н.Р. (1983). «Сетевой алгоритм для выполнения точного теста Фишера в таблицах непредвиденных обстоятельств rxc». Журнал Американской статистической ассоциации . 78 (382): 427–434. DOI : 10.1080 / 01621459.1983.10477989 .
  • Mehta, CR; Patel, NR; Сенчаудхури, П. (1988). «Выборка по важности для оценки точных вероятностей перестановочного вывода». Журнал Американской статистической ассоциации . 83 (404): 999–1005. DOI : 10.1080 / 01621459.1988.10478691 .
  • Гилл, PMW (2007). «Эффективное вычисление p-значений в тестах значимости перестановок линейной статистики» (PDF) . Журнал статистических вычислений и моделирования . 77 (1): 55–61. CiteSeerX  10.1.1.708.1957 . DOI : 10.1080 / 10629360500108053 . S2CID  1813706 .

Методы передискретизации [ править ]

  • Хорошо, П. (2006) Методы передискретизации . 3-е изд. Бирхаузер.
  • Вольтер, К.М. (2007). Введение в оценку дисперсии . 2-е издание. Springer, Inc.
  • Пьер Дель Мораль (2004). Формулы Фейнмана-Каца. Генеалогические и взаимодействующие системы частиц с приложениями, Springer, вероятностные серии и приложения. ISBN 978-0-387-20268-6 
  • Пьер Дель Мораль (2013). Дель Мораль, Пьер (2013). Моделирование среднего поля для интеграции Монте-Карло . Chapman & Hall / CRC Press, Монографии по статистике и прикладной вероятности. ISBN 9781466504059 

Внешние ссылки [ править ]

Текущие исследования тестов на перестановку [ править ]

  • Good, PI (2012) Практическое руководство по методам повторной выборки.
  • Хорошо, PI (2005) Перестановочные, параметрические и бутстрап-тесты гипотез
  • Учебник Bootstrap Sampling
  • Хестерберг, Т.С., Д.С. Мур, С. Монаган, А. Клипсон и Р. Эпштейн (2005): методы начальной загрузки и тесты перестановок , программное обеспечение .
  • Мур, Д.С., Дж. Маккейб, У. Дакворт и С. Склов (2003): методы начальной загрузки и перестановочные тесты
  • Саймон, Дж. Л. (1997): Передискретизация: Новая статистика .
  • Ю, Чонг Хо (2003): Методы передискретизации: концепции, приложения и обоснование. Практическая оценка, исследования и оценка, 8 (19) . (статистическая загрузка)
  • Передискретизация: брак компьютеров и статистики (дайджесты ERIC)

Программное обеспечение [ править ]

  • Анджело Канти и Брайан Рипли (2010). boot : Функции Bootstrap R (S-Plus). Пакет R версии 1.2-43. Функции и наборы данных для начальной загрузки из книги « Методы начальной загрузки и их приложения» А. С. Дэвисона и Д. В. Хинкли (1997, CUP).
  • Statistics101: Resampling, Bootstrap, программа моделирования Монте-Карло
  • Пакет R `samplingVarEst ': оценка дисперсии выборки. Реализует функции для оценки дисперсии выборки некоторых точечных оценщиков.
  • Парный тест рандомизации / перестановки для оценки результатов TREC
  • Тесты рандомизации / перестановки для оценки результатов в экспериментах по поиску информации (с поправками на множественные сравнения и без них).
  • Проверка множественных гипотез на основе повторной выборки биокондукторов с помощью Applications to Genomics.
  • permtest: пакет R для сравнения изменчивости внутри и расстояния между двумя группами в наборе данных микрочипа.
  • Bootstrap Resampling: интерактивная демонстрация проверки гипотез с начальной загрузкой в ​​R.
  • Проверка перестановки: интерактивная демонстрация проверки гипотез с проверкой перестановки в R.