Из Википедии, бесплатной энциклопедии
  (Перенаправлен из теста рандомизации )
Перейти к навигации Перейти к поиску

В статистике , передискретизации является любой из множества методов , выполнив одно из следующих действий :

  1. Оценка точности выборочной статистики ( медианы , дисперсии , процентили ) с использованием подмножеств доступных данных ( складывание ножей ) или случайное рисование с заменой из набора точек данных ( бутстреппинг )
  2. Обмен метками на точках данных при выполнении тестов значимости ( тесты перестановки , также называемые точными тестами , рандомизационными тестами или повторными рандомизационными тестами)
  3. Проверка моделей с использованием случайных подмножеств (бутстрэппинг, перекрестная проверка )

Bootstrap [ править ]

Лучший пример принципа плагина - метод самозагрузки.

Бутстрапирование представляет собой статистический метод оценки распределения выборки из с оценки путем отбора проб с заменой из исходного образца, чаще всего с целью получения устойчивых оценок стандартных ошибок и доверительных интервалов в качестве параметра популяции , как среднее , медианы , пропорция , коэффициенты коэффициент , коэффициент корреляции или коэффициент регрессии . Это было названо плагин в принципе , [1] , как это метод оценкифункционалов от распределения совокупности путем оценки тех же функционалов при эмпирическом распределении на основе выборки.

Например, [1] при оценке среднего по генеральной совокупности этот метод использует выборочное среднее; для оценки медианы совокупности используется медиана выборки; для оценки линии регрессии населения используется выборочная линия регрессии.

Его также можно использовать для построения тестов гипотез. Он часто используется в качестве надежной альтернативы логическому выводу, основанному на параметрических предположениях, когда эти предположения вызывают сомнения, или когда параметрический вывод невозможен или требует очень сложных формул для вычисления стандартных ошибок. Методы начальной загрузки также используются в переходах обновления-выбора фильтров частиц , алгоритмов генетического типа и связанных с ними методов Монте-Карло повторной выборки / реконфигурации, используемых в вычислительной физике . [2] [3] В этом контексте бутстрап используется для замены последовательно эмпирических взвешенных вероятностных мер эмпирическими.. Бутстрап позволяет заменять образцы с низким весом копиями образцов с большим весом.

Складной нож [ править ]

Метод складывания, который похож на бутстреппинг, используется в статистических выводах для оценки систематической ошибки и стандартной ошибки (дисперсии) статистики, когда для ее расчета используется случайная выборка наблюдений. Исторически этот метод предшествовал изобретению бутстрапа. Кенуй изобрел этот метод в 1949 году, а Тьюки расширил его в 1958 году. [4] [5] Этот метод был предвосхищен Махаланобисом, который в 1946 году предложил повторные оценки интересующей статистики с половиной меньшего. выборка выбрана случайным образом. [6] Он придумал для этого метода название «взаимопроникающие образцы».

Кенуй изобрел этот метод с целью уменьшения систематической ошибки выборочной оценки. Тьюки расширил этот метод, предположив, что если бы реплики можно было считать идентично и независимо распределенными, то можно было бы сделать оценку дисперсии параметра выборки и что она будет приблизительно распределена как при вариации с n −1 степенями свободы ( n размер выборки).

Основная идея оценщика дисперсии складного ножа заключается в систематическом пересчете статистической оценки, исключая одно или несколько наблюдений за раз из выборки. Из этого нового набора повторений статистики можно вычислить оценку систематической ошибки и оценку дисперсии статистики.

Вместо использования складного ножа для оценки дисперсии, его можно применить к журналу дисперсии. Это преобразование может привести к более точным оценкам, особенно когда распределение самой дисперсии может быть ненормальным.

Для многих статистических параметров оценка дисперсии складным ножом почти наверняка асимптотически стремится к истинному значению. С технической точки зрения можно сказать, что оценка складного ножа согласована . Складного ножа соответствует для выборки средств , образец дисперсии , центральные и нецентральные т-статистики (с , возможно , не-нормальных популяций), образец коэффициент вариации , оценок максимального правдоподобия , Оценщики наименьших квадратов, коэффициенты корреляции и коэффициенты регрессии .

Это не соответствует медиане выборки . В случае унимодальной вариации отношение дисперсии складного ножа к дисперсии выборки имеет тенденцию распределяться как половина квадрата распределения хи-квадрат с двумя степенями свободы .

Складной нож, как и оригинальный бутстрап, зависит от независимости данных. Были предложены удлинители складного ножа для учета зависимости в данных.

Другое расширение - метод удаления группы, используемый в сочетании с пуассоновской выборкой .

Сравнение бутстрапа и складного ножа [ править ]

Оба метода, бутстрап и складной нож, оценивают изменчивость статистики по изменчивости этой статистики между подвыборками, а не по параметрическим предположениям. Для более общего складного ножа, складного ножа для наблюдений delete-m, бутстрап можно рассматривать как случайное приближение к нему. Оба дают аналогичные численные результаты, поэтому каждый из них может рассматриваться как приближение к другому. Несмотря на огромные теоретические различия в их математических представлениях, главное практическое отличие для пользователей статистики заключается в том, что бутстрапдает разные результаты при повторении на одних и тех же данных, тогда как складной нож дает каждый раз точно такой же результат. Из-за этого складной нож популярен, когда оценки нужно проверять несколько раз перед публикацией (например, официальные статистические агентства). С другой стороны, когда эта функция проверки не имеет решающего значения и интересно иметь не число, а просто представление о его распределении, предпочтительнее использовать бутстрап (например, исследования в области физики, экономики, биологических наук).

Использование бутстрапа или складного ножа может больше зависеть от операционных аспектов, чем от статистических соображений опроса. Складной нож, первоначально использовавшийся для уменьшения систематической ошибки, представляет собой более специализированный метод, который оценивает только дисперсию точечной оценки. Этого может быть достаточно для базовых статистических выводов (например, проверки гипотез, доверительных интервалов). С другой стороны, бутстрап сначала оценивает все распределение (точечной оценки), а затем вычисляет отклонение от этого. Несмотря на то, что это мощно и просто, это может потребовать больших вычислительных ресурсов.

«Бутстрап может применяться как к задачам оценки дисперсии, так и к задачам оценки распределения. Однако с точки зрения эмпирических результатов оценка дисперсии начальной загрузки не так хороша, как складной нож или оценка дисперсии сбалансированной повторной репликации (BRR). Кроме того, бутстраповская оценка дисперсии обычно требует больше вычислений, чем складной нож или BRR. Таким образом, бутстрап в основном рекомендуется для оценки распределения ». [7]

Особое внимание уделяется складному ножу, особенно складному ножу для наблюдения delete-1. Его следует использовать только с гладкой дифференцируемой статистикой (например, итоговыми значениями, средними значениями, пропорциями, отношениями, отношениями нечетных чисел, коэффициентами регрессии и т. Д.; Не с медианами или квантилями). Это могло стать практическим недостатком. Этот недостаток обычно является аргументом в пользу самозагрузки, а не складывания. Более общие складные ножи, чем delete-1, такие как складной нож delete-m или оценка Ходжеса – Лемана с удалением всех, кроме 2 , решают эту проблему для медиан и квантилей, ослабляя требования гладкости для согласованной оценки дисперсии.

Обычно складной нож проще применять для сложных схем выборки, чем бутстрап. Сложные схемы выборки могут включать стратификацию, несколько этапов (кластеризацию), различные веса выборки (корректировка неполучения ответов, калибровка, пост-стратификация) и схемы выборки с неравной вероятностью. Теоретические аспекты как бутстрапа, так и складного ножа можно найти в Shao and Tu (1995), [8], тогда как базовое введение описано в Wolter (2007). [9] Бутстрапная оценка систематической ошибки предсказания модели более точна, чем оценки складного ножа с линейными моделями, такими как линейная дискриминантная функция или множественная регрессия. [10]

Подвыборка [ править ]

Субдискретизация - это альтернативный метод аппроксимации распределения выборки оценщика. Два ключевых отличия от бутстрапа: (i) размер повторной выборки меньше размера выборки и (ii) повторная выборка выполняется без замены. Преимущество подвыборки в том, что она действительна в гораздо более слабых условиях по сравнению с бутстрапом. В частности, набор достаточных условий состоит в том, что скорость сходимости оценки известна и что предельное распределение является непрерывным; кроме того, размер повторной выборки (или подвыборки) должен стремиться к бесконечности вместе с размером выборки, но с меньшей скоростью, чтобы их отношение сходилось к нулю. Хотя подвыборка была первоначально предложена только для случая независимых и идентично распределенных (iid) данных, методология была расширена, чтобы охватить также данные временных рядов;в этом случае выполняется повторная выборка блоков последующих данных, а не отдельных точек данных. Есть много случаев, представляющих прикладной интерес, когда подвыборка приводит к правильному выводу, тогда как бутстрэппинг - нет; например, такие случаи включают примеры, когда скорость сходимости оценки не является квадратным корнем из размера выборки или когда предельное распределение не является нормальным. Когда подвыборка и бутстрап согласованы, бутстрап обычно более точен.Когда подвыборка и бутстрап согласованы, бутстрап обычно более точен.Когда подвыборка и бутстрап согласованы, бутстрап обычно более точен.

Перекрестная проверка [ править ]

Перекрестная проверка - это статистический метод проверки прогнозной модели . Подмножества данных предназначены для использования в качестве проверочных наборов; модель соответствует оставшимся данным (обучающий набор) и используется для прогнозирования для набора проверки. Усреднение качества прогнозов по наборам проверки дает общий показатель точности прогнозирования. Перекрестная проверка многократно используется при построении деревьев решений.

Одна форма перекрестной проверки не учитывает одно наблюдение за раз; это похоже на складной нож . Другая, K- кратная перекрестная проверка, разбивает данные на K подмножеств; каждый проводится по очереди как набор для проверки.

Это позволяет избежать «самовоздействия». Для сравнения, в методах регрессионного анализа, таких как линейная регрессия , каждое значение y рисует линию регрессии к себе, делая прогноз этого значения более точным, чем он есть на самом деле. Перекрестная проверка, применяемая к линейной регрессии, позволяет прогнозировать значение y для каждого наблюдения без использования этого наблюдения.

Это часто используется для решения, сколько переменных-предикторов использовать в регрессии. Без перекрестной проверки добавление предикторов всегда уменьшает остаточную сумму квадратов (или, возможно, оставляет ее без изменений). Напротив, перекрестно проверенная среднеквадратичная ошибка будет иметь тенденцию уменьшаться, если добавляются ценные предикторы, но увеличиваться, если добавляются бесполезные предикторы. [11]

Перестановочные тесты [ править ]

Тест перестановки (также называемый тестом рандомизации, тестом повторной рандомизации или точным тестом ) - это тип теста статистической значимости, в котором распределение тестовой статистики при нулевой гипотезе получается путем вычисления всех возможных значений тестовой статистики. при всех возможных перестановках наблюдаемых точек данных. Другими словами, метод, с помощью которого назначается лечение субъектам в экспериментальном дизайне, отражается в анализе этого плана. Если метки можно менять при нулевой гипотезе, то полученные тесты дают точные уровни значимости; см. также возможность обмена. Затем на основе тестов можно получить доверительные интервалы. Эта теория возникла из работ Рональда Фишера и Э. Дж. Питмана в 1930-х годах.

Чтобы проиллюстрировать основную идею теста перестановки, предположу , что мы собираем случайные величины и для каждого человека из двух групп и чьи образцы средства и , и что мы хотим знать , является ли и из того же распределения. Позвольте и быть размером выборки, взятой из каждой группы. Тест перестановки разработан, чтобы определить, достаточно ли велика наблюдаемая разница между средними выборками, чтобы отклонить на некотором уровне значимости нулевую гипотезу H о том, что данные взяты из того же распределения, что и данные, взятые из .

Тест проходит следующим образом. Во- первых, разница в средств между двумя образцами рассчитывается следующим образом : это наблюдаемое значение тестовой статистики, .

Затем наблюдения групп и объединяются, и разница в средних значениях выборки вычисляется и записывается для всех возможных способов деления объединенных значений на две группы по размеру и (то есть для каждой перестановки групповых меток A и B). Набор этих вычисленных различий представляет собой точное распределение возможных различий (для этой выборки) при нулевой гипотезе о том, что групповые метки могут быть заменены (т. Е. Назначаются случайным образом).

Одностороннее p-значение теста рассчитывается как доля отобранных перестановок, в которых разница средних была больше или равна . Двустороннее p-значение теста рассчитывается как доля выбранных перестановок, где абсолютная разница была больше или равна .

В качестве альтернативы, если единственной целью теста является отклонение или не отклонение нулевой гипотезы, можно отсортировать записанные различия, а затем наблюдать, содержится ли в среднем их % для некоторого уровня значимости . Если это не так, мы отвергаем гипотезу об идентичности кривых вероятности на уровне значимости.

Отношение к параметрическим испытаниям [ править ]

Перестановочные тесты - это подмножество непараметрической статистики . Предполагая, что наши экспериментальные данные получены на основе данных, измеренных в двух группах лечения, метод просто генерирует распределение средних различий в предположении, что эти две группы не отличаются друг от друга с точки зрения измеряемой переменной. Исходя из этого, затем можно использовать наблюдаемую статистику (см. Выше), чтобы увидеть, в какой степени эта статистика является особенной, т. Е. Вероятность наблюдения величины такого значения (или большего), если метки лечения были просто рандомизированы после лечения.

В отличие от тестов перестановки, распределения, лежащие в основе многих популярных «классических» статистических тестов, таких как t- критерий , F- критерий , z- критерий и критерий χ 2 , получаются из теоретических распределений вероятностей. Точный тест Фишераявляется примером обычно используемого теста перестановки для оценки связи между двумя дихотомическими переменными. Когда размер выборки очень большой, критерий хи-квадрат Пирсона даст точные результаты. Для небольших выборок нельзя предположить, что эталонное распределение хи-квадрат дает правильное описание распределения вероятностей статистики теста, и в этой ситуации использование точного критерия Фишера становится более подходящим.

Перестановочные тесты существуют во многих ситуациях, когда параметрических тестов нет (например, при выводе оптимального теста, когда потери пропорциональны размеру ошибки, а не ее квадрату). Все простые и многие относительно сложные параметрические тесты имеют соответствующую версию теста перестановки, которая определяется с использованием той же тестовой статистики, что и параметрический тест, но получает значение p из распределения перестановок этой статистики для конкретной выборки, а не из теоретического распределение, полученное из параметрического предположения. Например, можно таким образом построить перестановки т -test , перестановка х 2 тестов ассоциации, перестановка версия теста Али для сравнения дисперсий и так далее.

Основные недостатки тестов перестановки заключаются в том, что они

  • Может потребовать значительных вычислительных ресурсов и может потребовать "специального" кода для трудно вычисляемой статистики. Это нужно переписывать для каждого случая.
  • В основном используются для определения p-значения. Инверсия теста для получения доверительных областей / интервалов требует еще большего количества вычислений.

Преимущества [ править ]

Перестановочные тесты существуют для любой тестовой статистики, независимо от того, известно ли ее распределение. Таким образом, всегда можно выбрать статистику, которая лучше всего различает гипотезу от альтернативы и минимизирует потери.

Перестановочные тесты могут использоваться для анализа несбалансированных планов [12] и для комбинирования зависимых тестов на смеси категориальных, порядковых и метрических данных (Pesarin, 2001) [ необходима цитата ] . Их также можно использовать для анализа качественных данных, которые были подвергнуты количественной оценке (т. Е. Преобразованы в числа). Перестановочные тесты могут быть идеальными для анализа количественных данных, которые не удовлетворяют статистическим допущениям, лежащим в основе традиционных параметрических тестов (например, t-тесты, ANOVA). [13]

До 1980-х годов бремя создания эталонного распределения было огромным, за исключением наборов данных с небольшими размерами выборки.

С 1980-х годов сочетание относительно недорогих быстрых компьютеров и разработка новых сложных алгоритмов пути, применимых в особых ситуациях, сделало применение методов проверки перестановок практичным для широкого круга задач. Он также инициировал добавление опций точного тестирования в основные пакеты статистического программного обеспечения и появление специализированного программного обеспечения для выполнения широкого диапазона точных тестов с одним и несколькими переменными и вычисления «точных» доверительных интервалов на основе тестов.

Ограничения [ править ]

Важное предположение, лежащее в основе проверки перестановки, состоит в том, что наблюдения можно обменивать при нулевой гипотезе. Важным следствием этого предположения является то, что тесты на различие в местоположении (например, t-тест перестановки) требуют равной дисперсии при предположении нормальности. В этом отношении t-критерий перестановки имеет ту же слабость, что и классический t-критерий Стьюдента ( проблема Беренса – Фишера ). Третья альтернатива в этой ситуации - использовать тест на основе начальной загрузки. Хорошо (2005) [ необходима цитата ]объясняет разницу между тестами перестановки и тестами начальной загрузки следующим образом: «Перестановки проверяют гипотезы, касающиеся распределений; гипотезы начальной загрузки, касающиеся параметров. В результате, бутстрап влечет за собой менее строгие допущения». Тесты начальной загрузки неточны. В некоторых случаях проверка перестановки, основанная на должным образом стьюдентизированной статистике, может быть асимптотически точной, даже когда нарушается предположение об обмене. [14]

Тестирование Монте-Карло [ править ]

Асимптотически эквивалентный тест перестановки может быть создан, когда существует слишком много возможных порядков данных, чтобы обеспечить полное перечисление удобным способом. Это делается путем создания эталонного распределения с помощью выборки Монте-Карло , которая берет небольшую (относительно общего числа перестановок) случайную выборку возможных повторов. Осознание того, что это может быть применено к любому тесту на перестановку в любом наборе данных, было важным прорывом в области прикладной статистики. Самая ранняя известная ссылка на этот подход - это Dwass (1957). [15] Этот тип теста перестановки известен под разными названиями: приблизительный тест перестановок , тесты подстановок Монта - Карло илитесты на случайную перестановку . [16]

После случайных перестановок можно получить доверительный интервал для p-значения на основе биномиального распределения. Например, если после случайных перестановок значение p оценивается как равное , то доверительный интервал 99% для истинного (тот, который был бы результатом попытки всех возможных перестановок) равен .

С другой стороны, цель оценки p-значения чаще всего состоит в том , чтобы решить , где это порог, при котором нулевая гипотеза будет отклонена (обычно ). В приведенном выше примере доверительный интервал говорит нам только о том, что существует примерно 50% -ная вероятность того, что значение p меньше 0,05, т.е. совершенно неясно, следует ли отклонять нулевую гипотезу на каком-либо уровне .

Если важно только знать, является ли данное утверждение, логично продолжать моделирование до тех пор, пока утверждение не будет установлено как истинное или ложное с очень низкой вероятностью ошибки. Учитывая предел допустимой вероятности ошибки (вероятность обнаружить, что когда на самом деле или наоборот), вопрос о том, сколько перестановок нужно сгенерировать, можно рассматривать как вопрос о том, когда прекратить генерировать перестановки, исходя из результатов моделирования до сих пор, чтобы гарантировать, что вывод (который либо или ) верен с вероятностью, по крайней мере, такой большой, как . ( обычно выбирается очень маленьким, например 1/1000.) Правила остановки для достижения этого были разработаны[17], которые могут быть включены с минимальными дополнительными вычислительными затратами. Фактически, в зависимости от истинного лежащего в основе p-значения часто обнаруживается, что количество требуемых имитаций очень мало (например, всего 5, а часто не больше 100), прежде чем решение может быть принято с виртуальной достоверностью.

См. Также [ править ]

  • Агрегирование бутстрапа (упаковка)
  • Генетические алгоритмы
  • Методы Монте-Карло
  • Непараметрическая статистика
  • Фильтр твердых частиц
  • Случайная перестановка
  • Тестирование суррогатных данных

Ссылки [ править ]

  1. ^ а б Логан, Дж. Дэвид и Волесенский, Виллиан Р. Математические методы в биологии. Чистая и прикладная математика: серия текстов, монографий и трактатов Wiley-interscience. John Wiley & Sons, Inc. 2009. Глава 6: Статистический вывод. Раздел 6.6: Методы начальной загрузки
  2. ^ Del Moral, Пьер (2004). Формулы Фейнмана-Каца. Генеалогические и взаимодействующие приближения частиц . Springer. п. 575. Серия: Вероятность и приложения.
  3. ^ Дель Мораль, Пьер (2013). Моделирование среднего поля для интеграции Монте-Карло . Чепмен и Холл / CRC Press. п. 626. Монографии по статистике и прикладной теории вероятностей.
  4. ^ Quenouille, MH (1949). «Приблизительные тесты корреляции во временных рядах». Журнал Королевского статистического общества, Series B . 11 (1): 68–84. DOI : 10.1111 / j.2517-6161.1949.tb00023.x . JSTOR 2983696 . 
  5. ^ Тьюки, JW (1958). «Предвзятость и уверенность в не очень больших выборках (предварительный отчет)». Анналы математической статистики . 29 (2): 614. JSTOR 2237363 . 
  6. ^ Махаланобиса, PC (1946). «Труды собрания Королевского статистического общества, состоявшегося 16 июля 1946 года». Журнал Королевского статистического общества . 109 (4): 325–370. JSTOR 2981330 . 
  7. ^ Шао, Дж. И Ту, Д. (1995). Складной нож и бутстрап. Springer-Verlag, Inc., с. 281.
  8. ^ Shao, J .; Ту, Д. (1995). Складной нож и бутстрап . Springer.
  9. ^ Вольтер, К. (2007). Введение в оценку дисперсии (второе изд.). Springer.
  10. ^ Verbyla, D .; Литвайтис, Дж. (1989). «Методы повторной выборки для оценки точности классификации моделей среды обитания диких животных». Экологический менеджмент . 13 (6): 783–787. Bibcode : 1989EnMan..13..783V . DOI : 10.1007 / bf01868317 . S2CID 153448048 . 
  11. ^ Verbyla, D. (1986). «Возможная ошибка прогноза в регрессионном и дискриминантном анализе». Канадский журнал исследований леса . 16 (6): 1255–1257. DOI : 10.1139 / x86-222 .
  12. ^ "Приглашенные статьи" (PDF) . Журнал современных прикладных статистических методов . 1 (2): 202–522. Осень 2011. Архивировано из оригинального (PDF) 5 мая 2003 года.
  13. ^ Collingridge, Dave S. (11 сентября 2012). «Праймеры по количественному анализу данных и перестановочному тестированию». Журнал смешанных методов исследования . 7 (1): 81–97. DOI : 10.1177 / 1558689812454457 . S2CID 124618343 . 
  14. ^ Чанг, EY; Романо, JP. «Точные и асимптотически устойчивые перестановочные тесты». Летопись статистики . 41 : 487–507. DOI : 10.1214 / 13-AOS1090 .
  15. ^ Дуасс, Мейер (1957). «Модифицированные критерии рандомизации для непараметрических гипотез» . Анналы математической статистики . 28 (1): 181–187. DOI : 10.1214 / АОМ / 1177707045 . JSTOR 2237031 . 
  16. ^ Томас Э. Николс , Эндрю П. Холмс (2001). «Непараметрические тесты перестановки для функциональной нейровизуализации: учебник с примерами» (PDF) . Картирование человеческого мозга . 15 (1): 1–25. DOI : 10.1002 / hbm.1058 . ЛВП : 2027,42 / 35194 . PMC 6871862 . PMID 11747097 .   
  17. ^ Gandy, Аксель (2009). «Последовательная реализация тестов Монте-Карло с равномерно ограниченным риском передискретизации». Журнал Американской статистической ассоциации . 104 (488): 1504–1511. arXiv : математика / 0612488 . DOI : 10,1198 / jasa.2009.tm08368 . S2CID 15935787 . 
  • Хорошо, Филлип (2005), Перестановка, параметрические и бутстрап-тесты гипотез (3-е изд.), Springer

Библиография [ править ]

Вводная статистика [ править ]

  • Гуд П. (2005) Введение в статистику с помощью методов передискретизации и R / S-PLUS . Вайли. ISBN 0-471-71575-1 
  • Гуд П. (2005) Введение в статистику с помощью методов повторной выборки и Microsoft Office Excel . Вайли. ISBN 0-471-73191-9 
  • Хестерберг, Т.С., Д.С. Мур, С. Монаган, А. Клипсон и Р. Эпштейн (2005). Методы начальной загрузки и тесты перестановок . [ требуется полная ссылка ]
  • Вольтер, К.М. (2007). Введение в оценку дисперсии . Второе издание. Springer, Inc.

Bootstrap [ править ]

  • Эфрон, Брэдли (1979). «Методы начальной загрузки: еще один взгляд на складной нож» . Летопись статистики . 7 : 1–26. DOI : 10.1214 / aos / 1176344552 .
  • Эфрон, Брэдли (1981). «Непараметрические оценки стандартной ошибки: складной нож, бутстрап и другие методы». Биометрика . 68 (3): 589–599. DOI : 10.2307 / 2335441 . JSTOR  2335441 .
  • Эфрон, Брэдли (1982). Складной нож, бутстрап и другие планы повторной выборки , In Society of Industrial and Applied Mathematics CBMS-NSF Monographs , 38.
  • Diaconis, P .; Эфрон, Брэдли (1983), "Компьютерные методы в статистике", Scientific American , май, 116–130.
  • Эфрон, Брэдли ; Тибширани, Роберт Дж. (1993). Введение в программу начальной загрузки , New York: Chapman & Hall , программное обеспечение .
  • Дэвисон, А.С. и Хинкли, Д.В. (1997): методы начальной загрузки и их применение, программное обеспечение .
  • Муни, Ч.З. и Дюваль, Р.Д. (1993). Самостоятельная загрузка. Непараметрический подход к статистическому выводу. Серия работ Университета Сейдж о количественных приложениях в социальных науках, 07-095. Ньюбери-Парк, Калифорния: Сейдж .
  • Саймон, Дж. Л. (1997): Передискретизация: Новая статистика .
  • Райт, Д. Б., Лондон, К., Филд, А. П. Использование начальной загрузки и принцип подключаемого модуля для данных клинической психологии. 2011 Textrum Ltd. Интернет: https://www.researchgate.net/publication/236647074_Using_Bootstrap_Estimation_and_the_Plug-in_Principle_for_Clinical_Psychology_Data . Проверено 25 апреля 2016 г.
  • Введение в Bootstrap. Монографии по статистике и прикладной вероятности 57. Chapman & Hall / CHC. 1998. Интернет https://books.google.it/books?id=gLlpIUxRntoC&pg=PA35&lpg=PA35&dq=plug+in+principle&source=bl&ots=A8AsW5K6E2&sig=7WQVzL3ujAnWC8HDNyOzKlKVX0k&hl=en&sa=X&sqi=2&ved=0ahUKEwiU5c-Ho6XMAhUaOsAKHS_PDJMQ6AEIPDAG#v=onepage&q=plug % 20in% 20principle & f = false . Проверено 25 апреля 2016.

Складной нож [ править ]

  • Бергер, Ю.Г. (2007). «Оценка дисперсии складного ножа для одноэтапных стратифицированных выборок с неравными вероятностями». Биометрика . 94 (4): 953–964. DOI : 10.1093 / Biomet / asm072 .
  • Бергер, Ю. Г.; Рао, JNK (2006). «Отрегулированный складной нож для вменения при неравновероятной выборке без замены». Журнал Королевского статистического общества, Series B . 68 (3): 531–547. DOI : 10.1111 / j.1467-9868.2006.00555.x .
  • Бергер, Ю. Г.; Скиннер, CJ (2005). «Оценщик отклонения складного ножа для неравной вероятностной выборки». Журнал Королевского статистического общества, Series B . 67 (1): 79–89. DOI : 10.1111 / j.1467-9868.2005.00489.x .
  • Jiang, J .; Lahiri, P .; Ван, С.М. (2002). «Единая теория складного ножа для эмпирического наилучшего прогноза с M-оценкой» . Летопись статистики . 30 (6): 1782–810. DOI : 10.1214 / AOS / 1043351257 .
  • Джонс, HL (1974). «Складной нож для оценки функций слоевых средств». Биометрика . 61 (2): 343–348. DOI : 10.2307 / 2334363 . JSTOR  2334363 .
  • Киш, Л .; Франкель, MR (1974). «Вывод из сложных образцов». Журнал Королевского статистического общества, Series B . 36 (1): 1–37.
  • Кревски, Д .; Рао, JNK (1981). «Вывод из стратифицированных образцов: свойства линеаризации, складной нож и сбалансированные методы повторной репликации» . Летопись статистики . 9 (5): 1010–1019. DOI : 10.1214 / AOS / 1176345580 .
  • Кенуй, MH (1956). «Заметки о предвзятости в оценке». Биометрика . 43 (3–4): 353–360. DOI : 10.1093 / Biomet / 43.3-4.353 .
  • Рао, JNK; Шао, Дж. (1992). «Оценка дисперсии складного ножа с данными обследования при вменении hot deck». Биометрика . 79 (4): 811–822. DOI : 10.1093 / Biomet / 79.4.811 .
  • Рао, JNK; Wu, CFJ; Юэ, К. (1992). «Некоторые недавние работы над методами повторной выборки для сложных опросов». Методология исследования . 18 (2): 209–217.
  • Шао, Дж. И Ту, Д. (1995). Складной нож и бутстрап. Springer-Verlag, Inc.
  • Тьюки, JW (1958). «Предвзятость и уверенность в не очень больших выборках (аннотация)». Анналы математической статистики . 29 (2): 614.
  • Ву, CFJ (1986). «Jackknife, Bootstrap и другие методы повторной выборки в регрессионном анализе» (PDF) . Летопись статистики . 14 (4): 1261–1295. DOI : 10.1214 / AOS / 1176350142 .

Подвыборка [ править ]

  • Delgado, M .; Rodriguez-Poo, J .; Вольф, М. (2001). «Вывод субдискретизации в асимптотике кубического корня с приложением к оценщику максимального балла Мански». Письма по экономике . 73 (2): 241–250. DOI : 10.1016 / s0165-1765 (01) 00494-3 . ЛВП : 10016/2449 .
  • Gonzalo, J .; Вольф, М. (2005). «Вывод субдискретизации в пороговых авторегрессионных моделях». Журнал эконометрики . 127 (2): 201–224. DOI : 10.1016 / j.jeconom.2004.08.004 . ЛВП : 10016/3218 .
  • Политис, ДН; Романо, JP (1994). «Доверительные области для большой выборки, основанные на подвыборках при минимальных предположениях» . Летопись статистики . 22 (4): 2031–2050. DOI : 10.1214 / AOS / 1176325770 .
  • Политис, ДН; Романо, JP; Вольф, М. (1997). «Подвыборка для гетероскедастических временных рядов». Журнал эконометрики . 81 (2): 281–317. DOI : 10.1016 / s0304-4076 (97) 86569-4 .
  • Политис, Д. Н., Романо, Дж. П., и Вольф, М. (1999). Подвыборка . Спрингер, Нью-Йорк.
  • Романо, JP; Вольф, М. (2001). «Интервалы субдискретизации в моделях авторегрессии с линейным временным трендом». Econometrica . 69 (5): 1283–1314. DOI : 10.1111 / 1468-0262.00242 . ЛВП : 10016/6400 .

Методы Монте-Карло [ править ]

  • Джордж С. Фишман (1995). Монте-Карло: концепции, алгоритмы и приложения , Спрингер, Нью-Йорк. ISBN 0-387-94527-X . 
  • Джеймс Э. Джентл (2009). Вычислительная статистика , Спрингер, Нью-Йорк. Часть III: Методы вычислительной статистики. ISBN 978-0-387-98143-7 . 
  • Пьер Дель Мораль (2004). Формулы Фейнмана-Каца. Генеалогические и взаимодействующие системы частиц с приложениями, Springer, вероятностные серии и приложения. ISBN 978-0-387-20268-6 
  • Пьер Дель Мораль (2013). Дель Мораль, Пьер (2013). Моделирование среднего поля для интеграции Монте-Карло . Chapman & Hall / CRC Press, Монографии по статистике и прикладной теории вероятностей. ISBN 9781466504059 
  • Дирк П. Крезе, Томас Таймре и Здравко И. Ботев. Справочник по методам Монте-Карло , John Wiley & Sons, Нью-Йорк. ISBN 978-0-470-17793-8 . 
  • Кристиан П. Роберт и Джордж Казелла (2004). Статистические методы Монте-Карло , второе издание, Спрингер, Нью-Йорк. ISBN 0-387-21239-6 . 
  • Шломо Савиловски и Гейл Фахум (2003). Статистика с помощью моделирования методом Монте-Карло с помощью Fortran. Рочестер-Хиллз, Мичиган: JMASM. ISBN 0-9740236-0-4 . 

Перестановочные тесты [ править ]

Исходные ссылки:

  • Фишер, Р. А. (1935) План экспериментов , Нью-Йорк: Хафнер
  • Pitman, EJG (1937) «Тесты значимости, которые могут быть применены к выборкам из любой популяции», Дополнение Королевского статистического общества , 4: 119–130 и 225–32 (части I и II). JSTOR  2984124 JSTOR  2983647
  • Питман, EJG (1938). «Тесты значимости, которые могут применяться к выборкам из любой популяции. Часть III. Тест дисперсионного анализа». Биометрика . 29 (3–4): 322–335. DOI : 10.1093 / Biomet / 29.3-4.322 .

Современные ссылки:

  • Коллингридж, Д.С. (2013). «Праймеры по количественному анализу данных и перестановочному тестированию». Журнал смешанных методов исследования . 7 (1): 79–95. DOI : 10.1177 / 1558689812454457 . S2CID  124618343 .
  • Эджингтон. ES (1995) Рандомизационные тесты , 3-е изд. Нью-Йорк: Марсель-Деккер
  • Хорошо, Филипп I. (2005) Перестановка, параметрические и бутстрап-тесты гипотез , 3-е изд., Springer ISBN 0-387-98898-X 
  • Хорошо, П (2002). «Расширения концепции взаимозаменяемости и их приложения» . Журнал современных прикладных статистических методов . 1 (2): 243–247. DOI : 10.22237 / jmasm / 1036110240 .
  • Луннеборг, Клифф. (1999) Анализ данных путем повторной выборки , Duxbury Press. ISBN 0-534-22110-6 . 
  • Пезарин, Ф. (2001). Многофакторные перестановочные тесты: с приложениями в биостатистике , John Wiley & Sons . ISBN 978-0471496700 
  • Уэлч, WJ (1990). «Построение перестановочных тестов». Журнал Американской статистической ассоциации . 85 (411): 693–698. DOI : 10.1080 / 01621459.1990.10474929 .

Вычислительные методы:

  • Mehta, CR; Патель, Н.Р. (1983). «Сетевой алгоритм для выполнения точного теста Фишера в таблицах непредвиденных обстоятельств rxc». Журнал Американской статистической ассоциации . 78 (382): 427–434. DOI : 10.1080 / 01621459.1983.10477989 .
  • Mehta, CR; Patel, NR; Сенчаудхури, П. (1988). «Выборка по важности для оценки точных вероятностей перестановочного вывода». Журнал Американской статистической ассоциации . 83 (404): 999–1005. DOI : 10.1080 / 01621459.1988.10478691 .
  • Гилл, PMW (2007). «Эффективное вычисление p-значений в тестах значимости перестановок линейной статистики» (PDF) . Журнал статистических вычислений и моделирования . 77 (1): 55–61. CiteSeerX  10.1.1.708.1957 . DOI : 10.1080 / 10629360500108053 . S2CID  1813706 .

Методы передискретизации [ править ]

  • Хорошо, П. (2006) Методы передискретизации . 3-е изд. Бирхаузер.
  • Вольтер, К.М. (2007). Введение в оценку дисперсии . 2-е издание. Springer, Inc.
  • Пьер Дель Мораль (2004). Формулы Фейнмана-Каца. Генеалогические и взаимодействующие системы частиц с приложениями, Springer, вероятностные серии и приложения. ISBN 978-0-387-20268-6 
  • Пьер Дель Мораль (2013). Дель Мораль, Пьер (2013). Моделирование среднего поля для интеграции Монте-Карло . Chapman & Hall / CRC Press, Монографии по статистике и прикладной теории вероятностей. ISBN 9781466504059 

Внешние ссылки [ править ]

Текущие исследования тестов на перестановку [ править ]

  • Good, PI (2012) Практическое руководство по методам повторной выборки.
  • Хорошо, PI (2005) Перестановочные, параметрические и бутстрап-тесты гипотез
  • Учебник Bootstrap Sampling
  • Хестерберг, Т.С., Д.С. Мур, С. Монаган, А. Клипсон и Р. Эпштейн (2005): методы начальной загрузки и тесты перестановок , программное обеспечение .
  • Мур, Д.С., Дж. Маккейб, У. Дакворт и С. Склов (2003): методы начальной загрузки и перестановочные тесты
  • Саймон, Дж. Л. (1997): Передискретизация: Новая статистика .
  • Ю, Чонг Хо (2003): Методы передискретизации: концепции, приложения и обоснование. Практическая оценка, исследования и оценка, 8 (19) . (статистическая загрузка)
  • Передискретизация: брак компьютеров и статистики (дайджесты ERIC)

Программное обеспечение [ править ]

  • Анджело Канти и Брайан Рипли (2010). boot : Функции Bootstrap R (S-Plus). Пакет R версии 1.2-43. Функции и наборы данных для начальной загрузки из книги « Методы начальной загрузки и их приложения» А. С. Дэвисона и Д. В. Хинкли (1997, CUP).
  • Statistics101: Resampling, Bootstrap, программа моделирования Монте-Карло
  • Пакет R `samplingVarEst ': оценка дисперсии выборки. Реализует функции для оценки дисперсии выборки некоторых точечных оценщиков.
  • Парный тест рандомизации / перестановки для оценки результатов TREC
  • Тесты рандомизации / перестановки для оценки результатов в экспериментах по поиску информации (с поправками на множественные сравнения и без них).
  • Проверка множественных гипотез на основе повторной выборки биокондукторов с помощью Applications to Genomics.
  • permtest: пакет R для сравнения изменчивости внутри и расстояния между двумя группами в наборе данных микрочипа.
  • Bootstrap Resampling: интерактивная демонстрация проверки гипотез с бутстраповой повторной выборкой в ​​R.
  • Проверка перестановки: интерактивная демонстрация проверки гипотез с проверкой перестановки в R.