Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В статистике , А распределение выборки или конечной выборка распределение является распределением вероятности данной случайной выборок основанной статистики . Если произвольно большое количество выборок, каждая из которых включает несколько наблюдений (точек данных), использовалось отдельно для вычисления одного значения статистики (например, среднего значения выборки или дисперсии выборки ) для каждой выборки, то выборка Распределение - это распределение вероятностей значений, которые принимает статистика. Во многих контекстах наблюдается только одна выборка, но распределение выборки можно найти теоретически.

Распределения выборки важны в статистике, потому что они значительно упрощают процесс статистического вывода . В частности, они позволяют аналитическим соображениям основываться на распределении вероятностей статистики, а не на совместном распределении вероятностей всех отдельных значений выборки.

Введение [ править ]

Распределение выборки из статистики является распределение этой статистики, рассматриваются как случайная величина , когда полученные из случайной выборки размера . Его можно рассматривать как распределение статистики для всех возможных выборок из одной и той же совокупности данного размера выборки. Распределение выборки зависит от основного распределения населения, рассматриваемой статистики, используемой процедуры выборки и размера используемой выборки. Часто возникает значительный интерес к тому, можно ли аппроксимировать выборочное распределение асимптотическим распределением, который соответствует предельному случаю, либо когда число случайных выборок конечного размера, взятых из бесконечной совокупности и используемых для получения распределения, стремится к бесконечности, либо когда из этой выборки берется только одна «выборка» равного бесконечного размера. такое же население.

Например, рассмотрим нормальную совокупность со средним значением и дисперсией . Предположим, мы неоднократно отбираем образцы заданного размера из этой совокупности и вычисляем среднее арифметическое для каждой выборки - эта статистика называется средним значением выборки . Распределение этих средних или средних значений называется «выборочным распределением выборочного среднего». Это распределение является нормальным (n - размер выборки), поскольку основная совокупность является нормальной, хотя распределения выборки также часто могут быть близки к нормальным, даже если распределение совокупности не является нормальным (см. Центральную предельную теорему ). Альтернативой выборочному среднему является выборочная медиана . При вычислении для одной и той же совокупности он имеет распределение выборки, отличное от среднего и обычно не является нормальным (но может быть близким для больших размеров выборки).

Среднее значение выборки из совокупности, имеющей нормальное распределение, является примером простой статистики, взятой из одной из простейших статистических совокупностей . Для других статистических данных и других популяций формулы более сложные, и часто их не существует в закрытом виде . В таких случаях выборочные распределения могут быть аппроксимированы с помощью моделирования Монте-Карло [1] [стр. 2] , бутстрап- методы или асимптотическая теория распределений .

Стандартная ошибка [ править ]

Стандартное отклонение распределения выборки в статистике упоминается как стандартная ошибка этой величины. Для случая, когда статистика представляет собой среднее значение выборки, а выборки не коррелированы, стандартная ошибка составляет:

где - стандартное отклонение распределения этого количества в совокупности и - размер выборки (количество элементов в выборке).

Важным следствием этой формулы является то, что размер выборки должен быть увеличен в четыре раза (умножен на 4), чтобы получить половину (1/2) ошибки измерения. При разработке статистических исследований, в которых стоимость является фактором, это может иметь значение для понимания компромиссов между затратами и выгодами.

Для случая, когда статистика представляет собой общий объем выборки, а выборки не коррелированы, стандартная ошибка составляет:

где, опять же, - стандартное отклонение распределения данного количества в генеральной совокупности, а - размер выборки (количество элементов в выборке).

Примеры [ править ]

Ссылки [ править ]

  1. Перейти ↑ Mooney, Christopher Z. (1999). Моделирование Монте-Карло . Таузенд-Оукс, Калифорния: Sage. ISBN 9780803959439.
  • Мерберг, А. и С. Дж. Миллер (2008). «Выборочное распределение медианы». Примечания к курсу по математике 162: математическая статистика , в Интернете по адресу http://web.williams.edu/Mat Mathematics/ sjmiller/public_html/BrownClasses/ 162/ Handouts/MedianThm04.pdf, стр. 1–9.

Внешние ссылки [ править ]

  • Создание выборочных распределений в Excel
  • Демонстрация Mathematica, показывающая выборочное распределение различных статистических данных (например, Σ x ²) для нормальной совокупности