Усеченное распределение


В статистике усеченное распределение — это условное распределение , возникающее в результате ограничения области некоторого другого распределения вероятностей .. Усеченные распределения возникают в практической статистике в тех случаях, когда возможность регистрировать или даже знать о событиях ограничена значениями, лежащими выше или ниже заданного порога или в пределах определенного диапазона. Например, если проверяются даты рождения детей в школе, они, как правило, подлежат усечению по сравнению с датами рождения всех детей в этом районе, учитывая, что школа принимает только детей в определенном возрастном диапазоне в конкретную дату. Не было бы никакой информации о том, у скольких детей в данной местности даты рождения были раньше или позже дат окончания школы, если бы для получения информации использовался только прямой подход к школе.

Если выборка предназначена для сохранения информации об элементах, выходящих за пределы требуемого диапазона, без записи фактических значений, это называется цензурой , в отличие от усечения здесь. [1]

Следующее обсуждение относится к случайной величине, имеющей непрерывное распределение , хотя те же самые идеи применимы к дискретным распределениям . Точно так же обсуждение предполагает, что усечение выполняется до полуоткрытого интервала y ∈ ( a,b ], но другие возможности могут быть обработаны напрямую.

Предположим, у нас есть случайная величина, распределенная согласно некоторой функции плотности вероятности, с кумулятивной функцией распределения, обе из которых имеют бесконечную поддержку . Предположим, мы хотим знать плотность вероятности случайной величины после ограничения носителя между двумя константами, так что носитель . То есть предположим, что мы хотим знать, как распределяется данное .

где для всех и везде. То есть, где функция индикатора. Обратите внимание, что знаменатель в усеченном распределении постоянен по отношению к .

Обратите внимание, что на самом деле это плотность: