Усеченное распределение

В статистике усеченное распределение — это условное распределение , возникающее в результате ограничения области некоторого другого распределения вероятностей .. Усеченные распределения возникают в практической статистике в тех случаях, когда возможность регистрировать или даже знать о событиях ограничена значениями, лежащими выше или ниже заданного порога или в пределах определенного диапазона. Например, если проверяются даты рождения детей в школе, они, как правило, подлежат усечению по сравнению с датами рождения всех детей в этом районе, учитывая, что школа принимает только детей в определенном возрастном диапазоне в конкретную дату. Не было бы никакой информации о том, у скольких детей в данной местности даты рождения были раньше или позже дат окончания школы, если бы для получения информации использовался только прямой подход к школе.

Если выборка предназначена для сохранения информации об элементах, выходящих за пределы требуемого диапазона, без записи фактических значений, это называется цензурой , в отличие от усечения здесь. ^[1]

Следующее обсуждение относится к случайной величине, имеющей непрерывное распределение , хотя те же самые идеи применимы к дискретным распределениям . Точно так же обсуждение предполагает, что усечение выполняется до полуоткрытого интервала y ∈ ( a,b ], но другие возможности могут быть обработаны напрямую.

Предположим, у нас есть случайная величина, распределенная согласно некоторой функции плотности вероятности, с кумулятивной функцией распределения, обе из которых имеют бесконечную поддержку . Предположим, мы хотим знать плотность вероятности случайной величины после ограничения носителя между двумя константами, так что носитель . То есть предположим, что мы хотим знать, как распределяется данное . ${\ Displaystyle Х}$ ${\ Displaystyle е (х)}$ ${\ Displaystyle F (х)}$ ${\ Displaystyle у = (а, б]}$ ${\ Displaystyle Х}$ ${\ Displaystyle а <Х \ Leq б}$

где для всех и везде. То есть, где функция индикатора. Обратите внимание, что знаменатель в усеченном распределении постоянен по отношению к . ${\ Displaystyle г (х) = е (х)}$ ${\ Displaystyle а <х \ Leq б}$ ${\ Displaystyle г (х) = 0}$ ${\ Displaystyle г (х) = е (х) \ cdot I (\ {а <х \ Leq б \})}$ ${\ Displaystyle я}$ ${\ Displaystyle х}$

Обратите внимание, что на самом деле это плотность: ${\ Displaystyle е (х | а <Х \ Leq б)}$