Экспоненциальное распределение

В теории вероятностей и статистике , то экспоненциальное распределение является распределение вероятностей времени между событиями в пуассоновском точечном процессе , то есть процесс , в котором события происходят непрерывно и независимо друг от друга с постоянной средней скоростью. Это частный случай гамма-распределения . Это непрерывный аналог геометрического распределения , и его ключевое свойство - отсутствие памяти . Помимо того, что он используется для анализа точечных процессов Пуассона, он встречается в различных других контекстах.

Экспоненциальный
Функция плотности вероятности
Кумулятивная функция распределения
Параметры	${\ displaystyle \ lambda> 0,}$ ставка, или обратная шкала
Служба поддержки	${\ Displaystyle х \ в [0, \ infty)}$
PDF	${\ displaystyle \ lambda e ^ {- \ lambda x}}$
CDF	${\ displaystyle 1-e ^ {- \ lambda x}}$
Квантиль	${\ displaystyle - {\ frac {\ ln (1-p)} {\ lambda}}}$
Иметь в виду	${\ displaystyle {\ frac {1} {\ lambda}}}$
Медиана	${\ displaystyle {\ frac {\ ln 2} {\ lambda}}}$
Режим	${\ displaystyle 0}$
Дисперсия	${\ displaystyle {\ frac {1} {\ lambda ^ {2}}}}$
Асимметрия	${\ displaystyle 2}$
Бывший. эксцесс	${\ displaystyle 6}$
Энтропия	${\ displaystyle 1- \ ln \ lambda}$
MGF	${\ displaystyle {\ frac {\ lambda} {\ lambda -t}}, {\ text {for}} t <\ lambda}$
CF	${\ displaystyle {\ frac {\ lambda} {\ lambda -it}}}$
Информация Fisher	${\ displaystyle {\ frac {1} {\ lambda ^ {2}}}}$
Расхождение Кульбака-Лейблера	${\ displaystyle \ ln {\ frac {\ lambda _ {0}} {\ lambda}} + {\ frac {\ lambda} {\ lambda _ {0}}} - 1}$

Экспоненциальное распределение - это не то же самое, что класс экспоненциальных семейств распределений, который представляет собой большой класс вероятностных распределений, который включает экспоненциальное распределение в качестве одного из его членов, но также включает нормальное распределение , биномиальное распределение , гамма-распределение , Пуассон , и много других.

Определения

Функция плотности вероятности

Функция плотности вероятности (pdf) экспоненциального распределения имеет вид

{\ displaystyle f (x; \ lambda) = {\ begin {cases} \ lambda e ^ {- \ lambda x} & x \ geq 0, \\ 0 & x <0. \ end {cases}}}

Здесь λ > 0 - параметр распределения, часто называемый параметром скорости . Распределение поддерживается на интервале [0, ∞). Если случайная величина X имеет это распределение, мы пишем X ~ Exp ( λ ).

Экспоненциальное распределение демонстрирует бесконечную делимость .

Кумулятивная функция распределения

Интегральная функция распределения задается

{\ displaystyle F (x; \ lambda) = {\ begin {cases} 1-e ^ {- \ lambda x} & x \ geq 0, \\ 0 & x <0. \ end {ases}}}

Альтернативная параметризация

Экспоненциальное распределение иногда параметризуется с помощью параметра масштаба $β = 1 / λ$ , который также является средним:

{\ displaystyle f (x; \ beta) = {\ begin {cases} {\ frac {1} {\ beta}} e ^ {- x / \ beta} & x \ geq 0, \\ 0 & x <0. \ end {case}} \ qquad \ qquad \ qquad F (x; \ beta) = {\ begin {cases} 1-e ^ {- x / \ beta} & x \ geq 0, \\ 0 & x <0. \ end {случаях }}}

Характеристики

Среднее, дисперсия, моменты и медиана

Среднее значение - это центр масс вероятности, то есть первый момент .

Медиана - это прообраз F ⁻¹ (1/2).

Среднее или ожидаемое значение экспоненциально распределенной случайной величины X с параметром скорости λ определяется выражением

{\ displaystyle \ operatorname {E} [X] = {\ frac {1} {\ lambda}}.}

В свете примеров, приведенных ниже , это имеет смысл: если вы получаете телефонные звонки со средней скоростью 2 в час, то вы можете ожидать полчаса для каждого звонка.

Дисперсия из X задается

{\ displaystyle \ operatorname {Var} [X] = {\ frac {1} {\ lambda ^ {2}}},}

поэтому стандартное отклонение равно среднему.

В моменты из X , для ${\ Displaystyle п \ в \ mathbb {N}}$ даны

{\ displaystyle \ operatorname {E} \ left [X ^ {n} \ right] = {\ frac {n!} {\ lambda ^ {n}}}.}

В центральные моменты из X , для ${\ Displaystyle п \ в \ mathbb {N}}$ даны

{\ displaystyle \ mu _ {n} = {\ frac {! n} {\ lambda ^ {n}}} = {\ frac {n!} {\ lambda ^ {n}}} \ sum _ {k = 0 } ^ {n} {\ frac {(-1) ^ {k}} {k!}}.}

где ! п является subfactorial из п

Медианный из X задается

{\ displaystyle \ operatorname {m} [X] = {\ frac {\ ln (2)} {\ lambda}} <\ operatorname {E} [X],}

где ln обозначает натуральный логарифм . Таким образом, абсолютная разница между средним и медианным значением составляет

{\ Displaystyle \ left | \ OperatorName {E} \ left [X \ right] - \ OperatorName {m} \ left [X \ right] \ right | = {\ frac {1- \ ln (2)} {\ lambda }} <{\ frac {1} {\ lambda}} = \ operatorname {\ sigma} [X],}

в соответствии с неравенством среднего среднего .

Без памяти

Экспоненциально распределенная случайная величина T подчиняется соотношению

{\ displaystyle \ Pr \ left (T> s + t \ mid T> s \ right) = \ Pr (T> t), \ qquad \ forall s, t \ geq 0.}

Это можно увидеть, рассматривая дополнительную кумулятивную функцию распределения :

{\ Displaystyle {\ begin {align} \ Pr \ left (T> s + t \ mid T> s \ right) & = {\ frac {\ Pr \ left (T> s + t \ cap T> s \ right )} {\ Pr \ left (T> s \ right)}} \\ [4pt] & = {\ frac {\ Pr \ left (T> s + t \ right)} {\ Pr \ left (T> s \ right)}} \\ [4pt] & = {\ frac {e ^ {- \ lambda (s + t)}} {e ^ {- \ lambda s}}} \\ [4pt] & = e ^ { - \ lambda t} \\ [4pt] & = \ Pr (T> t). \ end {align}}}

Когда T интерпретируется как время ожидания возникновения события относительно некоторого начального времени, это соотношение подразумевает, что, если T обусловлено невозможностью наблюдения за событием в течение некоторого начального периода времени s , распределение оставшегося времени ожидания совпадает с исходным безусловным распределением. Например, если событие не произошло через 30 секунд, условная вероятность того, что возникновение займет еще не менее 10 секунд, равна безусловной вероятности наблюдения события более чем через 10 секунд после начального времени.

Экспоненциальное распределение и геометрическое распределение - единственные распределения вероятностей без памяти .

Следовательно, экспоненциальное распределение также обязательно является единственным непрерывным распределением вероятностей, которое имеет постоянную интенсивность отказов .

Квантили

Критерии Тьюки для аномалий. ^{[ необходима цитата ]}

Функция квантиля (обратная кумулятивная функция распределения) для Exp ( λ ) равна

{\ displaystyle F ^ {- 1} (p; \ lambda) = {\ frac {- \ ln (1-p)} {\ lambda}}, \ qquad 0 \ leq p <1}

Таким образом, квартилями являются:

первый квартиль: ln (4/3) / λ
медиана : ln (2) / λ
третий квартиль: ln (4) / λ

И, как следствие, межквартильный размах равен ln (3) / λ .

Дивергенция Кульбака – Лейблера.

Направлено Кульбак-Либлер расхождение в нац из ${\ displaystyle e ^ {\ lambda}}$ («аппроксимирующее» распределение) от ${\ displaystyle e ^ {\ lambda _ {0}}}$ («истинное» распределение) определяется как

{\ displaystyle {\ begin {align} \ Delta (\ lambda _ {0} \ parallel \ lambda) & = \ mathbb {E} _ {\ lambda _ {0}} \ left (\ log {\ frac {p_ { \ lambda _ {0}} (x)} {p _ {\ lambda} (x)}} \ right) \\ & = \ mathbb {E} _ {\ lambda _ {0}} \ left (\ log {\ frac {\ lambda _ {0} e ^ {- \ lambda _ {0} x}} {\ lambda e ^ {- \ lambda x}}} \ right) \\ & = \ log (\ lambda _ {0} ) - \ log (\ lambda) - (\ lambda _ {0} - \ lambda) E _ {\ lambda _ {0}} (x) \\ & = \ log (\ lambda _ {0}) - \ log ( \ lambda) + {\ frac {\ lambda} {\ lambda _ {0}}} - 1. \ end {align}}}

Максимальное распределение энтропии

Среди всех непрерывных распределений вероятностей с опорой [0, ∞) и средним μ экспоненциальное распределение с λ = 1 / μ имеет наибольшую дифференциальную энтропию . Другими словами, это максимальное распределение вероятностей энтропии для случайной переменной X, которая больше или равна нулю и для которой E [ X ] фиксировано. ^[1]

Распределение минимума экспоненциальных случайных величин

Пусть X ₁ , ..., X _n - независимые экспоненциально распределенные случайные величины со скоростными параметрами λ ₁ , ..., λ _n . потом

{\ displaystyle \ min \ left \ {X_ {1}, \ dotsc, X_ {n} \ right \}}

также имеет экспоненциальное распределение с параметром

{\ displaystyle \ lambda = \ lambda _ {1} + \ dotsb + \ lambda _ {n}.}

Это можно увидеть, рассматривая дополнительную кумулятивную функцию распределения :

{\ displaystyle {\ begin {align} & \ Pr \ left (\ min \ {X_ {1}, \ dotsc, X_ {n} \}> x \ right) \\ = {} & \ Pr \ left (X_ {1}> x, \ dotsc, X_ {n}> x \ right) \\ = {} & \ prod _ {i = 1} ^ {n} \ Pr \ left (X_ {i}> x \ right) \\ = {} & \ prod _ {i = 1} ^ {n} \ exp \ left (-x \ lambda _ {i} \ right) = \ exp \ left (-x \ sum _ {i = 1} ^ {n} \ lambda _ {i} \ right). \ end {выравнивается}}}

Индекс переменной, которая достигает минимума, распределяется согласно категориальному распределению.

{\ displaystyle \ Pr \ left (к \ mid X_ {k} = \ min \ {X_ {1}, \ dotsc, X_ {n} \} \ right) = {\ frac {\ lambda _ {k}} { \ lambda _ {1} + \ dotsb + \ lambda _ {n}}}.}

Доказательство выглядит следующим образом:

{\ displaystyle {\ text {Let}} I = \ operatorname {argmin} _ {i \ in \ {1, \ dotsb, n \}} \ {X_ {1}, \ dotsc, X_ {n} \}}

{\ displaystyle {\ begin {align} {\ text {then}} \ Pr (I = k) & = \ int _ {0} ^ {\ infty} \ Pr (X_ {k} = x) \ Pr (X_ {i \ neq k}> x) dx \\ & = \ int _ {0} ^ {\ infty} \ lambda _ {k} e ^ {- \ lambda _ {k} x} \ left (\ prod _ { i = 1, i \ neq k} ^ {n} e ^ {- \ lambda _ {i} x} \ right) dx \\ & = \ lambda _ {k} \ int _ {0} ^ {\ infty} e ^ {- \ left (\ lambda _ {1} + \ dotsb + \ lambda _ {n} \ right) x} dx \\ & = {\ frac {\ lambda _ {k}} {\ lambda _ {1 } + \ dotsb + \ lambda _ {n}}}. \ end {выравнивается}}}

Обратите внимание, что

{\ Displaystyle \ макс \ {X_ {1}, \ dotsc, X_ {n} \}}

не распределяется экспоненциально. ^[2]

Совместные моменты экспоненциальной порядковой статистики iid

Позволять ${\ Displaystyle X_ {1}, \ dotsc, X_ {n}}$ быть ${\ displaystyle n}$ независимые и одинаково распределенные экспоненциальные случайные величины с параметром скорости λ . Позволять ${\ Displaystyle X _ {(1)}, \ dotsc, X _ {(n)}}$ обозначают соответствующую статистику порядка . Для ${\ displaystyle i }>$ , совместный момент ${\ Displaystyle \ OperatorName {E} \ left [X _ {(i)} X _ {(j)} \ right]}$ статистики заказов ${\ Displaystyle X _ {(я)}}$ а также ${\ displaystyle X _ {(j)}}$ дан кем-то

{\ displaystyle {\ begin {align} \ operatorname {E} \ left [X _ {(i)} X _ {(j)} \ right] & = \ sum _ {k = 0} ^ {j-1} {\ frac {1} {(nk) \ lambda}} \ operatorname {E} \ left [X _ {(i)} \ right] + \ operatorname {E} \ left [X _ {(i)} ^ {2} \ right ] \\ & = \ sum _ {k = 0} ^ {j-1} {\ frac {1} {(nk) \ lambda}} \ sum _ {k = 0} ^ {i-1} {\ frac {1} {(nk) \ lambda}} + \ sum _ {k = 0} ^ {i-1} {\ frac {1} {((nk) \ lambda) ^ {2}}} + \ left ( \ sum _ {k = 0} ^ {i-1} {\ frac {1} {(nk) \ lambda}} \ right) ^ {2}. \ end {align}}}

Это можно увидеть, применив закон полного ожидания и свойство без памяти:

{\ displaystyle {\ begin {align} \ operatorname {E} \ left [X _ {(i)} X _ {(j)} \ right] & = \ int _ {0} ^ {\ infty} \ operatorname {E} \ left [X _ {(i)} X _ {(j)} \ mid X _ {(i)} = x \ right] f_ {X _ {(i)}} (x) \, dx \\ & = \ int _ {x = 0} ^ {\ infty} x \ operatorname {E} \ left [X _ {(j)} \ mid X _ {(j)} \ geq x \ right] f_ {X _ {(i)}} (x ) \, dx && \ left ({\ textrm {Since}} ~ X _ {(i)} = x \ подразумевает X _ {(j)} \ geq x \ right) \\ & = \ int _ {x = 0} ^ {\ infty} x \ left [\ operatorname {E} \ left [X _ {(j)} \ right] + x \ right] f_ {X _ {(i)}} (x) \, dx && \ left ({\ текст {по свойству без памяти}} \ right) \\ & = \ sum _ {k = 0} ^ {j-1} {\ frac {1} {(nk) \ lambda}} \ operatorname {E} \ left [X _ {(i)} \ right] + \ operatorname {E} \ left [X _ {(i)} ^ {2} \ right]. \ End {выравнивается}}}

Первое уравнение следует из закона полного ожидания . Второе уравнение использует тот факт, что если мы поставим условие ${\ Displaystyle X _ {(я)} = х}$ , должно следовать, что ${\ displaystyle X _ {(j)} \ geq x}$ . Третье уравнение полагается на свойство без памяти для замены ${\ Displaystyle \ OperatorName {E} \ left [X _ {(j)} \ mid X _ {(j)} \ geq x \ right]}$ с участием ${\ Displaystyle \ OperatorName {E} \ left [X _ {(j)} \ right] + x}$ .

Сумма двух независимых экспоненциальных случайных величин

Функция распределения вероятностей (PDF) суммы двух независимых случайных величин представляет собой свертку их индивидуальных PDF . Если ${\ displaystyle X_ {1}}$ а также ${\ displaystyle X_ {2}}$ являются независимыми экспоненциальными случайными величинами с соответствующими параметрами скорости ${\ displaystyle \ lambda _ {1}}$ а также ${\ displaystyle \ lambda _ {2},}$ то плотность вероятности ${\ Displaystyle Z = X_ {1} + X_ {2}}$ дан кем-то

{\ displaystyle {\ begin {align} f_ {Z} (z) & = \ int _ {- \ infty} ^ {\ infty} f_ {X_ {1}} (x_ {1}) f_ {X_ {2} } (z-x_ {1}) \, dx_ {1} \\ & = \ int _ {0} ^ {z} \ lambda _ {1} e ^ {- \ lambda _ {1} x_ {1}} \ lambda _ {2} e ^ {- \ lambda _ {2} (z-x_ {1})} \, dx_ {1} \\ & = \ lambda _ {1} \ lambda _ {2} e ^ { - \ lambda _ {2} z} \ int _ {0} ^ {z} e ^ {(\ lambda _ {2} - \ lambda _ {1}) x_ {1}} \, dx_ {1} \\ & = {\ begin {cases} {\ dfrac {\ lambda _ {1} \ lambda _ {2}} {\ lambda _ {2} - \ lambda _ {1}}} \ left (e ^ {- \ lambda _ {1} z} -e ^ {- \ lambda _ {2} z} \ right) & {\ text {if}} \ lambda _ {1} \ neq \ lambda _ {2} \\ [4pt] \ lambda ^ {2} ze ^ {- \ lambda z} & {\ text {if}} \ lambda _ {1} = \ lambda _ {2} = \ lambda. \ end {cases}} \ end {выровнено}} }

Энтропия этого распределения доступна в закрытой форме: при условии, что ${\ displaystyle \ lambda _ {1}> \ lambda _ {2}}$ (без ограничения общности), то

{\ displaystyle {\ begin {align} H (Z) & = 1+ \ gamma + \ ln \ left ({\ frac {\ lambda _ {1} - \ lambda _ {2}} {\ lambda _ {1}) \ lambda _ {2}}} \ right) + \ psi \ left ({\ frac {\ lambda _ {1}} {\ lambda _ {1} - \ lambda _ {2}}} \ right), \ end {выровнено}}}

где ${\ displaystyle \ gamma}$ - постоянная Эйлера-Маскерони , а ${\ Displaystyle \ psi (\ cdot)}$ это функция дигаммы . ^[3]

В случае равных параметров скорости результатом является распределение Эрланга с формой 2 и параметром ${\ displaystyle \ lambda,}$ что, в свою очередь, является частным случаем гамма-распределения .

Связанные дистрибутивы

Если ${\ displaystyle X \ sim \ operatorname {Laplace} \ left (\ mu, \ beta ^ {- 1} \ right)}$ тогда | X - μ | ~ Exp (β).
Если X ~ Парето (1, λ), то log ( X ) ~ Exp (λ).
Если X ~ SkewLogistic (θ), то ${\ displaystyle \ log \ left (1 + e ^ {- X} \ right) \ sim \ operatorname {Exp} (\ theta)}$ .
Если X _i ~ U (0, 1), то
${\ displaystyle \ lim _ {n \ to \ infty} n \ min \ left (X_ {1}, \ ldots, X_ {n} \ right) \ sim \ operatorname {Exp} (1)}$
Экспоненциальное распределение - это предел масштабированного бета-распределения :
${\ displaystyle \ lim _ {n \ to \ infty} n \ operatorname {Beta} (1, n) = \ operatorname {Exp} (1).}$
Экспоненциальное распределение - это частный случай распределения Пирсона 3-го типа .
Если X ~ Exp (λ) и X _i ~ Exp (λ _i ), то:
- ${\ displaystyle kX \ sim \ operatorname {Exp} \ left ({\ frac {\ lambda} {k}} \ right)}$ , закрытие при масштабировании на положительный фактор.
- 1 + X ~ Benktander Weibull (λ, 1), который сводится к усеченному экспоненциальному распределению.
- ke ^X ~ Парето ( k , λ).
- е ^-X ~ Beta (λ, 1).
- 1/kе ^X ~ PowerLaw ( k , λ)
- ${\ displaystyle {\ sqrt {X}} \ sim \ operatorname {Rayleigh} \ left ({\ frac {1} {\ sqrt {2 \ lambda}}} \ right)}$ , распределение Рэлея
- ${\ displaystyle X \ sim \ operatorname {Weibull} \ left ({\ frac {1} {\ lambda}}, 1 \ right)}$ , распределение Вейбулла
- ${\ displaystyle X ^ {2} \ sim \ operatorname {Weibull} \ left ({\ frac {1} {\ lambda ^ {2}}}, {\ frac {1} {2}} \ right)}$
- μ - β log (λ X ) ∼ Gumbel (μ, β) .
- ${\ displaystyle \ lfloor X \ rfloor \ sim \ operatorname {Geometric} \ left (1-e ^ {- \ lambda} \ right)}$ , геометрическое распределение на 0,1,2,3, ...
- ${\ displaystyle \ lceil X \ rceil \ sim \ operatorname {Geometric} \ left (1-e ^ {- \ lambda} \ right)}$ , геометрическое распределение на 1,2,3,4, ...
- Если также Y ~ Erlang ( n , λ) или ${\ displaystyle Y \ sim \ Gamma \ left (n, {\ frac {1} {\ lambda}} \ right)}$ тогда ${\ displaystyle {\ frac {X} {Y}} + 1 \ sim \ operatorname {Pareto} (1, n)}$
- Если также λ ~ Gamma ( k , θ) (форма, параметризация масштаба), то маргинальное распределение X равно Lomax ( k , 1 / θ), гамма- смесь
- λ ₁X ₁ - λ ₂Y ₂ ~ Лаплас (0, 1) .
- min { X ₁ , ..., X _n } ~ Exp (λ ₁ + ... + λ _n ).
- Если также λ _i = λ, то:
  - ${\ Displaystyle X_ {1} + \ cdots + X_ {k} = \ sum _ {i} X_ {i} \ sim}$ Erlang ( k , λ) = Gamma ( k , λ ⁻¹ ) = Gamma ( k , λ) (в параметризации ( k , θ) и (α, β) соответственно) с целочисленным параметром формы k.
  - X _i - X _j ~ Лаплас (0, λ - ¹ ).
- Если также X _i независимы, то:
  - ${\ displaystyle {\ frac {X_ {i}} {X_ {i} + X_ {j}}}}$ ~ U (0, 1)
  - ${\ displaystyle Z = {\ frac {\ lambda _ {i} X_ {i}} {\ lambda _ {j} X_ {j}}}}$ имеет функцию плотности вероятности ${\ displaystyle f_ {Z} (z) = {\ frac {1} {(z + 1) ^ {2}}}}$ . Это можно использовать для получения доверительного интервала для ${\ displaystyle {\ frac {\ lambda _ {i}} {\ lambda _ {j}}}}$ .
- Если также λ = 1:
  - ${\ displaystyle \ mu - \ beta \ log \ left ({\ frac {e ^ {- X}} {1-e ^ {- X}}} \ right) \ sim \ operatorname {Logistic} (\ mu, \ бета)}$ , логистическая дистрибуция
  - ${\ displaystyle \ mu - \ beta \ log \ left ({\ frac {X_ {i}} {X_ {j}}} \ right) \ sim \ operatorname {Logistic} (\ mu, \ beta)}$
  - μ - σ log ( X ) ~ GEV (μ, σ, 0) .
  - Далее, если ${\ Displaystyle Y \ sim \ Gamma \ left (\ alpha, {\ frac {\ beta} {\ alpha}} \ right)}$ тогда ${\ displaystyle {\ sqrt {XY}} \ sim \ operatorname {K} (\ alpha, \ beta)}$ ( К-распределение )
- Если также λ = 1/2, то X ∼ χ²
  ₂; т.е. X имеет распределение хи-квадрат с 2 степенями свободы . Следовательно:
  ${\ displaystyle \ operatorname {Exp} (\ lambda) = {\ frac {1} {2 \ lambda}} \ operatorname {Exp} \ left ({\ frac {1} {2}} \ right) \ sim {\ frac {1} {2 \ lambda}} \ chi _ {2} ^ {2} \ Rightarrow \ sum _ {i = 1} ^ {n} \ operatorname {Exp} (\ lambda) \ sim {\ frac {1 } {2 \ lambda}} \ chi _ {2n} ^ {2}}$
Если ${\ displaystyle X \ sim \ operatorname {Exp} \ left ({\ frac {1} {\ lambda}} \ right)}$ а также ${\ displaystyle Y \ mid X}$ ~ Пуассон ( X ), тогда ${\ displaystyle Y \ sim \ operatorname {Geometric} \ left ({\ frac {1} {1+ \ lambda}} \ right)}$ ( геометрическое распределение )
Распределение Хойта может быть получено из экспоненциального распределения и распределения арксинуса

Другие связанные дистрибутивы:

Гиперэкспоненциальное распределение - распределение, плотность которого представляет собой взвешенную сумму экспоненциальных плотностей.
Гипоэкспоненциальное распределение - распределение общей суммы экспоненциальных случайных величин.
exGaussian распределение - сумма экспоненциального распределения и нормального распределения .

Статистические выводы

Ниже предположим, что случайная величина X экспоненциально распределена с параметром скорости λ, и ${\ displaystyle x_ {1}, \ dotsc, x_ {n}}$ являются п независимые выборок из X , с выборочным средним ${\ displaystyle {\ bar {x}}}$ .

Оценка параметров

Оценка максимального правдоподобия для λ строится следующим образом:

Функция правдоподобия для λ, учитывая независимую и одинаково распределенную выборку x = ( x ₁ , ..., x _n ), взятую из переменной, составляет:

{\ displaystyle L (\ lambda) = \ prod _ {i = 1} ^ {n} \ lambda \ exp (- \ lambda x_ {i}) = \ lambda ^ {n} \ exp \ left (- \ lambda \ sum _ {i = 1} ^ {n} x_ {i} \ right) = \ lambda ^ {n} \ exp \ left (- \ lambda n {\ overline {x}} \ right),}

где:

{\ displaystyle {\ overline {x}} = {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} x_ {i}}

- выборочное среднее.

Производная логарифма функции правдоподобия:

{\ displaystyle {\ frac {d} {d \ lambda}} \ ln L (\ lambda) = {\ frac {d} {d \ lambda}} \ left (n \ ln \ lambda - \ lambda n {\ overline {x}} \ right) = {\ frac {n} {\ lambda}} - n {\ overline {x}} \ {\ begin {cases}> 0, & 0 <\ lambda <{\ frac {1} { \ overline {x}}}, \\ [8pt] = 0, & \ lambda = {\ frac {1} {\ overline {x}}}, \\ [8pt] <0, & \ lambda> {\ frac {1} {\ overline {x}}}. \ End {case}}}

Следовательно, оценка максимального правдоподобия для параметра скорости составляет:

{\ displaystyle {\ widehat {\ lambda}} _ {\ text {mle}} = {\ frac {1} {\ overline {x}}} = {\ frac {n} {\ sum _ {i} x_ { я}}}}

Это не несмещенная оценка из ${\ displaystyle \ lambda,}$ хотя ${\ displaystyle {\ overline {x}}}$ является несмещенной ^[4] MLE ^[5] оценкой ${\ displaystyle 1 / \ lambda}$ и среднее значение распределения.

Предвзятость ${\ displaystyle {\ widehat {\ lambda}} _ {\ text {mle}}}$ равно

{\ displaystyle b \ Equiv \ OperatorName {E} \ left [\ left ({\ widehat {\ lambda}} _ {\ text {mle}} - \ lambda \ right) \ right] = {\ frac {\ lambda} {n-1}}}

что дает скорректированную смещением оценку максимального правдоподобия

{\ displaystyle {\ widehat {\ lambda}} _ {\ text {mle}} ^ {*} = {\ widehat {\ lambda}} _ {\ text {mle}} - {\ widehat {b}}.}

Приближенный минимизатор ожидаемой квадратичной ошибки

Предположим, у вас есть как минимум три образца. Если мы ищем минимизатор ожидаемой среднеквадратичной ошибки (см. Также: Компромисс смещения и дисперсии ), который аналогичен оценке максимального правдоподобия (то есть мультипликативной поправке к оценке правдоподобия), мы имеем:

{\ displaystyle {\ widehat {\ lambda}} = \ left ({\ frac {n-2} {n}} \ right) \ left ({\ frac {1} {\ bar {x}}} \ right) = {\ frac {n-2} {\ sum _ {i} x_ {i}}}}

Это выводится из среднего значения и дисперсии обратного гамма-распределения : ${\ textstyle {\ mbox {Inv-Gamma}} (п, \ лямбда)}$ . ^[6]

Информация Fisher

Информация Фишера , обозначенная ${\ Displaystyle {\ mathcal {I}} (\ lambda)}$ , для оценки параметра скорости ${\ displaystyle \ lambda}$ дается как:

{\ displaystyle {\ mathcal {I}} (\ lambda) = \ operatorname {E} \ left [\ left. \ left ({\ frac {\ partial} {\ partial \ lambda}} \ log f (x; \ lambda) \ right) ^ {2} \ right | \ lambda \ right] = \ int \ left ({\ frac {\ partial} {\ partial \ lambda}} \ log f (x; \ lambda) \ right) ^ {2} f (x; \ lambda) \, dx}

Подключение раздачи и решения дает:

{\ displaystyle {\ mathcal {I}} (\ lambda) = \ int _ {0} ^ {\ infty} \ left ({\ frac {\ partial} {\ partial \ lambda}} \ log \ lambda e ^ { - \ lambda x} \ right) ^ {2} \ lambda e ^ {- \ lambda x} \, dx = \ int _ {0} ^ {\ infty} \ left ({\ frac {1} {\ lambda} } -x \ right) ^ {2} \ lambda e ^ {- \ lambda x} \, dx = \ lambda ^ {- 2}.}.}

Это определяет количество информации, которую несет каждый независимый образец экспоненциального распределения о неизвестном параметре скорости. ${\ displaystyle \ lambda}$ .

Доверительные интервалы

Доверительный интервал 100 (1 - α)% для параметра скорости экспоненциального распределения определяется следующим образом: ^[7]

{\ displaystyle {\ frac {2n} {{\ widehat {\ lambda}} \ chi _ {1 - {\ frac {\ alpha} {2}}, 2n} ^ {2}}} <{\ frac {1 } {\ lambda}} <{\ frac {2n} {{\ widehat {\ lambda}} \ chi _ {{\ frac {\ alpha} {2}}, 2n} ^ {2}}}}

что также равно:

{\ displaystyle {\ frac {2n {\ overline {x}}} {\ chi _ {1 - {\ frac {\ alpha} {2}}, 2n} ^ {2}}} <{\ frac {1} {\ lambda}} <{\ frac {2n {\ overline {x}}} {\ chi _ {{\ frac {\ alpha} {2}}, 2n} ^ {2}}}}

где $χ 2 п, в$ является $100 (р)$ процентиля в распределение хи-квадрат с v степенями свободы , п число наблюдений раз между прибытия в образце, и х-бар средний образец. Простое приближение к точным конечным точкам интервала можно получить, используя нормальное приближение к $χ 2 п, в$ распределение. Это приближение дает следующие значения для 95% доверительного интервала:

{\ displaystyle {\ begin {align} \ lambda _ {\ text {lower}} & = {\ widehat {\ lambda}} \ left (1 - {\ frac {1.96} {\ sqrt {n}}} \ right ) \\\ lambda _ {\ text {upper}} & = {\ widehat {\ lambda}} \ left (1 + {\ frac {1.96} {\ sqrt {n}}} \ right) \ end {выровнено} }}

Это приближение может быть приемлемым для образцов, содержащих не менее 15-20 элементов. ^[8]

Байесовский вывод

Конъюгат до экспоненциального распределения является гамма - распределение (из которых экспоненциальное распределение является частным случаем). Полезна следующая параметризация функции плотности гамма-вероятности:

{\ displaystyle \ operatorname {Gamma} (\ lambda; \ alpha, \ beta) = {\ frac {\ beta ^ {\ alpha}} {\ Gamma (\ alpha)}} \ lambda ^ {\ alpha -1} \ exp (- \ lambda \ beta).}

Затем апостериорное распределение p может быть выражено через функцию правдоподобия, определенную выше, и априорную гамму:

{\ Displaystyle {\ begin {выровнено} п (\ лямбда) & \ propto L (\ лямбда) \ гамма (\ лямбда; \ альфа, \ бета) \\ & = \ лямбда ^ {n} \ exp \ left (- \ lambda n {\ overline {x}} \ right) {\ frac {\ beta ^ {\ alpha}} {\ Gamma (\ alpha)}} \ lambda ^ {\ alpha -1} \ exp (- \ lambda \ бета) \\ & \ propto \ lambda ^ {(\ alpha + n) -1} \ exp (- \ lambda \ left (\ beta + n {\ overline {x}} \ right)). \ end {выравнивается} }}

Теперь апостериорная плотность p задана с точностью до отсутствующей нормирующей константы. Поскольку он имеет форму гамма-PDF, его можно легко заполнить и получить:

{\ displaystyle p (\ lambda) = \ Gamma (\ lambda; \ alpha + n, \ beta + n {\ overline {x}}).}

Здесь гиперпараметр α можно интерпретировать как количество предыдущих наблюдений, а β как сумму предыдущих наблюдений. Апостериорное значение здесь:

{\ displaystyle {\ frac {\ alpha + n} {\ beta + n {\ overline {x}}}}.}

Возникновение и приложения

Возникновение событий

Экспоненциальное распределение возникает естественным образом при описании длительностей времен между приходами в однородном пуассоновском процессе .

Экспоненциальное распределение можно рассматривать как непрерывный аналог геометрического распределения , которое описывает количество попыток Бернулли, необходимых для изменения состояния дискретного процесса. Напротив, экспоненциальное распределение описывает время, в течение которого непрерывный процесс меняет состояние.

В реальных сценариях предположение о постоянной скорости (или вероятности в единицу времени) редко выполняется. Например, скорость входящих телефонных звонков зависит от времени суток. Но если мы сосредоточимся на временном интервале, в течение которого скорость примерно постоянна, например, с 14 до 16 часов в рабочие дни, экспоненциальное распределение можно использовать в качестве хорошей приблизительной модели для времени до следующего телефонного звонка. Подобные предостережения применимы к следующим примерам, которые дают приблизительно экспоненциально распределенные переменные:

Время до распада радиоактивной частицы или время между щелчками счетчика Гейгера
Время до следующего телефонного звонка
Время до дефолта (по выплате держателям долга компании) в сокращенной форме Моделирование кредитного риска

Экспоненциальные переменные также можно использовать для моделирования ситуаций, когда определенные события происходят с постоянной вероятностью на единицу длины, например расстояние между мутациями в цепи ДНК или между авариями на дороге.

В теории очередей время обслуживания агентов в системе (например, сколько времени требуется кассиру банка и т. Д. Для обслуживания клиента) часто моделируется как экспоненциально распределенные переменные. (Прибытие заявок, например, также моделируется распределением Пуассона, если поступления независимы и распределяются одинаково.) Продолжительность процесса, который можно представить как последовательность нескольких независимых задач, следует распределению Эрланга (которое является распределением суммы нескольких независимых переменных с экспоненциальным распределением). Теория надежности и надежность техники также широко использовать экспоненциальное распределение. Из-за того, что это распределение не имеет памяти , оно хорошо подходит для моделирования участка кривой ванны с постоянным уровнем опасности, используемого в теории надежности. Это также очень удобно, потому что в модель надежности очень легко добавить интенсивность отказов . Однако экспоненциальное распределение не подходит для моделирования общего срока службы организмов или технических устройств, потому что «интенсивность отказов» здесь непостоянна: больше отказов происходит как для очень молодых, так и для очень старых систем.

Подгоняемое кумулятивное экспоненциальное распределение к годовому максимуму однодневных осадков с использованием CumFreq ^[9]

В физике , если вы наблюдаете газ при фиксированной температуре и давлении в однородном гравитационном поле , высота различных молекул также подчиняется приблизительному экспоненциальному распределению, известному как барометрическая формула . Это следствие упомянутого ниже свойства энтропии.

В гидрологии экспоненциальное распределение используется для анализа экстремальных значений таких переменных, как месячные и годовые максимальные значения суточных осадков и объемов речного стока. ^[10]

На синем рисунке показан пример подгонки экспоненциального распределения к ранжированным годовым максимальным однодневным осадкам, показывающий также пояс уверенности 90% на основе биномиального распределения . Данные об осадках представлены в виде точек на графике как часть кумулятивного частотного анализа .

Прогноз

Наблюдая за выборкой из n точек данных из неизвестного экспоненциального распределения, общей задачей является использование этих выборок для прогнозирования будущих данных из того же источника. Распространенным прогнозирующим распределением по будущим выборкам является так называемое дополнительное распределение, формируемое путем включения подходящей оценки параметра скорости λ в экспоненциальную функцию плотности. Обычный выбор оценки - это оценка, обеспечиваемая принципом максимального правдоподобия, и использование этого дает прогнозирующую плотность для будущей выборки x _{n +1} , обусловленную наблюдаемыми выборками x = ( x ₁ , ..., x _n ) дано

{\ displaystyle p _ {\ rm {ML}} (x_ {n + 1} \ mid x_ {1}, \ ldots, x_ {n}) = \ left ({\ frac {1} {\ overline {x}}) } \ right) \ exp \ left (- {\ frac {x_ {n + 1}} {\ overline {x}}} \ right)}

Байесовский подход обеспечивает прогнозирующее распределение, которое учитывает неопределенность оцениваемого параметра, хотя это может существенно зависеть от выбора априорного значения.

Прогностическое распределение, свободное от проблем выбора априорных значений, возникающих при субъективном байесовском подходе, является

{\ displaystyle p _ {\ rm {CNML}} (x_ {n + 1} \ mid x_ {1}, \ ldots, x_ {n}) = {\ frac {n ^ {n + 1} \ left ({\ overline {x}} \ right) ^ {n}} {\ left (n {\ overline {x}} + x_ {n + 1} \ right) ^ {n + 1}}},}

что можно рассматривать как

частотное доверительное распределение , полученное из распределения ключевой величины ${\ displaystyle {x_ {n + 1}} / {\ overline {x}}}$ ; ^[11]
прогнозируемую вероятность профиля, полученную путем исключения параметра λ из совместной вероятности x _{n +1} и λ путем максимизации; ^[12]
объективное байесовское прогнозирующее апостериорное распределение, полученное с использованием неинформативного априорного распределения Джеффри 1 / λ ;
прогнозирующее распределение условного нормализованного максимального правдоподобия (CNML), исходя из теоретических соображений. ^[13]

Точность прогнозирующего распределения может быть измерена с использованием расстояния или расхождения между истинным экспоненциальным распределением с параметром скорости λ ₀ и прогнозируемым распределением на основе выборки x . Дивергенции Кульбака-Либлер является широко используемым, параметризация свободный мерой разности двух распределений. Обозначив Δ ( λ ₀ || p ) расхождение Кульбака – Лейблера между экспонентой с параметром скорости λ ₀ и прогнозным распределением p, можно показать, что

{\ displaystyle {\ begin {align} \ operatorname {E} _ {\ lambda _ {0}} \ left [\ Delta (\ lambda _ {0} \ parallel p _ {\ rm {ML}}) \ right] & = \ psi (n) + {\ frac {1} {n-1}} - \ log (n) \\\ имя оператора {E} _ {\ lambda _ {0}} \ left [\ Delta (\ lambda _ {0} \ parallel p _ {\ rm {CNML}}) \ right] & = \ psi (n) + {\ frac {1} {n}} - \ log (n) \ end {align}}}

где математическое ожидание берется относительно экспоненциального распределения с параметром скорости λ ₀ ∈ (0, ∞) , а ψ (·) - дигамма-функция. Ясно, что прогнозирующее распределение CNML строго превосходит распределение плагинов максимального правдоподобия с точки зрения среднего расхождения Кульбака – Лейблера для всех размеров выборки n > 0 .

Вычислительные методы

Генерация экспоненциальных переменных

Концептуально очень простой метод генерации экспоненциальных переменных основан на выборке с обратным преобразованием : для заданной случайной переменной U, взятой из равномерного распределения на единичном интервале (0, 1), переменная

{\ Displaystyle Т = F ^ {- 1} (U)}

имеет экспоненциальное распределение, где F ⁻¹ - функция квантиля , определяемая формулой

{\ displaystyle F ^ {- 1} (p) = {\ frac {- \ ln (1-p)} {\ lambda}}.}

Более того, если U равномерно на (0, 1), то и 1 - U равномерно . Это означает, что можно генерировать экспоненциальные переменные следующим образом:

{\ displaystyle T = {\ frac {- \ ln (U)} {\ lambda}}.}

Другие методы генерации экспоненциальных переменных обсуждаются Кнутом ^[14] и Деврой. ^[15]

Также доступен быстрый метод создания набора готовых экспоненциальных переменных без использования процедуры сортировки. ^[15]

Смотрите также

Мертвое время - применение экспоненциального распределения к анализу детектора частиц.
Распределение Лапласа , или «двойное экспоненциальное распределение».
Отношения между распределениями вероятностей
Экспоненциальное распределение Маршалла – Олкина.

Внешние ссылки

"Экспоненциальное распределение" , Энциклопедия математики , EMS Press , 2001 [1994]
Онлайн-калькулятор экспоненциального распределения

[1] Park, Sung Y .; Бера, Анил К. (2009). "Модель условной гетероскедастичности авторегрессии максимальной энтропии" (PDF) . Журнал эконометрики . Эльзевьер: 219–230. Архивировано из оригинального (PDF) 07 марта 2016 года . Проверено 2 июня 2011 .

[2] Майкл, Луго. «Ожидание максимума экспонент» (PDF) . Архивировано из оригинального (PDF) 20 декабря 2016 года . Проверено 13 декабря +2016 .

[3] Экфорд, Эндрю В .; Томас, Питер Дж. (2016). «Энтропия суммы двух независимых, неодинаково распределенных экспоненциальных случайных величин». arXiv : 1609.02911 .

[JohnsonWichern2007-4] Ричард Арнольд Джонсон; Дин В. Уичерн (2007). Прикладной многомерный статистический анализ . Пирсон Прентис Холл. ISBN 978-0-13-187715-3. Проверено 10 августа 2012 года .

[5] Электронный справочник статистических методов NIST / SEMATECH

[6] Эльфесси, Абдулазиз; Рейнеке, Дэвид М. (2001). «Байесовский взгляд на классическую оценку: экспоненциальное распределение» . Журнал статистики образования . 9 (1). DOI : 10.1080 / 10691898.2001.11910648 .

[7] Росс, Шелдон М. (2009). Введение в вероятность и статистику для инженеров и ученых (4-е изд.). Ассошиэйтед Пресс. п. 267. ISBN. 978-0-12-370483-2.

[Guerriero-8] Герриеро, В. (2012). "Распределение степенного закона: метод многомасштабной логической статистики" . Журнал современной математики Frontier (JMMF) . 1 : 21–28.

[9] «Cumfreq, бесплатная компьютерная программа для кумулятивного частотного анализа» .

[10] Ритзема (ред.), HP (1994). Частотный и регрессионный анализ . Глава 6 в: Принципы и применение дренажа, Публикация 16, Международный институт мелиорации и улучшения земель (ILRI), Вагенинген, Нидерланды. С. 175–224 . ISBN 90-70754-33-9.CS1 maint: дополнительный текст: список авторов ( ссылка )

[11] Лоулесс, JF; Фредетт, М. (2005). «Частотные предсказания интервалов и предсказывающих распределений» . Биометрика . 92 (3): 529–542. DOI : 10.1093 / Biomet / 92.3.529 .

[12] Бьорнстад, Дж. Ф. (1990). «Прогнозируемое правдоподобие: обзор» . Статист. Sci . 5 (2): 242–254. DOI : 10,1214 / сс / 1177012175 .

[13] DF Schmidt и E. Makalic, « Универсальные модели для экспоненциального распределения », IEEE Transactions on Information Theory , Volume 55, Number 7, pp. 3087–3090, 2009 doi : 10.1109 / TIT.2009.2018331

[14] Дональд Э. Кнут (1998). Искусство программирования , том 2: получисловые алгоритмы , 3-е изд. Бостон: Аддисон – Уэсли. ISBN 0-201-89684-2 . См. Раздел 3.4.1, с. 133.

[devroye-15] Люк Деврой (1986). Генерация неоднородной случайной величины . Нью-Йорк: Springer-Verlag. ISBN 0-387-96305-7 . См. Главу IX , раздел 2, стр. 392–401.