Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В теории вероятностей и статистике , то распределение Пуассона ( / р ж ɑ ы ɒ н / ; французское произношение: [pwasɔ] ), названное в честь французского математик Пуассона , является дискретным распределением вероятностей , выражающее вероятность заданного числа событий, происходящих в фиксированном интервале времени или пространства, если эти события происходят с известной постоянной средней скоростью и независимо от времени, прошедшего с момента последнего события. [1] Распределение Пуассона также можно использовать для количества событий в других заданных интервалах, таких как расстояние, площадь или объем.

Например, колл-центр принимает в среднем 180 звонков в час 24 часа в сутки. Звонки независимы; получение одного не меняет вероятность прибытия следующего. Количество звонков, полученных в течение любой минуты, имеет распределение вероятностей Пуассона: наиболее вероятные числа - 2 и 3, но также вероятны 1 и 4, и есть небольшая вероятность того, что оно будет равно нулю, и очень небольшая вероятность, что это может быть. 10. Другой пример - это количество распадов радиоактивного источника за определенный период наблюдений.

Определения [ править ]

Вероятностная функция масс [ править ]

Распределение Пуассона популярно для моделирования того, сколько раз событие происходит в интервале времени или пространства .

Дискретная случайная величина Х называются имеет распределение Пуассона с параметром λ  > 0 , если для к  = 0, 1, 2, ..., то функции вероятности массы из X определяются по формуле: [2] : 60

куда

  • e - число Эйлера ( e = 2,71828 ...)
  • k - количество вхождений
  • к ! является факторный из к .

Положительное действительное число λ равно ожидаемой величине из X , а также к его дисперсии [3]

Распределение Пуассона можно применять к системам с большим количеством возможных событий, каждое из которых является редким . Количество таких событий, которые происходят в течение фиксированного интервала времени, при определенных обстоятельствах является случайным числом с распределением Пуассона.

Уравнение можно адаптировать, если вместо среднего количества событий нам дадут временную шкалу количества событий, которые должны произойти. Затем (с указанием количества событий в единицу времени) и

Пример [ править ]

Распределение Пуассона может быть полезно для моделирования таких событий, как

  • Количество метеоритов диаметром более 1 метра, падающих на Землю за год.
  • Количество пациентов, поступивших в отделение неотложной помощи с 22 до 23 часов.
  • Количество лазерных фотонов, попавших в детектор за определенный промежуток времени.

Предположения и обоснованность [ править ]

Распределение Пуассона является подходящей моделью, если верны следующие предположения: [4]

  • k - количество раз, когда событие происходит в интервале, и k может принимать значения 0, 1, 2, ....
  • Возникновение одного события не влияет на вероятность того, что произойдет второе событие. То есть события происходят независимо.
  • Средняя скорость, с которой происходят события, не зависит от каких-либо событий. Для простоты это обычно считается постоянным, но на практике может меняться со временем.
  • Два события не могут происходить в один и тот же момент; вместо этого на каждом очень маленьком подынтервале происходит ровно одно событие, либо не происходит.

Если эти условия верны, то k - случайная величина Пуассона, а распределение k - распределение Пуассона.

Распределение Пуассона также предел из биномиального распределения , для которых вероятность успеха для каждого испытания равна λ , деленное на число испытаний, а число испытаний стремится к бесконечности (см Связанные распределения ).


Примеры вероятностей для распределений Пуассона [ править ]

Один раз в интервале событий: частный случай λ = 1 и k = 0 [ править ]

Предположим, что астрономы подсчитали, что большие метеориты (более определенного размера) падают на Землю в среднем один раз в 100 лет ( λ = 1 событие в 100 лет), и что количество попаданий метеоритов следует распределению Пуассона. Какова вероятность падения метеорита k = 0 в следующие 100 лет?

При этих предположениях вероятность того, что в ближайшие 100 лет не упадет на Землю ни один крупный метеорит, составляет примерно 0,37. Оставшееся 1 - 0,37 = 0,63 - это вероятность падения 1, 2, 3 или более крупных метеоритов в следующие 100 лет. В приведенном выше примере наводнение, вызванное переполнением, происходило каждые 100 лет ( λ  = 1). По тому же расчету вероятность отсутствия наводнений через 100 лет составила примерно 0,37.

В общем, если событие происходит в среднем один раз за интервал ( λ  = 1), и события следуют распределению Пуассона, то P (0 событий в следующем интервале) = 0,37 . Кроме того, P (ровно одно событие в следующем интервале) = 0,37, как показано в таблице для наводнений переполнения.

Примеры, нарушающие предположения Пуассона [ править ]

Количество студентов, которые прибывают в студенческий союз в минуту, скорее всего, не будет соответствовать распределению Пуассона, потому что этот показатель не является постоянным (низкий показатель во время уроков, высокий показатель между уроками), а прибытие отдельных студентов не является независимым (студенты обычно приходят группами).

Число землетрясений магнитудой 5 в год в стране может не соответствовать распределению Пуассона, если одно сильное землетрясение увеличивает вероятность афтершоков аналогичной магнитуды.

Примеры, в которых гарантировано хотя бы одно событие, не распространяются; но может быть смоделирован с использованием усеченного нулем распределения Пуассона .

Распределения подсчета, в которых количество интервалов с нулевыми событиями больше, чем предсказывается моделью Пуассона, можно смоделировать с использованием модели с нулевым раздутием .

Свойства [ править ]

Описательная статистика [ править ]

  • Ожидаемое значение и дисперсия из Пуассона-распределенной случайной величины оба равны Л.
  • Коэффициент вариации является , в то время как индекс дисперсии равен 1. [6] : 163
  • Среднее абсолютное отклонение около среднего значения [6] : 163
  • Режим из Пуассона-распределенной случайной переменной с нецелым Х равно , что наибольшее целое число меньше или равно  Л . Это также записывается как floor (λ). Когда λ - положительное целое число, режимы - λ и λ  - 1.
  • Все кумулянты распределения Пуассона равны математическому ожиданию  λ . П - я факторного момента распределения Пуассона λ п .
  • Ожидаемое значение из процесса Пуассона иногда разлагается в произведение интенсивности и экспозиции (или в более общем случае выражается в виде интеграла от «функции интенсивности» с течением времени или в пространстве, которое иногда называют как «воздействием»). [7]

Медиана [ править ]

Границы для медианы ( ) распределения известны и точны : [8]

Высшие моменты [ править ]

  • Высшие моменты относительно начала координат m k распределения Пуассона являются полиномами Тушара от λ:
где фигурные скобки обозначают числа Стирлинга второго рода . [9] [1] : 6 Коэффициенты многочленов имеют комбинаторный смысл. Фактически, когда ожидаемое значение распределения Пуассона равно 1, тогда формула Добинского говорит, что n- й момент равен количеству разбиений набора размера n .

Для нецентрированных моментов определим , тогда [10]

где - некоторая абсолютная постоянная больше 0.

Суммы случайных величин, распределенных по Пуассону [ править ]

Если для являются независимыми , то . [11] : 65 Обратное утверждение - теорема Райкова , которая гласит, что если сумма двух независимых случайных величин распределена по Пуассону, то каждая из этих двух независимых случайных величин также. [12] [13]

Другие свойства [ править ]

  • Распределения Пуассона - это безгранично делимые распределения вероятностей. [14] : 233 [6] : 164
  • Направлено Кульбак-Либлер расходимости из от задается
  • Границы вероятностей хвоста пуассоновской случайной величины могут быть получены с использованием аргумента границы Чернова . [15] : 97-98
,
  • Вероятность верхнего хвоста может быть увеличена (как минимум в два раза) следующим образом: [16]
где - направленное расхождение Кульбака – Лейблера, как описано выше.
  • Неравенства, связывающие функцию распределения пуассоновской случайной величины со стандартной функцией нормального распределения , следующие: [16]
где снова - направленное расхождение Кульбака – Лейблера.

Расы Пуассона [ править ]

Пусть и - независимые случайные величины, при , тогда мы имеем, что

Верхняя оценка доказывается с помощью стандартной оценки Чернова.

Нижнюю границу можно доказать, отметив, что это вероятность того , что , где , которая ограничена снизу , где - относительная энтропия (подробности см. В разделе о границах хвостов биномиальных распределений ). Далее, отмечая это , и вычисление нижней границы безусловной вероятности дает результат. Более подробную информацию можно найти в приложении Kamath et al. . [17]

Связанные дистрибутивы [ править ]

Общие [ править ]

  • Если и независимы, то разница соответствует распределению Скеллама .
  • Если и независимы, то распределение условного на является биномиальным распределением .
Конкретно если , то .
В более общем смысле, если X 1 , X 2 , ..., X n - независимые пуассоновские случайные величины с параметрами λ 1 , λ 2 , ..., λ n, то
дано . На самом деле, .
  • Если и распределение , обусловливающие X  =  К , является биномиальное распределение , , то распределение Y подчиняется распределению Пуассона . Фактически, если , при условии, что X = k, следует полиномиальному распределению , то каждое следует независимому распределению Пуассона .
  • Распределение Пуассона может быть получено как предельный случай для биномиального распределения, поскольку количество попыток стремится к бесконечности, а ожидаемое количество успехов остается фиксированным - см. Закон редких событий ниже. Следовательно, его можно использовать в качестве аппроксимации биномиального распределения, если n достаточно велико, а p достаточно мало. Существует эмпирическое правило, согласно которому распределение Пуассона является хорошим приближением биномиального распределения, если n не меньше 20, а p меньше или равно 0,05, и отличным приближением, если n  ≥ 100 и np  ≤ 10. [18 ]
  • Распределение Пуассона - это частный случай дискретного составного распределения Пуассона (или распределения Пуассона с заиканием) с одним параметром. [19] [20] Дискретное составное распределение Пуассона можно вывести из предельного распределения одномерного полиномиального распределения. Это также особый случай из сложного распределения Пуассона .
  • Для достаточно больших значений λ (скажем, λ> 1000) нормальное распределение со средним λ и дисперсией λ (стандартное отклонение ) является отличным приближением к распределению Пуассона. Если λ больше примерно 10, то нормальное распределение является хорошим приближением, если выполняется соответствующая коррекция непрерывности , т. Е. Если P ( X  ≤  x ), где x - неотрицательное целое число, заменяется на P ( X  ≤  х  + 0,5).
  • Преобразование, стабилизирующее дисперсию : Если , то
, [6] : 168
и
. [21] : 196
При этом преобразовании сходимость к нормальности (по мере увеличения) происходит намного быстрее, чем для непреобразованной переменной. [ необходима цитата ] Доступны и другие, немного более сложные преобразования, стабилизирующие дисперсию, [6] : 168 одним из которых является преобразование Анскомба . [22] См. Преобразование данных (статистика) для более общего использования преобразований.
  • Если для каждого t  > 0 количество вступлений во временном интервале [0,  t ] следует распределению Пуассона со средним λt , то последовательность времен между приходами является независимыми и одинаково распределенными экспоненциальными случайными величинами, имеющими среднее значение 1 / λ . [23] : 317–319
  • Эти кумулятивные функции распределения Пуассона и распределения хи-квадрат связаны следующими способами: [6] : 167
и [6] : 158

Приближение Пуассона [ править ]

Предположим , где , то [24] является полиномиально распределенный обусловлено .

Это означает [15] : 101-102 , среди прочего, что для любой неотрицательной функции , если она полиномиально распределена, то

где .

Коэффициент можно заменить на 2, если в дальнейшем предполагается, что он монотонно увеличивается или уменьшается.

Двумерное распределение Пуассона [ править ]

Это распределение было распространено на двумерный случай. [25] производящая функция для этого распределения

с

Маргинальные распределения - это пуассоновское ( θ 1 ) и пуассоновское ( θ 2 ), а коэффициент корреляции ограничен диапазоном

Простой способ сгенерировать двумерное распределение Пуассона - взять три независимых распределения Пуассона со средними и затем установить . Функция вероятности двумерного распределения Пуассона равна

Свободное распределение Пуассона [ править ]

Свободное распределение Пуассона [26] с размером и скоростью скачка возникает в свободной теории вероятностей как предел повторной свободной свертки.

при N  → ∞.

Другими словами, пусть будут случайными величинами, чтобы иметь значение с вероятностью и значение 0 с оставшейся вероятностью. Предположим также , что семья являются свободно независимыми . Тогда предел по закону задается законом Свободного Пуассона с параметрами .

Это определение аналогично одному из способов, которыми классическое распределение Пуассона получается из (классического) пуассоновского процесса.

Мера, связанная со свободным законом Пуассона, дается формулой [27]

куда

и имеет поддержку .

Этот закон также возникает в теории случайных матриц как закон Марченко – Пастура . Его свободные кумулянты равны .

Некоторые трансформации этого закона [ править ]

Приведены значения некоторых важных преобразований свободного закона Пуассона; это вычисление можно найти, например, в книге А. Ника и Р. Спайхера « Лекции по комбинаторике свободной вероятности » [28].

R-преобразование свободного закона Пуассона дается

Преобразование Коши (которое является отрицательным по отношению к преобразованию Стилтьеса ) задается формулой

S-преобразование задается

в том случае, если .

Статистический вывод [ править ]

Оценка параметров [ править ]

Учитывая выборку из n измеренных значений для i  = 1, ...,  n , мы хотим оценить значение параметра λ пуассоновской популяции, из которой была взята выборка. Максимального правдоподобия оценка [29]

Поскольку каждое наблюдение имеет математическое ожидание λ, то же самое означает и среднее значение выборки. Следовательно, оценка максимального правдоподобия является несмещенной оценкой λ. Это также эффективная оценка, поскольку ее дисперсия достигает нижней границы Крамера – Рао (CRLB). [ необходимая цитата ] Следовательно, это объективная минимальная дисперсия . Также можно доказать, что сумма (и, следовательно, выборочное среднее, поскольку оно является взаимно однозначной функцией суммы) является полной и достаточной статистикой для λ.

Чтобы доказать достаточность, мы можем использовать теорему факторизации . Рассмотрим разделение функции масс вероятности совместного распределения Пуассона для выборки на две части: одну, которая зависит исключительно от выборки (называемой ), и другую, которая зависит от параметра и выборки только через функцию . Тогда это достаточная статистика для .

Первый член ,, зависит только от . Второй член ,, зависит от выборки только через . Таким образом, достаточно.

Чтобы найти параметр λ, который максимизирует функцию вероятности для пуассоновской популяции, мы можем использовать логарифм функции правдоподобия:

Возьмем производную по λ и сравним с нулем:

Решение относительно λ дает стационарную точку.

Итак, λ - это среднее значение k i . Получение знака второй производной от L в стационарной точке определит, что это за экстремальное значение λ .

Оценка второй производной в стационарной точке дает:

что является отрицательным значением в n раз обратным среднему значению k i . Это выражение отрицательно, когда среднее положительное. Если это выполнено, то стационарная точка максимизирует функцию вероятности.

Для полноты , семейство распределений называется полным тогда и только тогда, когда это подразумевает это для всех . Если человек iid , то . Зная распределение, которое мы хотим исследовать, легко увидеть, что статистика завершена.

Для выполнения этого равенства должно быть 0. Это следует из того факта, что ни один из других членов не будет равен 0 для всех в сумме и для всех возможных значений . Следовательно, поскольку все подразумевает это , и статистика оказалась полной.

Доверительный интервал [ править ]

Доверительный интервал для среднего распределения Пуассона можно выразить с помощью соотношения между совокупными функциями распределения Пуассона и х-квадратом распределениями . Распределение хи-квадрат само по себе тесно связано с гамма-распределением , и это приводит к альтернативному выражению. Учитывая наблюдение k из распределения Пуассона со средним значением μ , доверительный интервал для μ с уровнем достоверности 1 - α равен

или, что эквивалентно,

где - функция квантиля (соответствующая нижней части хвоста p ) распределения хи-квадрат с n степенями свободы, и - функция квантиля гамма-распределения с параметром формы n и параметром масштаба 1. [6] : 176-178 [30] Этот интервал является « точным » в том смысле, что его вероятность охвата никогда не меньше номинальной 1 - α .

Когда квантили гамма-распределения недоступны, было предложено точное приближение к этому точному интервалу (на основе преобразования Уилсона – Хильферти ): [31]

где обозначает стандартное нормальное отклонение с верхней хвостовой частью α / 2 .

Для применения этих формул в том же контексте, что и выше (учитывая выборку из n измеренных значений k i, каждое из которых извлечено из распределения Пуассона со средним λ ), можно было бы установить

вычислить интервал для μ  =  , а затем вывести интервал для λ .

Байесовский вывод [ править ]

В байесовском выводе , то сопряженные перед для параметра скорости Х распределений Пуассона является гамма - распределение . [32] Пусть

обозначают, что λ распределяется согласно гамма- плотности g, параметризованной с помощью параметра формы α и параметра обратного масштаба β :

Затем, учитывая ту же выборку из n измеренных значений k i, что и раньше , и априорную гамму ( α , β ), апостериорное распределение имеет вид

Апостериорное среднее E [ λ ] приближается к оценке максимального правдоподобия в пределе as , что непосредственно следует из общего выражения среднего значения гамма-распределения .

Задней предсказанием распределения для одного дополнительного наблюдения является отрицательное биномиальное распределение , [33] : 53 иногда называют распределение гамма-Пуассона.

Одновременная оценка нескольких пуассоновских средних [ править ]

Предположим , что представляет собой набор независимых случайных величин из множества распределений Пуассона, каждый с параметром , и мы хотели бы, чтобы оценить эти параметры. Затем Clevenson и Зидек показывает , что при нормированной квадрате потери ошибки , когда , затем, подобно тому, как в примере Штейна для обычных средств, оценка MLE является недопустимой . [34]

В этом случае семейство минимаксных оценок дается для любого и как [35]

Возникновение и применение [ править ]

Приложения распределения Пуассона можно найти во многих областях, включая: [36]

  • Пример телекоммуникации : поступающие в систему телефонные звонки.
  • Пример из астрономии : фотоны прибывают в телескоп.
  • Химии пример: молекулярно - массовое распределение из живой полимеризации . [37]
  • Биологический пример: количество мутаций в цепи ДНК на единицу длины.
  • Пример управления : клиенты прибывают в прилавок или колл-центр.
  • Пример финансов и страхования : количество убытков или претензий, произошедших за определенный период времени.
  • Пример сейсмологии землетрясений : асимптотическая пуассоновская модель сейсмического риска для сильных землетрясений. [38]
  • Пример радиоактивности : количество распадов радиоактивного образца за заданный интервал времени.
  • Пример оптики : количество фотонов, испускаемых за один лазерный импульс. Это основная уязвимость большинства протоколов квантового распределения ключей , известная как разделение числа фотонов (PNS).

Распределение Пуассона возникает в связи с пуассоновскими процессами. Он применяется к различным явлениям с дискретными свойствами (то есть к тем, которые могут происходить 0, 1, 2, 3, ... раз в течение данного периода времени или в данной области) всякий раз, когда вероятность возникновения явления постоянна в время или пространство . Примеры событий, которые можно смоделировать как распределение Пуассона, включают:

  • Число солдат, убитых конными пинками каждый год в каждом корпусе прусской кавалерии. Этот пример был использован в книге Ладислава Борткевича (1868–1931). [39] : 23-25
  • Количество дрожжевых клеток, используемых при варке пива Guinness . Этот пример был использован Уильямом Сили Госсетом (1876–1937). [40] [41]
  • Количество телефонных звонков, поступивших в колл-центр за минуту. Этот пример описал А. К. Эрланг (1878–1929). [42]
  • Интернет-трафик.
  • Количество голов в видах спорта с участием двух соревнующихся команд. [43]
  • Количество смертей в год в данной возрастной группе.
  • Количество скачков цены акции за данный промежуток времени.
  • В предположении однородности количество обращений к веб-серверу в минуту.
  • Количество мутаций в данном участке ДНК после определенного количества радиации.
  • Доля клеток, которые будут инфицированы при данной множественности заражения .
  • Количество бактерий в определенном количестве жидкости. [44]
  • Прибытие фотонов на схему пикселя при заданном освещении и в течение заданного периода времени.
  • Нацеливание летающих бомб Фау-1 на Лондон во время Второй мировой войны исследовал Р. Д. Кларк в 1946 году. [45]

Галлахер показал в 1976 году, что подсчет простых чисел в коротких интервалах подчиняется распределению Пуассона [46], при условии, что верна определенная версия недоказанной гипотезы Харди-Литтлвуда о простых числах r-кортежей [47] .

Закон редких событий [ править ]

Сравнение распределения Пуассона (черные линии) и биномиального распределения при n  = 10 (красные кружки), n  = 20 (синие кружки), n  = 1000 (зеленые кружки). Все распределения имеют среднее значение 5. По горизонтальной оси отложено количество событий  k . По мере увеличения n распределение Пуассона становится все более лучшим приближением биномиального распределения с тем же средним значением.

Скорость события связана с вероятностью того, что событие произойдет в некотором небольшом подынтервале (времени, пространства или иного). В случае распределения Пуассона предполагается, что существует достаточно малый подинтервал, для которого вероятность того, что событие произойдет дважды, «пренебрежимо мала». С этим предположением можно вывести распределение Пуассона из биномиального, учитывая только информацию об ожидаемом количестве общих событий во всем интервале. Пусть это общее количество будет . Разделите весь интервал на подынтервалы равного размера так, чтобы > (поскольку нас интересуют только очень маленькие части интервала, это предположение имеет смысл). Это означает, что ожидаемое количество событий в интервале для каждого равно. Теперь мы предполагаем, что возникновение события во всем интервале можно рассматривать как испытание Бернулли , где испытание соответствует проверке того, происходит ли событие на подынтервале с вероятностью . Ожидаемое количество общих событий в таких испытаниях будет , как ожидаемое количество общих событий во всем интервале. Следовательно, для каждого подразделения интервала мы аппроксимировали возникновение события как процесс Бернулли формы . Как мы уже отмечали ранее, мы хотим рассматривать только очень маленькие подынтервалы. Поэтому мы берем предел, уходящий в бесконечность. В этом случае биномиальное распределение сходится к так называемому распределению Пуассона по предельной теореме Пуассона..

В некоторых из приведенных выше примеров, таких как количество мутаций в данной последовательности ДНК, подсчитываемые события на самом деле являются результатами дискретных испытаний и более точно моделируются с использованием биномиального распределения , то есть

В таких случаях n очень велико, а p очень мало (и поэтому математическое ожидание np имеет промежуточную величину). Тогда распределение может быть аппроксимировано менее громоздким распределением Пуассона [ править ]

Это приближение иногда называют законом редких событий , [48] : 5 , так как каждая из п отдельных Бернулли событий редко происходит. Название может вводить в заблуждение, потому что общее количество успешных событий в процессе Пуассона не обязательно должно быть редким, если параметр np не мал. Например, количество телефонных звонков на загруженный коммутатор за один час следует распределению Пуассона, при этом события кажутся оператору частыми, но они редки с точки зрения среднего члена населения, который вряд ли совершит звонок на тот коммутатор в тот час.

Слово закон иногда используется как синоним вероятностного распределения , а конвергенция закона означает конвергенцию в распределении . Соответственно, распределение Пуассона иногда называют «законом малых чисел», потому что это распределение вероятностей количества появлений события, которое случается редко, но имеет очень много возможностей произойти. Закон малых чисел - это книга Ладислава Борткевича о распределении Пуассона, опубликованная в 1898 году. [39] [49]

Точечный процесс Пуассона [ править ]

Распределение Пуассона возникает как количество точек точечного процесса Пуассона, расположенных в некоторой конечной области. Более конкретно, если D - некоторое пространство области, например евклидово пространство R d , для которого | D |, площадь, объем или, в более общем смысле, мера Лебега области конечна, и если N ( D ) обозначает количество точек в D , то

Пуассоновская регрессия и отрицательная биномиальная регрессия [ править ]

Пуассоновская регрессия и отрицательная биномиальная регрессия полезны для анализа, где зависимая (ответная) переменная - это количество (0, 1, 2, ...) количества событий или вхождений в интервале.

Другие приложения в науке [ править ]

В процессе Пуассона количество наблюдаемых явлений колеблется около своего среднего значения λ со стандартным отклонением . Эти колебания обозначаются как пуассоновский шум или (особенно в электронике) как дробовой шум .

Корреляция среднего и стандартного отклонения при подсчете независимых дискретных событий полезна с научной точки зрения. Наблюдая за тем, как колебания меняются со средним сигналом, можно оценить вклад одного события, даже если этот вклад слишком мал для непосредственного обнаружения . Например, заряд e электрона можно оценить, сопоставив величину электрического тока с его дробовым шумом . Если N электронов в среднем проходят точку за заданное время t , средний ток равен ; поскольку текущие колебания должны быть порядка (т. е. стандартное отклонениеПуассоновский процесс ), заряд можно оценить по соотношению . [ необходима цитата ]

Повседневный пример - зернистость, которая появляется при увеличении фотографий; зернистость обусловлена ​​пуассоновскими колебаниями количества восстановленных зерен серебра , а не самими отдельными зернами. Путем сопоставления зернистость со степенью расширения, можно оценить вклад отдельного зерна (которое в противном случае слишком малы , чтобы быть видно невооруженным). [ необходима цитата ] Многие другие молекулярные приложения пуассоновского шума были разработаны, например, для оценки числовой плотности рецепторных молекул в клеточной мембране .

В теории причинных множеств дискретные элементы пространства-времени следуют распределению Пуассона в объеме.

Вычислительные методы [ править ]

Распределение Пуассона ставит перед выделенными библиотеками программного обеспечения две разные задачи: оценка распределения и рисование случайных чисел в соответствии с этим распределением.

Оценка распределения Пуассона [ править ]

Вычисление для данного и является тривиальной задачей, которую можно выполнить, используя стандартное определение в терминах экспоненциальных, степенных и факториальных функций. Однако обычное определение распределения Пуассона содержит два члена, которые могут легко переполниться на компьютерах: λ k и k !. От λ k до k ! также может привести к очень большой ошибке округления по сравнению с e −λ и, следовательно, к ошибочному результату. Поэтому для численной устойчивости функция массы вероятности Пуассона должна быть оценена как

что математически эквивалентно, но численно стабильно. Натуральный логарифм гамма-функции можно получить с помощью lgammaфункции в стандартной библиотеке C (версия C99) или R , gammalnфункции в MATLAB или SciPy или log_gammaфункции в Fortran 2008 и более поздних версиях.

Некоторые вычислительные языки предоставляют встроенные функции для оценки распределения Пуассона, а именно:

  • R : функция dpois(x, lambda);
  • Excel : функция POISSON( x, mean, cumulative)с флагом для указания кумулятивного распределения;
  • Mathematica : одномерное распределение Пуассона , как , [50] двумерный распределение Пуассона , как ,. [51]PoissonDistribution[]MultivariatePoissonDistribution[,{ , }]

Случайный рисунок из распределения Пуассона [ править ]

Менее тривиальная задача - извлечь случайные целые числа из распределения Пуассона с заданным .

Решения предоставлены:

  • R : функция rpois(n, lambda);
  • Научная библиотека GNU (GSL): функция gsl_ran_poisson

Генерация случайных величин с распределением Пуассона [ править ]

Простой алгоритм генерации случайных чисел с распределением Пуассона ( выборка псевдослучайных чисел ) был предоставлен Кнутом : [52] : 137-138

алгоритм  случайных чисел Пуассона (Кнут) : init : Пусть L ← e −λ , k ← 0 и p ← 1. do : к ← к + 1. Сгенерируйте равномерное случайное число u в [0,1] и пусть p ← p × u. в то время как p> L. вернуть k - 1.

Сложность линейна по возвращаемому значению k , которое в среднем равно λ. Есть много других алгоритмов для улучшения этого. Некоторые из них приведены в Ahrens & Dieter, см. § Ссылки ниже.

Для больших значений λ значение L = e −λ может быть настолько малым, что его трудно представить. Это может быть решено путем изменения алгоритма, который использует дополнительный параметр STEP, так что e -STEP не опустошается : [ необходима цитата ]

алгоритм  случайных чисел Пуассона (Junhao, на основе Knuth) : init : Пусть λLeft ← λ, k ← 0 и p ← 1. do : к ← к + 1. Сгенерируйте равномерное случайное число u в (0,1) и пусть p ← p × u. в то время как p <1 и λLeft> 0: если λLeft> STEP: p ← p × e ШАГ λLeft ← λLeft - ШАГ еще : p ← p × e λ влево λвлево ← 0 пока p> 1. вернуть k - 1.

Выбор ШАГА зависит от порога переполнения. Для формата с плавающей запятой двойной точности порог близок к e 700 , поэтому 500 должно быть безопасным ШАГОМ .

Другие решения для больших значений λ включают выборку отбраковки и использование гауссовой аппроксимации.

Выборка с обратным преобразованием проста и эффективна для малых значений λ и требует только одного однородного случайного числа u на выборку. Кумулятивные вероятности исследуются по очереди, пока не превысит u .

алгоритм  генератора Пуассона, основанный на инверсии путем последовательного поиска : [53] : 505  init : Пусть x ← 0, p ← e −λ , s ← p. Сгенерируйте равномерное случайное число u в [0,1]. пока u> s делать : х ← х + 1. p ← p × λ / x. s ← s + p. вернуть x.

История [ править ]

Распределение было впервые представлено Симеоном Дени Пуассоном (1781–1840) и опубликовано вместе с его теорией вероятностей в его работе « Recherches sur la probabilité des jugements en matière criminelle et en matière civile» (1837). [54] : 205-207 В работе теоретизировалось количество неправомерных приговоров в данной стране, фокусируясь на определенных случайных величинах N, которые учитывают, среди прочего, количество дискретных происшествий (иногда называемых «событиями» или «прибытием»). которые происходят в течение определенного промежутка времени . Результат был дан еще в 1711 году Абрахамом де Муавром вDe Mensura Sortis seu; de Probabilitate Eventuum в Ludis a Casu Fortuito Pendentibus . [55] : 219 [56] : 14-15 [57] : 193 [6] : 157 Это делает его примером закона Стиглера и побуждает некоторых авторов утверждать, что распределение Пуассона должно носить имя де Муавра. [58] [59]

В 1860 году Саймон Ньюкомб применил распределение Пуассона к количеству звезд в единице пространства. [60] Дальнейшее практическое применение этого распределения было сделано Ладиславом Борткевичем в 1898 году, когда ему было поручено исследовать количество солдат в прусской армии, случайно убитых ногами лошадей; [39] : 23-25 этот эксперимент ввел распределение Пуассона в область техники надежности .

См. Также [ править ]

  • Составное распределение Пуассона
  • Распределение Конвея – Максвелла – Пуассона.
  • Распределение Erlang
  • Распределение Эрмита
  • Индекс рассеивания
  • Отрицательное биномиальное распределение
  • Комкование Пуассона
  • Точечный процесс Пуассона
  • Регрессия Пуассона
  • Пуассоновская выборка
  • Вейвлет Пуассона
  • Теория массового обслуживания
  • Теория обновления
  • Лемма Роббинса
  • Распределение Скеллама
  • Распределение твиди
  • Модель без наддува
  • Распределение Пуассона с нулевым усечением

Ссылки [ править ]

Цитаты [ править ]

  1. ^ a b Хейт, Фрэнк А. (1967), Справочник по распределению Пуассона , Нью-Йорк, Нью-Йорк, США: John Wiley & Sons, ISBN 978-0-471-33932-8
  2. ^ Йейтс, Рой Д .; Гудман, Дэвид Дж. (2014), Вероятность и случайные процессы: дружественное введение для инженеров-электриков и компьютерных инженеров (2-е изд.), Хобокен, США: Wiley, ISBN 978-0-471-45259-1
  3. ^ Для доказательства см .: Proof wiki: ожидание и Proof wiki: дисперсия
  4. ^ Кёрсен, Уильям (2019-01-20), Распределение Пуассона и объяснение процесса Пуассона , На пути к науке о данных , получено 19 сентября 2019 г.
  5. Угарте, Мария Долорес; Милитино, Ана Ф .; Арнхольт, Алан Т. (2016), Вероятность и статистика с R (второе издание), Бока-Ратон, Флорида, США: CRC Press, ISBN 978-1-4665-0439-4
  6. ^ a b c d e f g h я Джонсон, Норман Л .; Кемп, Эдриен В .; Коц, Самуил (2005), "Пуассон распределение", одномерные дискретные распределения (3 - й изд.), Нью - Йорк, Нью - Йорк, США: John Wiley & Sons, Inc., стр 156-207,. Дои : 10.1002 / 0471715816 , ISBN 978-0-471-27246-5
  7. ^ Хелске, Юни (2017). "KFAS: модели пространства состояний экспоненциального семейства в R". arXiv : 1612.01907 [ stat.CO ].
  8. ^ Choi, Квок P. (1994), "О медиан гамма - распределений и уравнения Рамануджане", Труды Американского математического общества , 121 (1): 245-251, DOI : 10,2307 / 2160389 , JSTOR 2160389 
  9. ^ Риордан, Джон (1937), "Момент рекуррентные соотношения для биномиального, Пуассона и гипергеометрического распределения частот" (PDF) , Анналы математической статистики , 8 (2): 103-111, DOI : 10,1214 / АОМ / 1177732430 , JSTOR 2957598  
  10. ^ Jagadeesan, Мина (2017). «Простой анализ разреженных, знакопоследовательных JL». arXiv : 1708.02966 [ cs.DS ].
  11. ^ Леманн, Эрих Лео (1986), Проверка статистических гипотез (второе изд.), Нью-Йорк, Нью-Джерси, США: Springer Verlag, ISBN 978-0-387-94919-2
  12. Райков, Дмитрий (1937), «О разложении законов Пуассона», Comptes Rendus de l'Académie des Sciences de l'URSS , 14 : 9–11
  13. ^ Мизес, Ричард (1964), Математическая теория вероятностей и статистика , Нью - Йорк, Нью - Джерси, США: Academic Press, DOI : 10.1016 / C2013-0-12460-9 , ISBN 978-1-4832-3213-3
  14. ^ Лаха, Радха G .; Рохатги, Виджай К. (1979), Теория вероятностей , Нью-Йорк, Нью-Джерси, США: John Wiley & Sons, ISBN 978-0-471-03262-5
  15. ^ a b Митценмахер, Майкл ; Упфаль, Эли (2005), Вероятность и вычисления: рандомизированные алгоритмы и вероятностный анализ , Кембридж, Великобритания: Cambridge University Press, ISBN 978-0-521-83540-4
  16. ^ Б Шорт, Майкл (2013), «Улучшенные Неравенства для распределения Пуассона и биномиального и надхвостье функций квантилей», ISRN Вероятность и статистика , 2013 : 412958, DOI : 10,1155 / 2013/412958
  17. ^ Камат, Говинда М .; Чашоглу, Эрен; Це, Дэвид (2015), «Оптимальная сборка гаплотипов на основе высокопроизводительных чтений пары сопряжений », Международный симпозиум IEEE по теории информации (ISIT), 2015 г., 14–19 июня , Гонконг, Китай, стр. 914–918, arXiv : 1502,01975 , DOI : 10,1109 / ISIT.2015.7282588 , S2CID 128634 
  18. ^ Принс, Джек (2012), «6.3.3.1. Графики контроля подсчета» , электронный справочник статистических методов , NIST / SEMATECH , получено 20 сентября 2019 г.
  19. ^ Чжан, Хуэйминь; Лю, Юньсяо; Ли Бо (2014), «Заметки о дискретном соединения Пуассона модели с приложениями к теории риска», страхование: математики и экономики , 59 : 325-336, DOI : 10.1016 / j.insmatheco.2014.09.012
  20. ^ Чжан, Хуэйминь; Ли, Бо (2016), "Характеризации дискретного составных распределений Пуассона", Связь в статистике - Теория и методика , 45 (22): 6789-6802, DOI : 10,1080 / 03610926.2014.901375 , S2CID 125475756 
  21. ^ МакКаллаг, Питер ; Нелдер, Джон (1989), Обобщенные линейные модели , Монографии по статистике и прикладной вероятности, 37 , Лондон, Великобритания: Chapman and Hall, ISBN 978-0-412-31760-6
  22. ^ Анскомб, Фрэнсис Дж (1948), "Преобразование Пуассона, биномиального и отрицательного биномиального данных", Biometrika , 35 (3-4): 246-254, DOI : 10,1093 / Biomet / 35.3-4.246 , JSTOR 2332343 
  23. ^ Росс, Шелдон М. (2010), Введение в вероятностные модели (десятое издание), Бостон, Массачусетс, США: Academic Press, ISBN 978-0-12-375686-2
  24. ^ «1.7.7 - Связь между полиномами и Пуассоном | STAT 504» .
  25. ^ Лукас, Сотириос; Кемп, C. Дэвид (1986), "Индекс дисперсионных теста для распределения Двумерный Пуассона", биометрия , 42 (4): 941-948, DOI : 10,2307 / 2530708 , JSTOR 2530708 
  26. ^ Бесплатные случайные переменные Д. Войкулеску, К. Дайкема, А. Ника, Серия монографий CRM, Американское математическое общество, Провиденс, Род-Айленд, 1992
  27. ^ Джеймс А. Минго, Роланд Спайчер: свободные вероятности и случайные матрицы. Монографии Института Филдса, Vol. 35, Спрингер, Нью-Йорк, 2017.
  28. ^ Лекции по комбинаторике свободной вероятности А. Ники и Р. Спайхера, стр. 203–204, Cambridge Univ. Пресса 2006
  29. ^ Пашек, Ева. «Оценка максимального правдоподобия - примеры» .
  30. ^ Гарвуд, Frank (1936), "пределы фунгицидного для распределения Пуассона", Biometrika , 28 (3/4): 437-442, DOI : 10,1093 / Biomet / 28.3-4.437 , JSTOR 2333958 
  31. ^ Бреслоу, Норман Э .; Дэй, Ник Э. (1987), Статистические методы исследования рака: Том 2 - Дизайн и анализ когортных исследований , Лион, Франция: Международное агентство исследований рака , ISBN 978-92-832-0182-3, Архивируются с оригинала на 2018-08-08 , извлекаться 2012-03-11
  32. ^ Финк, Daniel (1997), Компендиум Сопряженные Прайорс
  33. ^ Гельман; Карлин, Джон Б.; Стерн, Хэл С .; Рубин, Дональд Б. (2003), Байесовский анализ данных (2-е изд.), Бока-Ратон, Флорида, США: Chapman & Hall / CRC, ISBN 1-58488-388-X
  34. ^ Клевенсон, М. Лоуренс; Зидек, Джеймс В. (1975), "Синхронное Оценивание средств независимых законов Пуассона", журнал Американской ассоциации по статистике , 70 (351): 698-705, DOI : 10,1080 / 01621459.1975.10482497 , JSTOR 2285958 
  35. ^ Бергер, Джеймс О. (1985), Статистическая теория принятия решений и байесовский анализ , Серия Спрингера в статистике (2-е изд.), Нью-Йорк, Нью-Джерси, США: Springer-Verlag, Bibcode : 1985sdtb.book ..... B , DOI : 10.1007 / 978-1-4757-4286-2 , ISBN 978-0-387-96098-2
  36. ^ Раш, Георг (1963), "Пуассоновский процесс как модель разнообразия поведенческих явлений" (PDF) , 17-й Международный психологический конгресс , 2 , Вашингтон, округ Колумбия, США, 20-26 августа 1963 г .: Американская психологическая ассоциация , DOI : 10,1037 / e685262012-108 CS1 maint: location (link)
  37. ^ Флори, Пол Дж (1940), "Molecular Распределение размеров в основе оксида этилена Polymers", журнал Американского химического общества , 62 (6): 1561-1565, DOI : 10.1021 / ja01863a066
  38. ^ Lomnitz, Цинна (1994), Основы прогнозирования землетрясений , New York: John Wiley & Sons, ISBN 0-471-57419-8, OCLC  647404423
  39. ^ a b c фон Борткевич, Ladislaus (1898), Das Gesetz der kleinen Zahlen [ Закон малых чисел ] (на немецком языке), Лейпциг, Германия: B. G. Teubner, p. На странице 1 Борткевич представляет распределение Пуассона. На страницах 23–25 Борткевич представляет свой анализ «4. Beispiel: Die durch Schlag eines Pferdes im preußischen Heere Getöteten». (4. Пример: погибшие в прусской армии от удара лошади.)
  40. ^ Студент (1907), "О погрешности подсчета с Haemacytometer" , Biometrika , 5 (3): 351-360, DOI : 10,2307 / 2331633 , JSTOR 2331633 
  41. ^ Боланд, Philip J. (1984), "Биографический Проблеск Госсет", Американский Статистик , 38 (3): 179-183, DOI : 10,1080 / 00031305.1984.10483195 , JSTOR 2683648 
  42. ^ Эрланг, Агнер К. (1909), «Sandsynlighedsregning og Telefonsamtaler» [Расчет вероятности и телефонные разговоры], Nyt Tidsskrift for Matematik (на датском языке), 20 (B): 33–39, JSTOR 24528622 
  43. Хорнби, Дэйв (2014), Модель прогнозирования футбола: распределение Пуассона , Ставки на спорт онлайн , получено 19 сентября 2014 г.
  44. ^ Кояма, Кенто; Хокунан, Хидеказу; Хасэгава, Маюми; Кавамура, Шусо; Косеки, Сигенобу (2016), «Соответствуют ли числа бактериальных клеток теоретическому распределению Пуассона? Сравнение экспериментально полученных чисел отдельных клеток с генерацией случайных чисел с помощью компьютерного моделирования», Food Microbiology , 60 : 49–53, doi : 10.1016 / j. fm.2016.05.019 , PMID 27554145 
  45. ^ Кларк, Р. (1946), "Применение распределения Пуассона" (PDF) , журнал Института актуариев , 72 (3): 481, DOI : 10,1017 / S0020268100035435
  46. ^ Галлахер, Патрик Х. (1976), "О распределении простых чисел в коротких интервалах", Mathematika , 23 (1): 4-9, DOI : 10,1112 / s0025579300016442
  47. ^ Харди, Годфри Х .; Литтлвуд, Джон Э. (1923), "О некоторых проблемах" partitio numerorum "III: О выражении числа как суммы простых чисел", Acta Mathematica , 44 : 1–70, doi : 10.1007 / BF02403921
  48. ^ Кэмерон, А. Колин; Триведи, Правин К. (1998), Регрессионный анализ данных подсчета , Кембридж, Великобритания: Cambridge University Press, ISBN 978-0-521-63567-7
  49. ^ Эджворта, Фрэнсис Y. (1913), "О применении теории вероятностей в статистических данных , касающихся общества" , журнал Королевского статистического общества , 76 (2): 165-193, DOI : 10,2307 / 2340091 , JSTOR 2340091 
  50. ^ "Язык Wolfram Language: справочная страница PoissonDistribution" . wolfram.com . Проверено 8 апреля 2016 .
  51. ^ «Язык Wolfram: справочная страница по многомерному распределению Пуассона» . wolfram.com . Проверено 8 апреля 2016 .
  52. Перейти ↑ Knuth, Donald Ervin (1997), Seminumerical Algorithms , The Art of Computer Programming , 2 (3-е изд.), Addison Wesley , ISBN 978-0-201-89684-8
  53. ^ Devroye, Люк (1986), "Дискретная одномерные распределения" (PDF) , Non-Uniform Random Generation случайная величина , Нью - Йорк, Нью - Джерси, США:. Springer-Verlag, стр 485-553, DOI : 10.1007 / 978-1-4613 -8643-8_10 , ISBN  978-1-4613-8645-2
  54. Пуассон, Симеон Д. (1837), Probabilité des jugements en matière criminelle et en matière civile, précédées des règles générales du Calcul des probabilités [ Исследование вероятности судебных решений по уголовным и гражданским делам ] (на французском языке), Париж, Франция : Башелье
  55. ^ де Муавр, Абрахам (1711), «De mensura sortis, seu, de probabilitate eventuum in ludis a casu fortuito pendentibus» [Об измерении вероятности или о вероятности событий в играх, зависящих от случайности], Философские транзакции Королевского общества (на латыни), 27 (329): 213-264, DOI : 10.1098 / rstl.1710.0018
  56. ^ де Муавр, Авраам (1718), Доктрина шансов: Или, Метод расчета вероятности событий в игре , Лондон, Великобритания: У. Пирсон, ISBN 9780598843753
  57. ^ де Муавр, Авраам (1721 г.), «О законах случайности», в Мотте, Бенджамин (ред.), «Философские трансакции от года MDCC (где заканчивается мистер Лоуторп) до года MDCCXX». Abridg'd и Dispos'd Under General Heads (на латыни), Vol. I, Лондон, Великобритания: Р. Уилкин, Р. Робинсон, С. Баллард, У. и Дж. Иннис, и Дж. Осборн, стр. 190–219.
  58. ^ Стиглер, Стивен М. (1982), "Пуассона по распределению Пуассона", Статистика и вероятности Letters , 1 (1): 33-35, DOI : 10,1016 / 0167-7152 (82) 90010-4
  59. ^ Халд, Андерс; де Муавр, Авраам; МакКлинток, Брюс (1984), "А. де Муавра: 'De Mensura Sortis' или 'Об измерения Шанса ' ", Международный статистический обзор / Revue Internationale де - статистический , 52 (3): 229-262, DOI : 10,2307 / 1403045 , JSTOR 1403045 
  60. ^ Ньюкомб, Саймон (1860), «Заметки по теории вероятностей» , The Mathematical Monthly , 2 (4): 134–140

Источники [ править ]

  • Аренс, Иоахим Х .; Дитер Ульрих (1974), "Компьютерные методы отбора проб из гамма-, бета-, Пуассона и биномиальных распределений", вычислительная техника , 12 (3): 223-246, DOI : 10.1007 / BF02293108 , S2CID  37484126
  • Аренс, Иоахим Х .; Дитер Ульрих (1982), "Компьютерное поколение Пуассон отклоняющегося", ACM Сделки по математическому Software , 8 (2): 163-179, DOI : 10,1145 / 355993,355997 , S2CID  12410131
  • Эванс, Рональд Дж .; Boersma, J .; Блахман, Нью-Мексико; Егерей, А. А. (1988), "Энтропия распределения Пуассона: Проблема 87-6" , SIAM Review , 30 (2): 314-317, DOI : 10,1137 / 1030059