В теории вероятностей и статистике , то распределение Пуассона ( / р ж ɑ ы ɒ н / ; французское произношение: [pwasɔ] ), названное в честь французского математик Дениса Пуассона , является дискретным распределением вероятностей , выражающее вероятность заданного числа события, происходящие в фиксированном интервале времени или пространства, если эти события происходят с известной постоянной средней скоростью и независимо от времени, прошедшего с момента последнего события. [1] Распределение Пуассона также можно использовать для количества событий в других заданных интервалах, таких как расстояние, площадь или объем.
Вероятностная функция масс По горизонтальной оси отложен индекс k , количество вхождений. λ - ожидаемая частота появления. По вертикальной оси отложена вероятность k событий при λ . Функция определяется только при целочисленных значениях k ; соединительные линии служат лишь ориентирами для глаз. | |||
Кумулятивная функция распределения По горизонтальной оси отложен индекс k , количество вхождений. Функция CDF не является непрерывной для целых чисел k и плоской везде, потому что переменная с распределением Пуассона принимает только целые значения. | |||
Обозначение | |||
---|---|---|---|
Параметры | (показатель) | ||
Служба поддержки | ( Натуральные числа начиная с 0) | ||
PMF | |||
CDF | , или же , или же (для , где - верхняя неполная гамма-функция ,- минимальная функция , Q - регуляризованная гамма-функция ) | ||
Иметь в виду | |||
Медиана | |||
Режим | |||
Дисперсия | |||
Асимметрия | |||
Бывший. эксцесс | |||
Энтропия | (для больших ) | ||
MGF | |||
CF | |||
PGF | |||
Информация Fisher |
Например, колл-центр принимает в среднем 180 звонков в час 24 часа в сутки. Звонки независимы; получение одного не меняет вероятность прибытия следующего. Количество звонков, полученных в течение любой минуты, имеет распределение вероятностей Пуассона: наиболее вероятные числа - 2 и 3, но также вероятны 1 и 4, и есть небольшая вероятность того, что оно будет равно нулю, и очень небольшая вероятность, что это может быть. 10. Другой пример - количество событий распада радиоактивного источника в течение определенного периода наблюдения.
Определения
Вероятностная функция масс
Говорят, что дискретная случайная величина X имеет распределение Пуассона с параметром, если он имеет функцию массы вероятности, заданную как: [2] : 60
где
- k - количество вхождений ()
- e - число Эйлера ()
- ! - факториальная функция.
Положительное действительное число λ равно ожидаемой величине из X , а также к его дисперсии [3]
Распределение Пуассона можно применять к системам с большим количеством возможных событий, каждое из которых является редким . Количество таких событий, которые происходят в течение фиксированного интервала времени, при определенных обстоятельствах является случайным числом с распределением Пуассона.
Уравнение можно адаптировать, если вместо среднего количества событий , нам дана временная ставка на количество событий произойдет. потом (показывая количество событий в единицу времени), и
Пример
Распределение Пуассона может быть полезно для моделирования таких событий, как
- Количество метеоритов диаметром более 1 метра, падающих на Землю за год.
- Количество пациентов, поступивших в отделение неотложной помощи с 22 до 23 часов.
- Количество лазерных фотонов, попавших в детектор за определенный промежуток времени.
Предположения и обоснованность
Распределение Пуассона является подходящей моделью, если верны следующие предположения: [4]
- k - количество раз, когда событие происходит в интервале, и k может принимать значения 0, 1, 2, ....
- Возникновение одного события не влияет на вероятность того, что произойдет второе событие. То есть события происходят независимо.
- Средняя скорость, с которой происходят события, не зависит от каких-либо событий. Для простоты это обычно считается постоянным, но на практике может меняться со временем.
- Два события не могут происходить в один и тот же момент; вместо этого на каждом очень маленьком подынтервале происходит ровно одно событие, либо не происходит.
Если эти условия верны, то k - случайная величина Пуассона, а распределение k - распределение Пуассона.
Распределение Пуассона также предел из биномиального распределения , для которых вероятность успеха для каждого испытания равна λ , деленное на число испытаний, а число испытаний стремится к бесконечности (см Связанные распределения ).
Примеры вероятностей для распределений Пуассона
На конкретной реке паводки происходят в среднем раз в 100 лет. Рассчитайте вероятность k = 0, 1, 2, 3, 4, 5 или 6 паводков в течение 100-летнего интервала, предполагая, что модель Пуассона подходит. Поскольку средняя частота событий составляет одно наводнение за 100 лет, λ = 1
|
Вероятность от 0 до 6 наводнений за 100-летний период. |
Угарте и его коллеги сообщают, что среднее количество голов в футбольном матче чемпионата мира составляет примерно 2,5, и модель Пуассона подходит. [5] Так как средняя частота событий составляет 2,5 гола за матч, λ = 2,5.
|
Вероятность забить от 0 до 7 голов в матче. |
Один раз в интервале событий: частный случай λ = 1 и k = 0
Предположим, что астрономы подсчитали, что большие метеориты (более определенного размера) падают на Землю в среднем один раз в 100 лет ( λ = 1 событие в 100 лет), и что количество попаданий метеоритов следует распределению Пуассона. Какова вероятность падения метеорита k = 0 в следующие 100 лет?
При этих предположениях вероятность того, что в ближайшие 100 лет не упадет на Землю ни один крупный метеорит, составляет примерно 0,37. Оставшееся 1 - 0,37 = 0,63 - это вероятность падения 1, 2, 3 или более крупных метеоритов в следующие 100 лет. В приведенном выше примере наводнение, вызванное переполнением, происходило каждые 100 лет ( λ = 1). По тому же расчету вероятность отсутствия наводнений через 100 лет составила примерно 0,37.
В общем, если событие происходит в среднем один раз за интервал ( λ = 1), и события следуют распределению Пуассона, то P (0 событий в следующем интервале) = 0,37 . Кроме того, P (ровно одно событие в следующем интервале) = 0,37, как показано в таблице для наводнений переполнения.
Примеры, нарушающие предположения Пуассона
Количество студентов, прибывающих в студенческий союз в минуту, скорее всего, не будет соответствовать распределению Пуассона, потому что этот показатель не является постоянным (низкий показатель во время занятий, высокий показатель между уроками), а отдельные студенты, прибывающие в студенческий союз , не являются независимыми (студенты обычно приходят группами).
Число землетрясений магнитудой 5 в год в стране может не соответствовать распределению Пуассона, если одно сильное землетрясение увеличивает вероятность афтершоков аналогичной магнитуды.
Примеры, в которых гарантировано хотя бы одно событие, не распространяются; но может быть смоделирован с использованием усеченного нулем распределения Пуассона .
Распределения подсчета, в которых количество интервалов с нулевыми событиями больше, чем предсказывается моделью Пуассона, можно смоделировать с использованием модели с нулевым раздутием .
Характеристики
Описательная статистика
- Ожидаемое значение и дисперсия из Пуассона-распределенной случайной величины оба равны Л.
- Коэффициент вариации является, а индекс дисперсии равен 1. [6] : 163
- Среднее абсолютное отклонение около среднего значения [6] : 163
- Режим из Пуассона-распределенной случайной переменной с нецелым Х равен, которое является наибольшим целым числом, меньшим или равным λ . Это также записывается как floor (λ). Когда λ - положительное целое число, режимы - λ и λ - 1.
- Все кумулянты распределения Пуассона равны математическому ожиданию λ . П - я факторного момента распределения Пуассона λ п .
- Ожидаемое значение из процесса Пуассона иногда разлагается в произведение интенсивности и экспозиции (или в более общем случае выражается в виде интеграла от «функции интенсивности» с течением времени или в пространстве, которое иногда называют как «воздействием»). [7]
Медиана
Границы медианы () распределения известны и точны : [8]
Высшие моменты
- Чем выше не-центрируются моменты , т к из распределения Пуассона, являются Тушаром многочлены в Л:
- где фигурные скобки обозначают числа Стирлинга второго рода . [9] [1] : 6 Коэффициенты многочленов имеют комбинаторный смысл. Фактически, когда ожидаемое значение распределения Пуассона равно 1, тогда формула Добинского говорит, что n- й момент равен количеству разбиений набора размера n .
Простая оценка [10]
Суммы случайных величин, распределенных по Пуассону
- Если для являются независимыми , то . [11] : 65 Обратное утверждение - теорема Райкова , которая гласит, что если сумма двух независимых случайных величин распределена по Пуассону, то каждая из этих двух независимых случайных величин также. [12] [13]
Прочие свойства
- Распределения Пуассона - это безгранично делимые распределения вероятностей. [14] : 233 [6] : 164
- Направлено Кульбак-Либлер расходимости из из дан кем-то
- Границы вероятностей хвоста пуассоновской случайной величины может быть получен с использованием аргумента границы Чернова . [15] : 97-98
- ,
- Вероятность верхнего хвоста может быть увеличена (как минимум в два раза) следующим образом: [16]
- где - направленное расхождение Кульбака – Лейблера, как описано выше.
- Неравенства, связывающие функцию распределения пуассоновской случайной величины к стандартной функции нормального распределениязаключаются в следующем: [16]
- где снова является направленной дивергенцией Кульбака – Лейблера.
Гонки Пуассона
Позволять а также быть независимыми случайными величинами, с , то имеем
Верхняя оценка доказывается с помощью стандартной оценки Чернова.
Нижнюю оценку можно доказать, отметив, что вероятность того, что , где , ограниченная снизу величиной , где является относительной энтропией (см записи на границах на хвостах биномиальных распределений для деталей). Отмечая далее, что, и вычисление нижней границы безусловной вероятности дает результат. Более подробную информацию можно найти в приложении Kamath et al. . [17]
Связанные дистрибутивы
Общий
- Если а также независимы, то разница следует распределению Скеллама .
- Если а также независимы, то распределение при условии - биномиальное распределение .
- В частности, если , тогда .
- В более общем смысле, если X 1 , X 2 , ..., X n - независимые пуассоновские случайные величины с параметрами λ 1 , λ 2 , ..., λ n, то
- дано следует, что . По факту, .
- Если и распределение , при условии X = k , является биномиальным распределением ,, то распределение Y следует распределению Пуассона . Фактически, если, при условии X = k, подчиняется полиномиальному распределению, , то каждый следует независимому распределению Пуассона .
- Распределение Пуассона может быть получено как предельный случай для биномиального распределения, поскольку количество попыток стремится к бесконечности, а ожидаемое количество успехов остается фиксированным - см. Закон редких событий ниже. Следовательно, его можно использовать в качестве аппроксимации биномиального распределения, если n достаточно велико, а p достаточно мало. Существует эмпирическое правило, согласно которому распределение Пуассона является хорошей аппроксимацией биномиального распределения, если n не меньше 20, а p меньше или равно 0,05, и отличным приближением, если n ≥ 100 и np ≤ 10. [18 ]
- Распределение Пуассона - это частный случай дискретного составного распределения Пуассона (или распределения Пуассона с заиканием) с одним параметром. [19] [20] Дискретное составное распределение Пуассона можно вывести из предельного распределения одномерного полиномиального распределения. Это также особый случай из сложного распределения Пуассона .
- Для достаточно больших значений λ (скажем, λ> 1000) нормальное распределение со средним λ и дисперсией λ (стандартное отклонение) является отличным приближением к распределению Пуассона. Если λ больше примерно 10, то нормальное распределение является хорошим приближением, если выполняется соответствующая коррекция непрерывности , т. Е. Если P ( X ≤ x ), где x - неотрицательное целое число, заменяется на P ( X ≤ х + 0,5).
- Преобразование, стабилизирующее дисперсию : Если, тогда
- , [6] : 168
- а также
- . [21] : 196
- При таком преобразовании сходимость к нормальности (как увеличивается) намного быстрее, чем непреобразованная переменная. [ необходима цитата ] Доступны и другие, немного более сложные преобразования, стабилизирующие дисперсию, [6] : 168 одним из которых является преобразование Анскомба . [22] См. Преобразование данных (статистика) для более общего использования преобразований.
- Если для каждого t > 0 количество вступлений во временном интервале [0, t ] следует распределению Пуассона со средним λt , то последовательность времен между приходами является независимыми и одинаково распределенными экспоненциальными случайными величинами, имеющими среднее значение 1 / λ . [23] : 317–319
- Эти кумулятивные функции распределения Пуассона и распределения хи-квадрат связаны следующими способами: [6] : 167
- и [6] : 158
Приближение Пуассона
Предполагать где , то [24] является полиномиально распределены при условии .
Это означает [15] : 101-102 , среди прочего, что для любой неотрицательной функции, если полиномиально распределен, то
где .
Фактор можно заменить на 2, если далее предполагается, что она монотонно возрастает или убывает.
Двумерное распределение Пуассона
Это распределение было распространено на двумерный случай. [25] производящая функция для этого распределения
с участием
Маргинальные распределения - это пуассоновское ( θ 1 ) и пуассоновское ( θ 2 ), а коэффициент корреляции ограничен диапазоном
Простой способ сгенерировать двумерное распределение Пуассона состоит в том, чтобы взять три независимых распределения Пуассона со средствами а затем установите . Функция вероятности двумерного распределения Пуассона равна
Свободное распределение Пуассона
Свободное распределение Пуассона [26] с размером скачка и оценить возникает в свободной теории вероятностей как предел повторной свободной свертки
при N → ∞.
Другими словами, пусть быть случайными величинами, так что имеет ценность с вероятностью и значение 0 с оставшейся вероятностью. Предположим также, что семьяявляются свободно независимыми . Тогда предел при закона дается законом Свободного Пуассона с параметрами .
Это определение аналогично одному из способов, которыми классическое распределение Пуассона получается из (классического) пуассоновского процесса.
Мера, связанная со свободным законом Пуассона, дается формулой [27]
где
и имеет поддержку .
Этот закон также возникает в теории случайных матриц как закон Марченко – Пастура . Его свободные кумулянты равны.
Некоторые трансформации этого закона
Приведены значения некоторых важных преобразований свободного закона Пуассона; это вычисление можно найти, например, в книге А. Ника и Р. Спайхера « Лекции по комбинаторике свободной вероятности » [28].
R-преобразование свободного закона Пуассона дается
Преобразование Коши (отрицательное по отношению к преобразованию Стилтьеса ) задается формулой
S-преобразование задается
в случае, если .
Статистические выводы
Оценка параметров
Учитывая выборку из n измеренных значений, для i = 1, ..., n мы хотим оценить значение параметра λ пуассоновской популяции, из которой была взята выборка. Максимального правдоподобия оценка [29]
Поскольку каждое наблюдение имеет математическое ожидание λ, то же самое означает выборочное среднее. Следовательно, оценка максимального правдоподобия является несмещенной оценкой λ. Это также эффективная оценка, поскольку ее дисперсия достигает нижней границы Крамера – Рао (CRLB). [ необходимая цитата ] Следовательно, это объективная минимальная дисперсия . Также можно доказать, что сумма (и, следовательно, выборочное среднее, поскольку оно является взаимно однозначной функцией суммы) является полной и достаточной статистикой для λ.
Чтобы доказать достаточность, мы можем использовать теорему факторизации . Рассмотрим разделение функции масс вероятности совместного распределения Пуассона для выборки на две части: одна, которая зависит исключительно от выборки. (называется ) и зависящую от параметра и образец только через функцию . потом является достаточной статистикой для .
Первый срок, , зависит только от . Второй срок,, зависит от образца только через . Таким образом, достаточно.
Чтобы найти параметр λ, который максимизирует функцию вероятности для пуассоновской популяции, мы можем использовать логарифм функции правдоподобия:
Возьмем производную от относительно λ и сравните его с нулем:
Решение относительно λ дает стационарную точку.
Итак, λ - это среднее значение k i . Получение знака второй производной от L в стационарной точке определит, что это за экстремальное значение λ .
Оценка второй производной в стационарной точке дает:
что является отрицательным значением в n раз обратным среднему значению k i . Это выражение отрицательно, когда среднее положительное. Если это выполнено, то стационарная точка максимизирует функцию вероятности.
Для полноты семейство распределений называется полным тогда и только тогда, когда подразумевает, что для всех . Если человек iid , тогда . Зная распределение, которое мы хотим исследовать, легко увидеть, что статистика завершена.
Для выполнения этого равенства должно быть 0. Это следует из того факта, что ни один из других членов не будет 0 для всех в сумме и для всех возможных значений . Следовательно, для всех подразумевает, что , и статистика оказалась полной.
Доверительный интервал
Доверительный интервал для среднего распределения Пуассона можно выразить с помощью соотношения между совокупными функциями распределения Пуассона и х-квадратом распределениями . Распределение хи-квадрат само по себе тесно связано с гамма-распределением , и это приводит к альтернативному выражению. Учитывая наблюдение k из распределения Пуассона со средним значением μ , доверительный интервал для μ с уровнем достоверности 1 - α равен
или эквивалентно,
где - функция квантиля (соответствующая области нижнего хвоста p ) распределения хи-квадрат с n степенями свободы иявляется функцией квантиля гамма-распределения с параметром формы n и параметром масштаба 1. [6] : 176-178 [30] Этот интервал является « точным » в том смысле, что его вероятность охвата никогда не меньше номинального значения 1 - α .
Когда квантили гамма-распределения недоступны, было предложено точное приближение к этому точному интервалу (на основе преобразования Уилсона – Хильферти ): [31]
где обозначает стандартное нормальное отклонение с верхней хвостовой частью α / 2 .
Для применения этих формул в том же контексте, что и выше (учитывая выборку из n измеренных значений k i, каждое из которых извлечено из распределения Пуассона со средним λ ), можно было бы установить
вычислить интервал для μ = nλ , а затем вывести интервал для λ .
Байесовский вывод
В байесовском выводе , то сопряженные перед для параметра скорости Х распределений Пуассона является гамма - распределение . [32] Пусть
обозначают, что λ распределяется согласно гамма- плотности g, параметризованной с помощью параметра формы α и параметра обратного масштаба β :
Затем, учитывая ту же выборку из n измеренных значений k i, что и раньше , и априорную гамму ( α , β ), апостериорное распределение имеет вид
Апостериорное среднее E [ λ ] приближается к оценке максимального правдоподобия в пределе как , что непосредственно следует из общего выражения среднего гамма-распределения .
Задней предсказанием распределения для одного дополнительного наблюдения является отрицательное биномиальное распределение , [33] : 53 иногда называют распределение гамма-Пуассона.
Одновременная оценка нескольких средних Пуассона
Предполагать представляет собой набор независимых случайных величин из набора Распределения Пуассона, каждое с параметром , , и мы хотели бы оценить эти параметры. Затем Клевенсон и Зидек показывают, что при нормированных квадратах потерь ошибок, когда , то, как и в примере Стейна для нормальных средних, оценка MLEявляется недопустимым . [34]
В этом случае дается семейство минимаксных оценок для любых а также как [35]
Возникновение и приложения
Приложения распределения Пуассона можно найти во многих областях, включая: [36]
- Пример телекоммуникации : поступающие в систему телефонные звонки.
- Пример из астрономии : фотоны прибывают в телескоп.
- Химии пример: молекулярно - массовое распределение из живой полимеризации . [37]
- Биологический пример: количество мутаций в цепи ДНК на единицу длины.
- Пример управления : клиенты прибывают в прилавок или колл-центр.
- Пример финансов и страхования : количество убытков или претензий, произошедших за определенный период времени.
- Пример сейсмологии землетрясений : асимптотическая пуассоновская модель сейсмического риска для сильных землетрясений. [38]
- Пример радиоактивности : количество распадов радиоактивного образца за определенный интервал времени.
- Пример оптики : количество фотонов, испускаемых за один лазерный импульс. Это основная уязвимость большинства протоколов квантового распределения ключей , известная как разделение числа фотонов (PNS).
Распределение Пуассона возникает в связи с пуассоновскими процессами. Он применяется к различным явлениям с дискретными свойствами (то есть к тем, которые могут происходить 0, 1, 2, 3, ... раз в течение данного периода времени или в данной области) всякий раз, когда вероятность возникновения явления постоянна в время или пространство . Примеры событий, которые можно смоделировать как распределение Пуассона, включают:
- Число солдат, убитых конными пинками каждый год в каждом корпусе прусской кавалерии. Этот пример был использован в книге Ладислава Борткевича (1868–1931). [39] : 23-25
- Количество дрожжевых клеток, используемых при варке пива Guinness . Этот пример был использован Уильямом Сили Госсетом (1876–1937). [40] [41]
- Количество телефонных звонков, поступивших в колл-центр за минуту. Этот пример описал А. К. Эрланг (1878–1929). [42]
- Интернет-трафик.
- Количество голов в спорте с участием двух соревнующихся команд. [43]
- Количество смертей в год в данной возрастной группе.
- Количество скачков цены акции за данный промежуток времени.
- В предположении однородности количество обращений к веб-серверу в минуту.
- Количество мутаций в данном участке ДНК после определенного количества радиации.
- Доля клеток, которые будут инфицированы при данной множественности заражения .
- Количество бактерий в определенном количестве жидкости. [44]
- Прибытие фотонов на схему пикселя при заданном освещении и в течение заданного периода времени.
- Нацеливание летающих бомб Фау-1 на Лондон во время Второй мировой войны исследовал Р. Д. Кларк в 1946 году. [45]
Галлахер показал в 1976 году, что подсчет простых чисел в коротких интервалах подчиняется распределению Пуассона [46], при условии, что верна определенная версия недоказанной гипотезы Харди-Литтлвуда о простых числах r-кортежей [47] .
Закон редких событий
Скорость события связана с вероятностью того, что событие произойдет в некотором небольшом подынтервале (времени, пространства или иного). В случае распределения Пуассона предполагается, что существует достаточно малый подинтервал, для которого вероятность того, что событие произойдет дважды, «пренебрежимо мала». С этим предположением можно вывести распределение Пуассона из биномиального, учитывая только информацию об ожидаемом количестве общих событий во всем интервале. Пусть это общее количество будет. Разделите весь интервал на подынтервалы равного размера, так что > (поскольку нас интересуют только очень маленькие части интервала, это предположение имеет смысл). Это означает, что ожидаемое количество событий в интервале для каждого равно . Теперь мы предполагаем, что наступление события во всем интервале можно рассматривать как процесс Бернулли , где испытание соответствует проверке того, происходит ли событие на подынтервале с вероятностью . Ожидаемое количество общих событий в такие испытания были бы , ожидаемое количество общих событий во всем интервале. Следовательно, для каждого подразделения интервала мы аппроксимировали возникновение события как процесс Бернулли вида. Как мы уже отмечали ранее, мы хотим рассматривать только очень маленькие подынтервалы. Поэтому мы берем предел какуходит в бесконечность. В этом случае биномиальное распределение сходится к так называемому распределению Пуассона по предельной теореме Пуассона .
В некоторых из приведенных выше примеров - таких как количество мутаций в данной последовательности ДНК - подсчитываемые события на самом деле являются результатами дискретных испытаний и более точно моделируются с использованием биномиального распределения , т. Е.
В таких случаях n очень велико, а p очень мало (и поэтому математическое ожидание np имеет промежуточную величину). Тогда распределение может быть аппроксимировано менее громоздким распределением Пуассона [ править ]
Это приближение иногда называют законом редких событий , [48] : 5 , так как каждая из п отдельных Бернулли событий редко происходит. Название может вводить в заблуждение, потому что общее количество успешных событий в процессе Пуассона не обязательно должно быть редким, если параметр np не мал. Например, количество телефонных звонков на загруженный коммутатор за один час следует распределению Пуассона, при этом события кажутся оператору частыми, но они редки с точки зрения среднего члена населения, который вряд ли совершит звонок на тот коммутатор в тот час. Дисперсия биномиального распределения в 1 - p раз больше, чем у распределения Пуассона, поэтому почти одинакова, когда p очень мало.
Слово закон иногда используется как синоним вероятностного распределения , а конвергенция закона означает конвергенцию в распределении . Соответственно, распределение Пуассона иногда называют «законом малых чисел», потому что это распределение вероятностей количества появлений события, которое случается редко, но имеет очень много возможностей произойти. Закон малых чисел - это книга Ладислава Борткевича о распределении Пуассона, опубликованная в 1898 году. [39] [49]
Точечный процесс Пуассона
Распределение Пуассона возникает как количество точек точечного процесса Пуассона, расположенных в некоторой конечной области. Более конкретно, если D - некоторое пространство области, например евклидово пространство R d , для которого | D |, площадь, объем или, в более общем смысле, мера Лебега области конечна, и если N ( D ) обозначает количество точек в D , то
Пуассоновская регрессия и отрицательная биномиальная регрессия
Пуассоновская регрессия и отрицательная биномиальная регрессия полезны для анализа, где зависимая (ответная) переменная - это количество (0, 1, 2, ...) количества событий или вхождений в интервале.
Другие приложения в науке
В процессе Пуассона количество наблюдаемых явлений колеблется около своего среднего значения λ со стандартным отклонением . Эти колебания обозначаются как пуассоновский шум или (особенно в электронике) как дробовой шум .
Корреляция среднего и стандартного отклонения при подсчете независимых дискретных событий полезна с научной точки зрения. Наблюдая за тем, как флуктуации меняются со средним сигналом, можно оценить вклад одного события, даже если этот вклад слишком мал для непосредственного обнаружения . Например, заряд e электрона можно оценить, сопоставив величину электрического тока с его дробовым шумом . Если N электронов в среднем проходят точку за заданное время t , средний ток равен; поскольку текущие колебания должны быть порядка(т. е. стандартное отклонение пуассоновского процесса ), заряд можно оценить из соотношения . [ необходима цитата ]
Повседневный пример - зернистость, которая появляется при увеличении фотографий; зернистость обусловлена пуассоновскими колебаниями количества восстановленных зерен серебра , а не самими отдельными зернами. Путем сопоставления зернистость со степенью расширения, можно оценить вклад отдельного зерна (которое в противном случае слишком малы , чтобы быть видно невооруженным). [ необходима цитата ] Многие другие молекулярные применения пуассоновского шума были разработаны, например, для оценки числовой плотности рецепторных молекул в клеточной мембране .
В теории причинных множеств дискретные элементы пространства-времени следуют распределению Пуассона в объеме.
Вычислительные методы
Распределение Пуассона ставит перед выделенными программными библиотеками две разные задачи: Оценка распределения., и рисование случайных чисел в соответствии с этим распределением.
Оценка распределения Пуассона
Вычисление для данного а также это тривиальная задача, которую можно решить, используя стандартное определение в терминах экспоненциальной, степенной и факториальной функций. Однако обычное определение распределения Пуассона содержит два члена, которые могут легко переполниться на компьютерах: λ k и k !. От λ k до k ! также может привести к очень большой ошибке округления по сравнению с e −λ и, следовательно, к ошибочному результату. Поэтому для численной устойчивости функция массы вероятности Пуассона должна быть оценена как
что математически эквивалентно, но численно стабильно. Натуральный логарифм гамма-функции может быть получен с помощью lgamma
функции в стандартной библиотеке C (версия C99) или R , gammaln
функции в MATLAB или SciPy или log_gamma
функции в Fortran 2008 и более поздних версиях.
Некоторые вычислительные языки предоставляют встроенные функции для оценки распределения Пуассона, а именно:
- R : функция
dpois(x, lambda)
; - Excel : функция
POISSON( x, mean, cumulative)
с флагом для указания кумулятивного распределения; - Mathematica : одномерное распределение Пуассона , как , [50] двумерный распределение Пуассона , как ,. [51]
PoissonDistribution[]
MultivariatePoissonDistribution[,{ , }]
Случайная выборка из распределения Пуассона
Менее тривиальная задача - извлечь случайные целые числа из распределения Пуассона с заданными .
Решения предоставлены:
- R : функция
rpois(n, lambda)
; - Научная библиотека GNU (GSL): функция gsl_ran_poisson
Генерация случайных величин с распределением по Пуассону
Простой алгоритм генерации случайных чисел с распределением Пуассона ( выборка псевдослучайных чисел ) был предоставлен Кнутом : [52] : 137-138
алгоритм случайных чисел Пуассона (Кнут) : init : Пусть L ← e −λ , k ← 0 и p ← 1. do : к ← к + 1. Сгенерируйте равномерное случайное число u в [0,1] и пусть p ← p × u. в то время как p> L. вернуть k - 1.
Сложность линейна по возвращаемому значению k , которое в среднем равно λ. Есть много других алгоритмов для улучшения этого. Некоторые из них приведены в Ahrens & Dieter, см. § Ссылки ниже.
Для больших значений λ значение L = e −λ может быть настолько малым, что его трудно представить. Это может быть решено путем изменения алгоритма, который использует дополнительный параметр STEP, так что e -STEP не опустошается : [ необходима цитата ]
алгоритм случайных чисел Пуассона (Junhao, на основе Knuth) : init : Пусть λLeft ← λ, k ← 0 и p ← 1. do : к ← к + 1. Сгенерируйте равномерное случайное число u в (0,1) и пусть p ← p × u. в то время как p <1 и λLeft> 0: если λLeft> STEP: p ← p × e ШАГ λLeft ← λLeft - ШАГ еще : p ← p × e λ влево λвлево ← 0 пока p> 1. верните k - 1.
Выбор ШАГА зависит от порога переполнения. Для формата с плавающей запятой двойной точности порог близок к e 700 , поэтому 500 должно быть безопасным ШАГОМ .
Другие решения для больших значений λ включают выборку отбраковки и использование гауссовой аппроксимации.
Выборка с обратным преобразованием проста и эффективна для малых значений λ и требует только одного однородного случайного числа u на выборку. Кумулятивные вероятности исследуются по очереди, пока одна из них не превысит u .
алгоритм генератора Пуассона, основанный на инверсии путем последовательного поиска : [53] : 505 init : Пусть x ← 0, p ← e −λ , s ← p. Сгенерируйте равномерное случайное число u в [0,1]. пока u> s делать : х ← х + 1. p ← p × λ / x. s ← s + p. вернуть x.
История
Распределение было впервые представлено Симеоном Дени Пуассоном (1781–1840) и опубликовано вместе с его теорией вероятностей в его работе « Recherches sur la probabilité des jugements en matière criminelle et en matière civile» (1837). [54] : 205-207 В работе теоретизировалось количество неправомерных приговоров в данной стране, фокусируясь на определенных случайных величинах N, которые учитывают, среди прочего, количество дискретных происшествий (иногда называемых «событиями» или «прибытием»). которые происходят в течение определенного промежутка времени . Результат был уже дан в 1711 году Абрахамом де Муавром в De Mensura Sortis seu; de Probabilitate Eventuum в Ludis a Casu Fortuito Pendentibus . [55] : 219 [56] : 14-15 [57] : 193 [6] : 157 Это делает его примером закона Стиглера и побуждает некоторых авторов утверждать, что распределение Пуассона должно носить имя де Муавра. [58] [59]
В 1860 году Саймон Ньюкомб применил распределение Пуассона к количеству звезд в единице пространства. [60] Дальнейшее практическое применение этого распределения было сделано Ладиславом Борткевичем в 1898 году, когда ему было поручено исследовать количество солдат в прусской армии, случайно убитых ногами лошадей; [39] : 23-25 этот эксперимент ввел распределение Пуассона в область техники надежности .
Смотрите также
- Составное распределение Пуассона
- Распределение Конвея – Максвелла – Пуассона.
- Распределение Erlang
- Распределение Эрмита
- Индекс рассеивания
- Отрицательное биномиальное распределение
- Слипание Пуассона
- Точечный процесс Пуассона
- Регрессия Пуассона
- Пуассоновская выборка
- Вейвлет Пуассона
- Теория массового обслуживания
- Теория обновления
- Лемма Роббинса
- Распределение Скеллама
- Распределение твиди
- Модель без наддува
- Распределение Пуассона с нулевым усечением
Рекомендации
Цитаты
- ^ a b Хейт, Фрэнк А. (1967), Справочник по распределению Пуассона , Нью-Йорк, Нью-Йорк, США: John Wiley & Sons, ISBN 978-0-471-33932-8
- ^ Йейтс, Рой Д.; Гудман, Дэвид Дж. (2014), Вероятность и случайные процессы: дружественное введение для инженеров-электриков и компьютерных инженеров (2-е изд.), Хобокен, США: Wiley, ISBN 978-0-471-45259-1
- ^ Для доказательства см .: Proof wiki: ожидание и Proof wiki: дисперсия
- ^ Корсен, Уильям (2019-01-20), Распределение Пуассона и объяснение пуассоновского процесса , На пути к науке о данных , получено 19 сентября 2019 г.
- ^ Угарте, Мария Долорес; Милитино, Ана Ф .; Арнхольт, Алан Т. (2016), Вероятность и статистика с R (второе издание), Бока-Ратон, Флорида, США: CRC Press, ISBN 978-1-4665-0439-4
- ^ Б с д е е г ч I Джонсон, Норман Л .; Кемп, Эдриен В .; Коц, Самуил (2005), "Пуассон распределение", одномерные дискретные распределения (3 - й изд.), Нью - Йорк, Нью - Йорк, США: John Wiley & Sons, Inc., стр 156-207,. Дои : 10.1002 / 0471715816 , ISBN 978-0-471-27246-5
- ^ Хельске, Йоуни (2017). "KFAS: экспоненциальные модели пространства состояний семьи в R". Журнал статистического программного обеспечения . 78 (10). arXiv : 1612.01907 . DOI : 10,18637 / jss.v078.i10 . S2CID 14379617 .
- ^ Choi, Квок P. (1994), "О медиан гамма - распределений и уравнения Рамануджане", Труды Американского математического общества , 121 (1): 245-251, DOI : 10,2307 / 2160389 , JSTOR 2160389
- ^ Риордан, Джон (1937), "Момент Рекуррентные соотношения для биномиального, Пуассона и Гипергеометрические Частотные распределения" (PDF) , Анналы математической статистики , 8 (2): 103-111, DOI : 10,1214 / АОМ / 1177732430 , JSTOR 2957598
- ^ Д. Але, Томас (31 марта 2021 г.). «Точные и простые границы для исходных моментов биномиального и пуассоновского распределений». arXiv : 2103.17027 [ math.PR ].
- ^ Леманн, Эрих Лео (1986), Проверка статистических гипотез (второе изд.), Нью-Йорк, Нью-Джерси, США: Springer Verlag, ISBN 978-0-387-94919-2
- ^ Райков, Дмитрий (1937), "О разложении законов Пуассона", Comptes Rendus de l'Académie des Sciences de l'URSS , 14 : 9–11
- ^ Мизеса, Ричард (1964), Математическая теория вероятностей и статистика , Нью - Йорк, Нью - Джерси, США: Academic Press, DOI : 10.1016 / C2013-0-12460-9 , ISBN 978-1-4832-3213-3
- ^ Лаха, Радха Г .; Рохатги, Виджай К. (1979), Теория вероятностей , Нью-Йорк, Нью-Джерси, США: John Wiley & Sons, ISBN 978-0-471-03262-5
- ^ а б Митценмахер, Майкл ; Упфаль, Эли (2005), Вероятность и вычисления: рандомизированные алгоритмы и вероятностный анализ , Кембридж, Великобритания: Cambridge University Press, ISBN 978-0-521-83540-4
- ^ а б Короткий, Майкл (2013), "Улучшенные Неравенства для распределения Пуассона и биномиального и надхвостья Квантильных Functions", ISRN Вероятности и статистики , 2013 : 412958, DOI : 10,1155 / 2013/412958
- ^ Каматх, Говинда М .; Чашоглу, Эрен; Це, Дэвид (2015), «Оптимальная сборка гаплотипов из высокопроизводительных чтений пар пары», Международный симпозиум IEEE по теории информации (ISIT), 2015 г., 14–19 июня , Гонконг, Китай, стр. 914–918, arXiv : 1502,01975 , DOI : 10,1109 / ISIT.2015.7282588 , S2CID 128634
- ^ Принс, Джек (2012), «6.3.3.1. Графики контроля подсчета» , электронный справочник статистических методов , NIST / SEMATECH , получено 20 сентября 2019 г.
- ^ Чжан, Хуэйминь; Лю, Юньсяо; Ли Бо (2014), «Заметки о дискретном соединения Пуассона модели с приложениями к теории риска», страхование: математики и экономики , 59 : 325-336, DOI : 10.1016 / j.insmatheco.2014.09.012
- ^ Чжан, Хуэйминь; Ли, Бо (2016), "Характеризации дискретного составных распределений Пуассона", Связь в статистике - Теория и методика , 45 (22): 6789-6802, DOI : 10,1080 / 03610926.2014.901375 , S2CID 125475756
- ^ Маккаллах, Питер ; Нелдер, Джон (1989), Обобщенные линейные модели , Монографии по статистике и прикладной вероятности, 37 , Лондон, Великобритания: Chapman and Hall, ISBN 978-0-412-31760-6
- ^ Анскомб, Фрэнсис Дж (1948), "Преобразование Пуассона, биномиального и отрицательного биномиального данных", Biometrika , 35 (3-4): 246-254, DOI : 10,1093 / Biomet / 35.3-4.246 , JSTOR 2332343
- ^ Росс, Шелдон М. (2010), Введение в вероятностные модели (десятое изд.), Бостон, Массачусетс, США: Academic Press, ISBN 978-0-12-375686-2
- ^ «1.7.7 - Связь между многочленом и пуассоном | STAT 504» .
- ^ Лукас, Сотириос; Кемп, C. Дэвид (1986), "Индекс дисперсионных теста для распределения Двумерный Пуассона", биометрия , 42 (4): 941-948, DOI : 10,2307 / 2530708 , JSTOR 2530708
- ^ Бесплатные случайные переменные Д. Войкулеску, К. Дайкема, А. Ника, Серия монографий CRM, Американское математическое общество, Провиденс, Род-Айленд, 1992
- ^ Джеймс А. Минго, Роланд Спайчер: свободные вероятности и случайные матрицы. Монографии Института Филдса, Vol. 35, Спрингер, Нью-Йорк, 2017.
- ^ Лекции по комбинаторике свободной вероятности А. Ники и Р. Спайчера, стр. 203–204, Cambridge Univ. Пресса 2006
- ^ Пашек, Ева. «Оценка максимального правдоподобия - примеры» .
- ^ Гарвуд, Frank (1936), "пределы фунгицидного для распределения Пуассона", Biometrika , 28 (3/4): 437-442, DOI : 10,1093 / Biomet / 28.3-4.437 , JSTOR 2333958
- ^ Бреслоу, Норман Э .; Дэй, Ник Э. (1987), Статистические методы исследования рака: Том 2 - Дизайн и анализ когортных исследований , Лион, Франция: Международное агентство исследований рака , ISBN 978-92-832-0182-3, Архивируются с оригинала на 2018-08-08 , извлекаться 2012-03-11
- ^ Финк, Даниэль (1997), Сборник сопряженных приоров
- ^ Гельман; Карлин, Джон Б.; Стерн, Хэл С .; Рубин, Дональд Б. (2003), Байесовский анализ данных (2-е изд.), Бока-Ратон, Флорида, США: Chapman & Hall / CRC, ISBN 1-58488-388-X
- ^ Клевенсон, М. Лоуренс; Зидек, Джеймс В. (1975), "Синхронное Оценивание средств независимых законов Пуассона", журнал Американской ассоциации по статистике , 70 (351): 698-705, DOI : 10,1080 / 01621459.1975.10482497 , JSTOR 2285958
- ^ Бергер, Джеймс О. (1985), Статистическая теория принятия решений и байесовский анализ , Серия Springer в статистике (2-е изд.), Нью-Йорк, Нью-Джерси, США: Springer-Verlag, Bibcode : 1985sdtb.book ..... B , doi : 10.1007 / 978-1-4757-4286-2 , ISBN 978-0-387-96098-2
- ^ Раш, Георг (1963), «Пуассоновский процесс как модель разнообразия поведенческих явлений» (PDF) , 17-й Международный психологический конгресс , 2 , Вашингтон, округ Колумбия, США, 20–26 августа 1963 г .: Американская психологическая ассоциация, DOI : 10,1037 / e685262012-108CS1 maint: location ( ссылка )
- ^ Флори, Paul J. (1940), "Molecular Распределение размеров в основе оксида этилена Polymers", журнал Американского химического общества , 62 (6): 1561-1565, DOI : 10.1021 / ja01863a066
- ^ Ломниц, Цинна (1994), Основы прогнозирования землетрясений , Нью-Йорк: John Wiley & Sons, ISBN 0-471-57419-8, OCLC 647404423
- ^ а б в фон Борткевич, Ladislaus (1898), Das Gesetz der kleinen Zahlen [ Закон малых чисел ] (на немецком языке), Лейпциг, Германия: B. G. Teubner, p. На странице 1 Борткевич представляет распределение Пуассона. На страницах 23–25 Борткевич представляет свой анализ «4. Beispiel: Die durch Schlag eines Pferdes im preußischen Heere Getöteten». (4. Пример: погибшие в прусской армии от удара лошади.)
- ^ Студент (1907), "О погрешности подсчета с Haemacytometer" , Biometrika , 5 (3): 351-360, DOI : 10,2307 / 2331633 , JSTOR 2331633
- ^ Боланд, Philip J. (1984), "Биографический Проблеск Госсет", Американский Статистик , 38 (3): 179-183, DOI : 10,1080 / 00031305.1984.10483195 , JSTOR 2683648
- ^ Эрланг, Агнер К. (1909), «Sandsynlighedsregning og Telefonsamtaler» [Расчет вероятности и телефонные разговоры], Nyt Tidsskrift for Matematik (на датском языке), 20 (B): 33–39, JSTOR 24528622
- ^ Хорнби, Дэйв (2014), Модель прогнозирования футбола: распределение Пуассона , Ставки на спорт онлайн , получено 19 сентября 2014 г.
- ^ Кояма, Кенто; Хокунан, Хидеказу; Хасэгава, Маюми; Кавамура, Шусо; Косеки, Сигенобу (2016), «Соответствуют ли числа бактериальных клеток теоретическому распределению Пуассона? Сравнение экспериментально полученных чисел отдельных клеток с генерацией случайных чисел с помощью компьютерного моделирования», Food Microbiology , 60 : 49–53, doi : 10.1016 / j. fm.2016.05.019 , PMID 27554145
- ^ Кларк, RD (1946), "Применение распределения Пуассона" (PDF) , журнал Института актуариев , 72 (3): 481, DOI : 10,1017 / S0020268100035435
- ^ Галлахер, Патрик Х. (1976), "О распределении простых чисел в коротких интервалах", Mathematika , 23 (1): 4-9, DOI : 10,1112 / s0025579300016442
- ^ Харди, Годфри Х .; Литтлвуд, Джон Э. (1923), "О некоторых проблемах" partitio numerorum "III: О выражении числа как суммы простых чисел", Acta Mathematica , 44 : 1–70, doi : 10.1007 / BF02403921
- ^ Кэмерон, А. Колин; Триведи, Правин К. (1998), Регрессионный анализ данных подсчета , Кембридж, Великобритания: Cambridge University Press, ISBN 978-0-521-63567-7
- ^ Эджворта, Фрэнсис Y. (1913), «О применении теории вероятностей в статистических данных , касающихся общества» , журнал Королевского статистического общества , 76 (2): 165-193, DOI : 10,2307 / 2340091 , JSTOR 2340091
- ^ «Язык Wolfram Language: справочная страница PoissonDistribution» . wolfram.com . Проверено 8 апреля 2016 .
- ^ «Язык Wolfram Language: справочная страница по многомерному распределению Пуассона» . wolfram.com . Проверено 8 апреля 2016 .
- ^ Кнут, Дональд Эрвин (1997), получисловые алгоритмы , Искусство компьютерного программирования , 2 (3-е изд.), Addison Wesley , ISBN 978-0-201-89684-8
- ^ Devroye, Люк (1986), "Дискретная одномерные распределения" (PDF) , Non-Uniform Random Generation случайная величина , Нью - Йорк, Нью - Джерси, США:. Springer-Verlag, стр 485-553, DOI : 10.1007 / 978-1-4613- 8643-8_10 , ISBN 978-1-4613-8645-2
- ^ Пуассон, Симеон Д. (1837), Probabilité des jugements en matière criminelle et en matière civile, précédées des règles générales du Calcul des probabilités [ Исследование вероятности судебных решений по уголовным и гражданским делам ] (на французском языке), Париж, Франция: Башелье
- ^ де Муавр, Авраам (1711 г.), «De mensura sortis, seu, de probabilitate eventuum in ludis a casu fortuito pendentibus» [Об измерении вероятности или о вероятности событий в играх, зависящих от случайности], Философские труды Королевское общество (на латинском языке), 27 (329): 213-264, DOI : 10.1098 / rstl.1710.0018
- ^ де Муавр, Абрахам (1718), Доктрина шансов: Или, Метод расчета вероятности событий в игре , Лондон, Великобритания: У. Пирсон, ISBN 9780598843753
- ^ де Муавр, Авраам (1721 г.), «О законах случая», в Мотте, Бенджамин (ред.), «Философские транзакции от года MDCC (где заканчивается мистер Лоуторп) до года MDCCXX». Abridg'd и Dispos'd Under General Heads (на латыни), Vol. I, Лондон, Великобритания: Р. Уилкин, Р. Робинсон, С. Баллард, У. и Дж. Иннис, и Дж. Осборн, стр. 190–219.
|volume=
имеет дополнительный текст ( справка ) - ^ Стиглер, Стивен М. (1982), "Пуассона по распределению Пуассона", Статистика и вероятности Letters , 1 (1): 33-35, DOI : 10,1016 / 0167-7152 (82) 90010-4
- ^ Халд, Андерс; де Муавр, Авраам; МакКлинток, Брюс (1984), "А. де Муавра: 'De Mensura Sortis' или 'Об измерения Шанса ' ", Международный статистический обзор / Revue Internationale де - статистический , 52 (3): 229-262, DOI : 10,2307 / 1403045 , JSTOR 1403045
- ^ Ньюкомб, Саймон (1860), «Заметки по теории вероятностей» , The Mathematical Monthly , 2 (4): 134–140
Источники
- Аренс, Иоахим Х .; Дитер Ульрих (1974), "Компьютерные методы отбора проб из гамма-, бета-, Пуассона и биномиальных распределений", вычислительная техника , 12 (3): 223-246, DOI : 10.1007 / BF02293108 , S2CID 37484126
- Аренс, Иоахим Х .; Дитер Ульрих (1982), "Компьютерное поколение Пуассон отклоняющегося", ACM Сделки по математическому Software , 8 (2): 163-179, DOI : 10,1145 / 355993,355997 , S2CID 12410131
- Эванс, Рональд Дж .; Boersma, J .; Блахман, Нью-Мексико; Егерей, А. А. (1988), "Энтропия распределения Пуассона: Проблема 87-6" , SIAM Review , 30 (2): 314-317, DOI : 10,1137 / 1030059