Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В теории вероятностей и статистике , то распределение Эрмита , названный в честь Чарльза Эрмита , является дискретным распределением вероятностей используется для модели данных подсчета более одного параметра. Это распределение является гибким с точки зрения его способности допускать умеренный избыточный разброс данных.

Авторы Кемп и Кемп [1] назвали это «распределением Эрмита» из-за того, что его функция вероятности и функция, производящая момент, могут быть выражены через коэффициенты (модифицированных) полиномов Эрмита .

История [ править ]

Распределение первым появились в пачке применению математики в медицинские проблемы , [2] с помощью Anderson Gray Маккендрика в 1926 г. В этой работе автор объясняет несколько математических методов , которые могут быть применены к медицинским исследованиям. В одном из этих методов он рассмотрел двумерное распределение Пуассона и показал, что распределение суммы двух коррелированных переменных Пуассона следует распределению, которое позже будет известно как распределение Эрмита.

В качестве практического приложения Маккендрик рассмотрел распределение количества бактерий в лейкоцитах . Используя метод моментов, он согласовал данные с распределением Эрмита и нашел модель более удовлетворительной, чем согласование с распределением Пуассона .

Распределение было официально представлено и опубликовано CD Kemp и Adrienne W. Kemp в 1965 году в их работе Some Properties of Hermite Distribution . Работа сосредоточена на свойствах этого распределения, например, на необходимом условии для параметров и их оценках максимального правдоподобия (MLE), анализе производящей функции вероятности (PGF) и на том, как это может быть выражено через коэффициенты ( модифицированный) Многочлены Эрмита . Примером, который они использовали в этой публикации, является распределение количества бактерий в лейкоцитах, которое использовалось МакКендриком, но Кемп и Кемп оценивают модель, используя метод максимального правдоподобия .

Распределение Эрмита - это частный случай дискретного составного распределения Пуассона с двумя параметрами. [3] [4]

Те же авторы опубликовали в 1966 году статью «Альтернативный вывод распределения Эрмита» . [5] В этой работе установлено, что распределение Эрмита может быть получено формально путем комбинирования распределения Пуассона с нормальным распределением .

В 1971 г. Ю.К. Патель [6] провел сравнительное исследование различных процедур оценки распределения Эрмита в своей докторской диссертации. Он включал в себя оценку максимального правдоподобия, оценки момента, оценки средней и нулевой частоты и метод четных точек.

В 1974 г. Гупта и Джайн [7] провели исследование обобщенной формы распределения Эрмита.

Определение [ править ]

Вероятностная функция масс [ править ]

Пусть X 1 и X 2 - две независимые переменные Пуассона с параметрами a 1 и a 2 . Распределение вероятностей из случайной величины У = Х 1 + 2 Х 2 является распределение Эрмита с параметрами 1 и 2 и функция вероятности дается [8]

где

  • п = 0, 1, 2, ...
  • а 1 , а 2 ≥ 0.
  • ( п  - 2 дж )! и j ! являются факториалами ( n  - 2 j ) и j соответственно.
  • - целая часть числа   n / 2.

Производящая функция вероятности масса равна, [8]

Обозначение [ править ]

Когда случайная величина Y = X 1 + 2 X 2 распределена распределением Эрмита, где X 1 и X 2 - две независимые переменные Пуассона с параметрами a 1 и a 2 , мы пишем

Свойства [ править ]

Функции создания момента и кумулянта [ править ]

Функция создания момента случайной величины X определяется как ожидаемое значение e t как функция действительного параметра t . Для распределения Эрмита с параметрами X 1 и X 2 производящая функция момента существует и равна

Функция генерирования кумулянта представляет собой логарифм порождающей функции момента и равно [4]

Если рассматривать коэффициент ( it ) r r ! в разложении K ( t ) получаем r -кумулянт

Следовательно, среднее значение и следующие три момента о нем таковы.

Асимметрия [ править ]

Перекос третий момента вокруг среднего разделенного на 3/2 мощностей стандартного отклонения , а также для распределения Эрмита, [4]

  • Всегда , поэтому масса раздачи сосредоточена слева.

Эксцесс [ править ]

Эксцесс это четвертый момент вокруг среднего, деленный на квадрате дисперсии , и распределение Эрмита есть, [4]

Избыток эксцесс просто коррекция , чтобы сделать эксцесс нормального распределения равен нулю, и он заключается в следующем,

  • Всегда , или распределение имеет высокий острый пик вокруг среднего и более толстого хвостов.

Характеристическая функция [ править ]

В дискретной раздаче характеристическая функция любой вещественной случайной величины определяются как ожидаемое значение из , где я являюсь мнимой единицей и т  ∈  R

Эта функция связана с функцией создания момента через . Следовательно, для этого распределения характеристическая функция имеет вид [1]

Кумулятивная функция распределения [ править ]

Интегральная функция распределения является, [1]

Другие свойства [ править ]

  • Этот дистрибутив может иметь любое количество режимов . В качестве примера, насаженным распределения для Маккендрик в [2] данных, по оценкам , параметры , . Следовательно, первые пять оценочных вероятностей равны 0,899, 0,012, 0,084, 0,001, 0,004.
Пример мультимодальных данных, распределение Эрмита (0,1,1,5).
  • Это раздача закрыта по сложению или закрыта по сверткам. [9] Подобно распределению Пуассона, распределение Эрмита обладает этим свойством. С учетом двух Эрмита-распределенных случайных величин и , то Y = Х 1 + Х 2 следует за распределение Эрмита, .
  • Это распределение допускает умеренную избыточную дисперсию , поэтому его можно использовать, когда данные обладают этим свойством. [9] Случайная величина имеет избыточную дисперсию или избыточную дисперсию относительно распределения Пуассона, когда ее дисперсия больше ожидаемого значения. Распределение Эрмита допускает умеренную избыточную дисперсию, поскольку коэффициент дисперсии всегда находится между 1 и 2,

Оценка параметров [ править ]

Метод моментов [ править ]

Среднее и дисперсия распределения Эрмита являются и , соответственно. Итак, у нас есть эти два уравнения,

Решая эти два уравнения мы получаем моментных оценок и из в 1 и в 2 . [6]

Поскольку a 1 и a 2 положительны, оценки и допустимы (≥ 0), только если ,.

Максимальная вероятность [ править ]

Для выборки X 1 , ..., X m являются независимыми случайными величинами, каждая из которых имеет распределение Эрмита, и мы хотим оценить значение параметров и . Мы знаем, что среднее и дисперсия распределения равны и соответственно. Используя эти два уравнения,

Мы можем параметризовать функцию вероятности μ и d

Следовательно, функция логарифмического правдоподобия : [9]

где

Из логарифмической функции правдоподобия уравнения правдоподобия : [9]

Прямые вычисления показывают, что [9]

  • И d можно найти, решив,

где

  • Можно показать, что функция логарифмического правдоподобия строго вогнута в области значений параметров. Следовательно, MLE уникален.

Уравнение правдоподобия не всегда имеет решение, подобное следующему утверждению:

Предложение: [9] Пусть X 1 , ..., X m происходит из обобщенного распределения Эрмита с фиксированным n . Тогда MLE параметров равны, и если только если , где указывает эмпирический факторный момент порядка 2.

  • Замечание 1: Условие эквивалентно тому, где - эмпирический индекс дисперсии
  • Замечание 2: Если условие не выполняется, то MLE параметров являются и , то есть данные подбираются с использованием распределения Пуассона.

Нулевая частота и оценки среднего [ править ]

Обычный выбор для дискретных распределений - это нулевая относительная частота набора данных, которая приравнивается к вероятности нуля при предполагаемом распределении. Наблюдая за тем и . Следуя примеру YC Patel (1976), получившаяся система уравнений

Мы получаем нулевую частоту и среднюю оценку a 1 из и a 2 из , [6]

где , - нулевая относительная частота,  n  > 0

Видно, что для распределений с высокой вероятностью при 0 эффективность высока.

  • Для допустимых значений и необходимо, чтобы

Проверка предположения Пуассона [ править ]

Когда для моделирования выборки данных используется распределение Эрмита, важно проверить, достаточно ли распределения Пуассона для соответствия данным. Следуя параметризованной функции массы вероятности, используемой для вычисления оценки максимального правдоподобия, важно подтвердить следующую гипотезу:

Тест отношения правдоподобия [ править ]

Тест отношения правдоподобия статистика [9] для распределения Эрмита,

Где функция логарифма правдоподобия. Поскольку d  = 1 принадлежит границе области параметров, при нулевой гипотезе W не имеет асимптотического распределения, как ожидалось. Можно установить, что асимптотическое распределение W представляет собой смесь 50:50 константы 0 и . Процентные точки α верхнего хвоста для этой смеси такие же, как процентные точки 2α верхнего хвоста для a ; например, для α = 0,01, 0,05 и 0,10 они равны 5,41189, 2,70554 и 1,64237.

«Оценка» или тест множителя Лагранжа [ править ]

Статистика оценок: [9]

где m - количество наблюдений.

Асимптотическое распределение статистики критерия оценки при нулевой гипотезе является распределением. Может быть удобно использовать подписанную версию оценочного теста, то есть асимптотически следуя стандартной норме.

См. Также [ править ]

  • Составное распределение Пуассона
  • распределение Пуассона

Ссылки [ править ]

  1. ^ a b c Кемп, компакт-диск; Кемп, А.В. (1965). «Некоторые свойства« распространения Эрмита ». Биометрика . 52 (3–4): 381–394. DOI : 10.1093 / Biomet / 52.3-4.381 .
  2. ^ а б Маккендрик, AG (1926). «Приложения математики к медицинским проблемам» . Труды Эдинбургского математического общества . 44 : 98–130. DOI : 10.1017 / s0013091500034428 .
  3. ^ Хуэйминь, Чжан; Юньсяо Лю; Бо Ли (2014). «Заметки о дискретной составной модели Пуассона с приложениями к теории риска». Страхование: математика и экономика . 59 : 325–336. DOI : 10.1016 / j.insmatheco.2014.09.012 .
  4. ^ a b c d Джонсон, Н. Л., Кемп, А. В., и Котц, С. (2005) Одномерные дискретные распределения, 3-е издание, Wiley, ISBN 978-0-471-27246-5 . 
  5. ^ Кемп, ADRIENNE W .; Кемп CD (1966). «Альтернативный вывод распределения Эрмита». Биометрика . 53 (3–4): 627–628. DOI : 10.1093 / Biomet / 53.3-4.627 .
  6. ^ a b c Патель, YC (1976). «Оценка четных точек и оценка моментов в распределении Эрмита». Биометрия . 32 (4): 865–873. DOI : 10.2307 / 2529270 . JSTOR 2529270 . 
  7. ^ Гупта, RP; Джайн, GC (1974). «Обобщенное распределение Эрмита и его свойства». Журнал СИАМ по прикладной математике . 27 (2): 359–363. DOI : 10.1137 / 0127027 . JSTOR 2100572 . 
  8. ^ a b Котц, Сэмюэл (1982–1989). Энциклопедия статистических наук . Джон Вили. ISBN 978-0471055525.
  9. ^ Б с д е е г ч Puig, P. (2003). «Характеристика аддитивно замкнутых дискретных моделей по свойству их оценок максимального правдоподобия, с приложением к обобщенным распределениям Эрмита». Журнал Американской статистической ассоциации . 98 (463): 687–692. DOI : 10.1198 / 016214503000000594 . JSTOR 30045296 . S2CID 120484966 .