Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Распределение Коши , названное в честь Огюстена Коши , является непрерывным распределением вероятностей . Это также известно, особенно среди физиков , как распределение Лоренца (по Хендрику Лоренца ), распределение Коши – Лоренца , функция Лоренца (ian) или распределение Брейта – Вигнера . Распределение Коши - это распределение x-точки пересечения луча, исходящего из равномерно распределенного угла. Это также распределение отношения двух независимых нормально распределенных случайные величины с нулевым средним.

Распределение Коши часто используется в статистике как канонический пример « патологического » распределения, поскольку его ожидаемое значение и его дисперсия не определены (но см. § Объяснение неопределенных моментов ниже). Распределение Коши не имеет конечных моментов порядка больше или равных единице; существуют только дробные абсолютные моменты. [1] Распределение Коши не имеет функции, производящей момент .

В математике , она тесно связана с ядром Пуассона , которое является фундаментальным решением для уравнения Лапласа в верхней полуплоскости .

Это одно из немногих распределений, которое является стабильным и имеет функцию плотности вероятности, которая может быть выражена аналитически, а остальные являются нормальным распределением и распределением Леви .

История [ править ]

Оценка среднего и стандартного отклонения по выборкам из распределения Коши (внизу) не сходится с большим количеством выборок, как в нормальном распределении (вверху). Скачки оценок могут быть сколь угодно большими, как видно на графиках внизу. (Щелкните, чтобы развернуть)

Функции с формой функции плотности распределения Коши изучались математиками в 17 веке, но в другом контексте и под названием ведьмы Агнеси . Несмотря на название, первый явный анализ свойств распределения Коши был опубликован французским математиком Пуассоном в 1824 году, и Коши стал ассоциироваться с ним только во время академических споров в 1853 году. [2] Таким образом, название распределения стало является примером закона эпонимии Стиглера . Пуассон заметил, что если брать среднее значение наблюдений, следующих за таким распределением, то средняя ошибка не сходится к какому-либо конечному числу. Таким образом, использование ЛапласомЦентральная предельная теорема с таким распределением была неуместной, поскольку предполагала конечное среднее значение и дисперсию. Несмотря на это, Пуассон не считал этот вопрос важным, в отличие от Бьенайме , которому предстояло вовлечь Коши в долгий спор по этому поводу.

Характеристика [ править ]

Функция плотности вероятности [ править ]

Распределение Коши имеет функцию плотности вероятности (PDF) [1] [3]

где - параметр местоположения , определяющий положение пика распределения, и - параметр масштаба, который определяет полуширину на полувысоте (HWHM), альтернативно - это полная ширина на половине максимума (FWHM). также равна половине межквартильного размаха и иногда называется вероятной ошибкой . Огюстен-Луи Коши использовал такую ​​функцию плотности в 1827 году с бесконечно малым масштабным параметром, определив то, что теперь будет называться дельта-функцией Дирака .

Максимальное значение или амплитуда PDF Коши находится в .

Иногда удобно выражать PDF через комплексный параметр

Частный случай, когда и называется стандартным распределением Коши с функцией плотности вероятности [4] [5]

В физике часто используется трехпараметрическая функция Лоренца:

где - высота пика. Указанная трехпараметрическая функция Лоренца, как правило, не является функцией плотности вероятности, поскольку она не интегрируется до 1, за исключением особого случая, когда

Кумулятивная функция распределения [ править ]

Кумулятивная функция распределения распределения Коши:

а функция квантиля (обратная cdf ) распределения Коши равна

Отсюда следует , что первая и третья квартиль , и , следовательно, межквартильный диапазон находится .

Для стандартного распределения кумулятивная функция распределения упрощается до функции арктангенса :

Энтропия [ править ]

Энтропия распределения Коши определяется выражением:

Производная функции квантиля, функция плотности квантиля, для распределения Коши равна:

Дифференциальная энтропия из распределения может быть определена в терминах ее плотность квантиля, [6] а именно:

Распределение Коши - это максимальное распределение вероятностей энтропии для случайной величины, для которой

или, альтернативно, для случайной переменной, для которой

В своей стандартной форме это максимальное распределение вероятностей энтропии для случайной величины, для которой [7]


Расхождение Кульбака-Лейблера [ править ]

Кульбак-Либлер расхождение между двумя распределениями Коши имеет следующую симметричную форму замкнутой формулу: [8]

Свойства [ править ]

Распределение Коши является примером распределения, для которого не определены среднее значение , дисперсия или более высокие моменты . Его мода и медиана хорошо определены и оба равны .

Когда и являются двумя независимыми нормально распределенными случайными величинами с математическим ожиданием 0 и дисперсией 1, то отношение имеет стандартное распределение Коши.

Если является положительно-полуопределенной ковариационной матрицей со строго положительными диагональными элементами, то для независимых и одинаково распределенных и любого случайного -вектора, не зависящего от и такого, что и (определение категориального распределения ) выполняется, что

[9]

Если случайные переменные являются независимыми и одинаково распределенными , каждая из которых имеет стандартное распределение Коши, то среднее значение выборки имеет такое же стандартное распределение Коши. Чтобы убедиться, что это правда, вычислите характеристическую функцию выборочного среднего:

где - выборочное среднее. Этот пример показывает, что условие конечной дисперсии в центральной предельной теореме нельзя отбросить. Это также пример более обобщенной версии центральной предельной теоремы, которая характерна для всех стабильных распределений , частным случаем которых является распределение Коши.

Распределение Коши - это безгранично делимое распределение вероятностей . Это также строго стабильный дистрибутив. [10]

Стандартное распределение Коши совпадает с Стьюдентом т -распределением с одной степенью свободы.

Как и все стабильные распределения, семейство масштабов местоположения, к которому принадлежит распределение Коши, замкнуто относительно линейных преобразований с действительными коэффициентами. Кроме того, распределение Коши замкнуто относительно дробно-линейных преобразований с действительными коэффициентами. [11] В этой связи см. Также параметризацию МакКуллагом распределений Коши .

Характеристическая функция [ править ]

Пусть обозначают Коши распределенная случайная величина. Характеристическая функция распределения Коши задается

что является просто преобразованием Фурье плотности вероятности. Первоначальная плотность вероятности может быть выражена через характеристическую функцию, по существу, с помощью обратного преобразования Фурье:

П - й момента распределения является п - й производной от характеристической функции , измеренной при . Обратите внимание, что характеристическая функция не дифференцируема в начале координат: это соответствует тому факту, что распределение Коши не имеет четко определенных моментов, превышающих нулевой момент.

Объяснение неопределенных моментов [ править ]

Среднее [ править ]

Если распределение вероятностей имеет функцию плотности , то среднее значение, если оно существует, дается выражением

Мы можем вычислить этот двусторонний несобственный интеграл , вычислив сумму двух односторонних несобственных интегралов. То есть,

для произвольного действительного числа .

Чтобы интеграл существовал (даже как бесконечное значение), хотя бы один из членов этой суммы должен быть конечным или оба должны быть бесконечными и иметь один и тот же знак. Но в случае распределения Коши оба члена в этой сумме (2) бесконечны и имеют противоположный знак. Следовательно, (1) не определено, как и среднее значение. [12]

Обратите внимание, что главное значение Коши среднего значения распределения Коши равно

который равен нулю. С другой стороны, соответствующий интеграл

это не равна нулю, так как можно легко увидеть путем вычисления интеграла. Это снова показывает, что среднее (1) не может существовать.

Различные результаты теории вероятностей относительно ожидаемых значений , такие как усиленный закон больших чисел , не верны для распределения Коши. [12]

Меньшие моменты [ править ]

Определены абсолютные моменты для . Потому что у нас есть

Высшие моменты [ править ]

Распределение Коши не имеет конечных моментов любого порядка. Некоторые из высших сырых моментов действительно существуют и имеют значение бесконечности, например, необработанный второй момент:

Изменив формулу, можно увидеть, что второй момент - это, по сути, бесконечный интеграл от константы (здесь 1). Более высокие даже мощные необработанные моменты также будут оцениваться до бесконечности. Однако сырые моменты с нечетной силой не определены, что заметно отличается от существующих со значением бесконечности. Необработанные моменты с нечетной мощностью не определены, потому что их значения по существу эквивалентны, поскольку две половины интеграла расходятся и имеют противоположные знаки. Первый необработанный момент - это среднее значение, которого, как ни странно, не существует. (См. Также обсуждение этого вопроса выше.) Это, в свою очередь, означает, что все центральные моменты и стандартизированные моментыне определены, поскольку все они основаны на среднем значении. Дисперсия - второй центральный момент - также не существует (несмотря на то, что необработанный второй момент существует со значением бесконечность).

Результаты для высших моментов следуют из неравенства Гёльдера , из которого следует, что высшие моменты (или половины моментов) расходятся, если более низкие.

Моменты усеченных дистрибутивов [ править ]

Рассмотрим усеченное распределение, определенное путем ограничения стандартного распределения Коши интервалом [-10 100 , 10 100 ] . У такого усеченного распределения есть все моменты (и центральная предельная теорема применима к iid наблюдениям из него); однако почти для всех практических целей оно ведет себя как распределение Коши. [13]

Оценка параметров [ править ]

Поскольку параметры распределения Коши не соответствуют среднему значению и дисперсии, попытка оценить параметры распределения Коши с использованием выборочного среднего и выборочной дисперсии не увенчается успехом. [14] Например, если выборка iid размера n взята из распределения Коши, можно рассчитать выборочное среднее как:

Хотя значения выборки будут сконцентрированы вокруг центрального значения , среднее значение выборки будет становиться все более изменчивым по мере увеличения количества наблюдений из-за увеличения вероятности обнаружения точек выборки с большим абсолютным значением. Фактически, распределение выборочного среднего будет равно распределению самих наблюдений; то есть, выборочное среднее большой выборки не лучше (или хуже) для оценки, чем любое отдельное наблюдение из выборки. Точно так же расчет дисперсии выборки приведет к тому, что значения будут расти по мере увеличения количества наблюдений.

Следовательно, необходимы более надежные средства оценки центрального значения и параметра масштабирования . Один простой метод состоит в том, чтобы взять среднее значение выборки в качестве оценки, а половину межквартильного размаха выборки в качестве оценки . Были разработаны другие, более точные и надежные методы [15] [16] Например, усеченное среднее средних 24% статистики порядка выборки дает оценку, которая более эффективна, чем использование медианы выборки или полной выборки. иметь в виду. [17] [18] Однако из-за толстых хвостовраспределения Коши, эффективность оценки снижается, если используется более 24% выборки. [17] [18]

Максимальное правдоподобие также можно использовать для оценки параметров и . Однако это имеет тенденцию усложняться тем фактом, что для этого требуется найти корни многочлена высокой степени, и может быть несколько корней, которые представляют локальные максимумы. [19] Кроме того, хотя оценка максимального правдоподобия является асимптотически эффективной, она относительно неэффективна для небольших выборок. [20] [21] Логарифмическая функция правдоподобия для распределения Коши для размера выборки :

Максимизация логарифмической функции правдоподобия относительно и путем взятия первой производной дает следующую систему уравнений:

Обратите внимание, что

является монотонной функцией по и что решение должно удовлетворять

Решение только для требует решения полинома степени , [19] и решение только для требует решения полинома степени . Следовательно, независимо от того, решается ли решение для одного параметра или для обоих параметров одновременно, обычно требуется численное решение на компьютере. Преимущество оценки максимального правдоподобия - асимптотическая эффективность; оценка с использованием медианы выборки составляет лишь около 81% асимптотически эффективной оценки по максимальной вероятности. [18] [22] Усеченное выборочное среднее с использованием статистики среднего порядка 24% составляет около 88% как асимптотически эффективная оценка, как оценка максимального правдоподобия. [18] КогдаМетод Ньютона используется для нахождения решения для оценки максимального правдоподобия, статистические данные среднего порядка 24% могут использоваться в качестве начального решения для .

Форма может быть оценена с использованием медианы абсолютных значений, так как для расположения 0 переменных Коши , в параметре формы.

Многомерное распределение Коши [ править ]

Случайный вектор , как говорят, многомерное распределение Коши , если каждая линейная комбинация ее компоненты имеет распределение Коши. То есть для любого постоянного вектора случайная величина должна иметь одномерное распределение Коши. [23] Характеристическая функция многомерного распределения Коши определяется выражением:

где и действительные функции с более однородной функцией степени одного и положительно однородной функцией степени. [23] Более формально: [23]

для всех .

Пример двумерного распределения Коши может быть дан следующим образом: [24]

Обратите внимание , что в этом примере, несмотря на то, что нет аналога ковариационной матрицы, а не статистически независимы . [24]

Мы также можем написать эту формулу для комплексной переменной. Тогда функция плотности вероятности сложного Коши:

Подобно одномерной плотности, многомерная плотность Коши также связана с многомерным распределением Стьюдента . Они эквивалентны, когда параметр степеней свободы равен единице. Плотность распределения Стьюдента размерности с одной степенью свободы становится:

Свойства и подробности этой плотности можно получить, рассматривая ее как частный случай многомерной плотности Стьюдента.

Свойства трансформации [ править ]

  • Если тогда [25]
  • Если и независимы, то и
  • Если тогда
  • Параметризация распределений Коши Маккаллахом : [26] Выражая распределение Коши в терминах одного комплексного параметра , определите как среднее . Если тогда:

где , , и действительные числа.

  • Используя то же соглашение, что и выше, если тогда: [26]
где - круговое распределение Коши .

Мера Леви [ править ]

Распределение Коши является устойчивым распределением индекса 1. Представление Леви – Хинчина такого устойчивого распределения параметра задается формулой:

куда

и может быть выражена явно. [27] В случае распределения Коши имеет место .

Это последнее представление является следствием формулы

Связанные дистрибутивы [ править ]

  • Стьюдента т распределение
  • нестандартизированного Стьюдента т распределение
  • Если независимый, то
  • Если тогда
  • Если тогда
  • Если тогда
  • Распределение Коши - это предельный случай распределения Пирсона типа 4 [ необходима ссылка ]
  • Распределение Коши - это частный случай распределения Пирсона типа 7. [1]
  • Распределение Коши является стабильным распределением : если , то .
  • Распределение Коши является сингулярным пределом гиперболического распределения [ необходимая ссылка ]
  • Завернутые распределение Коши , принимая значения на окружности, является производным от распределения Коши, окружив его по кругу.
  • Если , , то . Для половинных распределений Коши соотношение выполняется, если положить .

Релятивистское распределение Брейта – Вигнера [ править ]

В ядерной физике и физике элементарных частиц энергетический профиль резонанса описывается релятивистским распределением Брейта – Вигнера , а распределение Коши - (нерелятивистским) распределением Брейта – Вигнера. [ необходима цитата ]

Возникновение и применение [ править ]

  • В спектроскопии распределение Коши описывает форму спектральных линий, которые подвержены однородному уширению, при котором все атомы взаимодействуют одинаково с диапазоном частот, содержащимся в форме линии. Многие механизмы вызывают однородное уширение, особенно уширение при столкновении . [28] Время жизни или естественное уширение также приводит к форме линии, описываемой распределением Коши.
  • Приложения распределения Коши или его преобразования можно найти в областях, работающих с экспоненциальным ростом. В статье Уайта 1958 года [29] была получена тестовая статистика для оценок уравнения, и где оценка максимального правдоподобия находится с использованием обычных наименьших квадратов, показано, что выборочное распределение статистики является распределением Коши.
Подгонка кумулятивного распределения Коши к максимальным однодневным осадкам с использованием CumFreq , см. Также подгонку распределения [30]
  • Распределение Коши часто представляет собой распределение наблюдений за вращающимися объектами. Классическая ссылка на это называется проблемой маяка Чайки [31] и, как и в предыдущем разделе, как распределение Брейта – Вигнера в физике элементарных частиц.
  • В гидрологии распределение Коши применяется к экстремальным явлениям, таким как годовые максимальные однодневные осадки и сток реки. На синем рисунке показан пример подгонки распределения Коши к ранжированным ежемесячным максимальным однодневным осадкам, показывающий также 90% доверительный пояс на основе биномиального распределения . Данные об осадках представлены в виде графиков позиций как часть кумулятивного частотного анализа .
  • Выражение для мнимой части комплексной диэлектрической проницаемости согласно модели Лоренца является распределением Коши.
  • В качестве дополнительного распределения для моделирования « толстых хвостов» в вычислительных финансах распределения Коши можно использовать для моделирования VAR ( подверженной риску стоимости ), дающей гораздо большую вероятность экстремального риска, чем распределение по Гауссу . [32]

См. Также [ править ]

  • Lévy полета и процесс Lévy
  • Процесс Коши
  • Стабильный процесс
  • Распределение слэша

Ссылки [ править ]

  1. ^ a b c Н. Л. Джонсон; С. Коц; Н. Балакришнан (1994). Непрерывные одномерные распределения, Том 1 . Нью-Йорк: Вили., Глава 16.
  2. ^ Коши и ведьма Агнеси в статистике на столе , С.М. Стиглер, Гарвард, 1999, глава 18
  3. ^ Феллер, Уильям (1971). Введение в теорию вероятностей и ее приложения, Том II (2-е изд.). Нью-Йорк: John Wiley & Sons Inc., стр.  704 . ISBN 978-0-471-25709-7.
  4. ^ Райли, Кен Ф .; Хобсон, Майкл П .; Бенце, Стивен Дж. (2006). Математические методы для физики и техники (3-е изд.). Кембридж, Великобритания: Издательство Кембриджского университета. С.  1333 . ISBN 978-0-511-16842-0.
  5. ^ Балакришнан, N .; Неврозов, В.Б. (2003). Букварь по статистическим распределениям (1-е изд.). Хобокен, Нью-Джерси: John Wiley & Sons Inc., стр.  305 . ISBN 0-471-42798-5.
  6. ^ Vasicek, Олдрич (1976). «Тест на нормальность, основанный на выборочной энтропии». Журнал Королевского статистического общества, Series B . 38 (1): 54–59.
  7. ^ Park, Sung Y .; Бера, Анил К. (2009). "Модель условной гетероскедастичности авторегрессии максимальной энтропии" (PDF) . Журнал эконометрики . Эльзевир. 150 (2): 219–230. DOI : 10.1016 / j.jeconom.2008.12.014 . Архивировано из оригинального (PDF) 30 сентября 2011 года . Проверено 2 июня 2011 .
  8. ^ Фредерик, Чизак; Нильсен, Франк (2019). «Формула в закрытой форме для расхождения Кульбака-Лейблера между распределениями Коши». arXiv : 1905.10965 . Bibcode : 2019arXiv190510965C . Cite journal requires |journal= (help)
  9. ^ Пиллаи Н. и Мэн, XL (2016). «Неожиданная встреча с Коши и Леви». Летопись статистики . 44 (5): 2089–2097. arXiv : 1505.01957 . DOI : 10.1214 / 15-AOS1407 . S2CID 31582370 . CS1 maint: uses authors parameter (link)
  10. ^ Кэмпбелл Б. Рид, Н. Балакришнан, Брани Видакович и Сэмюэл Коц (2006). Энциклопедия статистических наук (2-е изд.). Джон Вили и сыновья . п. 778. ISBN 978-0-471-15044-2.CS1 maint: uses authors parameter (link)
  11. FB Knight (1976). «Характеристика типа Коши» . Труды Американского математического общества . 55 (1): 130–135. DOI : 10.2307 / 2041858 . JSTOR 2041858 . 
  12. ^ а б «Распределение Коши» . Виртуальные лаборатории . Университет Алабамы в Хантсвилле . Проверено 19 сентября 2018 года .
  13. ^ Хэмпел, Франк (1998), "Неужели статистика слишком сложна?" (PDF) , канадский журнал статистики , 26 (3): 497-513, DOI : 10,2307 / 3315772 , ЛВП : 20.500.11850 / 145503 , JSTOR 3315772  .
  14. ^ Иллюстрация нестабильности выборочных средних
  15. ^ Cane, Гвенды J. (1974). «Линейная оценка параметров распределения Коши на основе выборочных квантилей». Журнал Американской статистической ассоциации . 69 (345): 243–245. DOI : 10.1080 / 01621459.1974.10480163 . JSTOR 2285535 . 
  16. Перейти ↑ Zhang, Jin (2010). «Высокоэффективная L-оценка для параметра местоположения распределения Коши». Вычислительная статистика . 25 (1): 97–105. DOI : 10.1007 / s00180-009-0163-у . S2CID 123586208 . 
  17. ^ a b Ротенберг, Томас Дж .; Фишер, Франклин, М .; Тиланус, CB (1964). «Примечание об оценке по выборке Коши». Журнал Американской статистической ассоциации . 59 (306): 460–463. DOI : 10.1080 / 01621459.1964.10482170 .
  18. ^ a b c d Блох, Даниэль (1966). «Примечание об оценке параметров местоположения распределения Коши». Журнал Американской статистической ассоциации . 61 (316): 852–855. DOI : 10.1080 / 01621459.1966.10480912 . JSTOR 2282794 . 
  19. ^ a b Фергюсон, Томас С. (1978). "Оценки максимального правдоподобия параметров распределения Коши для выборок размера 3 и 4". Журнал Американской статистической ассоциации . 73 (361): 211–213. DOI : 10.1080 / 01621459.1978.10480031 . JSTOR 2286549 . 
  20. ^ Cohen Freue, Габриэлла В. (2007). "Оценка Питмана параметра местоположения Коши" (PDF) . Журнал статистического планирования и вывода . 137 (6): 1901. DOI : 10.1016 / j.jspi.2006.05.002 . Архивировано из оригинального (PDF) 16 августа 2011 года.
  21. Перейти ↑ Wilcox, Rand (2012). Введение в робастную оценку и проверку гипотез . Эльзевир.
  22. ^ Барнетт, VD (1966). "Порядковые статистические оценщики расположения распределения Коши". Журнал Американской статистической ассоциации . 61 (316): 1205–1218. DOI : 10.1080 / 01621459.1966.10482205 . JSTOR 2283210 . 
  23. ^ a b c Фергюсон, Томас С. (1962). "Представление симметричного двумерного распределения Коши" . Анналы математической статистики . 33 (4): 1256–1266. DOI : 10.1214 / АОМ / 1177704357 . JSTOR 2237984 . Проверено 7 января 2017 . 
  24. ^ a b Molenberghs, Geert; Lesaffre, Эммануэль (1997). «Нелинейные интегральные уравнения для приближенных двумерных плотностей с заданными запасами и функцией зависимости» (PDF) . Statistica Sinica . 7 : 713–738. Архивировано из оригинального (PDF) 14 сентября 2009 года.
  25. ^ Лемонс, Дон С. (2002), «Введение в случайные процессы в физике», Американский журнал физики , издательство Johns Hopkins University Press, 71 (2): 35, Bibcode : 2003AmJPh..71..191L , doi : 10.1119 / 1.1526134 , ISBN 0-8018-6866-1
  26. ^ a b McCullagh, P. , "Условный вывод и модели Коши" , Biometrika , том 79 (1992), страницы 247–259. PDF с домашней страницы МакКаллага.
  27. ^ Киприану, Андреас (2009). Процессы Леви и ветвящиеся процессы с непрерывным состоянием: часть I (PDF) . п. 11. CS1 maint: uses authors parameter (link)
  28. Перейти ↑ E. Hecht (1987). Оптика (2-е изд.). Эддисон-Уэсли . п. 603.
  29. ^ Уайт, Дж. С. (1958) Предельное распределение коэффициента последовательной корреляции во взрывоопасном случае. Анналы математической статистики, 29, 1188-1197. https://doi.org/10.1214/aoms/1177706450
  30. ^ CumFreq, бесплатное программное обеспечение для кумулятивного частотного анализа и подбора распределения вероятностей [1]
  31. ^ Галл, С.Ф. (1988) Байесовский индуктивный вывод и максимальная энтропия. Kluwer Academic Publishers, Берлин. https://doi.org/10.1007/978-94-009-3049-0_4
  32. ^ Тонг Лю (2012), Промежуточное распределение между распределениями Гаусса и Коши. https://arxiv.org/pdf/1208.5109.pdf

Внешние ссылки [ править ]

  • "Распределение Коши" , Энциклопедия математики , EMS Press , 2001 [1994]
  • Раннее использование: запись о распределении Коши содержит некоторую историческую информацию.
  • Вайстейн, Эрик В. «Распределение Коши» . MathWorld .
  • Научная библиотека GNU - Справочное руководство
  • Отношения нормальных переменных Джорджа Марсальи