Ядро (статистика)

Эта статья требует дополнительных ссылок для проверки . Пожалуйста, помогите улучшить эту статью , добавив цитаты из надежных источников . Материал, не полученный от источника, может быть оспорен и удален.
Поиск источников: статистика "ядра" - новости · газеты · книги · ученый · JSTOR ( май 2012 г. ) ( Узнайте, как и когда удалить это сообщение-шаблон )

Термин ядро используется в статистическом анализе для обозначения оконной функции . Термин «ядро» имеет несколько различных значений в разных отраслях статистики.

Байесовская статистика [ править ]

В статистике, особенно в байесовской статистике , ядро функции плотности вероятности (pdf) или функции массы вероятности (pmf) представляет собой форму pdf или pmf, в которой любые факторы, не являющиеся функциями каких-либо переменных в области, являются опущено. ^{[ необходима цитата ]} Обратите внимание, что такие факторы могут быть функциями параметров PDF или PMF. Эти факторы являются частью коэффициента нормализации в распределении вероятностей , и не нужно во многих ситуациях. Например, при выборке псевдослучайных чисел большинство алгоритмов выборки игнорируют коэффициент нормализации. Кроме того, вБайесовский анализ из сопряженных предыдущих распределений, коэффициенты нормировки , как правило , игнорируются при расчетах, и только ядро рассматривается. В конце проверяется форма ядра, и если она соответствует известному распределению, коэффициент нормализации может быть восстановлен. В противном случае в этом может быть нет необходимости (например, если нужно только выбрать распределение).

Для многих дистрибутивов ядро можно записать в замкнутой форме, но не нормировочную константу.

Пример - нормальное распределение . Его функция плотности вероятности является

{\ displaystyle p (x | \ mu, \ sigma ^ {2}) = {\ frac {1} {\ sqrt {2 \ pi \ sigma ^ {2}}}} e ^ {- {\ frac {(x - \ mu) ^ {2}} {2 \ sigma ^ {2}}}}}

и связанное ядро

{\ displaystyle p (x | \ mu, \ sigma ^ {2}) \ propto e ^ {- {\ frac {(x- \ mu) ^ {2}} {2 \ sigma ^ {2}}}}}

Обратите внимание, что множитель перед экспонентой был опущен, хотя он содержит параметр , потому что он не является функцией переменной домена . ${\ displaystyle \ sigma ^ {2}}$ ${\ displaystyle x}$

Анализ паттернов [ править ]

Ядро воспроизводящего ядра Гильбертово пространство используется в наборе методов, известных как методы ядра, для выполнения таких задач, как статистическая классификация , регрессионный анализ и кластерный анализ данных в неявном пространстве. Это использование особенно распространено в машинном обучении .

Непараметрическая статистика [ править ]

В непараметрической статистике ядро - это весовая функция, используемая в методах непараметрической оценки. Ядра используются в оценке плотности ядра для оценки случайных величин " функции плотности , или в ядре регрессии для оценки условного математического ожидания случайной величины. Ядра также используются во временных рядах при использовании периодограммы для оценки спектральной плотности, где они известны как оконные функции . Дополнительное использование - оценка изменяющейся во времени интенсивности точечного процесса. где оконные функции (ядра) свертываются с данными временных рядов.

Обычно ширина ядра также должна быть указана при запуске непараметрической оценки.

Определение [ править ]

Ядро - это неотрицательная действительная интегрируемая функция K. Для большинства приложений желательно определить функцию, которая удовлетворяет двум дополнительным требованиям:

Нормализация :

{\ Displaystyle \ int _ {- \ infty} ^ {+ \ infty} К (и) \, ду = 1 \ ,;}

Симметрия:

{\ Displaystyle K (-u) = K (u) {\ mbox {для всех значений}} u \ ,.}

Первое требование гарантирует, что метод оценки плотности ядра дает функцию плотности вероятности . Второе требование гарантирует, что среднее значение соответствующего распределения равно среднему значению используемой выборки.

Если K является ядром, то функция K * определяется формулой K * ( u ) = λ K (λ u ), где λ> 0. Это можно использовать для выбора масштаба, подходящего для данных.

Часто используемые функции ядра [ править ]

Все ядра ниже в единой системе координат.

Обычно используются несколько типов ядерных функций: равномерная, треугольная, эпанечникова, ^[1] квартика (двувес), трикуб, ^[2] трехвес, гауссовская, квадратичная ^[3] и косинусная.

В приведенной ниже таблице, если задано с ограниченной опорой , то для значений u, лежащих вне опоры. ${\ displaystyle K}$ ${\ Displaystyle К (и) = 0}$

Функции ядра, K ( u )			${\ Displaystyle \ textstyle \ int и ^ {2} К (и) ду}$	${\ Displaystyle \ textstyle \ int К (и) ^ {2} ду}$	КПД ^[4] относительно ядра Епанечникова
Равномерное («прямоугольное окно»)	${\ Displaystyle К (и) = {\ гидроразрыва {1} {2}}}$ Поддерживать: ${\ displaystyle \| u \| \ leq 1}$	« Функция товарного вагона »	${\ displaystyle {\ frac {1} {3}}}$	${\frac {1}{2}}$	92,9%
Треугольный	$K(u)=(1-\|u\|)$ Поддерживать: $\|u\|\leq 1$		${\frac {1}{6}}$	${\frac {2}{3}}$	98,6%
Епанечников (параболический)	$K(u)={\frac {3}{4}}(1-u^{2})$ Поддерживать: $\|u\|\leq 1$		${\frac {1}{5}}$	${\frac {3}{5}}$	100%
Quartic ( двухвес )	$K(u)={\frac {15}{16}}(1-u^{2})^{2}$ Поддерживать: $\|u\|\leq 1$		${\frac {1}{7}}$	${\frac {5}{7}}$	99,4%
Трехвес	$K(u)={\frac {35}{32}}(1-u^{2})^{3}$ Поддерживать: $\|u\|\leq 1$		${\frac {1}{9}}$	${\frac {350}{429}}$	98,7%
Tricube	$K(u)={\frac {70}{81}}(1-{\left\|u\right\|}^{3})^{3}$ Поддерживать: $\|u\|\leq 1$		${\frac {35}{243}}$	${\frac {175}{247}}$	99,8%
Гауссовский	$K(u)={\frac {1}{\sqrt {2\pi }}}e^{-{\frac {1}{2}}u^{2}}$		$1\,$	${\frac {1}{2{\sqrt {\pi }}}}$	95,1%
Косинус	$K(u)={\frac {\pi }{4}}\cos \left({\frac {\pi }{2}}u\right)$ Поддерживать: $\|u\|\leq 1$		$1-{\frac {8}{\pi ^{2}}}$	${\frac {\pi ^{2}}{16}}$	99,9%
Логистика	$K(u)={\frac {1}{e^{u}+2+e^{-u}}}$		${\frac {\pi ^{2}}{3}}$	${\frac {1}{6}}$	88,7%
Сигмовидная функция	$K(u)={\frac {2}{\pi }}{\frac {1}{e^{u}+e^{-u}}}$		${\frac {\pi ^{2}}{4}}$	${\frac {2}{\pi ^{2}}}$	84,3%
Ядро Сильвермана ^[5]	$K(u)={\frac {1}{2}}e^{-{\frac {\|u\|}{\sqrt {2}}}}\cdot \sin \left({\frac {\|u\|}{\sqrt {2}}}+{\frac {\pi }{4}}\right)$		$0$	${\frac {3{\sqrt {2}}}{16}}$	непригодный

См. Также [ править ]

Оценка плотности ядра
Ядро более гладкое
Стохастическое ядро
Оценка плотности
Оценка многомерной плотности ядра

Эта статья включает в себя список общих ссылок , но он остается в основном непроверенным, поскольку в нем отсутствуют соответствующие встроенные ссылки . Пожалуйста, помогите улучшить эту статью, добавив более точные цитаты. ( Май 2012 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения )

Ссылки [ править ]

^ Названо в честь Епанечникова, В.А. (1969). «Непараметрическая оценка многомерной плотности вероятности». Теория вероятн. Appl . 14 (1): 153–158. DOI : 10.1137 / 1114019 .
^ Альтман, Н.С. (1992). «Введение в непараметрическую регрессию ядра и ближайшего соседа». Американский статистик . 46 (3): 175–185. DOI : 10.1080 / 00031305.1992.10475879 . hdl : 1813/31637 .
^ Кливленд, WS ; Девлин, SJ (1988). «Локально взвешенная регрессия: подход к регрессионному анализу путем локальной подгонки». Журнал Американской статистической ассоциации . 83 (403): 596–610. DOI : 10.1080 / 01621459.1988.10478639 .
^ Эффективность определяется как. ${\sqrt {\int u^{2}K(u)\,du}}\int K(u)^{2}\,du$
Перейти ↑ Silverman, BW (1986). Оценка плотности для статистики и анализа данных . Чепмен и Холл, Лондон.

Ли, Ци; Расин, Джеффри С. (2007). Непараметрическая эконометрика: теория и практика . Издательство Принстонского университета. ISBN 978-0-691-12161-1.

Кабачок, Уолтер. «ПРИКЛАДНЫЕ МЕТОДЫ Сглаживания. Часть 1: Оценка плотности ядра» (PDF) . Проверено 6 сентября 2018 года .

Comaniciu, D; Меер, П. (2002). «Среднее смещение: надежный подход к анализу пространства признаков». IEEE Transactions по анализу шаблонов и машинному анализу . 24 (5): 603–619. CiteSeerX 10.1.1.76.8968 . DOI : 10.1109 / 34.1000236 .

[1] Названо в честь Епанечникова, В.А. (1969). «Непараметрическая оценка многомерной плотности вероятности». Теория вероятн. Appl . 14 (1): 153–158. DOI : 10.1137 / 1114019 .

[2] Альтман, Н.С. (1992). «Введение в непараметрическую регрессию ядра и ближайшего соседа». Американский статистик . 46 (3): 175–185. DOI : 10.1080 / 00031305.1992.10475879 . hdl : 1813/31637 .

[3] Кливленд, WS ; Девлин, SJ (1988). «Локально взвешенная регрессия: подход к регрессионному анализу путем локальной подгонки». Журнал Американской статистической ассоциации . 83 (403): 596–610. DOI : 10.1080 / 01621459.1988.10478639 .

[4] Эффективность определяется как. ${\sqrt {\int u^{2}K(u)\,du}}\int K(u)^{2}\,du$

[5] Перейти ↑ Silverman, BW (1986). Оценка плотности для статистики и анализа данных . Чепмен и Холл, Лондон.