Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Термин ядро используется в статистическом анализе для обозначения оконной функции . Термин «ядро» имеет несколько различных значений в разных отраслях статистики.

Байесовская статистика [ править ]

В статистике, особенно в байесовской статистике , ядро функции плотности вероятности (pdf) или функции массы вероятности (pmf) представляет собой форму pdf или pmf, в которой любые факторы, не являющиеся функциями каких-либо переменных в области, являются опущено. [ необходима цитата ] Обратите внимание, что такие факторы могут быть функциями параметров PDF или PMF. Эти факторы являются частью коэффициента нормализации в распределении вероятностей , и не нужно во многих ситуациях. Например, при выборке псевдослучайных чисел большинство алгоритмов выборки игнорируют коэффициент нормализации. Кроме того, вБайесовский анализ из сопряженных предыдущих распределений, коэффициенты нормировки , как правило , игнорируются при расчетах, и только ядро рассматривается. В конце проверяется форма ядра, и если она соответствует известному распределению, коэффициент нормализации может быть восстановлен. В противном случае в этом может быть нет необходимости (например, если нужно только выбрать распределение).

Для многих дистрибутивов ядро ​​можно записать в замкнутой форме, но не нормировочную константу.

Пример - нормальное распределение . Его функция плотности вероятности является

и связанное ядро

Обратите внимание, что множитель перед экспонентой был опущен, хотя он содержит параметр , потому что он не является функцией переменной домена .

Анализ паттернов [ править ]

Ядро воспроизводящего ядра Гильбертово пространство используется в наборе методов, известных как методы ядра, для выполнения таких задач, как статистическая классификация , регрессионный анализ и кластерный анализ данных в неявном пространстве. Это использование особенно распространено в машинном обучении .

Непараметрическая статистика [ править ]

В непараметрической статистике ядро - это весовая функция, используемая в методах непараметрической оценки. Ядра используются в оценке плотности ядра для оценки случайных величин " функции плотности , или в ядре регрессии для оценки условного математического ожидания случайной величины. Ядра также используются во временных рядах при использовании периодограммы для оценки спектральной плотности, где они известны как оконные функции . Дополнительное использование - оценка изменяющейся во времени интенсивности точечного процесса. где оконные функции (ядра) свертываются с данными временных рядов.

Обычно ширина ядра также должна быть указана при запуске непараметрической оценки.

Определение [ править ]

Ядро - это неотрицательная действительная интегрируемая функция K. Для большинства приложений желательно определить функцию, которая удовлетворяет двум дополнительным требованиям:

  • Нормализация :
  • Симметрия:

Первое требование гарантирует, что метод оценки плотности ядра дает функцию плотности вероятности . Второе требование гарантирует, что среднее значение соответствующего распределения равно среднему значению используемой выборки.

Если K является ядром, то функция K * определяется формулой K * ( u ) = λ Ku ), где λ> 0. Это можно использовать для выбора масштаба, подходящего для данных.

Часто используемые функции ядра [ править ]

Все ядра ниже в единой системе координат.

Обычно используются несколько типов ядерных функций: равномерная, треугольная, эпанечникова, [1] квартика (двувес), трикуб, [2] трехвес, гауссовская, квадратичная [3] и косинусная.

В приведенной ниже таблице, если задано с ограниченной опорой , то для значений u, лежащих вне опоры.

См. Также [ править ]

  • Оценка плотности ядра
  • Ядро более гладкое
  • Стохастическое ядро
  • Оценка плотности
  • Оценка многомерной плотности ядра

Ссылки [ править ]

  1. ^ Названо в честь Епанечникова, В.А. (1969). «Непараметрическая оценка многомерной плотности вероятности». Теория вероятн. Appl . 14 (1): 153–158. DOI : 10.1137 / 1114019 .
  2. ^ Альтман, Н.С. (1992). «Введение в непараметрическую регрессию ядра и ближайшего соседа». Американский статистик . 46 (3): 175–185. DOI : 10.1080 / 00031305.1992.10475879 . hdl : 1813/31637 .
  3. ^ Кливленд, WS ; Девлин, SJ (1988). «Локально взвешенная регрессия: подход к регрессионному анализу путем локальной подгонки». Журнал Американской статистической ассоциации . 83 (403): 596–610. DOI : 10.1080 / 01621459.1988.10478639 .
  4. ^ Эффективность определяется как.
  5. Перейти ↑ Silverman, BW (1986). Оценка плотности для статистики и анализа данных . Чепмен и Холл, Лондон.
  • Ли, Ци; Расин, Джеффри С. (2007). Непараметрическая эконометрика: теория и практика . Издательство Принстонского университета. ISBN 978-0-691-12161-1.
  • Кабачок, Уолтер. «ПРИКЛАДНЫЕ МЕТОДЫ Сглаживания. Часть 1: Оценка плотности ядра» (PDF) . Проверено 6 сентября 2018 года .
  • Comaniciu, D; Меер, П. (2002). «Среднее смещение: надежный подход к анализу пространства признаков». IEEE Transactions по анализу шаблонов и машинному анализу . 24 (5): 603–619. CiteSeerX  10.1.1.76.8968 . DOI : 10.1109 / 34.1000236 .