Эта статья требует дополнительных ссылок для проверки . ( май 2012 г. ) ( Узнайте, как и когда удалить это сообщение-шаблон ) |
Термин ядро используется в статистическом анализе для обозначения оконной функции . Термин «ядро» имеет несколько различных значений в разных отраслях статистики.
Байесовская статистика [ править ]
В статистике, особенно в байесовской статистике , ядро функции плотности вероятности (pdf) или функции массы вероятности (pmf) представляет собой форму pdf или pmf, в которой любые факторы, не являющиеся функциями каких-либо переменных в области, являются опущено. [ необходима цитата ] Обратите внимание, что такие факторы могут быть функциями параметров PDF или PMF. Эти факторы являются частью коэффициента нормализации в распределении вероятностей , и не нужно во многих ситуациях. Например, при выборке псевдослучайных чисел большинство алгоритмов выборки игнорируют коэффициент нормализации. Кроме того, вБайесовский анализ из сопряженных предыдущих распределений, коэффициенты нормировки , как правило , игнорируются при расчетах, и только ядро рассматривается. В конце проверяется форма ядра, и если она соответствует известному распределению, коэффициент нормализации может быть восстановлен. В противном случае в этом может быть нет необходимости (например, если нужно только выбрать распределение).
Для многих дистрибутивов ядро можно записать в замкнутой форме, но не нормировочную константу.
Пример - нормальное распределение . Его функция плотности вероятности является
и связанное ядро
Обратите внимание, что множитель перед экспонентой был опущен, хотя он содержит параметр , потому что он не является функцией переменной домена .
Анализ паттернов [ править ]
Ядро воспроизводящего ядра Гильбертово пространство используется в наборе методов, известных как методы ядра, для выполнения таких задач, как статистическая классификация , регрессионный анализ и кластерный анализ данных в неявном пространстве. Это использование особенно распространено в машинном обучении .
Непараметрическая статистика [ править ]
В непараметрической статистике ядро - это весовая функция, используемая в методах непараметрической оценки. Ядра используются в оценке плотности ядра для оценки случайных величин " функции плотности , или в ядре регрессии для оценки условного математического ожидания случайной величины. Ядра также используются во временных рядах при использовании периодограммы для оценки спектральной плотности, где они известны как оконные функции . Дополнительное использование - оценка изменяющейся во времени интенсивности точечного процесса. где оконные функции (ядра) свертываются с данными временных рядов.
Обычно ширина ядра также должна быть указана при запуске непараметрической оценки.
Определение [ править ]
Ядро - это неотрицательная действительная интегрируемая функция K. Для большинства приложений желательно определить функцию, которая удовлетворяет двум дополнительным требованиям:
- Нормализация :
- Симметрия:
Первое требование гарантирует, что метод оценки плотности ядра дает функцию плотности вероятности . Второе требование гарантирует, что среднее значение соответствующего распределения равно среднему значению используемой выборки.
Если K является ядром, то функция K * определяется формулой K * ( u ) = λ K (λ u ), где λ> 0. Это можно использовать для выбора масштаба, подходящего для данных.
Часто используемые функции ядра [ править ]
Обычно используются несколько типов ядерных функций: равномерная, треугольная, эпанечникова, [1] квартика (двувес), трикуб, [2] трехвес, гауссовская, квадратичная [3] и косинусная.
В приведенной ниже таблице, если задано с ограниченной опорой , то для значений u, лежащих вне опоры.
Функции ядра, K ( u ) | КПД [4] относительно ядра Епанечникова | ||||
---|---|---|---|---|---|
Равномерное («прямоугольное окно») | Поддерживать: | « Функция товарного вагона » | 92,9% | ||
Треугольный | Поддерживать: | 98,6% | |||
Епанечников (параболический) | Поддерживать: | 100% | |||
Quartic ( двухвес ) | Поддерживать: | 99,4% | |||
Трехвес | Поддерживать: | 98,7% | |||
Tricube | Поддерживать: | 99,8% | |||
Гауссовский | 95,1% | ||||
Косинус | Поддерживать: | 99,9% | |||
Логистика | 88,7% | ||||
Сигмовидная функция | 84,3% | ||||
Ядро Сильвермана [5] | непригодный |
См. Также [ править ]
- Оценка плотности ядра
- Ядро более гладкое
- Стохастическое ядро
- Оценка плотности
- Оценка многомерной плотности ядра
Эта статья включает в себя список общих ссылок , но он остается в основном непроверенным, поскольку в нем отсутствуют соответствующие встроенные ссылки . Май 2012 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения ) ( |
Ссылки [ править ]
- ^ Названо в честь Епанечникова, В.А. (1969). «Непараметрическая оценка многомерной плотности вероятности». Теория вероятн. Appl . 14 (1): 153–158. DOI : 10.1137 / 1114019 .
- ^ Альтман, Н.С. (1992). «Введение в непараметрическую регрессию ядра и ближайшего соседа». Американский статистик . 46 (3): 175–185. DOI : 10.1080 / 00031305.1992.10475879 . hdl : 1813/31637 .
- ^ Кливленд, WS ; Девлин, SJ (1988). «Локально взвешенная регрессия: подход к регрессионному анализу путем локальной подгонки». Журнал Американской статистической ассоциации . 83 (403): 596–610. DOI : 10.1080 / 01621459.1988.10478639 .
- ^ Эффективность определяется как.
- Перейти ↑ Silverman, BW (1986). Оценка плотности для статистики и анализа данных . Чепмен и Холл, Лондон.
- Ли, Ци; Расин, Джеффри С. (2007). Непараметрическая эконометрика: теория и практика . Издательство Принстонского университета. ISBN 978-0-691-12161-1.
- Кабачок, Уолтер. «ПРИКЛАДНЫЕ МЕТОДЫ Сглаживания. Часть 1: Оценка плотности ядра» (PDF) . Проверено 6 сентября 2018 года .
- Comaniciu, D; Меер, П. (2002). «Среднее смещение: надежный подход к анализу пространства признаков». IEEE Transactions по анализу шаблонов и машинному анализу . 24 (5): 603–619. CiteSeerX 10.1.1.76.8968 . DOI : 10.1109 / 34.1000236 .