В статистике , оценка плотности ядра ( KDE ) представляет собой непараметрический способ оценки в функции плотности вероятности в виде случайной величины . Оценка плотности ядра - это фундаментальная проблема сглаживания данных, когда выводы о совокупности делаются на основе конечной выборки данных . В некоторых областях, таких как обработка сигналов и эконометрика, его также называют оконным методом Парзена – Розенблатта в честь Эмануэля Парзена и Мюррея Розенблатта., которым обычно приписывают самостоятельное создание в нынешнем виде. [1] [2] Один из известных применений оценки плотности ядра при оценке класса-условного предельные плотностей данных при использовании наивного байесовского классификатора , [3] [4] , который может улучшить его точность прогнозирования. [3]
Определение
Пусть ( x 1 , x 2 ,…, x n ) - независимые и одинаково распределенные выборки, взятые из некоторого одномерного распределения с неизвестной плотностью ƒ в любой заданной точке x . Нас интересует оценка формы этой функции ƒ . Его оценка плотности ядра :
где K - ядро ( неотрицательная функция), а h > 0 - параметр сглаживания, называемый полосой пропускания . Ядро с индексом h называется масштабированным ядром и определяется как K h ( x ) = 1 / h K ( x / h ) . Интуитивно хочется выбрать h настолько маленьким, насколько позволяют данные; однако всегда существует компромисс между смещением оценки и ее дисперсией. Более подробно выбор полосы пропускания обсуждается ниже.
Обычно используется ряд функций ядра : равномерный, треугольный, двухвес, трехвес, Епанечников, нормальный и другие. Ядро Епанечникова является оптимальным в смысле среднеквадратичной ошибки [5], хотя потеря эффективности для ядер, перечисленных ранее, невелика. [6] Из-за его удобных математических свойств часто используется нормальное ядро, что означает K ( x ) = ϕ ( x ) , где ϕ - стандартная нормальная функция плотности.
Построение оценки плотности ядра находит интерпретацию в областях, не связанных с оценкой плотности. [7] Например, в термодинамике это эквивалентно количеству тепла, выделяемого, когда тепловые ядра (фундаментальное решение уравнения теплопроводности ) размещаются в точках x i каждой точки данных . Подобные методы используются для построения дискретных операторов Лапласа на облаках точек для обучения многообразию (например, карта диффузии ).
Пример
Оценки плотности ядра тесно связаны с гистограммами , но могут быть наделены такими свойствами, как гладкость или непрерывность, с помощью подходящего ядра. Схема ниже, основанная на этих 6 точках данных, иллюстрирует эту взаимосвязь:
Образец | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
Значение | -2,1 | -1,3 | -0,4 | 1.9 | 5.1 | 6.2 |
Для гистограммы сначала горизонтальная ось делится на подинтервалы или интервалы, которые покрывают диапазон данных: в этом случае шесть интервалов шириной 2. Каждый раз, когда точка данных попадает в этот интервал, появляется прямоугольник высотой 1 / 12 находится там. Если в одну ячейку попадает более одной точки данных, ящики складываются друг на друга.
Для оценки плотности ядра нормальные ядра со стандартным отклонением 2,25 (обозначены красными пунктирными линиями) помещаются в каждую из точек данных x i . Ядра суммируются, чтобы сделать оценку плотности ядра (сплошная синяя кривая). Гладкость оценки плотности ядра (по сравнению с дискретностью гистограммы) показывает, как оценки плотности ядра быстрее сходятся к истинной базовой плотности для непрерывных случайных величин. [8]
Выбор полосы пропускания
Полоса пропускания ядра - это свободный параметр, который оказывает сильное влияние на итоговую оценку. Чтобы проиллюстрировать его эффект, мы берем смоделированную случайную выборку из стандартного нормального распределения (нанесенного синими шипами на графике коврика по горизонтальной оси). Серая кривая - истинная плотность (нормальная плотность со средним значением 0 и дисперсией 1). Для сравнения, красная кривая не сглажена, поскольку она содержит слишком много ложных артефактов данных, возникающих из-за использования полосы пропускания h = 0,05, которая слишком мала. Зеленая кривая слишком сглажена, поскольку использование полосы пропускания h = 2 скрывает большую часть лежащей в основе структуры. Черная кривая с шириной полосы h = 0,337 считается оптимально сглаженной, поскольку ее оценка плотности близка к истинной плотности. В пределе встречается экстремальная ситуация.(без сглаживания), где оценка представляет собой сумму n дельта-функций с центрами в координатах анализируемых образцов. В другом крайнем пределе оценка сохраняет форму используемого ядра, центрированную по среднему значению выборок (полностью гладкая).
Наиболее распространенным критерием оптимальности, используемым для выбора этого параметра, является ожидаемая функция риска L 2 , также называемая средней интегрированной квадратичной ошибкой :
Под слабых предположениях на ƒ и K , ( ƒ это, как правило , неизвестны, реальная функция плотности), [1] [2] MISE ( ч ) = AMISE ( ч ) + O (1 / (NH) + H 4 ) , где о - небольшое обозначение o , а n - размер выборки (как указано выше). AMISE - это асимптотическая MISE, которая состоит из двух ведущих терминов.
где для функции г , а также вторая производная от . Минимум этого AMISE является решением этого дифференциального уравнения
или же
Ни формулы AMISE, ни h- формулы AMISE нельзя использовать напрямую, поскольку они включают неизвестную функцию плотности или его вторая производная , поэтому для выбора полосы пропускания было разработано множество автоматических методов на основе данных. Было проведено множество обзорных исследований для сравнения их эффективности [9] [10] [11] [12] [13] [14] [15]] с общим мнением о том, что селекторы плагинов [7] [16] [ 17] и селекторы перекрестной проверки [18] [19] [20] являются наиболее полезными для широкого диапазона наборов данных.
Подстановка любой ширины полосы h, имеющей тот же асимптотический порядок n −1/5, что и h AMISE, в AMISE дает AMISE ( h ) = O ( n −4/5 ), где O - нотация большого o . Можно показать, что при слабых предположениях не может существовать непараметрическая оценка, которая сходится с большей скоростью, чем ядерная оценка. [21] Обратите внимание, что скорость n -4/5 ниже, чем типичная скорость сходимости n -1 параметрических методов.
Если полоса пропускания не удерживается фиксированной, а изменяется в зависимости от местоположения либо оценки (баллонная оценка), либо выборок (точечная оценка), это дает особенно эффективный метод, называемый адаптивной оценкой плотности ядра с переменной полосой пропускания .
Выбор полосы пропускания для оценки плотности ядра распределений с тяжелым хвостом является относительно трудным. [22]
Эмпирическое средство оценки пропускной способности
Если для аппроксимации одномерных данных используются базисные функции Гаусса , а базовая плотность, оцениваемая по Гауссу, является оптимальным выбором для h (то есть полосы пропускания, которая минимизирует среднюю интегрированную квадратную ошибку ): [23]
Чтобы сделать значение h более устойчивым, чтобы обеспечить хорошее соответствие как для длиннохвостого, так и для асимметричного распределения, а также для бимодального смешанного распределения, лучше заменить значение с другим параметром A, который определяется как:
- A = min (стандартное отклонение, межквартильный размах / 1,34).
Еще одна модификация, улучшающая модель, - снижение коэффициента с 1,06 до 0,9. Тогда окончательная формула будет такой:
где - стандартное отклонение выборки, n - размер выборки. IQR - это межквартильный размах.
Это приближение называется приближением нормального распределения, приближением Гаусса или эмпирическим правилом Сильвермана . [23] Хотя это эмпирическое правило легко вычислить, его следует использовать с осторожностью, поскольку оно может привести к весьма неточным оценкам, когда плотность не близка к нормальной. Например, при оценке модели бимодальной гауссовской смеси
из выборки 200 точек. На рисунке справа показаны истинная плотность и две оценки плотности ядра - одна с использованием полосы пропускания, основанная на практическом правиле, а другая с использованием полосы пропускания на основе решения уравнения. [7] [17] Оценка, основанная на практическом опыте, значительно преувеличена.
Связь с оценкой плотности характеристической функции
Для выборки ( x 1 , x 2 ,…, x n ) естественно оценить характеристическую функцию φ ( t ) = E [ e itX ] как
Зная характеристическую функцию, можно найти соответствующую функцию плотности вероятности с помощью формулы преобразования Фурье . Одна из трудностей с применением этой формулы обращения состоит в том, что она приводит к расходящемуся интегралу, поскольку оценканенадежен для больших t . Чтобы обойти эту проблему, оценщикумножается на функцию демпфирования ψ h ( t ) = ψ ( ht ) , которая равна 1 в начале координат, а затем падает до 0 на бесконечности. Параметр пропускной способности h определяет, насколько быстро мы пытаемся ослабить функцию.. В частности, когда h мало, то ψ h ( t ) будет приблизительно равным единице для большого диапазона t ’s, что означает, чтоостается практически неизменным в самой важной области т «s.
Наиболее распространенный выбор для функции ψ - это либо равномерная функция ψ ( t ) = 1 {−1 ≤ t ≤ 1 }, что фактически означает усечение интервала интегрирования в формуле обращения до [−1 / h , 1 / h ] , или гауссова функция ψ ( t ) = e - π t 2 . После того, как функция ψ выбрана, можно применить формулу инверсии, и оценщик плотности будет
где K - преобразование Фурье функции затухания ψ . Таким образом, оценка плотности ядра совпадает с оценкой плотности характеристической функции.
Геометрические и топологические особенности
Мы можем расширить определение (глобального) режима до локального значения и определить локальные режимы:
А именно, представляет собой набор точек, для которых функция плотности локально максимальна. Естественная оценкаэто плагин от KDE, [24] [25] где а также KDE версия а также . При умеренных предположениях, является последовательной оценкой . Обратите внимание, что можно использовать алгоритм среднего сдвига [26] [27] [28] для вычисления оценки численно.
Статистическая реализация
Неполный список программных реализаций ядерных оценщиков плотности включает:
- В версии 4.4 Analytica для параметра « Сглаживание» для результатов PDF используется KDE, а из выражений он доступен через встроенную
Pdf
функцию. - В C / C ++ , Figtree это библиотека , которая может быть использована для оценки плотности вычислительных ядра с использованием нормальных ядер. Доступен интерфейс MATLAB.
- В C ++ , libagf библиотека для оценки переменной плотности ядра .
- В C ++ , mlpack это библиотека , которая может вычислить KDE , используя много различных ядер. Это позволяет установить допуск ошибок для более быстрого вычисления. Доступны интерфейсы Python и R.
- в C # и F # , Math.NET Числовые является открытой библиотекой источника для численного расчета , который включает в себя оценку плотности ядра
- В CrimeStat оценка плотности ядра реализована с использованием пяти различных функций ядра: нормального, равномерного, четвертого, отрицательного экспоненциального и треугольного. Доступны как одноядерные, так и двухъядерные процедуры оценки плотности. Оценка плотности ядра также используется при интерполяции подпрограммы Head Bang, при оценке двумерной функции плотности пути к преступлению и при оценке трехмерной байесовской оценки пути к преступлению.
- В ELKI функции плотности ядра можно найти в пакете
de.lmu.ifi.dbs.elki.math.statistics.kernelfunctions
- В продуктах ESRI отображение плотности ядра управляется из набора инструментов Spatial Analyst и использует ядро Quartic (двумерное).
- В Excel Королевское химическое общество создало надстройку для оценки плотности ядра на основе Технического описания 4 комитета по аналитическим методам .
- В gnuplot оценка плотности ядра реализуется
smooth kdensity
опцией, файл данных может содержать вес и полосу пропускания для каждой точки, или же полоса пропускания может быть установлена автоматически [29] в соответствии с «эмпирическим правилом Сильвермана» (см. Выше). - В Haskell плотность ядра реализована в пакете статистики .
- В IGOR Pro оценка плотности ядра реализована
StatsKDE
операцией (добавлено в Igor Pro 7.00). Пропускная способность может быть указана пользователем или оценена с помощью Silverman, Scott или Bowmann и Azzalini. Типы ядер: Епанечников, Двухвес, Трехвес, Треугольное, Гауссовское и Прямоугольное. - В Java , то Weka (машинное обучение) пакет предоставляет weka.estimators.KernelEstimator , среди других.
- В JavaScript пакет визуализации D3.js предлагает пакет KDE в своем пакете science.stats.
- В JMP платформа Graph Builder использует оценку плотности ядра для предоставления контурных графиков и областей с высокой плотностью (HDR) для двумерных плотностей, а также графиков скрипки и HDR для одномерных плотностей. Ползунки позволяют пользователю изменять пропускную способность. Двумерные и одномерные оценки плотности ядра также предоставляются платформами Fit Y by X и Distribution соответственно.
- В Julia оценка плотности ядра реализована в пакете KernelDensity.jl .
- В MATLAB оценка плотности ядра реализована с помощью
ksdensity
функции (Statistics Toolbox). Начиная с версии MATLAB 2018a, можно указать как полосу пропускания, так и сглаживание ядра, включая другие параметры, такие как определение диапазона плотности ядра. [30] В качестве альтернативы, бесплатный программный пакет MATLAB, который реализует метод автоматического выбора полосы пропускания [7] , доступен из MATLAB Central File Exchange для- 1-мерные данные
- 2-мерные данные
- n-мерные данные
На этих страницах доступен бесплатный набор инструментов MATLAB с реализацией ядерной регрессии, оценки плотности ядра, оценки ядра функции риска и многих других (этот набор инструментов является частью книги [31] ).
- В системе Mathematica числовая оценка плотности ядра реализуется функцией
SmoothKernelDistribution
[32], а символьная оценка реализуется с помощью функцииKernelMixtureDistribution
[33], обе из которых обеспечивают управляемую данными полосу пропускания. - В Minitab Королевское химическое общество создало макрос для оценки плотности ядра на основе их Технического описания 4 Комитета по аналитическим методам [34].
- В библиотеке NAG оценка плотности ядра реализована с помощью
g10ba
процедуры (доступной как в версиях библиотеки Fortran [35], так и в версии C [36] ). - В Nuklei , C ++ методы плотности ядра сосредоточены на данных из группы Special евклидовой.
- В Octave оценка плотности ядра реализована
kernel_density
опцией (пакет эконометрики). - В Origin , 2D Kernel плотность участок может быть выполнен из пользовательского интерфейса, а также две функции, Ksdensity для 1D и Ks2density для 2D может быть использован с его LabTALK , Python или C код.
- В Perl реализацию можно найти в модуле Statistics-KernelEstimation.
- В PHP реализацию можно найти в библиотеке MathPHP.
- В Python существует множество реализаций: модуль pyqt_fit.kde в пакете PyQt-Fit , SciPy (
scipy.stats.gaussian_kde
), Statsmodels (KDEUnivariate
иKDEMultivariate
) и Scikit-learn (KernelDensity
) (см. Сравнение [37] ). KDEpy поддерживает взвешенные данные, и его реализация БПФ на порядки быстрее, чем другие реализации. Часто используемая библиотека pandas [1] предлагает поддержку построения графиков kde с помощью метода plot (df.plot(kind='kde')
[2] ). Пакет getdist для взвешенных и коррелированных выборок MCMC поддерживает оптимизированную полосу пропускания, коррекцию границ и методы высшего порядка для одномерных и двухмерных распределений. Одним из недавно используемых пакетов для оценки плотности ядра является seaborn (import seaborn as sns
,sns.kdeplot()
). [38] Также существует реализация KDE на графическом процессоре. [39] - В R это реализовано
density
в базовом распределении, аbw.nrd0
функция используется в пакете статистики, эта функция использует оптимизированную формулу из книги Сильвермана.bkde
в библиотеке KernSmooth ,ParetoDensityEstimation
в библиотеке DataVisualizations (для оценки плотности распределения Парето),kde
в библиотеке К.С. ,dkden
иdbckden
в библиотеке evmix (последней для оценки плотности граничной скорректированного ядра для ограниченной поддержки),npudens
в библиотеке нп (числовой и категоричен данные) ,sm.density
в библиотеке sm . Для реализацииkde.R
функции, которая не требует установки каких - либо пакетов или библиотек, см kde.R . Библиотека btb , предназначенная для городского анализа, реализует оценку плотности ядра черезkernel_smoothing
. - В SAS ,
proc kde
может быть использована для оценки одномерных и двумерный ядро плотности. - В Apache Спарк , то
KernelDensity()
класс [40] - В Stata это реализовано через
kdensity
: [41] напримерhistogram x, kdensity
. В качестве альтернативы бесплатного Stata модуль KDENS доступен из здесь позволяет пользователю оценить функции плотности 1D или 2D. - В Swift это реализовано
SwiftStats.KernelDensityEstimation
в библиотеке статистики с открытым исходным кодом SwiftStats .
Смотрите также
- Ядро (статистика)
- Сглаживание ядра
- Регрессия ядра
- Оценка плотности (с представлением других примеров)
- Средний сдвиг
- Масштабируемое пространство : тройки {( x , h , KDE с полосой пропускания h, оцениваемой как x : все x , h > 0} образуют представление данных в масштабном пространстве .
- Оценка многомерной плотности ядра
- Оценка переменной плотности ядра
- Голова / хвост ломаются
Рекомендации
- ^ a b Розенблатт, М. (1956). «Замечания о некоторых непараметрических оценках функции плотности» . Летопись математической статистики . 27 (3): 832–837. DOI : 10.1214 / АОМ / 1177728190 .
- ^ а б Парзен, Э. (1962). «Об оценке функции плотности вероятности и моды» . Летопись математической статистики . 33 (3): 1065–1076. DOI : 10.1214 / АОМ / 1177704472 . JSTOR 2237880 .
- ^ а б Пирьонеси С. Мадех; Эль-Дираби Тамер Э. (01.06.2020). «Роль аналитики данных в управлении инфраструктурными активами: преодоление проблем с размером и качеством данных». Журнал транспортного машиностроения, часть B: Тротуары . 146 (2): 04020022. DOI : 10,1061 / JPEODX.0000175 .
- ^ Хасти, Тревор ; Тибширани, Роберт ; Фридман, Джером Х. (2001). Элементы статистического обучения: интеллектуальный анализ данных, вывод и прогнозирование: с 200 полноцветными иллюстрациями . Нью-Йорк: Спрингер. ISBN 0-387-95284-5. OCLC 46809224 .
- ^ Епанечников В.А. (1969). «Непараметрическая оценка многомерной плотности вероятности». Теория вероятностей и ее приложения . 14 : 153–158. DOI : 10.1137 / 1114019 .
- ^ Жезл, МП; Джонс, MC (1995). Сглаживание ядра . Лондон: Chapman & Hall / CRC. ISBN 978-0-412-55270-0.
- ^ а б в г Ботев, Здравко (2007). Непараметрическая оценка плотности с помощью диффузионного перемешивания (Технический отчет). Университет Квинсленда.
- ^ Скотт, Д. (1979). «Об оптимальных и основанных на данных гистограммах». Биометрика . 66 (3): 605–610. DOI : 10.1093 / Biomet / 66.3.605 .
- ^ Парк, БУ; Маррон, JS (1990). «Сравнение управляемых данными селекторов полосы пропускания». Журнал Американской статистической ассоциации . 85 (409): 66–72. CiteSeerX 10.1.1.154.7321 . DOI : 10.1080 / 01621459.1990.10475307 . JSTOR 2289526 .
- ^ Парк, БУ; Турлах, Б.А. (1992). «Практическая работа нескольких селекторов полосы пропускания, управляемых данными (с обсуждением)» . Вычислительная статистика . 7 : 251–270.
- ^ Cao, R .; Cuevas, A .; Manteiga, WG (1994). «Сравнительное исследование нескольких методов сглаживания при оценке плотности». Вычислительная статистика и анализ данных . 17 (2): 153–176. DOI : 10.1016 / 0167-9473 (92) 00066-Z .
- ^ Джонс, MC; Маррон, Дж.С.; Шезер, SJ (1996). «Краткий обзор выбора полосы пропускания для оценки плотности». Журнал Американской статистической ассоциации . 91 (433): 401–407. DOI : 10.2307 / 2291420 . JSTOR 2291420 .
- ^ Шизер, SJ (1992). «Производительность шести популярных методов выбора полосы пропускания на некоторых реальных наборах данных (с обсуждением)». Вычислительная статистика . 7 : 225–250, 271–281.
- ^ Agarwal, N .; Алуру, Н.Р. (2010). «Управляемый данными стохастический подход к коллокации для количественной оценки неопределенности в МЭМС» (PDF) . Международный журнал численных методов в инженерии . 83 (5): 575–597. DOI : 10.1002 / nme.2844 .
- ^ Сюй, X .; Ян, З .; Сюй, С. (2015). «Оценка вероятностного распределения скорости ветра методом ядерной плотности на основе диффузии». Исследование электроэнергетических систем . 121 : 28–37. DOI : 10.1016 / j.epsr.2014.11.029 .
- ^ Ботев З.И. Grotowski, JF; Крезе, Д.П. (2010). «Оценка плотности ядра посредством диффузии». Анналы статистики . 38 (5): 2916–2957. arXiv : 1011.2602 . DOI : 10.1214 / 10-AOS799 .
- ^ а б Sheather, SJ; Джонс, MC (1991). «Надежный метод выбора полосы пропускания на основе данных для оценки плотности ядра». Журнал Королевского статистического общества, Series B . 53 (3): 683–690. DOI : 10.1111 / j.2517-6161.1991.tb01857.x . JSTOR 2345597 .
- ^ Рудемо, М. (1982). «Эмпирический выбор гистограмм и ядерных оценок плотности». Скандинавский статистический журнал . 9 (2): 65–78. JSTOR 4615859 .
- ^ Боуман, AW (1984). «Альтернативный метод перекрестной проверки для сглаживания оценок плотности». Биометрика . 71 (2): 353–360. DOI : 10.1093 / Biomet / 71.2.353 .
- ^ Холл, П .; Маррон, Дж.С.; Парк, БУ (1992). «Сглаженная перекрестная проверка». Теория вероятностей и смежные области . 92 : 1–20. DOI : 10.1007 / BF01205233 .
- ^ Вахба, Г. (1975). «Свойства оптимальной сходимости методов переменного узла, ядра и ортогональных рядов для оценки плотности» . Анналы статистики . 3 (1): 15–29. DOI : 10.1214 / AOS / 1176342997 .
- ^ Бух-Ларсен, TINE (2005). «Оценка плотности ядра для распределений с тяжелыми хвостами с использованием преобразования Чамперноуна». Статистика . 39 (6): 503–518. CiteSeerX 10.1.1.457.1544 . DOI : 10.1080 / 02331880500439782 .
- ^ а б Сильверман, Б.В. (1986). Оценка плотности для статистики и анализа данных . Лондон: Chapman & Hall / CRC. п. 45 . ISBN 978-0-412-24620-3.
- ^ Чен, Йен-Чи; Genovese, Christopher R .; Вассерман, Ларри (2016). «Комплексный подход к кластеризации режимов» . Электронный статистический журнал . 10 (1): 210–241. DOI : 10.1214 / 15-ejs1102 . ISSN 1935-7524 .
- ^ Шазаль, Фредерик; Фаси, Бриттани Тереза; Леччи, Фабрицио; Ринальдо, Алессандро; Вассерман, Ларри (2014). «Стохастическая конвергенция постоянных ландшафтов и силуэтов» . Ежегодный симпозиум по вычислительной геометрии - SOCG'14 . Нью-Йорк, Нью-Йорк, США: ACM Press: 474–483. DOI : 10.1145 / 2582112.2582128 . ISBN 978-1-4503-2594-3.
- ^ Fukunaga, K .; Хостетлер, Л. (январь 1975 г.). «Оценка градиента функции плотности с приложениями в распознавании образов». IEEE Transactions по теории информации . 21 (1): 32–40. DOI : 10,1109 / tit.1975.1055330 . ISSN 0018-9448 .
- ^ Ицзун Чэн (1995). «Средний сдвиг, поиск режима и кластеризация». IEEE Transactions по анализу шаблонов и машинному анализу . 17 (8): 790–799. DOI : 10.1109 / 34.400568 . ISSN 0162-8828 .
- ^ Comaniciu, D .; Меер, П. (май 2002 г.). «Средний сдвиг: надежный подход к анализу пространства признаков». IEEE Transactions по анализу шаблонов и машинному анализу . 24 (5): 603–619. DOI : 10.1109 / 34.1000236 . ISSN 0162-8828 .
- ^ Джанерт, Филипп К (2009). Gnuplot в действии: понимание данных с помощью графиков . Коннектикут, США: Manning Publications. ISBN 978-1-933988-39-9.См. Раздел 13.2.2, озаглавленный « Оценки плотности ядра» .
- ^ «Оценка функции сглаживания ядра для одномерных и двумерных данных - MATLAB ksde density» . www.mathworks.com . Проверено 5 ноября 2020 .
- ^ Horová, I .; Koláček, J .; Зелинка, Дж. (2012). Сглаживание ядра в MATLAB: теория и практика сглаживания ядра . Сингапур: World Scientific Publishing. ISBN 978-981-4405-48-5.
- ^ «SmoothKernelDistribution - документация по языку Wolfram Language» . reference.wolfram.com . Проверено 5 ноября 2020 .
- ^ «KernelMixtureDistribution - документация по языку Wolfram Language» . reference.wolfram.com . Проверено 5 ноября 2020 .
- ^ «Программное обеспечение для расчета плотности ядра» . www.rsc.org . Проверено 5 ноября 2020 .
- ^ Группа численных алгоритмов. «Стандартный документ библиотеки NAG: nagf_smooth_kerndens_gauss (g10baf)» (PDF) . Руководство библиотеки NAG, Марк 23 . Проверено 16 февраля 2012 .
- ^ Группа численных алгоритмов. «Стандартный документ библиотеки NAG: nag_kernel_de density_estim (g10bac)» (PDF) . Руководство библиотеки NAG, Mark 9 . Архивировано из оригинального (PDF) 24 ноября 2011 года . Проверено 16 февраля 2012 .
- ^ Вандерплас, Джейк (01.12.2013). «Оценка плотности ядра в Python» . Проверено 12 марта 2014 .
- ^ "seaborn.kdeplot - документация seaborn 0.10.1" . seaborn.pydata.org . Проверено 12 мая 2020 .
- ^ https://pypi.org/project/kde-gpu/#description
- ^ «Базовая статистика - API на основе RDD - Документация по Spark 3.0.1» . spark.apache.org . Проверено 5 ноября 2020 .
- ^ https://www.stata.com/manuals15/rkde density.pdf
Внешние ссылки
- Введение в оценку плотности ядра Краткое руководство, которое мотивирует использование оценок плотности ядра как улучшение по сравнению с гистограммами.
- Оптимизация пропускной способности ядра . Бесплатный онлайн-инструмент, который генерирует оптимизированную оценку плотности ядра.
- Бесплатное онлайн-программное обеспечение (калькулятор) вычисляет оценку плотности ядра для ряда данных в соответствии со следующими ядрами: гауссовское, эпанечниковское, прямоугольное, треугольное, двухвесовое, косинусное и опткосинусное.
- Апплет оценки плотности ядра Интерактивный онлайн-пример оценки плотности ядра. Требуется .NET 3.0 или новее.