В статистике , то Бхаттачариа расстояние измеряет сходство двух вероятностных распределений . Это тесно связано с коэффициентом Бхаттачарьи, который является мерой степени перекрытия между двумя статистическими выборками или популяциями. Оба показателя названы в честь Анила Кумара Бхаттачарьи , статистика , работавшего в 1930-х годах в Индийском статистическом институте . [1]
Коэффициент может использоваться для определения относительной близости двух рассматриваемых выборок. Он используется для измерения разделимости классов при классификации и считается более надежным, чем расстояние Махаланобиса , поскольку расстояние Махаланобиса является частным случаем расстояния Бхаттачарьи, когда стандартные отклонения двух классов одинаковы. Следовательно, когда два класса имеют одинаковые средние значения, но разные стандартные отклонения, расстояние Махаланобиса будет стремиться к нулю, тогда как расстояние Бхаттачарьи растет в зависимости от разницы между стандартными отклонениями.
Определение
Для вероятностных распределений p и q в одной и той же области X расстояние Бхаттачарьи определяется как
где
- коэффициент Бхаттачарьи для дискретных распределений вероятностей .
Для непрерывных распределений вероятностей коэффициент Бхаттачарьи определяется как
В любом случае, а также . не подчиняется неравенству треугольника , но расстояние Хеллингера , которое задается подчиняется неравенству треугольника.
В своей простейшей формулировке расстояние Бхаттачарьи между двумя классами при нормальном распределении может быть вычислено [2] путем извлечения среднего и дисперсии двух отдельных распределений или классов:
где:
- дисперсия p -го распределения, - среднее значение p -го распределения, а это два разных дистрибутива.
Расстояние Махаланобиса, используемое в линейном дискриминантном анализе Фишера, является частным случаем расстояния Бхаттачарьи.
Для многомерных нормальных распределений,
где а также - средние и ковариации распределений, и
Обратите внимание, что в этом случае первый член расстояния Бхаттачарьи связан с расстоянием Махаланобиса .
Коэффициент Бхаттачарьи
Коэффициент Бхаттачарьи - это приблизительное измерение степени перекрытия между двумя статистическими выборками. Коэффициент может использоваться для определения относительной близости двух рассматриваемых выборок.
Расчет коэффициента Бхаттачарьи включает в себя элементарную форму интегрирования перекрытия двух выборок. Интервал значений двух выборок разбивается на выбранное количество разделов , и количество членов каждой выборки в каждом разделе используется в следующей формуле:
где, учитывая выборки p и q , n - количество разделов, а, - количество членов выборок p и q в i -м разделе.
Следовательно, эта формула больше для каждого раздела, в котором есть элементы из обеих выборок, и больше для каждого раздела, который имеет большое перекрытие двух элементов в нем. Выбор количества разделов зависит от количества членов в каждом образце; слишком мало разделов потеряет точность из-за переоценки области перекрытия, а слишком много разделов потеряют точность из-за создания отдельных разделов без элементов, несмотря на то, что они находятся в густонаселенном пространстве выборки.
Коэффициент Бхаттачарьи будет равен 0, если нет никакого перекрытия из-за умножения на ноль в каждом разделе. Это означает, что расстояние между полностью разделенными образцами не будет зависеть только от этого коэффициента.
Коэффициент Бхаттачарьи используется при построении полярных кодов . [4]
Приложения
Бхаттачариа расстояние широко используются в исследовании выделения признаков и селекции, [5] обработки изображений, [6] распознавания диктора , [7] и телефон кластеризация. [8]
«Пространство Бхаттачарьи» было предложено в качестве метода выбора признаков, который можно применять для сегментации текстуры. [9]
Смотрите также
Рекомендации
- ↑ Bhattacharyya, A. (1943). «О мере расхождения между двумя статистическими популяциями, определяемыми их распределениями вероятностей». Бюллетень математического общества Калькутты . 35 : 99–109. Руководство по ремонту 0010358 .
- ^ Гай Б. Коулман, Гарри С. Эндрюс, «Сегментация изображений с помощью кластеризации», Proc IEEE , Vol. 67, No. 5, pp. 773–785, 1979 г.
- ^ Д. Команичиу, В. Рамеш, П. Меер, Отслеживание нежестких объектов в реальном времени с использованием среднего сдвига. Архивировано 14 августа 2010 г.на Wayback Machine , НАГРАДА ЛУЧШЕЙ БУМАГИ, IEEE Conf. Компьютерное зрение и распознавание образов (CVPR'00), Хилтон-Хед-Айленд, Южная Каролина, Vol. 2, 142–149, 2000.
- ^ Арыкан, Эрдал (июль 2009 г.). «Поляризация канала: метод построения кодов достижения пропускной способности для симметричных каналов без памяти с двоичным входом». IEEE Transactions по теории информации . 55 (7): 3051–3073. arXiv : 0807.3917 . DOI : 10.1109 / TIT.2009.2021379 .
- ^ Euisun Choi, Chulhee Ли, "Выделение признаков на основе расстояния Бхаттачариа", Pattern Recognition , том 36, выпуск 8, август 2003, страницы 1703-1709
- ^ François Goudail, Philippe Réfrégier, Guillaume Delyon, "Расстояние Бхаттачарьи как параметр контраста для статистической обработки зашумленных оптических изображений", JOSA A , Vol. 21, выпуск 7, стр. 1231-1240 (2004)
- ^ Чанг Хуай Ю, "Ядро SVM с GMM-супервектором на основе расстояния Бхаттачарьи для распознавания говорящего", Письма об обработке сигналов , IEEE, том 16, часть 1, стр. 49-52
- ^ Мак, Б., "Телефонная кластеризация с использованием расстояния Бхаттачарьи", Разговорный язык , 1996. ICSLP 96. Proceedings., Четвертая международная конференция, Том 4, стр. 2005–2008, том 4, 3-6 октября 1996 г.
- ^ Reyes-Aldasoro, CC, и А. Bhalerao, "О Бхаттачариа пространство для выбора функций и ее применение к сегментации текстуры", Pattern Recognition (2006) Vol. 39, выпуск 5, май 2006 г., стр. 812–826
- Nielsen, F .; Больц, С. (2010). «Центроиды Бурбеа-Рао и Бхаттачарья». IEEE Transactions по теории информации . 57 (8): 5455–5466. arXiv : 1004.5049 . DOI : 10.1109 / TIT.2011.2159046 .
- Кайлат, Т. (1967). «Расхождение и меры расстояния Бхаттачарьи в выборе сигнала». IEEE Transactions по коммуникационным технологиям . 15 (1): 52–60. DOI : 10.1109 / TCOM.1967.1089532 .
- Djouadi, A .; Snorrason, O .; Гарбер, Ф. (1990). «Качество обучающей выборки оценок коэффициента Бхаттачарьи». IEEE Transactions по анализу шаблонов и машинному анализу . 12 (1): 92–97. DOI : 10.1109 / 34.41388 .
- Краткий список свойств см. По адресу : http://www.mtm.ufsc.br/~taneja/book/node20.html.
Внешние ссылки
- «Расстояние Бхаттачарьи» , Математическая энциклопедия , EMS Press , 2001 [1994]