Коэффициент ранговой корреляции Кендалла


В статистике коэффициент ранговой корреляции Кендалла , обычно называемый коэффициентом Кендалла τ (от греческой буквы τ , тау), представляет собой статистику , используемую для измерения порядковой связи между двумя измеряемыми величинами. Тест τ представляет собой непараметрическую проверку гипотезы о статистической зависимости, основанную на коэффициенте τ.

Это мера ранговой корреляции : сходство упорядочения данных при ранжировании по каждой из величин. Он назван в честь Мориса Кендалла , который разработал его в 1938 году [1] , хотя Густав Фехнер предложил аналогичную меру в контексте временных рядов в 1897 году [2] .

Интуитивно корреляция Кендалла между двумя переменными будет высокой, когда наблюдения имеют одинаковый (или идентичный для корреляции 1) ранг (т. е. метку относительного положения наблюдений внутри переменной: 1-е, 2-е, 3-е и т. д.) между двумя переменными. переменные, и низкий, когда наблюдения имеют разные (или полностью разные для корреляции -1) ранги между двумя переменными.

И Кендалла, и Спирмена можно сформулировать как частные случаи более общего коэффициента корреляции .

Пусть есть набор наблюдений совместных случайных величин X и Y , такой, что все значения ( ) и ( ) уникальны (связями для простоты пренебрегают). Любая пара наблюдений и , где , называется согласованной , если порядок сортировки и согласуется: то есть, если либо оба и выполняются, либо оба и ; в противном случае они называются несогласованными .

Где биномиальный коэффициент для количества способов выбрать два предмета из n предметов.


Все точки в серой области согласуются, а все точки в белой области дискордантны по отношению к точке . С точками существует общее количество возможных пар точек. В этом примере имеется 395 пар согласованных точек и 40 пар несогласованных точек, что приводит к коэффициенту ранговой корреляции Кендалла, равному 0,816.