Коэффициент ранговой корреляции Кендалла

В статистике коэффициент ранговой корреляции Кендалла , обычно называемый коэффициентом Кендалла τ (от греческой буквы τ , тау), представляет собой статистику , используемую для измерения порядковой связи между двумя измеряемыми величинами. Тест τ представляет собой непараметрическую проверку гипотезы о статистической зависимости, основанную на коэффициенте τ.

Это мера ранговой корреляции : сходство упорядочения данных при ранжировании по каждой из величин. Он назван в честь Мориса Кендалла , который разработал его в 1938 году ^[1] , хотя Густав Фехнер предложил аналогичную меру в контексте временных рядов в 1897 году ^{[2] .}

Интуитивно корреляция Кендалла между двумя переменными будет высокой, когда наблюдения имеют одинаковый (или идентичный для корреляции 1) ранг (т. е. метку относительного положения наблюдений внутри переменной: 1-е, 2-е, 3-е и т. д.) между двумя переменными. переменные, и низкий, когда наблюдения имеют разные (или полностью разные для корреляции -1) ранги между двумя переменными.

И Кендалла, и Спирмена можно сформулировать как частные случаи более общего коэффициента корреляции . ${\ Displaystyle \ тау}$ ${\ Displaystyle \ ро}$

Пусть есть набор наблюдений совместных случайных величин X и Y , такой, что все значения ( ) и ( ) уникальны (связями для простоты пренебрегают). Любая пара наблюдений и , где , называется согласованной , если порядок сортировки и согласуется: то есть, если либо оба и выполняются, либо оба и ; в противном случае они называются несогласованными . ${\ Displaystyle (х_ {1}, у_ {1}), ..., (х_ {п}, у_ {п})}$ ${\ Displaystyle х_ {я}}$ ${\ Displaystyle у_ {я}}$ ${\ Displaystyle (х_ {я}, у_ {я})}$ ${\ Displaystyle (x_ {j}, y_ {j})}$ ${\ Displaystyle я <j}$ ${\ Displaystyle (х_ {я}, х_ {j})}$ ${\ Displaystyle (у_ {я}, у_ {j})}$ ${\ Displaystyle х_ {я}> х_ {дж}}$ ${\ displaystyle y_ {i}> y_ {j}}$ ${\ Displaystyle х_ {я} <х_ {j}}$ ${\ Displaystyle у_ {я} <у_ {j}}$

Где биномиальный коэффициент для количества способов выбрать два предмета из n предметов. ${\ Displaystyle {п \ выберите 2} = {п (п-1) \ более 2}}$

Все точки в серой области согласуются, а все точки в белой области дискордантны по отношению к точке . С точками существует общее количество возможных пар точек. В этом примере имеется 395 пар согласованных точек и 40 пар несогласованных точек, что приводит к коэффициенту ранговой корреляции Кендалла, равному 0,816.

{\ Displaystyle (X_ {1}, Y_ {1})}

{\ Displaystyle п = 30}

{\ displaystyle {\ binom {30} {2}} = 435}