В статистике , V Крамера (иногда упоминаются как фи Крамер и обозначаются как φ с ) является мерой ассоциации между двумя номинальными переменными , что дает значение от 0 до +1 (включительно). Он основан на статистике хи-квадрат Пирсона и был опубликован Харальдом Крамером в 1946 году [1].
Использование и интерпретация
φ c - это взаимная корреляция двух дискретных переменных [2] и может использоваться с переменными, имеющими два или более уровней. φ c - это симметричная мера: не имеет значения, какую переменную мы помещаем в столбцы, а какую - в строки. Кроме того, порядок строк / столбцов не имеет значения, поэтому φ c можно использовать с номинальными типами данных или выше (в частности, упорядоченными или числовыми).
V Крамера также может применяться к качеству соответствия моделей хи-квадрат, когда существует таблица 1 × k (в данном случае r = 1). В этом случае k берется как количество необязательных результатов, и он функционирует как мера тенденции к единственному результату. [ необходима цитата ]
V Крамера варьируется от 0 (что соответствует отсутствию ассоциации между переменными) до 1 (полная ассоциация) и может достигать 1 только тогда, когда каждая переменная полностью определяется другой.
φ c 2 - среднеквадратичная каноническая корреляция между переменными. [ необходима цитата ]
В случае таблицы непредвиденных обстоятельств 2 × 2 V Крамера равно коэффициенту Phi .
Обратите внимание: поскольку значения хи-квадрат имеют тенденцию увеличиваться с увеличением количества ячеек, чем больше разница между r (строки) и c (столбцы), тем более вероятно, что φ c будет стремиться к 1 без убедительных доказательств значимой корреляции. [ необходима цитата ]
V можно рассматривать как связь между двумя переменными как процент от их максимально возможного изменения. V 2 - среднеквадратичная каноническая корреляция между переменными. [ необходима цитата ]
Расчет
Пусть выборка размера n одновременно распределенных переменных а также для быть заданными частотами
- количество раз значения наблюдались.
Тогда статистика хи-квадрат будет:
V Крамера вычисляется путем деления квадратного корня из статистики хи-квадрат на размер выборки и минимальное измерение минус 1:
где:
- - коэффициент фи.
- выводится из критерия хи-квадрат Пирсона
- это общая сумма наблюдений и
- количество столбцов.
- количество строк.
Р-значение для значения из V является той же, что вычисляется с помощью критерия хи-квадрат тест Пирсона . [ необходима цитата ]
Формула дисперсии V = φ c известна. [3]
В R функция cramerV()
из пакета rcompanion
[4] вычисляет V с помощью функции chisq.test из пакета stats. В отличие от функции cramersV()
из пакета lsr
[5] , cramerV()
также предлагает возможность коррекции смещения. Применяется исправление, описанное в следующем разделе.
Коррекция смещения
V Крамера может быть сильно предвзятой оценкой его аналога по населению и будет иметь тенденцию переоценивать силу ассоциации. Поправка смещения с использованием вышеуказанных обозначений дается формулой [6]
где
а также
потом оценивает ту же численность населения, что и V Крамера, но обычно с гораздо меньшей среднеквадратичной ошибкой . Причина исправления заключается в том, что в условиях независимости. [7]
Смотрите также
Другие меры корреляции для номинальных данных:
- Коэффициент фи
- Т. Чупрова
- Коэффициент неопределенности
- Коэффициент лямбда
- Индекс Рэнда
- Индекс Дэвиса – Боулдина
- Индекс Данна
- Индекс Жаккара
- Индекс Фаулкса – Маллоуса
Другие статьи по теме:
Рекомендации
- ^ Крамер, Харальд. 1946. Математические методы статистики . Princeton: Princeton University Press, стр. 282 (Глава 21. Двумерный случай). ISBN 0-691-08004-6 ( таблица содержания, заархивированная 16 августа 2016 г. на Wayback Machine )
- ^ Шескин, Дэвид Дж. (1997). Справочник по параметрическим и непараметрическим статистическим процедурам. Бока-Ратон, Флорида: CRC Press.
- ^ Liebetrau, Альберт М. (1983). Меры ассоциации . Ньюбери-Парк, Калифорния: Sage Publications. Количественные применения в серии социальных наук № 32 (страницы 15–16)
- ^ «Rcompanion: функции для поддержки оценки программы дополнительного образования» . 2019-01-03.
- ^ «Lsr: Companion to« Learning Statistics with R » » . 2015-03-02.
- ^ Бергсма, Вичер (2013). "Коррекция смещения для V Крамера и T Чупрова". Журнал Корейского статистического общества . 42 (3): 323–328. DOI : 10.1016 / j.jkss.2012.10.002 .
- ^ Бартлетт, Морис С. (1937). «Свойства достаточности и статистических тестов» . Труды Лондонского королевского общества . Series A. 160 (901): 268–282. DOI : 10.1098 / rspa.1937.0109 . JSTOR 96803 .
Внешние ссылки
- Мера ассоциации для непараметрической статистики (Алан К. Акок и Гордон Р. Ставиг, стр. 1381 из 1381–1386)
- Номинальная ассоциация: Phi and Cramer's Vl [ мертвая ссылка ] с домашней страницы Пэта Даттало.