Коэффициент корреляции является числовой мерой какого - либо типа корреляции , а это означает статистическую зависимость между двумя переменными . [a] Переменные могут быть двумя столбцами данного набора данных наблюдений, часто называемого выборкой , или двумя компонентами многомерной случайной величины с известным распределением . [ необходима цитата ]
Существует несколько типов коэффициента корреляции, каждый со своим определением и собственным диапазоном удобства использования и характеристик. Все они принимают значения в диапазоне от -1 до +1, где ± 1 указывает на самое сильное возможное согласие, а 0 - на самое сильное возможное несогласие. [2] Как инструменты анализа, коэффициенты корреляции создают определенные проблемы, включая склонность некоторых типов искажаться выбросами и возможность неправильного использования для вывода причинно-следственной связи между переменными (подробнее см. Корреляция не подразумевает причинно-следственную связь ). [3]
Типы [ править ]
Существует несколько различных показателей степени корреляции данных в зависимости от типа данных: в основном, являются ли данные измерениями, порядковыми или категориальными.
Пирсон [ править ]
Коэффициент корреляции произведение-момент Пирсона , также известный как r , R или коэффициент Пирсона r , является мерой силы и направления линейной связи между двумя переменными, которая определяется как ковариация переменных, деленная на произведение их стандарта. отклонения. [4] [5] Это наиболее известный и наиболее часто используемый тип коэффициента корреляции. Когда термин «коэффициент корреляции» используется без дополнительных уточнений, он обычно относится к коэффициенту корреляции произведение-момент Пирсона.
Внутриклассный [ править ]
Внутриклассовая корреляция (ICC) - это описательная статистика, которую можно использовать, когда количественные измерения производятся на единицах, которые организованы в группы; он описывает, насколько сильно единицы в одной группе похожи друг на друга.
Ранг [ править ]
Ранговая корреляция - это мера взаимосвязи между рейтингами двух переменных или двумя рейтингами одной и той же переменной:
- Коэффициент ранговой корреляции Спирмена - это мера того, насколько хорошо взаимосвязь между двумя переменными может быть описана монотонной функцией.
- Коэффициент ранговой корреляции тау Кендалла является мерой доли рангов, совпадающих между двумя наборами данных.
- Гамма Гудмана и Крускала - это мера силы связи данных кросс-таблицы, когда обе переменные измеряются на порядковом уровне.
Тетрахорический и полихорический [ править ]
Коэффициент полихорической корреляции измеряет связь между двумя упорядоченно-категориальными переменными. Технически это определяется как оценка коэффициента корреляции Пирсона, которую можно получить, если:
- Две переменные измерялись по непрерывной шкале, а не как переменные упорядоченной категории.
- Две непрерывные переменные следовали двумерному нормальному распределению .
Когда обе переменные являются дихотомическими, а не упорядоченно-категориальными, коэффициент полихорической корреляции называется коэффициентом тетрахорической корреляции.
См. Также [ править ]
- Коэффициент детерминации
- Корреляция и зависимость
- Коэффициент корреляции
- Корреляция расстояний
- Степень соответствия , любая из нескольких мер, которые измеряют, насколько хорошо статистическая модель соответствует наблюдениям, суммируя несоответствие между наблюдаемыми значениями и значениями, ожидаемыми в рамках модели.
- Множественная корреляция
- Частичная корреляция
Сноски [ править ]
- ^ Коэффициент корреляции: статистика, используемая для демонстрации того, как баллы одного показателя соотносятся с баллами второго показателя для той же группы людей. Высокое значение (приближающееся к +1,00) является сильной прямой зависимостью, значения около 0,50 считаются умеренными, а значения ниже 0,30 считаются показывающими слабую взаимосвязь. Низкое отрицательное значение (приближающееся к -1,00) также является сильной обратной зависимостью, а значения около 0,00 указывают на небольшую взаимосвязь, если таковая имеется. [1]
Ссылки [ править ]
- ^ "коэффициент корреляции" . NCME.org . Национальный совет по измерениям в образовании . Архивировано из оригинала 22 июля 2017 года . Проверено 17 апреля 2014 года .
- ^ Тейлор, Джон Р. (1997). Введение в анализ ошибок: исследование неопределенностей в физических измерениях (PDF) (2-е изд.). Саусалито, Калифорния: Университетские научные книги. п. 217. ISBN. 0-935702-75-X. Архивировано из оригинального (PDF) 15 февраля 2019 года . Проверено 14 февраля 2019 .
- ^ Бодди, Ричард; Смит, Гордон (2009). Статистические методы на практике: для ученых и технологов . Чичестер, Великобритания: Wiley. С. 95–96. ISBN 978-0-470-74664-6.
- ^ «Список вероятностных и статистических символов» . Математическое хранилище . 2020-04-26 . Проверено 22 августа 2020 .
- ^ Вайсштейн, Эрик В. «Статистическая корреляция» . mathworld.wolfram.com . Проверено 22 августа 2020 .