Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

В статистических данных , двумерные данные это данные по каждому из двух переменных , где каждое значение одной из переменных в паре со значением другой переменной. [1] Обычно было бы интересно исследовать возможную связь между двумя переменными. [2] Связь можно изучить с помощью табличного или графического отображения или с помощью выборочной статистики, которая может быть использована для вывода. Метод, используемый для исследования связи, будет зависеть от уровня измерения переменной.

Для двух количественных переменных (интервал или соотношение в уровне измерения ) можно использовать диаграмму рассеяния, а для количественной оценки связи можно использовать коэффициент корреляции или модель регрессии . [3] Для двух качественных переменных (номинального или порядкового по уровню измерения ) таблица непредвиденных обстоятельств может использоваться для просмотра данных, а также может использоваться мера ассоциации или тест независимости. [3]

Если переменные являются количественными, пары значений этих двух переменных часто представляются в виде отдельных точек на плоскости с использованием диаграммы рассеяния . Это сделано для того, чтобы можно было легко увидеть взаимосвязь (если таковая имеется) между переменными. [4] Например, двумерные данные на диаграмме рассеяния можно использовать для изучения взаимосвязи между длиной шага и длиной ног.

Зависимые и независимые переменные [ править ]

В некоторых случаях двумерных данных определяется, что одна переменная влияет или определяет вторую переменную, и термины зависимые и независимые переменные используются для различения двух типов переменных. В приведенном выше примере длина ног человека является независимой переменной. Длина шага определяется длиной ног человека, поэтому она является зависимой переменной. Длинные ноги увеличивают длину шага, но увеличение длины шага не увеличивает длину ваших ног. [5]

Корреляция между двумя переменными определяется как сильная или слабая корреляция и оценивается по шкале от –1 до 1, где 1 - идеальная прямая корреляция, –1 - идеальная обратная корреляция, а 0 - отсутствие корреляции. В случае длинных ног и больших шагов будет сильная прямая корреляция. [6]

Анализ двумерных данных [ править ]

При анализе двумерных данных обычно либо сравнивают сводную статистику каждой из переменных, либо используют регрессионный анализ, чтобы определить силу и направление конкретной взаимосвязи между переменными. Если каждая переменная может принимать только одно из небольшого числа значений, например только «мужской» или «женский», или только «левосторонний» или «правосторонний», тогда совместное частотное распределение может быть отображено в непредвиденных обстоятельствах. таблица , которую можно проанализировать на предмет силы связи между двумя переменными.

Ссылки [ править ]

  1. ^ «Двумерный» . Wolfram Research . Проверено 15 августа 2011 .
  2. ^ Мур, Дэвид; Маккейб, Джордж (1999). Введение в статистическую практику (Третье изд.). Нью-Йорк: WH Freeman and Company. п. 104.
  3. ^ a b Отт, Лайман; Лонгнекер, Майкл (2010). Введение в статистические методы и анализ данных (шестое изд.). Бельмонт, Калифорния: Брукс / Коул. С. 102–112.
  4. ^ Национальный совет учителей математики. «Статистика и проблема вероятностей». Получено 7 августа 2013 г. из http://www.nctm.org/uploadedFiles/Statistics%20and%20Probability%20Problem%202.pdf#search=%22bivariate [ постоянная мертвая ссылка ] data% 22
  5. ^ Национальный центр статистики образования. «Что такое независимые и зависимые переменные? Детская зона NCES». Получено 7 августа 2013 г. с веб-сайта http://nces.ed.gov/nceskids/help/user_guide/graph/variables.asp.
  6. ^ Пирс, Род. (4 января 2013 г.). «Корреляция». Математика - это весело. Получено 7 августа 2013 г. с сайта http://www.mathsisfun.com/data/correlation.html.