Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Сгруппированные данные являются данными , сформированного путем объединения отдельных наблюдений о наличии переменного на группы, так что распределение частот этих групп служит удобным средством обобщения и анализа данных. Существует два основных типа группировки: биннинг данных одномерной переменной, замена отдельных чисел счетчиками в бункерах; и группирование многомерных переменных по некоторым параметрам (особенно по независимым переменным ), получение распределения разгруппированных измерений (особенно зависимых переменных ).

Пример [ править ]

Идею сгруппированных данных можно проиллюстрировать, рассмотрев следующий набор исходных данных:

Приведенные выше данные могут быть сгруппированы для построения частотного распределения любым из нескольких способов. Один из методов - использовать интервалы в качестве основы.

Наименьшее значение в приведенных выше данных - 8, а наибольшее - 34. Интервал от 8 до 34 разбит на более мелкие подинтервалы (называемые интервалами классов ). Для каждого интервала класса подсчитывается количество элементов данных, попадающих в этот интервал. Это число называется частотой интервала между занятиями. Результаты представлены в виде таблицы частот следующим образом:

Другой метод группировки данных - использование некоторых качественных характеристик вместо числовых интервалов. Например, предположим, что в приведенном выше примере есть три типа учащихся: 1) ниже нормы, если время ответа составляет от 5 до 14 секунд, 2) нормально, если оно составляет от 15 до 24 секунд, и 3) выше нормы, если оно составляет 25 секунд или более, то сгруппированные данные выглядят так:

Еще одним примером группировки данных является использование некоторых обычно используемых числовых значений, которые фактически являются «именами», которые мы присваиваем категориям. Например, давайте посмотрим на возрастное распределение учеников в классе. Студентам может быть 10, 11 или 12 лет. Это возрастные группы: 10, 11 и 12. Обратите внимание, что возраст учащихся в возрастной группе 10 составляет от 10 лет и 0 дней до 10 лет и 364 дней, а их средний возраст составляет 10,5 лет, если мы посмотрим на возраст. в непрерывном масштабе. Сгруппированные данные выглядят так:

Среднее значение сгруппированных данных [ править ]

Оценка, , в среднем населения , из которого данные нарисованы могут быть вычислены из сгруппированных данных , как:

В этой формуле x относится к средней точке интервалов классов, а f - частота классов. Обратите внимание, что результат этого будет отличаться от выборочного среднего несгруппированных данных. Среднее значение для сгруппированных данных в приведенном выше примере можно рассчитать следующим образом:


Таким образом, среднее значение сгруппированных данных равно


Среднее значение для сгруппированных данных в примере 4 выше можно рассчитать следующим образом:


Таким образом, среднее значение сгруппированных данных равно

См. Также [ править ]

Примечания [ править ]

umeshnikita123 />

Ссылки [ править ]

  • Newbold, P .; Карлсон, В .; Торн, Б. (2009). Статистика для бизнеса и экономики (седьмое изд.). Pearson Education. ISBN 978-0-13-507248-6.