Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В статистике , А распределение частот представляет собой список, таблица или график , который отображает частоту различных исходов в образце . [1] Каждая запись в таблице содержит частоту или количество появлений значений в определенной группе или интервале.

Пример [ править ]

Вот пример одномерной (одной переменной ) таблицы частот. Отображается частота каждого ответа на вопрос опроса.

Другая схема табуляции объединяет значения в ячейки, так что каждая ячейка охватывает диапазон значений. Например, рост учеников в классе можно объединить в следующую таблицу частот.

Распределение частот показывает нам обобщенную группировку данных, разделенных на взаимоисключающие классы, и количество вхождений в класс. Это способ отображения неорганизованных данных, особенно для отображения результатов выборов, доходов людей в определенном регионе, продаж продукта за определенный период, сумм студенческих ссуд для выпускников и т. Д. Некоторые графики, которые можно использовать с частотные распределения - это гистограммы , линейные диаграммы , гистограммы и круговые диаграммы . Распределения частот используются как для качественных, так и для количественных данных.

Строительство [ править ]

  1. Определитесь с количеством занятий. Слишком много классов или слишком мало классов могут не раскрыть основную форму набора данных, также будет трудно интерпретировать такое частотное распределение. Идеальное количество классов можно определить или оценить по формуле: (логарифм по основанию 10) или по формуле выбора квадратного корня, где n - общее количество наблюдений в данных. (Последнее будет слишком большим для больших наборов данных, таких как статистика населения.) Однако эти формулы не являются жестким правилом, и результирующее количество классов, определяемое формулой, не всегда может точно соответствовать обрабатываемым данным.
  2. Вычислите диапазон данных (Диапазон = Макс - Мин) , найдя минимальное и максимальное значения данных. Диапазон будет использоваться для определения интервала или ширины класса.
  3. Определите ширину классов, обозначенную h и полученную (при условии, что интервалы классов одинаковы для всех классов).

Обычно интервал классов или ширина классов одинаковы для всех классов. Все классы, взятые вместе, должны охватывать как минимум расстояние от наименьшего (минимального) значения в данных до наивысшего (максимального) значения. Равные интервалы классов предпочтительны в распределении частот, в то время как неравные интервалы классов (например, логарифмические интервалы) могут быть необходимы в определенных ситуациях, чтобы обеспечить хороший разброс наблюдений между классами и избежать большого количества пустых или почти пустых классов. [2]

  1. Определите индивидуальные ограничения класса и выберите подходящую начальную точку первого класса, которая является произвольной; оно может быть меньше или равно минимальному значению. Обычно он запускается перед минимальным значением таким образом, чтобы средняя точка (среднее значение нижнего и верхнего пределов класса для первого класса) была правильно [ требуется пояснение ] .
  2. Возьмите наблюдение и отметьте вертикальной чертой (|) класс, к которому оно принадлежит. Текущий счет ведется до последнего наблюдения.
  3. Найдите нужные частоты, относительную частоту, совокупную частоту и т. Д.

Совместное частотное распределение [ править ]

Двумерные совместные частотные распределения часто представлены в виде (двусторонних) таблиц непредвиденных обстоятельств :

Строка итогов и столбец итогов сообщают о предельных частотах или предельном распределении , в то время как основная часть таблицы сообщает о совместных частотах. [3]

Приложения [ править ]

Управлять данными с частотной таблицей и работать с ними намного проще, чем с необработанными данными. Существуют простые алгоритмы вычисления медианы, среднего, стандартного отклонения и т. Д. Из этих таблиц.

Статистическая проверка гипотез основана на оценке различий и сходств между частотными распределениями. Эта оценка включает в себя меры центральной тенденции или средних значений , такие как среднее и медианное значение , а также меры изменчивости или статистической дисперсии , такие как стандартное отклонение или дисперсия .

Считается, что частотное распределение искажено, если его среднее и медиана существенно различаются, или, в более общем смысле, когда оно асимметрично . Эксцесс из частотного распределения является мерой доли экстремальных значений (отклоняющихся значения), которые появляются на любом конце гистограммы . Если это распределение более подвержено выбросам, чем нормальное, оно называется лептокуртическим; если менее подвержен выбросам, это называется плоскостопием.

Распределение частот букв также используется в частотном анализе для взлома шифров и используется для сравнения относительных частот букв на разных языках, при этом часто используются другие языки, такие как греческий, латинский и т. Д.

См. Также [ править ]

  • Данные подсчета
  • Кросстабуляция
  • Накопленная частота
  • Эмпирическая функция распределения

Заметки [ править ]

  1. ^ Австралийское статистическое бюро, http://www.abs.gov.au/websitedbs/a3121120.nsf/home/statistical+language+-+frequency+distribution
  2. ^ Manikandan, S (1 января 2011). «Частотное распределение» . Журнал фармакологии и фармакотерапии . 2 (1): 54–55. DOI : 10.4103 / 0976-500X.77120 . ISSN  0976-500X . PMC  3117575 . PMID  21701652 .
  3. ^ Stat Trek, Статистика и Глоссарий вероятностей, sv Совместная частота

Внешние ссылки [ править ]

  • СМИ, связанные с распределением частот на Викискладе?
  • Узнайте 7 способов сделать таблицу частотного распределения в Excel