Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Описательная статистика (в графе существительного смысла) представляет собой краткое изложение статистика , которая количественно описывает или суммирует особенность из коллекции информации , [1] в то время как описательная статистика (в массовом существительного смысле) является процессом использования и анализа этих статистических данных. Описательная статистика отличается от логической статистики (или индуктивной статистики) своей целью обобщить выборку , а не использовать данные для изучения совокупности.что, как предполагается, представляет собой образец данных. Как правило, это означает, что описательная статистика, в отличие от статистики вывода, не разрабатывается на основе теории вероятностей и часто является непараметрической статистикой . [2] Даже когда основные выводы анализа данных делаются с использованием статистических выводов, обычно также представлена ​​описательная статистика. Например, в документы, посвященные людям, обычно включается таблица с указанием общего размера выборки, размеров выборки в важных подгруппах (например, для каждой группы лечения или воздействия) и демографических или клинических характеристик, таких как среднеевозраст, доля субъектов каждого пола, доля лиц с сопутствующими заболеваниями и т. д.

Некоторые меры, которые обычно используются для описания набора данных, - это меры центральной тенденции и меры изменчивости или дисперсии . Меры центральной тенденции включают среднее , медианное значение и моду , тогда как меры изменчивости включают стандартное отклонение (или дисперсию ), минимальные и максимальные значения переменных, эксцесс и асимметрию . [3]

Использование в статистическом анализе [ править ]

Описательная статистика предоставляет простые сводки об образце и о сделанных наблюдениях. Такие сводки могут быть как количественными , то есть сводной статистикой , так и визуальными, то есть простыми для понимания графиками. Эти сводки могут либо лечь в основу первоначального описания данных как часть более обширного статистического анализа, либо сами по себе могут быть достаточными для конкретного исследования.

Например, процент бросков в баскетболе - это описательная статистика, которая суммирует результативность игрока или команды. Это число представляет собой количество сделанных снимков, разделенное на количество сделанных снимков. Например, игрок, который забивает 33%, делает примерно один бросок из каждых трех. Процент суммирует или описывает несколько дискретных событий. Учитывайте также средний балл . Это единственное число описывает общую успеваемость студента по всему спектру курсов. [4]

Использование описательной и сводной статистики имеет обширную историю, и, действительно, простое табулирование населения и экономических данных было первым способом появления темы статистики . Совсем недавно, коллекция методов summarisation была сформулирована под заголовком разведочного анализа данных : пример такого метода является коробка сюжет .

В деловом мире описательная статистика предоставляет полезную сводку многих типов данных. Например, инвесторы и брокеры могут использовать исторический учет поведения доходности, выполняя эмпирический и аналитический анализ своих инвестиций, чтобы принимать более обоснованные инвестиционные решения в будущем.

Одномерный анализ [ править ]

Одномерный анализ включает описание распределения отдельной переменной, включая ее центральную тенденцию (включая среднее значение , медианное значение и моду ) и дисперсию (включая диапазон и квартили набора данных, а также меры разброса, такие как дисперсия и стандартное отклонение). ). Форму распределения также можно описать с помощью таких показателей, как асимметрия и эксцесс . Характеристики распределения переменной также могут быть отображены в графическом или табличном формате, включая гистограммы и отображение стеблей и листьев..

Двумерный и многомерный анализ [ править ]

Когда выборка состоит из более чем одной переменной, описательная статистика может использоваться для описания взаимосвязи между парами переменных. В этом случае описательная статистика включает:

  • Перекрестные таблицы и таблицы непредвиденных обстоятельств
  • Графическое представление в виде диаграмм рассеяния
  • Количественные показатели зависимости
  • Описание условных распределений

Основная причина разграничения одномерного и двумерного анализа заключается в том, что двумерный анализ - это не только простой описательный анализ, но также он описывает взаимосвязь между двумя разными переменными. [5] Количественные меры зависимости включают корреляцию (например , r Пирсона, когда обе переменные непрерывны, или rho Спирмена, если одна или обе не являются непрерывными ) и ковариацию (которая отражает масштабные переменные, на которых измеряются). Наклон в регрессионном анализе также отражает взаимосвязь между переменными. Нестандартизированный наклон указывает на изменение единицы в переменной критерия для изменения на одну единицу в предсказателе . Стандартизированный наклон указывает на это изменение стандартизованного (z-оценка ) единиц. Сильно искаженные данные часто преобразуются путем логарифмирования. Использование логарифмов делает графики более симметричными и более похожими на нормальное распределение , что упрощает их интуитивную интерпретацию. [6] : 47

Ссылки [ править ]

  1. Перейти ↑ Mann, Prem S. (1995). Вводная статистика (2-е изд.). Вайли. ISBN 0-471-31009-3.
  2. ^ Додж, Ю. (2003). Оксфордский словарь статистических терминов . ОУП. ISBN 0-19-850994-4.
  3. ^ Investopedia, термины описательной статистики
  4. ^ Трохим, Уильям К. (2006). «Описательная статистика» . База знаний о методах исследования . Проверено 14 марта 2011 года .
  5. ^ Бэбби, Эрл Р. (2009). Практика социальных исследований (12-е изд.). Уодсворт. С.  436–440 . ISBN 0-495-59841-0.
  6. ^ Ник, Тодд Г. (2007). "Описательная статистика". Темы биостатистики . Методы молекулярной биологии . 404 . Нью-Йорк: Спрингер. С. 33–52. DOI : 10.1007 / 978-1-59745-530-5_3 . ISBN 978-1-58829-531-6.

Внешние ссылки [ править ]

  • Лекция по описательной статистике: Суперкурс Питтсбургского университета: http://www.pitt.edu/~super1/lecture/lec0421/index.htm