Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Точка диаграмма или точечный участок представляет собой статистический график , состоящий из точек данных , построенных на довольно простом уровне, как правило , с использованием заполнены кругами. Есть две общие, но очень разные версии точечной диаграммы. Первая использовалась в нарисованных от руки (докомпьютерная эпоха) графиках для изображения распределений, восходящих к 1884 году. [1] Другая версия описана Уильямом С. Кливлендом как альтернатива гистограмме, в которой используются точки. для изображения количественных значений (например, количества), связанных с категориальными переменными. [2]

Точечные графики [ править ]

Точечный график 50 случайных значений от 0 до 9.

Точечный график как представление распределения состоит из группы точек данных, нанесенных на простой масштаб. Точечные диаграммы используются для непрерывных , количественных , одномерных данных. Точки данных могут быть помечены, если их немного.

Точечные графики - это один из простейших статистических графиков, который подходит для небольших и средних наборов данных. Они полезны для выделения кластеров и пробелов, а также выбросов . Другое их преимущество - сохранение числовой информации. При работе с большими наборами данных (около 20–30 или более точек данных) связанный стержневой график , прямоугольная диаграмма или гистограмма могут быть более эффективными, так как точечные графики после этого момента могут стать слишком загроможденными. Точечные графики можно отличить от гистограмм тем, что точки не расположены равномерно по горизонтальной оси.

Хотя сюжет кажется простым, его расчет и лежащая в его основе статистическая теория непросты. Алгоритм вычисления точечной диаграммы тесно связан с оценкой плотности ядра . Выбранный размер точек влияет на внешний вид сюжета. Выбор размера точки эквивалентен выбору полосы пропускания для оценки плотности ядра.

В языке программирования R этот тип графика также называется полосовой диаграммой [3] или stripplot . [4]

Кливлендские точечные графики [ править ]

Точечный график может также относиться к графикам точек, каждая из которых принадлежит к одной из нескольких категорий. Они являются альтернативой гистограммам или круговым диаграммам и выглядят чем-то вроде горизонтальной гистограммы, где столбцы заменены точками в значениях, связанных с каждой категорией. По сравнению с (вертикальными) столбчатыми диаграммами и круговыми диаграммами, Кливленд утверждает, что точечные диаграммы позволяют читателям более точно интерпретировать график, облегчая чтение этикеток, уменьшая количество чернил, не связанных с данными (или беспорядок на графике), и поддерживая поиск в таблицах.

Ссылки [ править ]

  1. Перейти ↑ Wilkinson, Leland (1999). «Точечные сюжеты». Американский статистик . Американская статистическая ассоциация. 53 (3): 276–281. DOI : 10.2307 / 2686111 . JSTOR  2686111 .
  2. ^ Кливленд, Уильям С. (1993). Визуализация данных . Hobart Press. hdl : 2027 / mdp.39015026891187 . ISBN 0-9634884-0-6.
  3. ^ Питер Далгаард . Вводная статистика с R . Springer. ISBN 0-387-95475-9.
  4. ^ Пол Мюррелл (2005). R Графика . Чепмен и Холл / CRC. ISBN 1-58488-486-X.

Другие ссылки [ править ]

  • Уайлд К. и Себер Г. (2000) Случайные встречи: первый курс анализа и вывода данных Джон Вили и сыновья. ISBN 0-471-32936-3 

Внешние ссылки [ править ]

  • Точечные графики: полезная альтернатива гистограммам