Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Пример звездного графика от НАСА, в центре которого представлены некоторые из наиболее желаемых результатов проектирования.
Эта паутинная диаграмма отображает выделенный бюджет в сравнении с фактическими расходами для данной организации.

Лепестковая диаграмма представляет собой графический метод отображения многомерных данных в виде двумерной диаграмме из трех или более количественных переменных , представленных на осях , начиная с той же точки. Относительное положение и угол осей обычно неинформативны, но для сортировки переменных (осей) по относительным позициям могут применяться различные эвристические методы, такие как алгоритмы, отображающие данные как максимальную общую площадь, что позволяет выявить четкие корреляции, компромиссы и т. Д. и множество других сравнительных мер. [1]

Лепестковая диаграмма также известна как вебы - диаграмма , паутинная диаграмма , паутины диаграмма , звезды диаграмма , [2] звезда участок , паутинка диаграмма , неправильный многоугольник , полярная диаграмма или Kiviat диаграмма . [3] [4] Это эквивалентно графику параллельных координат с осями, расположенными радиально.

Обзор [ править ]

Радиолокационная диаграмма представляет собой диаграмму и / или график, который состоит из последовательности спиц с одинаковым углом наклона, называемых радиусами, причем каждая спица представляет одну из переменных. Длина данных спицы пропорциональна величине переменной для точки данных относительно максимальной величины переменной для всех точек данных. Линия соединяет значения данных для каждой спицы. Это придает сюжету звездный вид и дает начало одному из популярных имен этого сюжета. Звездный сюжет можно использовать для ответа на следующие вопросы: [5]

  • Какие наблюдения наиболее похожи, т. Е. Существуют ли группы наблюдений? (Радиолокационные диаграммы используются для проверки относительных значений для одной точки данных (например, точка 3 большая для переменных 2 и 4, маленькая для переменных 1, 3, 5 и 6), а также для обнаружения похожих или несходных точек.) [5]
  • Есть выбросы?

Радарные диаграммы - это удобный способ отображения многомерных наблюдений с произвольным числом переменных. [6] Каждая звезда представляет собой одно наблюдение. Обычно радиолокационные карты создаются в формате с несколькими графиками, на каждой странице которого много звезд, и каждая звезда представляет одно наблюдение. [5] Звездный график был впервые использован Георгом фон Майром в 1877 году. [7] [8] Радарные диаграммы отличаются от графиков глифов тем, что все переменные используются для построения построенной звездной фигуры. Нет разделения на переменные переднего и заднего плана.. Вместо этого звездообразные фигуры обычно располагаются на странице в виде прямоугольного массива. Несколько легче увидеть закономерности в данных, если наблюдения расположены в некотором непроизвольном порядке (если переменные присвоены лучам звезды в некотором значимом порядке). [9]

Приложения [ править ]

Одним из применений радарных диаграмм является контроль повышения качества для отображения показателей производительности любой текущей программы. [10]

Они также используются в спорте для обозначения сильных и слабых сторон игроков, где их обычно называют радарными диаграммами. [11]

Ограничения [ править ]

Радарные диаграммы в первую очередь подходят для яркого отображения выбросов и общности , или когда одна диаграмма больше по каждой переменной, чем другая, и в основном используются для порядковых измерений - где каждая переменная в некотором отношении соответствует «лучше», а все переменные в одном масштабе. .

И наоборот, радиолокационные карты критиковались как плохо подходящие для принятия компромиссных решений - когда один график лучше другого по одним переменным, но меньше по другим. [12]

Кроме того, трудно визуально сравнивать длины разных спиц, потому что трудно судить о радиальных расстояниях, хотя концентрические круги помогают в качестве линий сетки. Вместо этого можно использовать простой линейный график, особенно для временных рядов. [13]

Радарные диаграммы могут до некоторой степени искажать данные, особенно когда области заполнены, потому что содержащаяся область становится пропорциональной квадрату линейных мер. Например, на диаграмме с 5 переменными в диапазоне от 1 до 100 область, содержащаяся в многоугольнике, ограниченном 5 точками, когда все меры равны 90, более чем на 10% больше, чем то же самое для диаграммы со всеми значениями 82.

Искусственное сооружение [ править ]

Радиолокационные диаграммы накладывают на данные несколько структур, которые часто являются искусственными:

  • Связь соседей - радарные диаграммы часто используются, когда соседние переменные не связаны между собой, создавая ложные связи.
  • Циклическая структура - первая и последняя переменные располагаются рядом друг с другом.
  • Длина - переменные чаще всего являются порядковыми: лучше или хуже, хотя степень различия может быть искусственной.
  • Площадь - область масштабируется как квадрат значений, что усиливает эффект больших чисел. Например, 2, 2 занимает площадь в 4 раза больше, чем 1, 1. Это общая проблема с графами с областями, и о площади трудно судить - см. «Иерархия Кливленда». [14]

Например, чередующиеся данные 9, 1, 9, 1, 9, 1 дают диаграмму пикового радара (которая входит и исчезает), а переупорядочивание данных как 9, 9, 9, 1, 1, 1 вместо этого дает два различных клинья (сектора).

В некоторых случаях это естественная структура, и радиолокационные карты могут хорошо подойти. Например, для диаграмм данных, которые меняются в течение 24-часового цикла, почасовые данные естественным образом связаны со своим соседом и имеют циклическую структуру, поэтому их можно естественно отобразить как радарную диаграмму. [13] [15] [16]

Один набор руководящих принципов по использованию радиолокационных карт (или, скорее, близкородственного «графика полярной области»): [16]

  • вы не против чтения сложенных областей вместо расположения по общей шкале (см. Иерархию Кливленда),
  • набор данных действительно циклический, а не линейный, и
  • есть две серии для сравнения, одна намного меньше другой

Размер набора данных [ править ]

Радарные диаграммы полезны для многомерных наборов данных малого и среднего размера . Их основная слабость заключается в том, что их эффективность ограничена наборами данных с менее чем несколькими сотнями точек. После этого они становятся подавляющими. [5]

Пример [ править ]

Деталь звездного сюжета Cadillac Seville

На диаграмме справа [5] показаны звездные графики 15 автомобилей . Список переменных для примера звездного графика:

  1. Цена
  2. Пробег (MPG)
  3. Рекорд по ремонту 1978 года (1 = худшее, 5 = лучшее)
  4. Рекорд по ремонту 1977 года (1 = худший, 5 = лучший)
  5. Высота
  6. Заднее сиденье
  7. Багажник
  8. Масса
  9. Длина

Мы можем рассматривать эти графики по отдельности или использовать их для выявления групп автомобилей с похожими характеристиками. Например, мы можем взглянуть на звездный график Cadillac Seville (последний на изображении) и увидеть, что это один из самых дорогих автомобилей, расход топлива ниже среднего (но не худший), средний расход топлива. ремонтные записи, вместительность и размер - от среднего до среднего. Затем мы можем сравнить модели Cadillac (последние три графика) с моделями AMC (первые три графика). Это сравнение показывает четкие закономерности. Модели AMC, как правило, недороги, имеют расход топлива ниже среднего, небольшие по высоте, весу и вместительности. Модели Cadillac дороги, у них плохой расход топлива, они большие как по размеру, так и по вместительности. [5]

Альтернативы [ править ]

Проще всего можно использовать простой линейный график, особенно для временных рядов. [13]

Для качественного графического сравнения двухмерных табличных данных с несколькими переменными распространенной альтернативой являются шары Харви , которые широко используются в Consumer Reports . [17] Сравнение в шарах Харви (и радарных диаграммах) может быть значительно облегчено путем алгоритмического упорядочивания переменных для добавления порядка. [18]

Отличный способ визуализации структур в многомерных данных предлагает анализ главных компонентов (PCA).

Другой альтернативой является использование небольших встроенных гистограмм, которые можно сравнить со спарклайнами . [18]

Хотя радарные и полярные карты часто описываются как карты одного и того же типа [4], некоторые источники делают различие между ними и даже рассматривают радарную карту как вариацию полярной карты, которая не отображает данные в терминах полярных координат. [19]

См. Также [ править ]

  • Сюжет (графика)
  • Диаграмма полярной области
  • Параллельные координаты

Ссылки [ править ]

 Эта статья включает материалы, являющиеся  общественным достоянием, с веб-сайта Национального института стандартов и технологий https://www.nist.gov .

  1. ^ Портер, Майкл М; Никсиар, Пуйя (2018). «Многомерная механика: отображение характеристик естественных биологических систем с использованием переставленных радарных диаграмм» . PLOS ONE . 13 (9): e0204309. DOI : 10.1371 / journal.pone.0204309 . PMC  6161877 . PMID  30265707 .
  2. ^ Нэнси Р. Тейг (2005) Набор инструментов качества . стр.437.
  3. ^ Kolence, Kenneth W. (1973). «Эмпирик программного обеспечения». Обзор оценки эффективности ACM SIGMETRICS . 2 (2): 31–36. DOI : 10.1145 / 1113644.1113647 . S2CID 18600391 . На недавнем семинаре NBS / ACM по измерению эффективности доктор Филип Дж. Кивиат предположил, что круговой график с радиусами в качестве переменных осей может быть полезной формой. […] Я рекомендую называть их «Сюжеты Кивиата» или «Графики Кивиат», чтобы признать его понимание их важности. 
  4. ^ a b «Найдите пробелы в содержании с помощью радарных диаграмм» . Семинары по контент-стратегии. 3 марта 2015 . Проверено 17 декабря 2015 года .
  5. ^ Б с д е е NIST / SEMATECH (2003). Звездочка в: электронном справочнике по статистическим методам . 01.06.2003 (Дата создания)
  6. Чемберс, Джон, Уильям Кливленд, Бит Кляйнер и Пол Тьюки, (1983). Графические методы анализа данных . Уодсворт. стр. 158–162
  7. ^ Майр, Георг фон (1877), Die Gesetzmäßigkeit im Gesellschaftsleben (на немецком языке), Мюнхен: Oldenbourg, OL 23294909M , стр.78. Linien-Diagramme im Kreise: линейные диаграммы в кругах.
  8. ^ Майкл Френдли (2008). «Вехи в истории тематической картографии, статистической графики и визуализации данных» .
  9. ^ Майкл Френдли (1991). «Статистическая графика для многомерных данных» . Документ, представленный на конференции SAS SUGI 16, апрель 1991 г.
  10. Рон Басу (2004). Внедрение качества: практическое руководство по инструментам и методам . с.131.
  11. ^ Spider Graphs: Графики баскетбольной статистики
  12. ^ Вы НЕ человек-паук, так почему вы используете радарные диаграммы? , автор: Chandoo, 18 сентября 2008 г.
  13. ^ a b c Пельтье, Джон (2008-08-14). «Рок Круглосуточно - Технический блог Пельтье» . Peltiertech.com . Проверено 11 сентября 2013 .
  14. ^ ( Кливленд 1984 ), краткое содержание на http://processtrends.com/toc_data_visualization.htm. Архивировано 25 марта 2010 г., в Wayback Machine.
  15. ^ «График круглосуточно. Блог о диаграммах Excel» . Excelcharts.com. 2008-08-15 . Проверено 11 сентября 2013 .
  16. ^ a b Часы Это
  17. ^ «Качественное сравнение» . Блог поддержки аналитики . 11 декабря 2007 года Архивировано из оригинала на 2012-04-08.
  18. ^ a b «Информационный океан: переупорядочиваемые таблицы II: Бертин против пауков» . I-ocean.blogspot.com. 2008-09-24 . Проверено 11 сентября 2013 .
  19. ^ «Полярные диаграммы (построитель отчетов и SSRS)» . Сеть разработчиков Microsoft . Проверено 17 декабря 2015 года .

Внешние ссылки [ править ]

  • Звездный график - Электронный справочник статистических методов NIST / SEMATECH