Bagplot или STARBURST участок , [1] [2] представляет собой метод , в надежных статистиках для визуализации двух- или трехмерных статистических данных, аналогичен одномерной коробка участка . Представленный в 1999 г. Rousseuw et al., Диаграмма позволяет визуализировать расположение, разброс, асимметрию и выбросы набора данных. [3]
Строительство [ править ]
Багплощадка состоит из трех вложенных многоугольников , называемых «мешок», «забор» и «петля».
- Внутренний многоугольник, называемый мешком , построен на основе глубины Тьюки , наименьшего числа наблюдений, которое может содержать полуплоскость, которая также содержит данную точку. [4] Он содержит не более 50% точек данных.
- Самый внешний из трех многоугольников, называемый забором , не рисуется как часть волынки, а используется для его построения. Он образуется при надувании мешка определенным коэффициентом (обычно 3). Наблюдения за забором помечаются как выбросы . [5]
- Наблюдения, которые не отмечены как выбросы, окружены петлей , выпуклой оболочкой наблюдений внутри ограждения. [6]
Символ звездочки (*) рядом с центром графика используется для обозначения медианы глубины, точки с максимально возможной глубиной Тьюки. Наблюдения между сумкой и забором отмечены отрезками линии на средней глубине, соединяющей их с сумкой.
Объемная версия состоит из внутренней и внешней сумки. [7] Внешний мешок должен быть окрашен в прозрачные цвета, чтобы внутренний мешок оставался видимым.
Свойства [ править ]
Багаж инвариантен относительно аффинных преобразований плоскости и устойчив к выбросам. [8]
Ссылки [ править ]
- ^ Rousseeuw, Питер Дж .; Колеи I .; Тьюки Дж. В. (1999). "Багажник: двумерный коробчатый сюжет". Американский статистик . 53 (4): 382–387. DOI : 10.1080 / 00031305.1999.10474494 .
- ↑ Рональд К. Пирсон (1 апреля 2005 г.). Несовершенные данные горнодобывающей промышленности: работа с загрязнением и неполными записями . СИАМ. С. 204–. ISBN 978-0-89871-582-8.
- ^ Доминик Хотон ; Джонатан Хотон (18 сентября 2011 г.). Аналитика уровня жизни: развитие через призму данных обследований домашних хозяйств . Springer. С. 14–. ISBN 978-1-4614-0385-2.
- ^ Софи Дабо-Нианг; Фредерик Феррати (21 мая 2008 г.). Функциональная и операторская статистика . Springer. С. 204–. ISBN 978-3-7908-2062-1.
- ^ Джон С. Гауэр; Сугнет Гарднер Люббе; Ниль Ж. Ле Ру (23 февраля 2011 г.). Понимание биплотов . Джон Вили и сыновья. С. 59–. ISBN 978-1-119-97290-7.
- ^ Prabhanjan Narayanachar Tattar (24 июля 2013). R Разработка статистических приложений на примере руководства для начинающих . Пакт Паблишинг Лтд., Стр. 203–. ISBN 978-1-84951-945-8.
- ^ Kruppa, Jochen J .; Юнг К. (2017). «Автоматическая идентификация выбросов из нескольких групп в молекулярных данных с высокой пропускной способностью с использованием диаграмм и диаграмм» . BMC Bioinformatics . 18 : 232. DOI : 10,1186 / s12859-017-1645-5 . PMC 5414140 .
- ^ Раджив Раман; Роберт Седжвик; Маттиас Ф. Столлманн (1 января 2006 г.). Труды восьмого семинара по разработке алгоритмов и экспериментов и третьего семинара по аналитической алгоритмике и комбинаторике . СИАМ. С. 62–. ISBN 978-0-89871-610-8.