Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Пример bagplot созданного в R .

Bagplot или STARBURST участок , [1] [2] представляет собой метод , в надежных статистиках для визуализации двух- или трехмерных статистических данных, аналогичен одномерной коробка участка . Представленный в 1999 г. Rousseuw et al., Диаграмма позволяет визуализировать расположение, разброс, асимметрию и выбросы набора данных. [3]

Строительство [ править ]

Багплощадка состоит из трех вложенных многоугольников , называемых «мешок», «забор» и «петля».

  • Внутренний многоугольник, называемый мешком , построен на основе глубины Тьюки , наименьшего числа наблюдений, которое может содержать полуплоскость, которая также содержит данную точку. [4] Он содержит не более 50% точек данных.
  • Самый внешний из трех многоугольников, называемый забором , не рисуется как часть волынки, а используется для его построения. Он образуется при надувании мешка определенным коэффициентом (обычно 3). Наблюдения за забором помечаются как выбросы . [5]
  • Наблюдения, которые не отмечены как выбросы, окружены петлей , выпуклой оболочкой наблюдений внутри ограждения. [6]

Символ звездочки (*) рядом с центром графика используется для обозначения медианы глубины, точки с максимально возможной глубиной Тьюки. Наблюдения между сумкой и забором отмечены отрезками линии на средней глубине, соединяющей их с сумкой.
Объемная версия состоит из внутренней и внешней сумки. [7] Внешний мешок должен быть окрашен в прозрачные цвета, чтобы внутренний мешок оставался видимым.

Свойства [ править ]

Багаж инвариантен относительно аффинных преобразований плоскости и устойчив к выбросам. [8]

Ссылки [ править ]

  1. ^ Rousseeuw, Питер Дж .; Колеи I .; Тьюки Дж. В. (1999). "Багажник: двумерный коробчатый сюжет". Американский статистик . 53 (4): 382–387. DOI : 10.1080 / 00031305.1999.10474494 .
  2. Рональд К. Пирсон (1 апреля 2005 г.). Несовершенные данные горнодобывающей промышленности: работа с загрязнением и неполными записями . СИАМ. С. 204–. ISBN 978-0-89871-582-8.
  3. ^ Доминик Хотон ; Джонатан Хотон (18 сентября 2011 г.). Аналитика уровня жизни: развитие через призму данных обследований домашних хозяйств . Springer. С. 14–. ISBN 978-1-4614-0385-2.
  4. ^ Софи Дабо-Нианг; Фредерик Феррати (21 мая 2008 г.). Функциональная и операторская статистика . Springer. С. 204–. ISBN 978-3-7908-2062-1.
  5. ^ Джон С. Гауэр; Сугнет Гарднер Люббе; Ниль Ж. Ле Ру (23 февраля 2011 г.). Понимание биплотов . Джон Вили и сыновья. С. 59–. ISBN 978-1-119-97290-7.
  6. ^ Prabhanjan Narayanachar Tattar (24 июля 2013). R Разработка статистических приложений на примере руководства для начинающих . Пакт Паблишинг Лтд., Стр. 203–. ISBN 978-1-84951-945-8.
  7. ^ Kruppa, Jochen J .; Юнг К. (2017). «Автоматическая идентификация выбросов из нескольких групп в молекулярных данных с высокой пропускной способностью с использованием диаграмм и диаграмм» . BMC Bioinformatics . 18 : 232. DOI : 10,1186 / s12859-017-1645-5 . PMC 5414140 . 
  8. ^ Раджив Раман; Роберт Седжвик; Маттиас Ф. Столлманн (1 января 2006 г.). Труды восьмого семинара по разработке алгоритмов и экспериментов и третьего семинара по аналитической алгоритмике и комбинаторике . СИАМ. С. 62–. ISBN 978-0-89871-610-8.