Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Параллельные координаты
Ггоби-блоха2

Параллельные координаты - это распространенный способ визуализации и анализа многомерных наборов данных .

Чтобы показать набор точек в n- мерном пространстве , рисуется фон, состоящий из n параллельных линий, обычно вертикальных и равномерно расположенных. Точка в n -мерном пространстве представлена ломаной линией с вершинами на параллельных осях; положение вершины на я ю оси соответствует якоординатам точки.

Эта визуализация тесно связана с визуализацией временных рядов , за исключением того, что она применяется к данным, оси которых не соответствуют моментам времени и, следовательно, не имеют естественного порядка. Следовательно, может быть интересным другое расположение осей.

История [ править ]

Часто говорят, что параллельные координаты были изобретены Филбертом Морисом д'Оканьем (фр.) В 1885 г. [1], но даже несмотря на то, что в названии книги присутствуют слова «Coordonnées parallèles», эта работа не имеет ничего общего с техникой визуализации того же название; в книге описан только метод преобразования координат. Но даже до 1885 года параллельные координаты использовались, например, в Генри Ганнеттсе «Общая сводка, показывающая ранг штатов в соотношениях, 1880 год» [2] , [2] или позже в Генри Ганнетте «Рейтинг штатов и территорий по населению при каждой переписи». , 1790-1890 »в 1898 году. Их снова популяризировал 87 лет спустя Альфред Инзельберг [3]в 1985 году и систематически разрабатывалась как система координат, начиная с 1977 года. Некоторые важные приложения находятся в алгоритмах предотвращения столкновений для управления воздушным движением (1987-3 патенты США), интеллектуального анализа данных (патент США), компьютерного зрения (патент США), оптимизации, обработки контроль , в последнее время в обнаружении вторжений и в других местах.

Высшие измерения [ править ]

На плоскости с декартовой системой координат xy добавление дополнительных размеров в параллельных координатах (часто сокращенно || -коорд или PCP) включает добавление большего количества осей. Ценность параллельных координат заключается в том, что определенные геометрические свойства в больших размерах преобразуются в легко видимые 2D-модели. Например, набор точек на прямой в n- пространстве преобразуется в набор полилиний в параллельных координатах, пересекающихся в n  - 1 точках. Для n = 2 это дает двойственность точки и линии, указывающую на то, почему математические основы параллельных координат развиваются в проективной, а не евклидовой форме.космос. Пара линий пересекается в уникальной точке, имеющей две координаты, и, следовательно, может соответствовать уникальной линии, которая также определяется двумя параметрами (или двумя точками). Напротив, для задания кривой требуется более двух точек, а также пара кривых может не иметь уникального пересечения. Следовательно, при использовании кривых в параллельных координатах вместо линий двойственность точечных линий теряется вместе со всеми другими свойствами проективной геометрии и известными красивыми многомерными паттернами, соответствующими (гипер) плоскостям, кривым, нескольким гладким (гипер) поверхностям. , близости, выпуклости и недавней неориентируемости. [4] Цель состоит в том, чтобы отобразить n-мерные отношения в 2D-паттерны. Следовательно, параллельные координаты - это не двухточечное отображение, а скорее nОтображение подмножества D в двумерное подмножество, нет потери информации. Примечание: даже точка в nD отображается не в точку в 2D, а в многоугольную линию - подмножество 2D.

Статистические соображения [ править ]

Репрезентативный образец для параллельных координат.

При использовании для визуализации статистических данных необходимо учитывать три важных аспекта: порядок, поворот и масштабирование осей.

Порядок осей имеет решающее значение для поиска функций, и при типичном анализе данных необходимо будет попробовать множество переупорядочений. Некоторые авторы придумали эвристику упорядочивания, которая может создать проясняющую упорядоченность. [5]

Вращение осей - это перенос в параллельных координатах, и если линии пересекаются вне параллельных осей, он может быть перемещен между ними поворотами. Самый простой пример - поворот оси на 180 градусов. [6]

Масштабирование необходимо, потому что график основан на интерполяции (линейной комбинации) последовательных пар переменных. [6] Следовательно, переменные должны иметь общий масштаб, и существует множество методов масштабирования, которые следует рассматривать как часть процесса подготовки данных, которые могут дать более информативные представления.

Плавный график параллельных координат достигается с помощью сплайнов. [7] На гладком графике каждое наблюдение отображается в параметрическую линию (или кривую), которая является гладкой, непрерывной по осям и ортогональной каждой параллельной оси. Этот дизайн подчеркивает уровень квантования для каждого атрибута данных. [6]

Чтение [ править ]

Инзельберг ( Inselberg 1997 ) сделал полный обзор того, как визуально считывать реляционные паттерны параллельных координат. [8] Когда большинство линий между двумя параллельными осями в некоторой степени параллельны друг другу, это предполагает положительную взаимосвязь между этими двумя измерениями. Когда линии пересекаются в виде наложения X-образных фигур, это отрицательная взаимосвязь. Когда линии пересекаются случайным образом или параллельны, это показывает, что нет особой взаимосвязи.

Ограничения [ править ]

В параллельных координатах каждая ось может иметь не более двух соседних осей (одну слева и одну справа). Для d-мерного набора данных одновременно может отображаться не более d-1 отношений. В визуализации временных рядов существует естественный предшественник и преемник; поэтому в этом особом случае существует предпочтительное расположение. Однако, когда оси не имеют уникального порядка, поиск хорошего расположения осей требует использования эвристики и экспериментов. Чтобы исследовать более сложные отношения, необходимо изменить порядок осей.

При размещении осей в трехмерном пространстве (однако, все еще параллельно, как гвозди в ногтевом ложе), ось может иметь более двух соседей по кругу вокруг центрального атрибута, и проблема расположения упрощается (например, с помощью с использованием минимального остовного дерева ). [9] Прототип этой визуализации доступен как расширение программы интеллектуального анализа данных ELKI . Однако визуализацию сложнее интерпретировать и взаимодействовать с ней, чем с линейным порядком.

Программное обеспечение [ править ]

Несмотря на то, что существует большое количество статей о параллельных координатах, имеется лишь несколько общедоступных известных программ для преобразования баз данных в графику с параллельными координатами. [10] Известными программами являются ELKI , GGobi , Mondrian , Orange и ROOT . Библиотеки включают Protovis.js , D3.js предоставляет базовые примеры. Также был опубликован D3.Parcoords.js (библиотека на основе D3), специально предназначенная для создания графики с параллельными координатами. Библиотека структуры данных и анализа Python Pandas реализует построение параллельных координат с помощью библиотеки графиков matplotlib.. [11]

Другие визуализации для многомерных данных [ править ]

  • Радиолокационная карта - визуализация с радиально расположенными осями координат.
  • График Эндрюса - преобразование Фурье параллельного графа координат

Ссылки [ править ]

  1. ^ d'Ocagne, Морис (1885). Параллельные и аксиальные координаты: метод геометрического преобразования и новый процесс вычисления графических вычислений для согласования параллельных координат . Париж: Готье-Виллар.
  2. ^ Ганнетт, Генри. «Общая сводка, показывающая рейтинг государств по соотношению 1880 г.» . Цитировать журнал требует |journal=( помощь )
  3. ^ Инзельберг, Альфред (1985). «Плоскость с параллельными координатами». Визуальный компьютер . 1 (4): 69–91. DOI : 10.1007 / BF01898350 .
  4. ^ Инзельберг, Альфред (2009). Параллельные координаты: ВИЗУАЛЬНАЯ многомерная геометрия и ее приложения . Springer. ISBN 978-0387215075.
  5. ^ Ян, Цзин; Пэн, Вэй; Уорд, Мэтью О .; Рунденштайнер, Эльке А. (2003). «Интерактивное иерархическое упорядочивание измерений, интервал и фильтрация для исследования высокоразмерных наборов данных» (PDF) . Симпозиум IEEE по визуализации информации (INFOVIS 2003) : 3–4.
  6. ^ a b c Мустафа, Рида; Вегман, Эдвард Дж. (2006). «Многомерные непрерывные данные - параллельные координаты». In Unwin, A .; Theus, M .; Хофманн, Х. (ред.). Графика больших наборов данных: визуализация миллиона . Springer. С. 143–156. ISBN 978-0387329062.
  7. ^ Мустафа, Рида; Вегман, Эдвард Дж. (2002). «О некоторых обобщениях параллельных координатных графиков» (PDF) . Увидев миллион, семинар по визуализации данных, Рейн-Ам-Лех (Nr.), Германия . Архивировано из оригинального (PDF) 24 декабря 2013 года.
  8. ^ Инзельберг, A. (1997), "Многомерная детектив", . Визуализация информации, 1997. Труды IEEE симпозиум по ., Стр 100-107, DOI : 10,1109 / INFVIS.1997.636793 , ISBN 0-8186-8189-6
  9. ^ Элька Achtert, Ханс-Петер Кригель , Эрих Шуберт, Артур Zimek (2013). "Интерактивный интеллектуальный анализ данных с помощью трехмерных параллельных координатных деревьев". Труды Международной конференции ACM по управлению данными (SIGMOD) . Нью - Йорк, Нью - Йорк: 1009 DOI : 10,1145 / 2463676,2463696 . ISBN 9781450320375.CS1 maint: несколько имен: список авторов ( ссылка )
  10. ^ Косара, Роберт (2010). «Параллельные координаты» .
  11. ^ Параллельные координаты в пандах

Дальнейшее чтение [ править ]

  • Генрих, Джулиан и Вайскопф, Даниэль (2013) Современное состояние параллельных координат , Eurographics 2013 - Современные отчеты, стр. 95–116
  • Мустафа, Рида (2011) Графики плотности в параллельных и параллельных координатах , Wiley Interdisciplinary Reviews: Computational Statistics, Vol 3 (2), pp. 134–148.
  • Weidele, Daniel Karl I. (2019) Условные параллельные координаты , Конференция по визуализации IEEE (VIS) 2019, стр. 221–225

Внешние ссылки [ править ]

  • Домашняя страница Альфреда Инзельберга с наглядным руководством, историей, избранными публикациями и приложениями
  • Исследование методов визуализации многомерных наборов данных, проведенное К. Брансдоном, AS Fotheringham и ME Charlton, Университет Ньюкасла , Великобритания
  • Использование кривых для улучшения визуализации параллельных координат. Архивировано 15 марта 2007 г. в Wayback Machine Мартином Грэмом и Джесси Кеннеди, Университет Напьера , Эдинбург , Великобритания.
  • Параллельные координаты , учебник Роберта Косары
  • Условные параллельные координаты - рекурсивный вариант параллельных координат, где категориальное значение может расширяться, чтобы показать другой уровень параллельных координат.