Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Визуализация данных (часто сокращенно именно данные [1] ) является междисциплинарной областью , которая имеет дело с графическим представлением о данных . Это особенно эффективный способ связи, когда данных много, например, временные ряды . С академической точки зрения это представление можно рассматривать как сопоставление исходных данных (обычно числовых) и графических элементов (например, линий или точек на диаграмме). Отображение определяет, как атрибуты этих элементов меняются в зависимости от данных. В этом свете гистограмма - это отображение длины столбца на величину переменной. Поскольку графический дизайн карты может негативно повлиять на читаемость диаграммы,[2] картографирование - это основная компетенция визуализации данных. Визуализация данных берет свое начало в области статистики и поэтому обычно считается отраслью описательной статистики . Однако, поскольку для эффективной визуализации требуются как навыки проектирования, так и статистические и вычислительные навыки, некоторые авторы утверждают, что это одновременно искусство и наука. [3]

Обзор [ править ]

Визуализация данных - один из этапов анализа данных и представления их пользователям.

Для четкой и эффективной передачи информации в визуализации данных используются статистические графики , графики , информационные графики и другие инструменты. Числовые данные могут быть закодированы с использованием точек, линий или полос, чтобы визуально передать количественное сообщение. [4] Эффективная визуализация помогает пользователям анализировать и рассуждать о данных и доказательствах. Это делает сложные данные более доступными, понятными и удобными. У пользователей могут быть определенные аналитические задачи, такие как сравнение или понимание причинно-следственной связи., и принцип построения графики (т. е. показ сравнения или демонстрация причинно-следственной связи) следует задаче. Таблицы обычно используются там, где пользователи будут искать конкретное измерение, в то время как диаграммы различных типов используются для отображения закономерностей или взаимосвязей в данных для одной или нескольких переменных.

Визуализация данных относится к методам, используемым для передачи данных или информации путем кодирования их в виде визуальных объектов (например, точек, линий или полос), содержащихся в графике. Цель состоит в том, чтобы четко и эффективно передавать информацию пользователям. Это один из этапов анализа данных или науки о данных.. По словам Виталия Фридмана (2008), «основная цель визуализации данных - четко и эффективно передавать информацию с помощью графических средств. Это не означает, что визуализация данных должна выглядеть скучной, чтобы быть функциональной, или чрезвычайно сложной, чтобы выглядеть красивой. Для передачи идей. По сути, эстетическая форма и функциональность должны идти рука об руку, обеспечивая понимание довольно разреженного и сложного набора данных за счет передачи его ключевых аспектов более интуитивно понятным способом. Тем не менее, дизайнерам часто не удается достичь баланса между формой и функцией, создавая великолепные визуализации данных, которые не служат своему основному назначению - передаче информации ». [5]

Действительно, Фернанда Вьегас и Мартин М. Ваттенберг предположили, что идеальная визуализация должна не только четко передавать информацию, но и стимулировать вовлечение и внимание зрителей. [6]

Визуализация данных тесно связана с информационной графикой , визуализацией информации , научной визуализацией , исследовательским анализом данных и статистической графикой . В новом тысячелетии визуализация данных стала активной областью исследований, обучения и развития. По данным Post et al. (2002) объединила научную и информационную визуализацию. [7]

В коммерческой среде визуализацию данных часто называют информационными панелями . Инфографика - еще одна очень распространенная форма визуализации данных.

Основы [ править ]

Характеристики эффективных графических дисплеев [ править ]

Диаграмма 1869 года вторжения наполеоновской Франции в Россию Шарля Жозефа Минара , ранний пример информационной графики
Наибольшая ценность картины - это когда она заставляет нас замечать то, чего мы никогда не ожидали увидеть.

Джон Тьюки [8]

Профессор Эдвард Тафте объяснил, что пользователи информационных дисплеев выполняют определенные аналитические задачи, такие как сравнение. Принцип построения информационной графики должен поддерживать аналитическую задачу. [9] Как показывают Уильям Кливленд и Роберт МакГилл, различные графические элементы выполняют это более или менее эффективно. Например, точечные диаграммы и гистограммы превосходят круговые диаграммы. [10]

В своей книге 1983 Визуальное отображение количественной информации , Тафть определяет «графический дисплей» и принципы эффективного графического дисплея в следующем пассаже: «Совершенство в статистических графиках состоит из сложных идей , сообщенных с ясностью, точностью и эффективностью Графических дисплеи должны.:

  • показать данные
  • побудить зрителя задуматься о сути, а не о методологии, графическом дизайне, технологии графического производства или о чем-то еще
  • не искажать то, что говорят данные
  • представить много чисел в небольшом пространстве
  • сделать большие наборы данных согласованными
  • побудить глаз сравнивать разные данные
  • раскрыть данные на нескольких уровнях детализации, от широкого обзора до тонкой структуры
  • служат достаточно ясной цели: описанию, исследованию, составлению таблиц или украшению
  • быть тесно интегрированным со статистическим и вербальным описанием набора данных.

Графика раскрывает данные. Действительно, графики могут быть более точными и показательными, чем обычные статистические вычисления » [11].

Например, диаграмма Минара показывает потери, понесенные армией Наполеона в период 1812–1813 годов. На графике нанесены шесть переменных: размер армии, ее расположение на двумерной поверхности (x и y), время, направление движения и температура. Ширина линии иллюстрирует сравнение (размер армии в определенные моменты времени), в то время как ось температуры указывает причину изменения размера армии. Этот многовариантный дисплей на двумерной поверхности рассказывает историю, которую можно понять сразу же, идентифицируя исходные данные для создания достоверности. В 1983 году Тафт писал: «Это может быть лучший статистический график из когда-либо созданных». [11]

Несоблюдение этих принципов может привести к ошибочным графикам , которые искажают сообщение или поддерживают ошибочный вывод. По словам Тафте , чарт-мусор относится к постороннему внутреннему оформлению графики, которое не усиливает сообщение, или к беспричинным трехмерным или перспективным эффектам. Излишне отделить пояснительный ключ от самого изображения, требуя, чтобы глаз перемещался от изображения к ключу и обратно, является формой «административного мусора». Отношение «данные к чернилам» должно быть максимальным, стирая чернила, не относящиеся к данным, где это возможно. [11]

Бюджетное управление Конгресса США резюмировать несколько лучших практик для графических дисплеев в июне 2014 года презентации. К ним относятся: а) знание своей аудитории; б) разработка графики, которая может стоять отдельно вне контекста отчета; и c) Разработка графических изображений, передающих ключевые идеи отчета. [12]

Количественные сообщения [ править ]

Временной ряд, проиллюстрированный линейной диаграммой, демонстрирующей тенденции в федеральных расходах и доходах США с течением времени.
Диаграмма рассеяния, показывающая отрицательную корреляцию между двумя переменными (инфляция и безработица), измеренными в определенные моменты времени.

Автор Стивен Фью описал восемь типов количественных сообщений, которые пользователи могут попытаться понять или передать на основе набора данных и связанных графиков, используемых для передачи сообщения:

  1. Временной ряд: одна переменная фиксируется за определенный период времени, например, уровень безработицы за 10-летний период. Для демонстрации тренда можно использовать линейный график .
  2. Ранжирование: категориальные подразделения ранжируются в порядке возрастания или убывания, например, рейтинг эффективности продаж ( показатель ) по продавцам ( категория , где каждый продавец является категориальным подразделением ) в течение одного периода. Гистограмма может быть использована , чтобы показать сравнение между продажными лицами.
  3. От части к целому: категориальные подразделения измеряются как отношение к целому (т. Е. Процент от 100%). Круговая диаграмма или гистограмма может показать сравнение коэффициентов, таких как доля рынка в лице конкурентов на рынке.
  4. Отклонение: категориальные подразделения сравниваются с эталоном, например, сравнение фактических и бюджетных расходов для нескольких отделов бизнеса за определенный период времени. Гистограмма может показать сравнение фактической суммы с контрольной.
  5. Частотное распределение: показывает количество наблюдений за определенной переменной для заданного интервала, например количество лет, в течение которых доходность фондового рынка находится между такими интервалами, как 0-10%, 11-20% и т. Д. Гистограмма , тип гистограммы, может использоваться для этого анализа. Boxplot помогает Визуализируйте основные статистические данные о распределении, например, медиана, квартили, выпадающих и т.д.
  6. Корреляция: сравнение наблюдений, представленных двумя переменными (X, Y), чтобы определить, имеют ли они тенденцию двигаться в одном или противоположных направлениях. Например, построение графика безработицы (X) и инфляции (Y) для выборки месяцев. Для этого сообщения обычно используется диаграмма рассеяния .
  7. Номинальное сравнение: сравнение категорийных подразделений без определенного порядка, например, объем продаж по коду продукта. Для этого сравнения можно использовать гистограмму.
  8. Географические или геопространственные : сравнение переменной на карте или макете, например, уровень безработицы по штатам или количество людей на разных этажах здания. Картограмма представляет собой типичный графический используется. [4] [13]

Аналитики, просматривающие набор данных, могут подумать, применимы ли некоторые или все приведенные выше сообщения и графические типы к их задачам и аудитории. Процесс проб и ошибок для выявления значимых взаимосвязей и сообщений в данных является частью исследовательского анализа данных .

Визуальное восприятие и визуализация данных [ править ]

Человек может легко различать различия в длине линий, форме, ориентации, расстояниях и цвете (оттенке) без значительных усилий по обработке; они упоминаются как « атрибуты предварительного внимания ». Например, может потребоваться значительное время и усилия («внимательная обработка»), чтобы определить, сколько раз цифра «5» появляется в серии чисел; но если эта цифра отличается по размеру, ориентации или цвету, экземпляры цифры можно быстро отметить с помощью предварительной обработки. [14]

Эффективная графика использует преимущества предварительной обработки и атрибутов, а также относительной силы этих атрибутов. Например, поскольку людям легче обрабатывать различия в длине линии, чем в площади поверхности, может быть более эффективным использовать гистограмму (которая использует длину линии для сравнения), а не круговые диаграммы (которые используют площадь поверхности для отображения сравнения. ). [14]

Человеческое восприятие / познание и визуализация данных [ править ]

Почти все визуализации данных созданы для потребления человеком. Знание человеческого восприятия и познания необходимо при разработке интуитивных визуализаций. [15] Познание относится к таким человеческим процессам, как восприятие, внимание, обучение, память, мышление, формирование концепций, чтение и решение проблем. [16]Обработка изображений человеком эффективна при обнаружении изменений и сравнении количества, размеров, форм и вариаций легкости. Когда свойства символьных данных сопоставляются с визуальными свойствами, люди могут эффективно просматривать большие объемы данных. Подсчитано, что 2/3 нейронов мозга могут участвовать в обработке изображений. Правильная визуализация обеспечивает другой подход к отображению потенциальных связей, отношений и т. Д., Которые не так очевидны в не визуализированных количественных данных. Визуализация может стать средством исследования данных .

Исследования показали, что люди использовали в среднем на 19% меньше когнитивных ресурсов и на 4,5% лучше запоминали детали при сравнении визуализации данных с текстом. [17]

История [ править ]

Избранные вехи и изобретения

Нет исчерпывающей «истории» визуализации данных. Нет отчетов, которые охватывают все развитие визуального мышления и визуального представления данных и которые сопоставляют вклад различных дисциплин. [18] Майкл Френдли и Дэниел Дж. Денис из Йоркского университета участвуют в проекте, который пытается представить исчерпывающую историю визуализации. Вопреки распространенному мнению, визуализация данных - это не современная разработка. С доисторических времен данные о звездах или информация, такая как расположение звезд, визуализировались на стенах пещер (таких как пещера Ласко на юге Франции) с эпохи плейстоцена . [19] Физические артефакты, такие как месопотамскиеглинистые лексемы (5500 до н.э.), Inca Кипу (2600 г. до н.э.) и Маршалловы острова придерживаться графиков (ND) также можно рассматривать как визуализируя количественную информацию. [20] [21]

Первая документированная визуализация данных может быть прослежена до 1160 г. до н.э. с помощью Туринской карты папируса, которая точно иллюстрирует распределение геологических ресурсов и предоставляет информацию о разработке этих ресурсов. [22] Такие карты можно отнести к категории тематической картографии , которая представляет собой тип визуализации данных, который представляет и передает конкретные данные и информацию посредством географической иллюстрации, предназначенной для демонстрации конкретной темы, связанной с определенной географической областью. Самыми ранними задокументированными формами визуализации данных были различные тематические карты из разных культур, а также идеограммы и иероглифы, которые обеспечивали и позволяли интерпретировать иллюстрированную информацию. Например, таблетки линейного письма БМикены предоставили визуализацию информации о торговле эпохи поздней бронзы в Средиземноморье. Идея координат использовалась древнеегипетскими геодезистами при планировании городов, земные и небесные позиции определялись чем-то вроде широты и долготы, по крайней мере, к 200 г. до н.э., а картографическая проекция сферической земли в широту и долготу Клавдием Птолемеем [ c.85 – c. 165] в Александрии служили эталоном до XIV века. [22]

Изобретение бумаги и пергамента позволило дальнейшее развитие визуализаций на протяжении всей истории. На рисунке показан график 10-го или, возможно, 11-го века, который предназначен для иллюстрации движения планет и используется в приложении к учебнику в монастырских школах. [23]График, по-видимому, должен был представлять собой график наклонов планетных орбит в зависимости от времени. Для этого зона зодиака изображалась на плоскости с горизонтальной линией, разделенной на тридцать частей в качестве временной или продольной оси. Вертикальная ось обозначает ширину зодиака. Горизонтальный масштаб, по-видимому, был выбран для каждой планеты индивидуально, поскольку периоды не могут быть согласованы. Сопроводительный текст относится только к амплитудам. Видимо, кривые не связаны во времени.

Планетарные движения

К 16 веку методы и инструменты для точного наблюдения и измерения физических величин, а также географического и небесного положения были хорошо развиты (например, «квадрант стены», построенный Тихо Браге [1546–1601], покрывающий всю стену в его обсерватория). Особенно важным было развитие триангуляции и других методов для точного определения местоположения на карте. [18] Очень рано измерение времени привело ученых к разработке инновационных способов визуализации данных (например, Лоренц Кодоманн в 1596 году, Иоганнес Темпорариус в 1596 году [24] ).

Французские философы и математики Рене Декарт и Пьер де Ферма разработали аналитическую геометрию и двумерную систему координат, которые сильно повлияли на практические методы отображения и вычисления значений. Работа Ферма и Блеза Паскаля по статистике и теории вероятностей заложила основу для того, что мы теперь концептуализируем как данные. [18] По данным Interaction Design Foundation, эти разработки позволили и помогли Уильяму Плейфэру , который увидел потенциал графической передачи количественных данных, создать и разработать графические методы статистики. [15]

Playfair TimeSeries

Во второй половине 20-го века Жак Бертин использовал количественные графики для представления информации «интуитивно, ясно, точно и эффективно». [15]

Джон Тьюки и Эдвард Тафт расширили границы визуализации данных; Тьюки с его новым статистическим подходом к исследовательскому анализу данных и Тафте с его книгой «Визуальное отображение количественной информации» проложили путь к совершенствованию методов визуализации данных не только для статистиков. С развитием технологий пришла и визуализация данных; начиная с рисованной визуализации и заканчивая более техническими приложениями, включая интерактивные проекты, ведущие к визуализации программного обеспечения. [25]

Такие программы, как SAS , SOFA , R , Minitab , Cornerstone и другие, позволяют визуализировать данные в области статистики. Другие приложения для визуализации данных, более целенаправленные и уникальные для отдельных лиц, языки программирования, такие как D3 , Python и JavaScript, помогают сделать визуализацию количественных данных возможной. Частные школы также разработали программы для удовлетворения спроса на визуализацию обучающих данных и связанные библиотеки программирования, включая бесплатные программы, такие как The Data Incubator, или платные программы, такие как General Assembly . [26]

Начиная с симпозиума «Данные для открытия» в 2013 году, Колледж дизайна ArtCenter, Калифорнийский технологический институт и Лаборатория реактивного движения в Пасадене запустили годовую программу по интерактивной визуализации данных. [27]Программа задает вопрос: как интерактивная визуализация данных может помочь ученым и инженерам более эффективно исследовать свои данные? Как вычисления, дизайн и дизайн-мышление могут помочь максимизировать результаты исследований? Какие методологии наиболее эффективны для использования знаний из этих областей? Кодируя реляционную информацию с соответствующими визуальными и интерактивными характеристиками, чтобы помочь исследовать и, в конечном итоге, получить новое представление о данных, программа разрабатывает новые междисциплинарные подходы к сложным научным проблемам, сочетая дизайнерское мышление и новейшие методы вычислений, ориентированного на пользователя дизайна, дизайна взаимодействия. и 3D-графика.

Терминология [ править ]

Визуализация данных включает в себя особую терминологию, часть которой основана на статистике. Например, автор Стивен Фью определяет два типа данных, которые используются в комбинации для поддержки значимого анализа или визуализации:

  • Категориальный: представляют группы объектов с определенной характеристикой. Категориальные переменные могут быть номинальными или порядковыми. Номинальные переменные, например пол, не имеют порядка между собой и, следовательно, являются номинальными. Порядковые переменные - это категории с порядком, для выборки записи возрастной группы, в которую попадает человек. [28]
  • Количественные: представляют измерения, такие как рост человека или температура окружающей среды. Количественные переменные могут быть непрерывными или дискретными . Непрерывные переменные отражают идею о том, что измерения всегда можно проводить более точно. В то время как дискретные переменные имеют только конечное число возможностей, таких как количество результатов или возраст, измеренный в целых годах. [28]

Различие между количественными и категориальными переменными важно, поскольку для этих двух типов требуются разные методы визуализации.

Два основных типа отображения информации - это таблицы и графики.

  • Таблица содержит количественные данные , организованные в виде строк и столбцов с категорическими метками. Он в основном используется для поиска определенных значений. В приведенном выше примере таблица может иметь метки столбцов категорий, представляющие имя ( качественная переменная ) и возраст ( количественная переменная ), причем каждая строка данных представляет одного человека (выбранную экспериментальную единицу или подразделение категорий ).
  • График , в основном используется , чтобы показать отношения между данными и значениями изображает закодированы в виде визуальных объектов (например, линии, бары или точек). Числовые значения отображаются в области, обозначенной одной или несколькими осями . Эти оси представляют собой шкалы (количественные и категориальные), используемые для маркировки и присвоения значений визуальным объектам. Многие графики также называют диаграммами . [29]

Эпплер и Ленглер разработали «Периодическую таблицу методов визуализации», интерактивную диаграмму, отображающую различные методы визуализации данных. Он включает шесть типов методов визуализации данных: данные, информация, концепция, стратегия, метафора и соединение. [30]

Методы [ править ]

Интерактивность [ править ]

Интерактивная визуализация данных позволяет выполнять прямые действия на графическом графике для изменения элементов и связи между несколькими графиками. [33]

Интерактивная визуализация данных была предметом внимания статистиков с конца 1960-х годов. Примеры разработок можно найти в библиотеке видеопроката Американской статистической ассоциации . [34]

Общие взаимодействия включают:

  • Кисть : работает с использованием мыши для управления кистью, напрямую изменяя цвет или глиф элементов графика. Кисть иногда является указателем, а иногда работает, рисуя своего рода контур вокруг точек; контур иногда имеет неправильную форму, как лассо. Кисть чаще всего используется, когда видно несколько графиков и между графиками существует какой-то механизм связи. Существует несколько различных концептуальных моделей чистки и ряд общих механизмов связывания. Диаграммы рассеивания кистьюможет быть временной операцией, при которой точки на активном графике сохраняют свои новые характеристики только тогда, когда они заключены или пересекаются кистью, или это может быть постоянная операция, чтобы точки сохраняли свой новый вид после того, как кисть была перемещена . Переходная чистка обычно выбирается для связанной чистки, как мы только что описали.
  • Рисование : постоянная чистка полезна, когда мы хотим сгруппировать точки в кластеры, а затем перейти к использованию других операций, таких как тур, для сравнения групп. Обычной терминологией становится называть постоянную операцию рисованием,
  • Идентификация : то, что также можно назвать нанесением этикеток или чисткой этикеток, является еще одной манипуляцией с сюжетом, которую можно связать. Если подвести курсор к точке или краю на диаграмме рассеивания или к полосе на гистограмме , появится метка, идентифицирующая элемент графика. Он широко доступен во многих интерактивных графических объектах и ​​иногда называется наведением курсора мыши.
  • Масштабирование : отображает данные в окне и изменяет область. Функция отображения помогает нам узнать разные вещи из одного и того же сюжета. Масштабирование обычно используется для увеличения плотных участков диаграммы рассеяния, а также может использоваться для изменения соотношения сторон графика, чтобы выявить различные особенности данных.
  • Связывание : соединяет элементы, выбранные на одном участке, с элементами другого участка. Самый простой вид связывания, взаимно однозначный, когда оба графика показывают разные проекции одних и тех же данных, а точка на одном графике соответствует ровно одной точке на другом. При использовании графиков с областями чистка любой части области дает тот же эффект, что и чистка всей области, и эквивалентна выбору всех случаев в соответствующей категории. Даже когда некоторые элементы графика представляют более одного случая, основное правило связывания по-прежнему связывает один случай на одном графике с таким же случаем на других графиках. Связывание также может осуществляться по категориальной переменной, например, по идентификатору субъекта, так что все значения данных, соответствующие этому субъекту, выделяются на всех видимых графиках.

Другие перспективы [ править ]

Существуют разные подходы к сфере визуализации данных. Одним из наиболее распространенных направлений является представление информации, например, Friedman (2008). Friendly (2008) предполагает две основные части визуализации данных: статистические графики и тематическую картографию . [35] В этой строке в статье «Визуализация данных: современные подходы» (2007) дается обзор семи предметов визуализации данных: [36]

  • Статьи и ресурсы
  • Отображение подключений
  • Отображение данных
  • Отображение новостей
  • Отображение веб-сайтов
  • Ментальные карты
  • Инструменты и услуги

Все эти предметы тесно связаны с графическим дизайном и представлением информации.

С другой стороны, с точки зрения информатики , Фриц Х. Пост в 2002 году разделил эту область на подполя: [7] [37]

  • Визуализация информации
  • Методы и архитектуры взаимодействия
  • Техники моделирования
  • Методы с несколькими разрешениями
  • Алгоритмы и методы визуализации
  • Визуализация объема

В рамках Harvard Business Review Скотт Беринато разработал структуру подхода к визуализации данных. [38] Чтобы начать думать визуально, пользователи должны ответить на два вопроса; 1) Что у вас есть и 2) что вы делаете. Первый шаг - определить, какие данные вы хотите визуализировать. Он основан на данных, таких как прибыль за последние десять лет или концептуальная идея, например, как устроена конкретная организация. Как только на этот вопрос ответят, можно сосредоточиться на том, пытаются ли они передать информацию (декларативная визуализация) или пытаются что-то выяснить (исследовательская визуализация). Скотт Беринато объединил эти вопросы, чтобы дать четыре типа визуального общения, каждый из которых имеет свои собственные цели. [38]

Эти четыре типа визуальной коммуникации заключаются в следующем;

  • иллюстрация идеи (концептуальная и декларативная). [38]
    • Используется для обучения, объяснения и / или просто понятий. Например, организационные диаграммы и деревья решений.
  • генерация идей (концептуальная и исследовательская). [38]
    • Используется для обнаружения, внедрения новшеств и решения проблем. Например, доска после мозгового штурма.
  • визуальное открытие (ориентированное на данные и исследовательское). [38]
    • Используется для выявления тенденций и анализа данных. Этот тип визуальных элементов чаще встречается с большими и сложными данными, где набор данных в некоторой степени неизвестен, а задача является открытой.
  • повседневная визуализация данных (декларативная и управляемая данными). [38]
    • Самый распространенный и простой тип визуализации, используемый для подтверждения и настройки контекста. Например, линейный график ВВП во времени.

Архитектура представления данных [ править ]

Визуализация данных из социальных сетей

Архитектура представления данных ( DPA ) - это набор навыков, который стремится идентифицировать, находить, обрабатывать, форматировать и представлять данные таким образом, чтобы оптимально передавать смысл и правильные знания.

Исторически термин « архитектура представления данных» приписывается Келли Лотт: [a] «Архитектура представления данных (DPA) - это редко применяемый набор навыков, критически важных для успеха и ценности бизнес-аналитики . Архитектура представления данных объединяет науку о числах, данных и статистика для обнаружения ценной информации из данных и ее использования, актуальности и действенности с помощью искусства визуализации данных, коммуникации, организационной психологии и управления изменениямичтобы предоставить решения для бизнес-аналитики с объемом данных, сроками доставки, форматом и визуализацией, которые будут наиболее эффективно поддерживать и управлять операционным, тактическим и стратегическим поведением для достижения понятных бизнес-(или организационных) целей. DPA не является ни ИТ, ни бизнес-навыками, а существует как отдельная область знаний. Архитектура представления данных, которую часто путают с визуализацией данных, представляет собой гораздо более широкий набор навыков, который включает определение того, какие данные по какому графику и в каком точном формате должны быть представлены, а не только лучший способ представления данных, который уже был выбран. Навыки визуализации данных - один из элементов DPA ».

Цели [ править ]

DPA преследует две основные цели:

  • Использовать данные для предоставления знаний наиболее эффективным способом (минимизировать шум, сложность и ненужные данные или детали с учетом потребностей и ролей каждой аудитории)
  • Использовать данные для предоставления знаний наиболее эффективным способом (предоставлять актуальные, своевременные и полные данные каждому члену аудитории в ясной и понятной форме, которая передает важное значение, является действенной и может повлиять на понимание, поведение и решения)

Сфера [ править ]

С учетом вышеуказанных целей фактическая работа по архитектуре представления данных состоит из:

  • Создание эффективных механизмов доставки для каждого члена аудитории в зависимости от их роли, задач, местоположения и доступа к технологиям
  • Определение важного значения (соответствующих знаний), которое необходимо каждому члену аудитории в каждом контексте
  • Определение необходимой периодичности обновления данных (актуальности данных)
  • Определение правильного времени для представления данных (когда и как часто пользователю нужно просматривать данные)
  • Поиск нужных данных (предметная область, исторический охват, широта, уровень детализации и т. Д.)
  • Использование соответствующего анализа, группировки, визуализации и других форматов представления

Связанные поля [ править ]

Работа DPA имеет общие черты с несколькими другими областями, в том числе:

  • Бизнес-анализ в определении бизнес-целей, сборе требований, отображении процессов.
  • Улучшение бизнес-процессов в том смысле, что его цель - улучшить и оптимизировать действия и решения для достижения бизнес-целей.
  • Визуализация данных в том смысле, что она использует хорошо зарекомендовавшие себя теории визуализации, чтобы добавить или выделить значение или важность в представлении данных.
  • Информационная архитектура , но информационная архитектура сосредоточена на неструктурированных данных и поэтому исключает как анализ (в смысле статистики / данных), так и прямое преобразование фактического содержания (данные для DPA) в новые сущности и комбинации.
  • HCI и дизайн взаимодействия , так как многие принципы проектирования интерактивной визуализации данных были разработаны в междисциплинарной среде с HCI.
  • Визуальная журналистика и журналистика, основанная на данных, или журналистика данных : визуальная журналистика занимается всеми типами графического упрощения рассказа новостей, а журналистика, основанная на данных, и журналистика данных не обязательно рассказываются с визуализацией данных. Тем не менее, журналистика находится на переднем крае разработки новых визуализаций данных для передачи данных.
  • Графический дизайн , передача информации через стиль, типографику, положение и другие эстетические аспекты.

См. Также [ править ]

  • Аналитика
  • Сбалансированная система показателей
  • Большое количество данных
  • Бизнес-анализ
  • Бизнес-аналитика
  • Искусство изменения климата
  • Dashboard_ (бизнес)
  • Анализ данных
  • Искусство данных
  • Профилирование данных
  • Наука о данных
  • Хранилище данных
  • Исследовательский анализ данных
  • Инфографика
  • Информационная архитектура
  • Информационный дизайн
  • Визуализация информации
  • Интерактивный дизайн
  • Техники взаимодействия
  • Научная визуализация
  • Визуализация программного обеспечения
  • статистический анализ
  • Статистическая графика
  • Визуальная аналитика
  • Визуальная журналистика
  • Согревающие полосы

Примечания [ править ]

  1. Первые официальные, зарегистрированные публичные употребления термина «архитектура представления данных» были на трех официальных мероприятиях по запуску Microsoft Office 2007 в декабре, январе и феврале 2007-08 гг. В Эдмонтоне, Калгари и Ванкувере (Канада) в презентации Келли Лотт. описание системы бизнес-аналитики, предназначенной для повышения качества обслуживания в целлюлозно-бумажной компании. Этот термин был в дальнейшем использован и зарегистрирован в публичном употреблении 16 декабря 2009 года в презентации Microsoft Canada о ценности слияния бизнес-аналитики с корпоративными процессами совместной работы.

Ссылки [ править ]

  1. ^ Shewan, Dan (5 октября 2016). «Данные прекрасны: 7 инструментов визуализации данных для цифровых маркетологов» . Business2Community .com . Архивировано 12 ноября 2016 года.
  2. ^ Nussbaumer Knaflic, Коул (2 ноября 2015). Storytelling with Data: A Data Visualization Guide for Business Professional . ISBN 978-1-119-00225-3.
  3. ^ Гершон, Наум; Пейдж, Уорд (1 августа 2001 г.). «Что рассказывание историй может сделать для визуализации информации». Коммуникации ACM . 44 (8): 31–37. DOI : 10.1145 / 381641.381653 . S2CID 7666107 . 
  4. ^ a b «Стивен Фью-Perceptual Edge-Выбор правильного графика для вашего сообщения-2004» (PDF) . Архивировано (PDF) из оригинала на 2014-10-05 . Проверено 8 сентября 2014 .
  5. ^ Виталий Фридман (2008) «Визуализация данных и инфографика». Архивировано 22июля 2008 г.на Wayback Machine в: Graphics , Monday Inspiration, 14 января 2008 г.
  6. ^ Фернанда Viegas и Мартин Уоттенберг (19 апреля 2011). «Как сделать данные сексуальными» . CNN.com . Архивировано из оригинала 6 мая 2011 года . Проверено 7 мая 2017 года .CS1 maint: использует параметр авторов ( ссылка )
  7. ^ a b Фриц Х. Пост, Грегори М. Нильсон и Жорж-Пьер Бонно (2002). Визуализация данных: современное состояние . Исследовательская статья TU delft, 2002. Архивировано 07 октября 2009 г. в Wayback Machine .
  8. ^ Тьюки, Джон (1977). Исследовательский анализ данных . Эддисон-Уэсли. ISBN 0-201-07616-0.
  9. ^ techatstate (7 августа 2013 г.). «Tech @ State: Визуализация данных - основной доклад доктора Эдварда Тафте» . Архивировано 29 марта 2017 года . Проверено 29 ноября 2016 г. - через YouTube.
  10. ^ Кливленд, WS; Макгилл Р. (1985). «Графическое восприятие и графические методы анализа научных данных». Наука . 229 (4716): 828–33. DOI : 10.1126 / science.229.4716.828 . PMID 17777913 . S2CID 16342041 .  
  11. ^ a b c Тафт, Эдвард (1983). Визуальное отображение количественной информации . Чешир, Коннектикут: Graphics Press. ISBN 0-9613921-4-2. Архивировано 14 января 2013 года . Проверено 10 августа 2019 .
  12. ^ «Рассказывая визуальные истории о данных - Бюджетное управление Конгресса» . www.cbo.gov . Архивировано 4 декабря 2014 года . Проверено 27 ноября 2014 .
  13. ^ "Стивен Фью-Перцепционная матрица выбора граничного графа" (PDF) . Архивировано (PDF) из оригинала на 2014-10-05 . Проверено 8 сентября 2014 .
  14. ^ a b "Стивен Фью-Нажимая на силу визуального восприятия - сентябрь 2004 г." (PDF) . Архивировано (PDF) из оригинала на 2014-10-05 . Проверено 8 октября 2014 .
  15. ^ a b c «Визуализация данных для человеческого восприятия» . Основа дизайна взаимодействия . Архивировано 23 ноября 2015 года . Проверено 23 ноября 2015 .
  16. ^ «Визуализация» (PDF) . ЮФУ . Лекция СФУ. Архивировано из оригинального (PDF) 22 января 2016 года . Проверено 22 ноября 2015 .
  17. Перейти ↑ Graham, Fiona (2012-04-17). "Могут ли изображения остановить перегрузку данных?" . BBC News . Проверено 30 июля 2020 .
  18. ^ a b c Дружелюбно, Майкл. «Краткая история визуализации данных». Springer-Verlag. CiteSeerX 10.1.1.446.458 .  Цитировать журнал требует |journal=( помощь )
  19. Перейти ↑ Whitehouse, D. (9 августа 2000). «Открыта звездная карта ледникового периода» . BBC News . Архивировано 6 января 2018 года . Проверено 20 января 2018 года .
  20. ^ Драгичевич, Пьер; Янсен, Ивонн (2012). «Список физических визуализаций и связанных артефактов» . Архивировано 13 января 2018 года . Проверено 12 января 2018 .
  21. ^ Янсен, Ивонн; Драгичевич, Пьер; Изенберг, Петра; Александр, Джейсон; Карник, Абхиджит; Килдал, Йохан; Субраманиан, Шрирам; Хорнбек, Каспер (2015). «Возможности и проблемы для физикализации данных» . Труды 33-й ежегодной конференции ACM по человеческому фактору в вычислительных системах : 3227–3236. Архивировано 13 января 2018 года . Проверено 12 января 2018 .
  22. ^ a b Friendly, Майкл (2001). «Вехи в истории тематической картографии, статистической графики и визуализации данных» . Архивировано из оригинала на 2014-04-14.
  23. ^ Funkhouser, Говард Грей (январь 1936). «Заметка о графике десятого века». Осирис . 1 : 260–262. DOI : 10.1086 / 368425 . JSTOR 301609 . S2CID 144492131 .  
  24. ^ «Визуализация данных: определение, примеры, инструменты, советы [руководство 2020]» . Консультации по исследованию рынка . 2020-12-09 . Проверено 9 декабря 2020 .
  25. ^ Дружелюбный, Майкл (2006). «Краткая история визуализации данных» (PDF) . Йоркский университет . Springer-Verlag. Архивировано (PDF) из оригинала 08.05.2016 . Проверено 22 ноября 2015 .
  26. ^ «Нью-Йорк получает новый учебный лагерь для специалистов по данным: это бесплатно, но труднее попасть, чем в Гарвард» . Венчурный бит . Архивировано 15 февраля 2016 года . Проверено 21 февраля 2016 .
  27. ^ Интерактивная визуализация данных
  28. ^ a b Балмер, Майкл (2013). Портативное введение в анализ данных . Университет Квинсленда: Центр публикации по запросу. С. 4–5. ISBN 978-1-921723-10-0.
  29. ^ «Стивен Фью - Выбор правильного графика для вашего сообщения - сентябрь 2004 г.» (PDF) . Архивировано (PDF) из оригинала на 2014-10-05 . Проверено 8 сентября 2014 .
  30. ^ Ленглер, Ральф ; Эпплер, Мартин. Дж . «Периодическая таблица методов визуализации» . www.visual-literacy.org. Архивировано 16 марта 2013 года . Проверено 15 марта 2013 года .
  31. Кан, Брайан (17 июня 2019 г.). «Эта поразительная визуализация изменения климата теперь настраивается для любого места на Земле» . Gizmodo . Архивировано 26 июня 2019 года.Разработанная в мае 2018 года по Ed Hawkins , Университет Рединга .
  32. Муни, Крис (11 мая 2016 г.). «Этот ученый просто изменил наше представление об изменении климата с помощью одной гифки» . Вашингтон Пост . Архивировано 6 февраля 2019 года. Эд Хокинс взял эти ежемесячные данные о температуре и построил их в виде спирали, так что для каждого года в центре круга было двенадцать точек, по одной на каждый месяц - с более теплые температуры наружу и более холодные температуры ближе внутрь.
  33. ^ Суэйн, Дебора (1999). «Введение в спецвыпуск по интерактивному графическому анализу данных: что такое взаимодействие?». Вычислительная статистика . 14 (1): 1–6.
  34. ^ Американская статистическая ассоциация, Секция статистической графики. «Библиотека видеопроката» .
  35. ^ Майкл Френдли (2008). «Вехи в истории тематической картографии, статистической графики и визуализации данных». Архивировано 11 сентября 2008 г. в Wayback Machine .
  36. ^ «Визуализация данных: современные подходы». Архивировано 22 июля 2008 г. в Wayback Machine . в: Графика , 2 августа 2007 г.
  37. ^ Фриц Х. Пост, Грегори М. Нильсон и Жорж-Пьер Бонно (2002). Визуализация данных: современное состояние. Архивировано 07 октября 2009 г. в Wayback Machine .
  38. ^ Б с д е е Berinato, Скотт (июнь 2016). «Визуализации, которые действительно работают» . Harvard Business Review : 92–100.

Дальнейшее чтение [ править ]

  • Кливленд, Уильям С. (1993). Визуализация данных . Hobart Press. ISBN 0-9634884-0-6.
  • Эвергрин, Стефани (2016). Эффективная визуализация данных: правильная диаграмма для правильных данных . Мудрец. ISBN 978-1-5063-0305-5.
  • Хили, Киран (2019). Визуализация данных: практическое введение . Принстон: Издательство Принстонского университета. ISBN 978-0-691-18161-5.
  • Post, Frits H .; Нильсон, Грегори М .; Бонно, Жорж-Пьер (2003). Визуализация данных: современное состояние . Нью-Йорк: Спрингер. ISBN 978-1-4613-5430-7.
  • Рослинг, Х .; Рослинг, О .; Рослинг Рённлунд, А. (2018). Правдивость: десять причин, по которым мы не правы в отношении мира, и почему все лучше, чем вы думаете . Книги Флэтайрон. п. 288. ISBN 9781250123817.
  • Вилке, Клаус О. (2018). Основы визуализации данных . О'Рейли. ISBN 978-1-4920-3108-6.
  • Уилкинсон, Лиланд (2012). Грамматика графики . Нью-Йорк: Спрингер. ISBN 978-1-4419-2033-1.

Внешние ссылки [ править ]

  • Вехи в истории тематической картографии, статистической графики и визуализации данных , иллюстрированная хронология инноваций Майкла Френдли и Дэниела Дж. Дениса.
  • Университет Дьюка - презентация Кристы Келлехер - общение с помощью инфографики - визуализация научной и инженерной информации - 6 марта 2015 г.