Визуализация данных


Визуализация данных — это представление данных в виде, который обеспечивает наиболее эффективную работу человека по их изучению.[1] Визуализация данных находит широкое применение в научных и статистических исследованиях (в частности, в прогнозировании, интеллектуальном анализе данных, бизнес-анализе), в педагогическом дизайне для обучения и тестирования, в новостных сводках и аналитических обзорах. Визуализация данных связана с визуализацией информации, инфографикой, визуализацией научных данных, разведочным анализом данных и статистической графикой.

Термины «визуализация данных» и «инфографика» часто считаются синонимами, однако специалисты в области представления информации проводят между ними различие.[2] В одном из подходов визуализация данных считается частью инфографики, которая, согласно этой точке зрения, представляет собой комбинацию собственно визуализации данных, иллюстраций, рисунков и текста, служащую для подачи целостного сообщения.[3]

Другой подход условно проводит разграничение между этими понятиями по методу создания, эстетическим качествам и количеству данных. Согласно этому подходу, инфографика относится к представлениям данных, которые: созданы при участии человека, специфичны по отношению к представляемой информации, высокоэстетичны и не содержат большого количества данных. Напротив, визуализация данных относится к представлениям, которые созданы алгоритмическим путём, легко воспроизводимы для разных выборок и схожих типов данных, не содержат излишних декоративных элементов, отражают большие объёмы данных.[4]

Истоки представления данных в виде таблиц, диаграмм и карт прослеживаются с древнейших времён.[5] Ощутимая потребность в качественном представлении информации стала возникать в эпоху Возрождения, с появлением больших количеств данных и визуальной информации из географии, астрономии, геометрии, статистики и других наук.[6]

В первой половине XIX века наблюдался значительный рост работ, в которых использовалось графическое отображение данных. К середине века были изобретены все основные типы представления данных: столбчатые и круговые диаграммы, гистограммы, линейные графики, графики временных рядов, контурные диаграммы и т. д.[7]

Тенденция роста пошла на спад в начале XX века, уступив место точной математике. Тем не менее, именно в этот период стали появляться учебники и курсы по графическим методам представления данных, а сами графики стали использоваться не только для представления результатов, но и для исследования информации и выдвижения гипотез в астрономии, физике, биологии и других науках.[8]