Визуализация данных

Завершено

Специалисты по обработке и анализу данных визуализируют данные, чтобы лучше их понять. Они могут сканировать необработанные данные, проверять сводные меры, такие как средние или графировать данные. Графы — это мощные средства визуализации данных, а специалисты по обработке и анализу данных часто используют графы для быстрого распознавания умеренно сложных шаблонов.

Визуальное представление данных

Графирование выполняется для обеспечения быстрой качественной оценки наших данных, которая может оказаться полезной для понимания результатов, определения вылитых значений, изучения распределения чисел и т. д.

Хотя иногда мы заранее понимаем, какой тип графа будет наиболее полезным, в других случаях мы используем графы произвольным образом. Чтобы понять возможности визуализации данных, рассмотрим следующие данные: расположение (x,y) самоуправляемого автомобиля. В необработанной форме данных трудно увидеть реальные шаблоны. Среднее или среднее говорит нам, что путь автомобиля был сосредоточен вокруг x=0,2 и y=0,3, а диапазон чисел, как представляется, находится в диапазоне от -2 до 2.

Время Location-X Location-Y
0 0 2
1 1.682942 1.080605
2 1.818595 -0.83229
3 0.28224 -1.97998
4 -1.5136 -1.30729
5 -1.91785 0.567324
6 -0.55883 1.920341
7 1.313973 1.507805
12 0.00001 0.00001
13 0.840334 1.814894
14 1.981215 0.273474
15 1.300576 -1.51938
16 -0.57581 -1.91532
17 -1.92279 -0.55033
18 -1.50197 1.320633
19 0.299754 1.977409
20 1.825891 0.816164

Если теперь построить Location-X с течением времени, мы увидим, что у нас есть отсутствующие значения в диапазоне от 7 до 12.

Graph of Location-X coordinates plotted against time.

Если мы граф X и Y, мы в конечном итоге с картой того, где автомобиль ехал. Это мгновенно очевидно, что автомобиль ехал в круг и в какой-то момент поехал в центр этого круга.

Graph of Location-X and Location-Y coordinates plotted.

Графы не ограничиваются 2D-точечной диаграммой, как описано выше. Их можно использовать для изучения других аспектов данных; Например, пропорции (круговая диаграмма и диаграммы с накоплением) и распределение данных (гистограммы и графики виски). Часто, когда мы пытаемся понять необработанные данные или результаты, мы можем экспериментировать с различными типами графов, пока мы не столкнулись с данными визуально интуитивно.