Визуализация данных
Специалисты по обработке и анализу данных визуализируют данные, чтобы лучше их понять. Они могут сканировать необработанные данные, проверять сводные меры, такие как средние или графировать данные. Графы — это мощные средства визуализации данных, а специалисты по обработке и анализу данных часто используют графы для быстрого распознавания умеренно сложных шаблонов.
Визуальное представление данных
Графирование выполняется для обеспечения быстрой качественной оценки наших данных, которая может оказаться полезной для понимания результатов, определения вылитых значений, изучения распределения чисел и т. д.
Хотя иногда мы заранее понимаем, какой тип графа будет наиболее полезным, в других случаях мы используем графы произвольным образом. Чтобы понять возможности визуализации данных, рассмотрим следующие данные: расположение (x,y) самоуправляемого автомобиля. В необработанной форме данных трудно увидеть реальные шаблоны. Среднее или среднее говорит нам, что путь автомобиля был сосредоточен вокруг x=0,2 и y=0,3, а диапазон чисел, как представляется, находится в диапазоне от -2 до 2.
Время | Location-X | Location-Y |
---|---|---|
0 | 0 | 2 |
1 | 1.682942 | 1.080605 |
2 | 1.818595 | -0.83229 |
3 | 0.28224 | -1.97998 |
4 | -1.5136 | -1.30729 |
5 | -1.91785 | 0.567324 |
6 | -0.55883 | 1.920341 |
7 | 1.313973 | 1.507805 |
12 | 0.00001 | 0.00001 |
13 | 0.840334 | 1.814894 |
14 | 1.981215 | 0.273474 |
15 | 1.300576 | -1.51938 |
16 | -0.57581 | -1.91532 |
17 | -1.92279 | -0.55033 |
18 | -1.50197 | 1.320633 |
19 | 0.299754 | 1.977409 |
20 | 1.825891 | 0.816164 |
Если теперь построить Location-X с течением времени, мы увидим, что у нас есть отсутствующие значения в диапазоне от 7 до 12.
Если мы граф X и Y, мы в конечном итоге с картой того, где автомобиль ехал. Это мгновенно очевидно, что автомобиль ехал в круг и в какой-то момент поехал в центр этого круга.
Графы не ограничиваются 2D-точечной диаграммой, как описано выше. Их можно использовать для изучения других аспектов данных; Например, пропорции (круговая диаграмма и диаграммы с накоплением) и распределение данных (гистограммы и графики виски). Часто, когда мы пытаемся понять необработанные данные или результаты, мы можем экспериментировать с различными типами графов, пока мы не столкнулись с данными визуально интуитивно.