Упражнение. Использование запросов для изучения тенденций

Завершено

Вы изучили необработанные данные и диапазон незнакомого метеорологического набора данных. В этом уроке вы будете использовать визуализации для просмотра распределения данных.

Timechart

Помните, что некоторые столбцы данных, которые вы видели в последнем уроке, были типа DateTime, и представляли время начала и окончания для событий шторма. Чтобы узнать, какие даты имеют события storm-data, можно наметить количество записей и времени.

Обратите внимание, что предыдущий модуль использовал подмножество из 50 строк данных, в то время как в этом уроке будет использоваться полный набор данных.

Следующий запрос создает диаграмму времени числа событий шторма в 8-часовом контейнере в качестве функции времени.

  1. Выполните приведенный ниже запрос:

    Выполнить запрос

    StormEvents
    | summarize Count = count() by bin (StartTime, 8h)
    | render timechart
    

    Вы должны получить результаты, аналогичные приведенным на следующем рисунке:

    Снимок экрана: результаты диаграммы времени.

  2. Посмотрите на результирующий граф. Вы видите какие-либо очевидные пробелы или аномалии?

События по состоянию

Другим способом просмотра распределения данных является группирование по расположению событий (в данном случае — состояние), чтобы увидеть, какие тенденции можно понять из распределения.

  1. Выполните приведенный ниже запрос:

    Выполнить запрос

    StormEvents
    | summarize event = count() by State
    | sort by event
    | render barchart 
    

    Вы должны получить результаты, аналогичные приведенным на следующем рисунке:

    Снимок экрана: линейчатая диаграмма с повреждением по состоянию.

  2. Посмотрите на результирующий граф. В списке есть 67 различных штатов, в том числе те, которые не являются официальными штатами в США, таких как "Американская Самоа" и "Гавайские воды". Имеет ли смысл этот тип географического распределения штормов?

  3. Вы можете просмотреть базовые данные, выбрав вкладку "Таблица " над диаграммой. Помогут ли фактические числа лучше понять распределение данных?

    Снимок экрана: таблица данных для диаграммы повреждения.

События по географическому расположению

Вы узнали, как количество событий зависит от времени и состояния. Напомним, что сопоставление схемы показало, что каждая запись события storm содержит latitudinal и longitudinal information. Давайте рассмотрим, как кластеры данных на карте.

  1. Следующий запрос группирует события по географической ячейке и подсчитывает количество событий в каждой ячейке. Эти результаты отображаются на карте, где размер круга соответствует количеству событий в этой ячейке. Выполните приведенный ниже запрос:

    Выполнить запрос

    StormEvents
    | project BeginLon, BeginLat
    | where isnotnull(BeginLat) and isnotnull(BeginLon)
    | summarize count_summary=count() by hash = geo_point_to_s2cell(BeginLon, BeginLat,6)
    | project geo_s2cell_to_central_point(hash), count_summary
    | extend Events = "count"
    | render piechart with (kind = map)
    

    Вы должны получить результаты, аналогичные приведенным на следующем рисунке:

    Снимок экрана: результат диаграммы карты с кругами с числом событий в заданной области.

  2. Попробуйте увеличить масштаб, нажав клавиши CTRL +. Теперь, когда вы видели типы штормов представлены, имеет ли смысл, что есть больше этих типов штормов в северо-восточной части США и залива Мексики?