Применение аналитических сведений в Power BI Desktop для объяснения колебаний в визуализациях

ОБЛАСТЬ ПРИМЕНЕНИЯ: ✔️ Служба Power BI Desktop ❌ Power BI

Часто в визуальных элементах вы видите большое увеличение, а затем резкое падение значений, и интересно о причине таких колебаний. С помощью аналитических сведений в Power BI Desktop эту причину можно узнать всего за несколько щелчков.

Например, рассмотрим следующий визуальный элемент, который показывает Объем продаж по показателям Год и Квартал. Происходит существенное снижение продаж в 2014 году — продажи резко падают между первым и вторым кварталом. В таких случаях можно подробнее исследовать данные, чтобы пояснить такие изменения.

Visual with increases and decreases

Вы можете запросить в Power BI Desktop объяснение роста или снижения показателей на диаграммах, просмотреть на них факторы распределения, а также быстро выполнить автоматический информативный анализ своих данных. Просто щелкните правой кнопкой мыши точку данных и выберите "Объяснить уменьшение" (или увеличить, если предыдущая панель была ниже) или "Анализ >> места, где это распределение отличается, и аналитические сведения доставляются вам в удобном окне".

Insights shown in visual

Аналитика — это контекстная функция, результаты которой зависят от последней точки данных, например предыдущей строки или столбца.

Примечание

Функция аналитики включена по умолчанию в Power BI Desktop.

Использование аналитики

Чтобы использовать аналитические сведения для объяснения увеличения или уменьшения, показанного на диаграммах, просто щелкните правой кнопкой мыши любую точку данных на линейчатой или линейной диаграмме и выберите "Анализ объяснений > увеличения " (или "Объяснить уменьшение", так как все аналитические сведения основаны на изменении предыдущей точки данных).

Show insights menu

Программа Power BI Desktop запустит алгоритмы машинного обучения с использованием данных, и в окне появится визуальный элемент с описанием того, какие категории больше всего повлияли на рост или снижение. По умолчанию аналитические сведения представлены в виде каскадного визуального элемента, как показано на следующем рисунке.

insights pop-up window

С помощью небольших значков в нижней части каскадного визуального элемента можно отобразить аналитические данные в виде точечной диаграммы, гистограммы с накоплением или диаграммы ленты.

trio of insights visuals

В верхней части страницы расположены значки Палец вверх и Палец вниз. С их помощью вы можете оставить отзыв о визуальном элементе и функции. Это обеспечивает обратную связь, но пока не обучает алгоритм и не влияет на следующие результаты использования этой функции.

И, что важно, с помощью кнопки + в верхней части визуального элемента вы можете добавить выбранный визуальный элемент к отчету, как если бы вы создали этот элемент вручную. Затем вы сможете отформатировать или настроить иным способом добавленный визуальный элемент, как и другие визуальные элементы в отчете. Вы можете добавить выбранный визуальный элемент аналитики только при редактировании отчета в Power BI Desktop.

Аналитику можно использовать, когда отчет находится в режиме чтения или правки, что позволяет выполнять в нем анализ данных и создавать визуальные элементы, которые вы можете легко добавлять в отчеты.

Сведения о возвращаемых результатах

Сведения, возвращаемые функцией аналитических сведений, показывают, что изменилось между двумя периодами времени, чтобы вам было проще понять произошедшие изменения.

Например, если Объем продаж увеличился на 55 % между третьим и четвертым кварталом и это относится и к каждой категории продуктов (продажи компьютеров увеличились на 55 %, а также продажи аудио и т. д.), и к каждой стране, и каждому типу клиентов, то это изменение сложно объяснить с помощью имеющихся данных. Но обычно все бывает иначе и мы можем найти отличия, например, в категориях Компьютеры и Бытовая техника продажи выросли на 63 %, а в ТВ и аудио — только на 23 %, и поэтому Компьютеры и Бытовая техника сыграли большую роль в увеличении объема продаж в четвертом квартале по сравнению с третьим. В этом примере можно дать следующее объяснение роста: особенно эффективные продажи в категориях "Компьютеры" и "ТВ и аудио".

Поэтому алгоритм не просто возвращает значения, с которыми связаны самые значимые изменения. Например, если большая часть (98 %) объема продаж приходится на США, то большая часть роста также должна приходиться на США. Но если в США или других странах значительно не изменилась доля от общего объема продаж, категория Страна не будет считаться интересной в этом контексте.

Проще говоря, алгоритм берет все столбцы в модели, рассчитывает разбивку по столбцам для периодов до и после, определяет, насколько значительные изменения произошли в этой разбивке, а затем возвращает столбцы с самыми крупными изменениями. В примере выше была выбрана Категория, так как доля категории ТВ и видео снизилась на 7 % с 33 до 26 %, а доля категории Бытовая техника выросла с нуля до 6 %.

Для каждого возвращенного столбца может отображаться четыре визуальных элемента. Три из этих визуальных элементов подчеркивают изменение доли между двумя периодами. Например, чтобы объяснить рост между вторым и третьим кварталами.

Точечная диаграмма

Точечная диаграмма показывает значение меры в первый период (по оси x) и значение меры во второй период (по оси y) для каждого значения столбца (в данном случае — Категория). Таким образом, как показано на следующем рисунке, точки данных располагаются в зеленой области, если значения увеличились, и в красной — если сократились.

Пунктирная линия показывает среднее значение. Поэтому точки выше линии увеличились больше, чем общий рост, а точки ниже — меньше.

Scatter plot with dotted line

Если значение элемента данных было пустым в любой период, эти элементы не будут отображаться на точечной диаграмме (в нашем примере это Бытовая техника).

Нормированная гистограмма с накоплением

На нормированной гистограмме с накоплением показаны значения меры до и после по выбранному столбцу. Таким образом, вы можете параллельно сравнивать долю до и после. Подсказки показывают фактическую долю для выбранного значения.

100% stacked column chart

Ленточная диаграмма

На ленточной диаграмме также отображается значение меры до и после. Это особенно удобно для просмотра изменений доли, если при этом изменился порядок категорий (например, Компьютеры занимали первое место, а затем опустились на третье).

ribbon chart

Каскадная диаграмма

Четвертый визуальный элемент — это каскадная диаграмма, где отображается основной фактический рост и снижение между периодами. Этот визуальный элемент наглядно показывает фактические изменения, но подчеркивает не изменение доли, а почему эти столбцы считаются интересными.

waterfall chart

При выборе столбцов с наибольшими отличиями в относительных долях учитываются следующие факторы.

  • Учитывается количество элементов, поскольку разница будет иметь меньшее статистическое значение и представлять меньший интерес, если в столбце большое количество элементов.

  • Различия для категорий, где исходные значения были очень большими или очень близкими к нулю, имеют больший вес, чем другие. Например, если категория способствовала только 1% продаж, и это изменилось на 6%, что является более статистически значимым, и поэтому считается более интересным, чем категория, вклад которой изменился с 50% до 55%.

  • Для выбора наиболее важных результатов используются различные эвристические методы, например для изучения других связей между данными.

После изучения различных столбцов выбираются и выводятся столбцы, в которых показано самое большое изменение относительной доли. Для каждого из них самые важные для изменения доли значения выводятся в описании. Кроме того, выводятся значения с наибольшим фактическим ростом или снижением.

Рекомендации и ограничения

Так как результаты анализа основаны на сведениях об изменениях, которые поступают из предыдущей точки данных, они не будут доступны при выборе первой точки данных в визуальном элементе.

В следующем списке представлена подборка сценариев, которые сейчас не поддерживаются для объяснения снижения и роста.

  • фильтры "Ведущие N";
  • фильтры включения и исключения;
  • фильтры мер;
  • нечисловые меры.
  • Использование функции "Показать значение как"
  • Отфильтрованные меры — это расчеты на уровне визуального элемента с применением определенного фильтра (например, Общий объем продаж для Франции), которые используются в некоторых визуальных элементах, созданных функцией аналитических сведений.
  • категориальные столбцы по оси X, только если они не определяют порядок сортировки по столбцам, которые являются скалярными (но если используется иерархия, то каждый столбец в активной иерархии должен соответствовать этому условию);
  • Модели данных с поддержкой RLS или OLS

Кроме того, сейчас для аналитики не поддерживаются следующие типы моделей и источников данных:

  • DirectQuery
  • Live Connect;
  • локальные службы Reporting Services.
  • Внедрение

Функция аналитики не поддерживает отчеты, распределенные как приложение.

Дальнейшие действия

Дополнительные сведения о Power BI Desktop и инструкции по началу работы см. в следующих статьях.