Utiliser des insights dans Power BI Desktop pour identifier les différences de répartition (préversion)Use insights in Power BI Desktop to find where a distribution is different (Preview)

Quand vous examinez un point de données dans un visuel, vous vous demandez souvent si la répartition serait la même pour d’autres catégories.Often in visuals, you see a data point, and wonder about whether distribution would be the same for different categories. Grâce aux insights de Power BI Desktop, vous pouvez obtenir la réponse en quelques clics.With insights in Power BI Desktop you can find out with just a few clicks.

Penchons-nous sur le visuel suivant, qui présente le total des ventes (Total Sales) par pays (Country).Consider the following visual, which shows Total Sales by Country. Comme le montre le graphique, la plupart des ventes sont réalisées aux États-Unis, qui représentent 57 % des ventes totales, la part des autres pays étant plus faible.As the chart shows, most sales come from the United States, accounting for 57% of all sales with lessor contributions coming from the other countries. En pareil cas, il est souvent intéressant de savoir si cette répartition serait identique pour des sous-populations différentes.It's often interesting in such cases to explore whether that same distribution would be seen for different sub-populations. Par exemple, le résultat est-il le même pour toutes les années, tous les canaux de vente et toutes les catégories de produits ?For example, is this the same for all years, all sales channels, and all categories of products? Même s’il est possible d’appliquer des filtres différents et de comparer les résultats visuellement, cette opération s’avère fastidieuse et sujette à des erreurs.While you could apply different filters and compare the results visually, doing so can be time consuming and error prone.

Graphique avec une répartition à grande échelle

Vous pouvez demander à Power BI Desktop de localiser les différences de répartition et obtenir une analyse automatique, rapide et révélatrice de vos données.You can tell Power BI Desktop to find where a distribution is different, and get fast, automated, insightful analysis about your data. Cliquez simplement avec le bouton droit sur un point de données, puis sélectionnez Analyser > Localiser les différences de répartition. Vous obtenez alors des insights dans une fenêtre simple d’utilisation.Simply right-click on a data point, and select Analyze > Find where the distribution is different, and insight is delivered to you in an easy-to-use window.

Insights pour la localisation des différences de répartition

Dans cet exemple, l’analyse automatisée montre rapidement que pour la catégorie Touring Bikes (Vélos de cyclotourisme), la proportion de ventes réalisées aux États-Unis et au Canada est inférieure à celle observée dans les autres pays.In this example, the automated analysis quickly shows that for Touring Bikes, the proportion of sales in the United States and Canada are lower, while the proportion coming from the other countries is higher.

Notes

Cette fonctionnalité étant en préversion, elle est sujette à modification.This feature is in preview, and is subject to change. La fonctionnalité permettant d’obtenir des informations est activée par défaut (vous n’avez pas besoin de cliquer sur une zone d’aperçu pour l’activer) à partir de la version de septembre 2017 de Power BI Desktop.The insight feature is enabled and on by default (you don't need to check a Preview box to enable it) beginning with the September 2017 version of Power BI Desktop.

Utilisation des informationsUsing insights

Pour utiliser les insights de façon à localiser les différences de répartition dans les graphiques, cliquez simplement avec le bouton droit sur un point de données (ou sur le visuel dans sa globalité), puis sélectionnez Analyser > Localiser les différences de répartition.To use insights to find where distributions seen on charts are different, just right-click on any data point (or on the visual as a whole), and select Analyze > Find where the distribution is different.

Cliquez avec le bouton droit pour obtenir des insights

Power BI Desktop exécute alors ses algorithmes de Machine Learning sur les données, puis insère dans une fenêtre un visuel et une description des catégories (colonnes) et des valeurs qui entraînent une différence de répartition la plus significative.Power BI Desktop then runs its machine learning algorithms over the data, and populates a window with a visual and a description that describes which categories (columns), and which values of those columns, result in the most significantly different distribution. Les insights sont fournis sous forme d’histogramme, comme le montre l’image suivante.Insights are provided as a column chart, as shown in the following image.

Histogramme

Les valeurs auxquelles le filtre sélectionné est appliqué s’affichent dans la couleur par défaut normale.The values with the selected filter applied are shown using the normal default color. Les valeurs globales, telles qu’elles sont représentées dans le visuel initial, sont affichées en gris pour faciliter la comparaison.The overall values, as seen on the original starting visual, are shown in grey for easy comparison. Il est possible d’appliquer jusqu’à trois filtres différents (en l’occurrence, Touring Bikes (Vélos de cyclotourisme), Mountain Bikes (VTT), Road Bikes (Vélos de route)). Pour choisir des filtres différents, il suffit de cliquer dessus (ou d’utiliser la combinaison ctrl-clic pour en sélectionner plusieurs).Up to three different filters might be included (Touring Bikes, Mountain Bikes, Road Bikes in this example) and different filters can be chosen by clicking on them (or using ctrl-click to select multiple).

Pour les mesures additives simples, comme Total Sales (Total des ventes) dans cet exemple, la comparaison s’effectue à partir de valeurs relatives, et non absolues.For simple additive measures, like Total Sales in this example, the comparison is based on the relative, rather than absolute, values. Par conséquent, même si les ventes de vélos de cyclotourisme sont plus faibles que les ventes globales qui concernent toutes les catégories, par défaut, le visuel utilise un axe double pour permettre à l’utilisateur de comparer la proportion des ventes dans les différents pays, pour la catégorie Touring Bikes par rapport à toutes les catégories de vélos.Hence while the sales for Touring Bikes are lower than overall sales for all categories, by default the visual uses a dual axis to allow the comparison between the proportion of sales across different countries, for Touring Bikes versus all categories of bikes. En actionnant le bouton bascule situé au bas du visuel, vous pouvez afficher les deux valeurs sur le même axe, ce qui vous permet de comparer facilement les valeurs absolues (comme le montre l’image suivante).Switching the toggle below the visual allows the two values to be displayed in the same axis, allowing the absolute values to easily be compared (as shown in the following image).

visuels utilisant des insights

Le texte descriptif donne aussi des indications sur le niveau d’importance qui peut être lié à une valeur de filtre, selon le nombre d’enregistrements qui correspondent au filtre.The descriptive text also gives some indication of the level of importance that might be attached to a filter value, by given the number of records that match the filter. Ainsi, dans cet exemple, même si la répartition pour la catégorie Touring Bikes (Vélos de cyclotourisme) est nettement différente, celle-ci représente seulement 16,6 % des enregistrements.So in this example, you can see that while the distribution for Touring Bikes might be significantly different, they account for only 16.6% of records.

Les icônes de pouce levé et de pouce baissé en haut de la page vous permettent de commenter le visuel et la fonctionnalité.The thumbs up and thumbs down icons at the top of the page are provided so you can provide feedback about the visual and the feature. En procédant ainsi, vous communiquez des commentaires, mais vous ne formez pas l’algorithme pour influencer les résultats qui seront retournés la prochaine fois que vous utiliserez la fonctionnalité.Doing so provides feedback, but it does not currently train the algorithm to influence the results returned next time you use the feature.

Et surtout, le bouton + en haut d’un visuel vous permet d’ajouter le visuel sélectionné à votre rapport, exactement comme si vous créiez le visuel manuellement.And importantly, the + button at the top of the visual lets you add the selected visual to your report, just as if you created the visual manually. Vous pouvez ensuite mettre en forme ou ajuster autrement le visuel ajouté, comme vous le feriez pour tout autre visuel figurant sur votre rapport.You can then format or otherwise adjust the added visual just as you would to any other visual on your report. Lorsque vous modifiez un rapport dans Power BI Desktop, vous ne pouvez ajouter qu’un seul visuel d’information sélectionné.You can only add a selected insight visual when you're editing a report in Power BI Desktop.

Vous pouvez utiliser cette fonctionnalité d’affichage d’informations lorsque votre rapport est en mode de lecture ou de modification. La fonctionnalité est donc polyvalente pour l’analyse de données et la création de visuels que vous pouvez aisément ajouter à vos rapports.You can use insights when your report is in reading or editing mode, making it versatile for both analyzing data, and for creating visuals you can easily add to your reports.

Détails des résultats retournésDetails of the returned results

Voici comment fonctionne l’algorithme : après avoir pris toutes les autres colonnes du modèle, il applique toutes les valeurs de ces colonnes en guise de filtres au visuel d’origine et identifie les valeurs de filtre qui produisent le résultat le plus différent de l’original.You can think of the algorithm as taking all the other columns in the model, and for all of the values of those columns, applying them as filters to the original visual, and finding which of those filter values produces the most different result from the original.

Vous vous demandez probablement ce que l’on entend par différent.You likely wonder what different means. Par exemple, supposons que la répartition globale des ventes entre les États-Unis et le Canada était la suivante :For example, say that the overall split of sales between the USA and Canada was the following:

PaysCountry Ventes (en millions de dollars)Sales ($M)
USAUSA 1515
CanadaCanada 55

Ensuite, pour une catégorie de produit déterminée (Road Bikes) (Vélos de route), les ventes pouvaient être réparties comme suit :Then for a particular category of product “Road Bike) the split of sales might be:

PaysCountry Ventes (en millions de dollars)Sales ($M)
USAUSA 33
CanadaCanada 11

Même si les chiffres sont différents dans chacun de ces tableaux, les valeurs relatives entre les États-Unis et le Canada sont identiques (75 % et 25 % pour les ventes globales et de vélos de route).While the numbers are different in each of those tables, the relative values between USA and Canada are identical (75% and 25% overall, and for Road Bikes). De ce fait, elles ne sont pas considérées comme étant différentes.Because of that, these are not considered different. Pour des mesures additives simples comme celles-ci, l’algorithme recherche donc des différences dans les valeurs relatives.For simple additive measures like this, the algorithm is therefore looking for differences in the relative value.

Maintenant, penchons-nous sur un autre type de mesure : la marge, qui est calculée en tant que Bénéfice/Coût. Supposons que les marges globales pour les États-Unis et le Canada étaient les suivantes :By contrast consider a measure like margin, that is calculated as Profit/Cost, and say that the overall margins for the USA and Canada were the following

PaysCountry Marge (%)Margin (%)
USAUSA 1515
CanadaCanada 55

Ensuite, pour une catégorie de produit déterminée (Road Bikes) (Vélos de route), les ventes pouvaient être réparties comme suit :Then for a particular category of product “Road Bike) the split of sales might be:

PaysCountry Marge (%)Margin (%)
USAUSA 33
CanadaCanada 11

Compte tenu de la nature de ces mesures, elles sont considérés comme étant différentes et donc intéressantes.Given the nature of such measures, this is considered interestingly different. Par conséquent, pour les mesures non additives telles que cet exemple de marge, l’algorithme recherche des différences dans la valeur absolue.So for non-additive measures such as this margin example, the algorithm is looking for differences in the absolute value.

Les visuels affichés ont donc pour but de mettre en évidence les différences trouvées entre la répartition globale (telle que présentée dans le visuel d’origine) et la valeur après application du filtre spécifique.The visuals displayed are thus intended to clearly show the differences found between the overall distribution (as seen in the original visual) and the value with the particular filter applied.

Ainsi, pour les mesures additives, telles que les ventes (Sales) dans l’exemple précédent, un histogramme et un graphique en courbes sont utilisés, de même qu’un double axe et une mise à l’échelle appropriée pour faciliter la comparaison des valeurs relatives.So for additive measures, like Sales in the previous example, a column and line chart is used, where the use of a dual axis with appropriate scaling such that the relative values can easily be compared. Les colonnes présentent la valeur avec le filtre appliqué, tandis que la ligne présente la valeur globale (l’axe des colonnes étant situé à gauche et l’axe des lignes étant situé à droite, comme à l’habitude).The columns show the value with the filter applied, and the line shows the overall value (with the column axis being on the left, and the line axis on the right, as normal). La ligne s’affiche avec un style en escalier, avec une ligne en pointillés, remplie de gris.The line is shown using a stepped style, with a dashed line, filled with grey. Pour l’exemple précédent, si la valeur maximale de l’axe des colonnes est 4 et que la valeur maximale de l’axe des lignes est 20, les valeurs relatives entre les États-Unis et le Canada sont faciles à comparer pour les valeurs filtrées et les valeurs globales.For the previous example, if the column axis maximum value is 4, and the line axis maximum value is 20, then it would allow easy comparison of the relative values between USA and Canada for the filtered and overall values.

De la même façon, pour les mesures non additives comme la marge (Margin) dans l’exemple précédent, un histogramme et un graphique en courbes sont utilisés, de même qu’un axe unique, ce qui signifie que les valeurs absolues peuvent être facilement comparées.Similarly, for non-additive measures like Margin in the previous example, a column and line chart is used, where the use of a single axis means the absolute values can easily be compared. Là encore, la ligne (remplie de gris) présente la valeur globale.Again the line (filled with grey) shows the overall value. Qu’il s’agisse de comparer des valeurs réelles ou des valeurs relatives, il ne suffit pas de calculer la différence entre les valeurs pour déterminer le degré de différence entre deux répartitions.Whether comparing actual or relative numbers, the determination of the degree to which two distributions are different is not simply a matter of calculating the difference in the values. Par exemple :For example:

  • La taille de la population est prise en compte, car une différence est statistiquement moins significative et moins intéressante quand elle s’applique à une faible proportion de la population globale.The size of the population is factored in, as a difference is less statistically significant and less interesting when it applies to a smaller proportion of the overall population. De ce fait, si la répartition des ventes entre les pays est très différente pour un produit donné, il ne s’agit pas d’un élément intéressant s’il existait plusieurs milliers de produits, car ce produit ne représente qu’un faible pourcentage des ventes globales.As an example, the distribution of sales across countries might be very different for some particular product, this would not be considered interesting if there were thousands of products, and hence that particular product accounted for only a small percentage of the overall sales.

  • Les différences concernant les catégories dont les valeurs d’origine étaient très élevées ou très proches de zéro sont privilégiées par rapport aux autres.Differences for those categories where the original values were very high or very close to zero are weighted higher than others. Par exemple, si la part globale des ventes dans un pays se limite à 1 %, mais que la part pour un certain type de produit est de 6 %, il s’agit d’un élément statistiquement plus significatif et donc considéré comme plus intéressant qu’un pays dont la part est passée de 50 % à 55 %.For example, if a country overall contributes only 1% of sales, but for some particular type of product contributes 6%, that is more statistically significant, and therefore considered more interesting, than a country whose contribution changed from 50% to 55%.

  • Plusieurs méthodes heuristiques sont utilisées pour sélectionner les résultats les plus significatifs, par exemple en prenant en considération d’autres relations entre les données.Various heuristics are employed to select the most meaningful results, for example by considering other relationships between the data.

Après examen des différentes colonnes et des valeurs de chacune de ces colonnes, c’est l’ensemble de valeurs qui présentent les plus grandes différences qui est choisi.After examining different columns, and the values for each of those columns, the set of values that give the biggest differences are chosen. Pour faciliter la compréhension, ces valeurs sont regroupées par colonne, la colonne dont les valeurs présentent la plus grande différence étant répertoriée en premier.For ease of understanding, these are then output grouped by column, with the column whose values give the biggest difference listed first. Chaque colonne contient au maximum trois valeurs, mais peut en présenter moins si le nombre de valeurs ayant un effet important est moindre ou si certaines valeurs ont beaucoup plus d’impact que d’autres.Up to three values are shown per column, but less might be shown either if there were fewer than three values that have a large effect, or if some values are much more impactful than others.

Toutes les colonnes du modèle n’étant pas nécessairement examinées pendant la période disponible, il n’est pas garanti que les colonnes et les valeurs ayant le plus fort impact soient affichées.It is not necessarily the case that all of the columns in the model will be examined in the time available, so it is not guaranteed that the most impactful columns and values are displayed. Cependant, diverses méthodes heuristiques sont utilisées pour faire en sorte que les meilleurs candidats parmi les colonnes soient examinés en premier.However, various heuristics are employed to ensure that the most likely columns are examined first. Par exemple, supposons qu’après examen de toutes les colonnes, il est établi que les colonnes/valeurs suivantes ont le plus fort impact sur la répartition (ordre décroissant) :For example, say that after examining all the columns, it is determined that the following columns/values have the biggest impact on the distribution, from most impact to least:

Subcategory = Touring Bikes
Channel = Direct
Subcategory = Mountain Bikes
Subcategory = Road Bikes
Subcategory = Kids Bikes
Channel = Store

La sortie obtenue en fonction de l’ordre des colonnes est la suivante :These would get output in column order, as follows:

Subcategory: Touring Bikes, Mountain Bikes, Road Bikes (only three listed, with the text including “...amongst others” to indicate that more than three have a significant impact) 

Channel = Direct (only Direct listed, if it’s level of impact was much greater than Store)

Considérations et limitationsConsiderations and limitations

La liste suivante répertorie les scénarios actuellement non pris en charge pour la fonctionnalités d’affichage d’informations :The following list is the collection of currently unsupported scenarios for insights:

  • Filtres TopNTopN filters
  • Filtres de mesuresMeasure filters
  • Mesures non numériquesNon-numeric measures
  • Utilisation de « Afficher la valeur comme »Use of "Show value as"
  • Mesures filtrées - les mesures filtrées sont des calculs effectués au niveau du visuel auxquels est appliqué un filtre spécifique (par exemple, Total des ventes pour la France) ; elles sont utilisées dans certains visuels créés par la fonctionnalité d’insights.Filtered measures - filtered measures are visual level calculations with a specific filter applied (for example, Total Sales for France), and are used on some of the visuals created by the insights feature

De plus, les sources de données et les types de modèles suivants ne sont actuellement pas pris en charge pour la fonctionnalité d’affichage d’informations :In addition, the following model types and data sources are currently not supported for insights:

  • DirectQueryDirectQuery
  • Live ConnectLive connect
  • Reporting Services en localOn-premises Reporting Services
  • IncorporationEmbedding

Étapes suivantesNext steps

Pour plus d’informations sur Power BI Desktop et la prise en main de cette solution, voir les articles suivants.For more information about Power BI Desktop, and how to get started, check out the following articles.