Visualisation des influenceurs clésKey influencers visualization

Notes

Ces visuels peuvent être créés et affichés à la fois dans Power BI Desktop et dans le service Power BI.These visuals can be created and viewed in both Power BI Desktop and the Power BI service. Les étapes et les illustrations de cet article proviennent de Power BI Desktop.The steps and illustrations in this article are from Power BI Desktop.

Le visuel d’influenceurs clés vous aide à comprendre les facteurs affectant une métrique qui vous intéresse.The key influencers visual helps you understand the factors that drive a metric you're interested in. Il analyse vos données, classe les facteurs qui sont importants et les affiche sous forme d’influenceurs clés.It analyzes your data, ranks the factors that matter, and displays them as key influencers. Par exemple, supposons que vous souhaitez déterminer ce qui influence le renouvellement du personnel.For example, suppose you want to figure out what influences employee turnover, which is also known as churn. L’un des facteurs peut être la longueur du contrat d’emploi et un autre l’âge de l’employé.One factor might be employment contract length, and another factor might be employee age.

Quand utiliser des influenceurs clésWhen to use key influencers

Le visuel d’influenceurs clés constitue un excellent choix quand vous souhaitez :The key influencers visual is a great choice if you want to:

  • Voir quels facteurs affectent la métrique en cours d’analyse.See which factors affect the metric being analyzed.
  • Comparer l’importance relative de ces facteurs.Contrast the relative importance of these factors. Par exemple, les contrats à court terme ont-ils plus d’impact sur le renouvellement du personnel que les contrats à long terme ?For example, do short-term contracts have more impact on churn than long-term contracts?

Fonctionnalités du visuel d’influenceurs clésFeatures of the key influencers visual

Fonctionnalités numérotées

  1. Onglets : sélectionnez un onglet pour changer de vue.Tabs: Select a tab to switch between views. Influenceurs clés montre les principaux contributeurs à la valeur de métrique sélectionnée.Key influencers shows you the top contributors to the selected metric value. Top des segments montre les principaux segments qui contribuent à la valeur de métrique sélectionnée.Top segments shows you the top segments that contribute to the selected metric value. Un segment est composé d’une combinaison de valeurs.A segment is made up of a combination of values. Par exemple, un segment peut représenter les consommateurs qui sont clients depuis au moins 20 ans et qui habitent dans la région Ouest.For example, one segment might be consumers who have been customers for at least 20 years and live in the west region.

  2. Zone de liste déroulante : valeur de la métrique étudiée.Drop-down box: The value of the metric under investigation. Dans cet exemple, examinez la métrique Évaluation.In this example, look at the metric Rating. La valeur sélectionnée est Faible.The selected value is Low.

  3. Répétition : permet d’interpréter le visuel dans le volet gauche.Restatement: It helps you interpret the visual in the left pane.

  4. Volet gauche : le volet gauche contient un visuel.Left pane: The left pane contains one visual. Ici, le volet gauche montre une liste des principaux influenceurs clés.In this case, the left pane shows a list of the top key influencers.

  5. Répétition : permet d’interpréter le visuel dans le volet droit.Restatement: It helps you interpret the visual in the right pane.

  6. Volet droit : le volet droit contient un visuel.Right pane: The right pane contains one visual. Ici, l’histogramme affiche toutes les valeurs pour l’influenceur clé Thème qui est sélectionné dans le volet gauche.In this case, the column chart displays all the values for the key influencer Theme that was selected in the left pane. La valeur spécifique (usage) dans le volet gauche est indiquée en vert.The specific value of usability from the left pane is shown in green. Toutes les autres valeurs pour Thème sont en noir.All the other values for Theme are shown in black.

  7. Ligne moyenne : La moyenne est calculée pour toutes les autres valeurs possibles pour Thème sauf usability (utilisabilité) (qui est l’influenceur sélectionné).Average line: The average is calculated for all possible values for Theme except usability (which is the selected influencer). Le calcul s’applique donc à toutes les valeurs en noir.So the calculation applies to all the values in black. Il vous indique quel pourcentage des autres Thèmes a donné une évaluation faible.It tells you what percentage of the other Themes had a low rating. Dans ce cas, 11,35 % avait une évaluation faible (indiquée par la ligne en pointillés).In this case 11.35% had a low rating (shown by the dotted line).

  8. Case à cocher : Filtre le visuel dans le volet droit pour afficher uniquement les valeurs qui sont des influenceurs pour ce champ.Check box: Filters out the visual in the right pane to only show values that are influencers for that field. Dans cet exemple, cela permet de filtrer le visuel sur l’utilisabilité, la sécurité et la navigation.In this example, this would filter the visual to usability, security and navigation.

Analyser une métrique de catégorieAnalyze a metric that is categorical

Regardez cette vidéo pour découvrir comment créer un visuel d’influenceurs clés avec une métrique de catégorie.Watch this video to learn how to create a key influencers visual with a categorical metric. Effectuez ensuite ces étapes pour en créer un.Then follow these steps to create one.

Notes

Cette vidéo utilise une version antérieure de Power BI Desktop.This video uses an earlier version of Power BI Desktop.

Votre responsable produit vous demande d’identifier les facteurs qui poussent les clients à laisser des avis négatifs sur votre service cloud.Your Product Manager wants you to figure out which factors lead customers to leave negative reviews about your cloud service. Pour suivre la procédure, ouvrez le fichier PBIX de commentaires client dans Power BI Desktop.To follow along, open the Customer Feedback PBIX file in Power BI Desktop. Vous pouvez également télécharger le fichier Excel de commentaires client pour le service Power BI ou Power BI Desktop.You also can download the Customer Feedback Excel file for Power BI service or Power BI Desktop. Sélectionnez l’un des liens, puis sélectionnez Télécharger dans la page GitHub qui s’ouvre.Select either link and then select Download from the GitHub page that opens.

Notes

Le jeu de données de commentaires clients est basé sur [Moro et al., 2014] S. Moro, P. Cortez et P. Rita.The Customer Feedback data set is based on [Moro et al., 2014] S. Moro, P. Cortez, and P. Rita. « A Data-Driven Approach to Predict the Success of Bank Telemarketing. »"A Data-Driven Approach to Predict the Success of Bank Telemarketing." Decision Support Systems, Elsevier, 62:22-31, juin 2014.Decision Support Systems, Elsevier, 62:22-31, June 2014.

  1. Ouvrez le rapport et sélectionnez l’icône Influenceurs clés.Open the report, and select the Key influencers icon.

    Dans le volet Visualisations, sélectionnez le modèle Influenceurs clés.

  2. Déplacez la métrique que vous voulez examiner dans le champ Analyser.Move the metric you want to investigate into the Analyze field. Pour voir les facteurs qui incitent les clients à laisser une évaluation faible, sélectionnez Table des clients > Évaluation.To see what drives a customer rating of the service to be low, select Customer Table > Rating.

  3. Déplacez les champs qui selon vous pourraient influencer Évaluation dans le champ Expliquer par.Move fields that you think might influence Rating into the Explain by field. Vous pouvez déplacer autant de champs que vous le souhaitez.You can move as many fields as you want. Dans ce cas, démarrez avec :In this case, start with:

    • Pays-RégionCountry-Region
    • Rôle dans l’orgRole in Org
    • Type d’abonnementSubscription Type
    • Taille de l’entrepriseCompany Size
    • ThèmeTheme
  4. Laissez vide le champ Développer par.Leave the Expand by field empty. Ce champ est utilisé seulement lors de l’analyse d’une mesure ou d’un champ synthétisé.This field is only used when analyzing a measure or summarized field.

  5. Pour vous concentrer sur les évaluations négatives, sélectionnez Faible dans la zone de liste déroulante Ce qui influence l’évaluation.To focus on the negative ratings, select Low in the What influences Rating to be drop-down box.

    Sélectionner Faible dans la zone de liste déroulante

L’analyse s’exécute au niveau table du champ en cours d’analyse.The analysis runs on the table level of the field that's being analyzed. Dans ce cas, il s’agit de la métrique Évaluation.In this case, it's the Rating metric. Cette métrique est définie au niveau client.This metric is defined at a customer level. Chaque client a donné un score élevé ou un score faible.Each customer has given either a high score or a low score. Tous les facteurs explicatifs doivent être définis au niveau client pour que le visuel puisse les utiliser.All the explanatory factors must be defined at the customer level for the visual to make use of them.

Dans l’exemple précédent, tous les facteurs explicatifs ont une relation un-à-un ou plusieurs-à-un avec la métrique.In the previous example, all of the explanatory factors have either a one-to-one or a many-to-one relationship with the metric. Dans ce cas, chaque client a affecté un seul thème à son évaluation.In this case, each customer assigned a single theme to their rating. De même, les clients proviennent d’un pays, ont un type d’appartenance et jouent un rôle dans leur organisation.Similarly, customers come from one country, have one membership type, and perform one role in their organization. Les facteurs explicatifs sont déjà des attributs d’un client et aucune transformation n’est nécessaire.The explanatory factors are already attributes of a customer, and no transformations are needed. Le visuel peut les utiliser immédiatement.The visual can make immediate use of them.

Plus loin dans le tutoriel, vous examinerez des exemples plus complexes avec des relations un-à-plusieurs.Later in the tutorial, you look at more complex examples that have one-to-many relationships. Dans ces cas-là, vous devrez d’abord agréger les colonnes au niveau client avant de pouvoir exécuter l’analyse.In those cases, the columns have to first be aggregated down to the customer level before you can run the analysis.

Les métriques et agrégats utilisés comme facteurs explicatifs sont également évalués au niveau table de la métrique Analyse.Measures and aggregates used as explanatory factors are also evaluated at the table level of the Analyze metric. Vous verrez quelques exemples plus loin dans cet article.Some examples are shown later in this article.

Interpréter les influenceurs clés catégorielsInterpret categorical key influencers

Jetons un œil aux influenceurs clés pour les évaluations faibles.Let's take a look at the key influencers for low ratings.

Principal facteur influençant la probabilité d’une évaluation faibleTop single factor that influences the likelihood of a low rating

Dans cet exemple, le client peut avoir trois rôles : consommateur, administrateur et éditeur.The customer in this example can have three roles: consumer, administrator, and publisher. Le fait d’être un consommateur est le principal facteur contribuant à une évaluation faible.Being a consumer is the top factor that contributes to a low rating.

Sélectionner Rôle dans l’org est consommateur

Plus précisément, vos consommateurs sont 2,57 fois plus susceptibles d’attribuer à votre service un score négatif.More precisely, your consumers are 2.57 times more likely to give your service a negative score. Le graphique d’influenceurs clés mentionne Rôle dans l’org est consommateur en premier dans la liste sur la gauche.The key influencers chart lists Role in Org is consumer first in the list on the left. En sélectionnant Rôle dans l’org est consommateur, Power BI affiche des détails supplémentaires dans le volet droit.By selecting Role in Org is consumer, Power BI shows additional details in the right pane. L’effet comparatif de chaque rôle sur la probabilité d’une évaluation faible est indiqué.The comparative effect of each role on the likelihood of a low rating is shown.

  • 14,93 % des consommateurs attribuent un score faible.14.93% of consumers give a low score.
  • En moyenne, tous les autres rôles attribuent un score faible 5,78 % du temps.On average, all other roles give a low score 5.78% of the time.
  • Les consommateurs sont 2,57 fois plus susceptibles d’attribuer un score faible par rapport à tous les autres rôles.Consumers are 2.57 times more likely to give a low score compared to all other roles. Vous pouvez déterminer cela en divisant la barre verte par la ligne rouge en pointillés.You can determine this by dividing the green bar by the red dotted line.

Deuxième facteur influençant la probabilité d’une évaluation faibleSecond single factor that influences the likelihood of a low rating

Le visuel d’influenceurs clés compare et classe les facteurs à partir de nombreuses variables différentes.The key influencers visual compares and ranks factors from many different variables. Le deuxième influenceur n’a rien à voir avec Rôle dans l’org. Sélectionnez le deuxième influenceur dans la liste, à savoir Thème est usage.The second influencer has nothing to do with Role in Org. Select the second influencer in the list, which is Theme is usability.

Sélectionner Thème est usage

Le deuxième facteur le plus important est lié au thème de l’évaluation du client.The second most important factor is related to the theme of the customer’s review. Les clients qui ont commenté l’usage du produit étaient 2,55 fois plus susceptibles d’attribuer un score faible par rapport aux clients ayant commenté d’autres thèmes tels que la fiabilité, la conception ou la vitesse.Customers who commented about the usability of the product were 2.55 times more likely to give a low score compared to customers who commented on other themes, such as reliability, design, or speed.

Entre les visuels, la moyenne (ligne rouge en pointillés) est passé de 5,78 % à 11,34 %.Between the visuals, the average, which is shown by the red dotted line, changed from 5.78% to 11.34%. La moyenne est dynamique, car elle est basée sur la moyenne de toutes les autres valeurs.The average is dynamic because it's based on the average of all other values. Pour le premier influenceur, la moyenne exclut le rôle client.For the first influencer, the average excluded the customer role. Pour le deuxième influenceur, elle exclut le thème de l’usage.For the second influencer, it excluded the usability theme.

Cochez la case Afficher uniquement les valeurs qui sont des influenceurs pour filtrer en utilisant uniquement les valeurs influentes.Select the Only show values that are influencers check box to filter by using only the influential values. Dans ce cas, ils s’agit des rôles qui génèrent un score faible.In this case, they're the roles that drive a low score. Sur les douze thèmes, Power BI en retient quatre générant des évaluations faibles.Twelve themes are reduced to the four that Power BI identified as the themes that drive low ratings.

Cocher la case

Interagir avec d’autres visuelsInteract with other visuals

Chaque fois que vous sélectionnez un segment, un filtre ou un autre visuel sur le canevas, le visuel d’influenceurs clés réexécute son analyse sur la nouvelle portion de données.Every time you select a slicer, filter, or other visual on the canvas, the key influencers visual reruns its analysis on the new portion of data. Par exemple, vous pouvez déplacer Taille de l’entreprise dans le rapport et l’utiliser comme segment.For example, you can move Company Size into the report and use it as a slicer. Utilisez-le pour voir si les influenceurs clés pour nos clients en entreprise diffèrent de ceux de la population générale.Use it to see if the key influencers for your enterprise customers are different than the general population. Une grande entreprise est une organisation qui compte plus de 50 000 employés.An enterprise company size is larger than 50,000 employees.

Sélectionnez > 50 000 pour réexécuter l’analyse. Vous pouvez alors voir que les influenceurs ont changé.Selecting >50,000 reruns the analysis, and you can see that the influencers changed. Pour les clients des grandes entreprises, le principal influenceur pour les évaluations faibles a un thème lié à la sécurité.For large enterprise customers, the top influencer for low ratings has a theme related to security. Vous souhaiterez peut-être approfondir vos recherches afin de déterminer s’il existe des fonctionnalités de sécurité spécifiques dont vos clients de grandes entreprises ne sont pas satisfaits.You might want to investigate further to see if there are specific security features your large customers are unhappy about.

Segment par taille d’entreprise

Interpréter les influenceurs clés continusInterpret continuous key influencers

Jusqu’à présent, vous avez vu comment utiliser le visuel pour explorer la manière dont différents champs de catégorie influencent les évaluations faibles.So far, you've seen how to use the visual to explore how different categorical fields influence low ratings. Il est également possible d’avoir des facteurs continus tels que l’âge, la hauteur et le prix dans le champ Expliquer par.It's also possible to have continuous factors such as age, height, and price in the Explain by field. Examinons à présent ce qui se passe si nous déplaçons Ancienneté de la table des clients dans Expliquer par.Let’s look at what happens when Tenure is moved from the customer table into Explain by. L’ancienneté représente depuis combien de temps le client utilise le service.Tenure depicts how long a customer has used the service.

À mesure que l’ancienneté augmente, la probabilité de recevoir une évaluation plus faible augmente également.As tenure increases, the likelihood of receiving a lower rating also increases. Cette tendance suggère que les clients à long terme sont plus susceptibles d’attribuer un score négatif.This trend suggests that the longer-term customers are more likely to give a negative score. Cet insight est intéressant et peut faire l’objet d’un suivi par la suite.This insight is interesting, and one that you might want to follow up on later.

La visualisation montre que chaque fois que l’ancienneté augmente de 13,44 mois, en moyenne la probabilité d’une évaluation faible est multipliée par 1,23.The visualization shows that every time tenure goes up by 13.44 months, on average the likelihood of a low rating increases by 1.23 times. Ici, 13,44 mois représente l’écart type pour Ancienneté.In this case, 13.44 months depict the standard deviation of tenure. Ainsi, l’insight que vous obtenez examine comment le fait d’augmenter l’ancienneté d’une certaine valeur (c’est-à-dire l’écart type pour l’ancienneté) affecte la probabilité de recevoir une évaluation faible.So the insight you receive looks at how increasing tenure by a standard amount, which is the standard deviation of tenure, affects the likelihood of receiving a low rating.

Le nuage de points dans le volet droit trace le pourcentage moyen d’évaluations faibles pour chaque valeur d’ancienneté.The scatter plot in the right pane plots the average percentage of low ratings for each value of tenure. Il met en évidence la pente avec une courbe de tendance.It highlights the slope with a trend line.

Nuage de points pour Ancienneté

Influenceurs clés continus compartimentésBinned continuous key influencers

Dans certains cas, vous pouvez constater que vos facteurs continus ont été automatiquement convertis en catégories.In some cases you may find that your continuous factors were automatically turned into categorical ones. Cela est dû au fait que nous avons découvert que la relation entre les variables n’est pas linéaire et que nous ne pouvons pas décrire la relation comme une simple augmentation ou une diminution (comme nous l’avons fait dans l’exemple ci-dessus).This is because we realized the relationship between the variables is not linear and so we cannot describe the relationship as simply increasing or decreasing (like we did in the example above).

Nous exécutons des tests de corrélation pour déterminer la linéarité de l’influenceur par rapport à la cible.We run correlation tests to determine how linear the influencer is with regards to the target. Si la cible est continue, nous exécutons la corrélation de Pearson et, si la cible est une catégorie, nous exécutons des tests de corrélation bisérielle de points.If the target is continuous, we run Pearson correlation and if the target is categorical, we run Point Biserial correlation tests. Si nous détectons que la relation n’est pas suffisamment linéaire, nous traitons des compartimentages supervisés et générons un maximum de 5 emplacements. Pour déterminer les emplacements les plus significatifs, nous utilisons une méthode de compartimentage supervisée qui examine la relation entre le facteur explicatif et la cible analysée.If we detect the relationship is not sufficiently linear we conduct supervised binning and generate a maximum of 5 bins. To figure out which bins make the most sense we use a supervised binning method which looks at the relationship between the explanatory factor and the target being analyzed.

Interpréter les mesures et agrégats comme influenceurs clésInterpret measures and aggregates as key influencers

Vous pouvez utiliser des mesures et des agrégats comme facteurs explicatifs dans votre analyse.You can use measures and aggregates as explanatory factors inside your analysis. Par exemple, vous pouvez souhaiter connaître l’impact du nombre de tickets de support client ou de la durée moyenne d’un ticket ouvert sur le score que vous recevez.For example, you might want to see what effect the count of customer support tickets or the average duration of an open ticket has on the score you receive.

Ici, vous voulez voir si le nombre de tickets de support d’un client a un impact sur le score qu’il attribue.In this case, you want to see if the number of support tickets that a customer has influences the score they give. Importez à présent l’ID de ticket de support à partir de la table de ticket de support.Now you bring in Support Ticket ID from the support ticket table. Un client pouvant avoir plusieurs tickets de support, vous agrégez l’ID au niveau client.Because a customer can have multiple support tickets, you aggregate the ID to the customer level. L’agrégation est importante car l’analyse s’exécute au niveau client, et tous les facteurs doivent donc être définis à ce niveau de granularité.Aggregation is important because the analysis runs on the customer level, so all drivers must be defined at that level of granularity.

Examinons le nombre d’ID.Let's look at the count of IDs. Chaque ligne de client est donc associée à un nombre de tickets de support.Each customer row has a count of support tickets associated with it. Ici, à mesure que le nombre de tickets de support augmente, la probabilité de recevoir une évaluation faible est multipliée par 5,51.In this case, as the count of support tickets increases, the likelihood of the rating being low goes up 5.51 times. Le visuel de droite indique le nombre moyen de tickets de support en fonction de différentes valeurs Évaluation au niveau client.The visual on the right shows the average number of support tickets by different Rating values evaluated at the customer level.

Influence du nombre d’ID de ticket de support

Interprétez les résultats : Top des segmentsInterpret the results: Top segments

Vous pouvez utiliser l’onglet Influenceurs clés pour évaluer chaque facteur individuellement.You can use the Key influencers tab to assess each factor individually. Vous pouvez également utiliser l’onglet Top des segments pour voir comment une combinaison de facteurs affecte la métrique que vous analysez.You also can use the Top segments tab to see how a combination of factors affects the metric that you're analyzing.

Top des segments montre initialement une vue d’ensemble de tous les segments découverts par Power BI.Top segments initially show an overview of all the segments that Power BI discovered. L’exemple suivant montre que six segments ont été trouvés.The following example shows that six segments were found. Ces segments sont classés en fonction du pourcentage d’évaluations faibles dans le segment.These segments are ranked by the percentage of low ratings within the segment. Le segment 1, par exemple, a 74,3 % d’évaluations de client qui sont faibles.Segment 1, for example, has 74.3% customer ratings that are low. Plus la bulle est haute, plus la proportion d’évaluations faibles est élevée.The higher the bubble, the higher the proportion of low ratings. La taille de la bulle représente le nombre de clients inclus dans le segment.The size of the bubble represents how many customers are within the segment.

Sélectionner l’onglet Top des segments

La sélection d’une bulle permet d’explorer les détails de ce segment.Selecting a bubble drills into the details of that segment. Si vous sélectionnez par exemple le segment 1, vous observez qu’il est constitué de clients relativement anciens.If you select Segment 1, for example, you find that it's made up of relatively established customers. Ils sont clients depuis plus de 29 mois et ont plus de quatre tickets de support.They've been customers for over 29 months and have more than four support tickets. Pour finir, il ne s’agit pas d’éditeurs (ils sont donc consommateurs ou administrateurs).Finally, they're not publishers, so they're either consumers or administrators.

Dans ce groupe, 74,3 % des clients ont attribué une évaluation faible.In this group, 74.3% of the customers gave a low rating. Le client moyen attribue une évaluation faible 11,7 % du temps. Ce segment a donc une proportion nettement plus élevée d’évaluations faiblesThe average customer gave a low rating 11.7% of the time, so this segment has a larger proportion of low ratings. (63 points de pourcentage en plus).It's 63 percentage points higher. Le segment 1 contient également environ 2,2 % des données. Il représente donc une partie de la population pouvant être identifiée et ciblée.Segment 1 also contains approximately 2.2% of the data, so it represents an addressable portion of the population.

Sélectionner le premier segment principal

Ajout de décomptesAdding counts

Parfois, un influenceur peut avoir un impact important, mais représenter très peu de données.Sometimes an influencer can have a big impact but represent very little of the data. Par exemple, Thème est usability (utilisabilité) est le deuxième plus grand influenceur pour les évaluations basses.For example, Theme is usability is the second biggest influencer for low ratings. Cependant, il n’y a qu’un petit nombre de clients qui se sont plaint de l’utilisabilité.However there might have only been a handful of customers who complained about usability. Les décomptes peuvent vous aider à hiérarchiser les influenceurs sur lesquels vous voulez vous concentrer.Counts can help you prioritize which influencers you want to focus on.

Vous pouvez activer les décomptes via la Carte d’analyse du volet de mise en forme.You can turn counts on through the Analysis card of the formatting pane.

Ajouter des décomptes

Une fois les décomptes activés, vous verrez un anneau autour de la bulle de chaque influenceur, qui représente le pourcentage approximatif de données contenues dans l’influenceur.Once counts are turned on, you’ll see a ring around each influencer’s bubble, which represents the approximate percentage of data that influencer contains. Plus la partie de la bulle encerclée par l’anneau est importante, plus il contient de données.The more of the bubble the ring circles, the more data it contains. Nous pouvons voir que Thème est usability (utilisabilité) contient une très petite proportion des données.We can see that Theme is usability contains a very small proportion of data.

Montrer les décomptes

Vous pouvez également utiliser la bascule Trier par dans le coin inférieur gauche du visuel pour trier les bulles d’abord par décompte au lieu de les trier par impact.You can also use the Sort by toggle in the bottom left of the visual to sort the bubbles by count first instead of impact. Type d’abonnement est Premier est le premier influenceur en fonction du décompte.Subscription Type is Premier is the top influencer based on count.

Trier par décomptes

Si vous avez un anneau complet autour du cercle, cela signifie que l’influenceur contient 100 % des données.Having a full ring around the circle means the influencer contains 100% of the data. Vous pouvez changer le type de décompte pour qu’il soit relatif à l’influenceur maximal en utilisant la liste déroulante Type de décompte dans la Carte d’analyse du volet de mise en forme.You can change the count type to be relative to the maximum influencer using the Count type dropdown in the Analysis card of the formatting pane. À présent, l’influenceur avec la plus grande quantité de données est représenté par un anneau complet, et tous les autres décomptes sont relatifs à cet influenceur.Now the influencer with the most amount of data will be represented by a full ring and all other counts will be relative to it.

Montrer des décomptes relatifs

Analyser une métrique numériqueAnalyze a metric that is numeric

Si vous déplacez un champ numérique non synthétisé dans le champ Analyser, vous pouvez choisir comment gérer ce scénario.If you move an unsummarized numerical field into the Analyze field, you have a choice how to handle that scenario. Pour changer le comportement du visuel, accédez au volet de mise en forme et basculez entre le type d’analyse Catégorie et le type d’analyse Continu.You can change the behavior of the visual by going into the Formatting Pane and switching between Categorical Analysis Type and Continuous Analysis Type.

Remplacer Catégorie par Continu

Un type d’analyse Catégorie se comporte comme dans la description ci-dessus.A Categorical Analysis Type behaves as described above. Par exemple, si vous passez en revue les scores d’une enquête allant de 1 à 10, vous pouvez vous poser la question suivante : « Quels sont les facteurs qui contribuent à l’obtention d’un score d’enquête de 1 ? ».For instance, if you were looking at survey scores ranging from 1 to 10, you could ask ‘What influences Survey Scores to be 1?’

Un type d’analyse Continu change la question en question continue.A Continuous Analysis Type changes the question to a continuous one. Dans l’exemple ci-dessus, notre nouvelle question serait la suivante : « Quels sont les facteurs qui influent sur l’augmentation ou la diminution des scores d’enquête ? ».In the example above, our new question would be ‘What influences Survey Scores to increase/decrease?’

Cette distinction est très utile quand vous avez un grand nombre de valeurs uniques dans le champ que vous analysez.This distinction is very helpful when you have lots of unique values in the field you are analyzing. Dans l’exemple ci-dessous, nous allons examiner le prix d’une maison.In the example below we look at house prices. La question « Quels sont les facteurs qui contribuent à l’obtention d’un prix de 156 214 $ ? » n’a guère d’utilité.It is not very meaningful to ask ‘What influences House Price to be 156,214?’ Elle est en effet très spécifique, et nous risquons de ne pas avoir suffisamment de données pour en déduire une tendance.as that is very specific and we are likely not to have enough data to infer a pattern.

Au lieu de cela, nous pouvons nous poser la question suivante : « Quels sont les facteurs qui influencent l’augmentation du prix d’une maison ? ».Instead we may want to ask, ‘What influences House Price to increase’? Nous pouvons ainsi traiter le prix de la maison comme une plage et non comme une valeur distincte.which allows us to treat house prices as a range rather than distinct values.

Question numérique

Interprétez les résultats : Influenceurs clésInterpret the results: Key influencers

Dans ce scénario, nous examinons les facteurs qui influent sur l’augmentation du prix d’une maison.In this scenario we look at ‘What influences House Price to increase’. Nous nous intéressons à plusieurs facteurs explicatifs susceptibles d’impacter le prix d’une maison, notamment Year Built (année de construction), KitchenQual (qualité de la cuisine) et YearRemodAdd (année de rénovation).We are looking at a number of explanatory factors that could impact a house price like Year Built (year the house was built), KitchenQual (kitchen quality) and YearRemodAdd (year the house was remodeled).

Dans l’exemple ci-dessous, nous examinons notre influenceur principal, à savoir une cuisine d’excellente qualité.In the example below we look at our top influencer which is kitchen quality being Excellent. Les résultats sont très similaires à ceux que nous avons vu quand nous analysions les métriques catégorielles, avec toutefois quelques différences importantes :The results are very similar to the ones we saw when we were analyzing categorical metrics with a few important differences:

  • L’histogramme sur la droite s’intéresse aux moyennes plutôt qu’aux pourcentages.The column chart on the right is looking at the averages rather than percentages. Il nous montre donc le prix moyen d’une maison équipée d’une cuisine d’excellente qualité (barre verte) par rapport au prix moyen d’une maison sans une telle cuisine (ligne en pointillés).It therefore shows us what the average house price of a house with an excellent kitchen is (green bar) compared to the average house price of a house without an excellent kitchen (dotted line)
  • Le chiffre dans la bulle est la différence entre la ligne en pointillés rouge et la barre verte, mais elle est exprimée sous forme d’un nombre (158 490 $) et non d’une probabilité (1,93 fois).The number in the bubble is still the difference between the red dotted line and green bar but it’s expressed as a number ($158.49K) rather than a likelihood (1.93x). Ainsi, en moyenne, les maisons équipées d’une cuisine d’excellente qualité sont presque 160 000 $ plus chères que les maisons sans une telle cuisine.So on average, houses with excellent kitchens are almost $160K more expensive than houses without excellent kitchens.

Influenceurs de catégorie d’une cible numérique

Dans l’exemple ci-dessous, nous nous intéressons à l’impact d’un facteur continu (année de rénovation) sur le prix d’une maison.In the example below we are looking at the impact a continuous factor (year house was remodeled) has on house price. Les différences par rapport à la façon dont nous analysons les influenceurs continus pour les métriques de catégorie sont les suivantes :The differences compared to how we analyze continuous influencers for categorical metrics are as follows:

  • Le nuage de points dans le volet droit indique le prix moyen d’une maison pour chaque année de rénovation.The scatter plot in the right pane plots the average house price for each distinct value of year remodeled.
  • La valeur dans la bulle indique dans quelle mesure le prix moyen d’une maison augmente (ici, de 2 870 $) quand l’année de rénovation de la maison augmente de son écart type (dans ce cas, 20 ans).The value in the bubble shows by how much the average house price increases (in this case $2.87k) when the year the house was remodeled increases by its standard deviation (in this case 20 years)

Influenceurs continus d’une cible numérique

Enfin, dans le cas des mesures, nous examinons l’année moyenne de la construction d’une maison.Finally, in the case of measures we are looking at the average year a house was built. L’analyse ici est la suivante :The analysis here is as follows:

  • Le nuage de points dans le volet droit indique le prix moyen d’une maison pour chaque valeur distincte dans la table.The scatterplot in the right pane plots the average house price for each distinct value in the table
  • La valeur dans la bulle indique dans quelle mesure le prix moyen d’une maison augmente (ici, de 1 350 $) quand l’année moyenne augmente de son écart type (dans ce cas, 30 ans).The value in the bubble shows by how much the average house price increases (in this case $1.35K) when the average year increases by its standard deviation (in this case 30 years)

Influenceurs de mesure d’une cible numérique

Interprétez les résultats : Top des segmentsInterpret the results: Top Segments

Le top des segments pour les cibles numériques montre les groupes pour lesquels le prix de la maison est en moyenne supérieur à celui du jeu de données d’ensemble.Top segments for numerical targets show groups where the house prices on average are higher than in the overall dataset. Par exemple, nous pouvons voir ci-dessous que le Segment 1 se compose de maisons où GarageCars (capacité du garage en nombre de voitures) est supérieur à 2 et où RoofStyle est Hip.For example, below we can see that Segment 1 is made up of houses where GarageCars (number of cars the garage can fit) is greater than 2 and the RoofStyle is Hip. Les maisons présentant ces caractéristiques ont un prix moyen de 355 000 $, tandis que la moyenne globale dans les données est de 180 000 $.Houses with those characteristics have an average price of $355K compared to the overall average in the data which is $180K.

Influenceurs de mesure pour des cibles numériques

Analyser une métrique qui est une mesure ou une colonne synthétiséeAnalyze a metric that is a measure or a summarized column

Dans le cas d’une mesure ou d’une colonne synthétisée, l’analyse est définie par défaut sur le Type d’analyse continue décrit ci-dessus.In the case of a measure or summarized column the analysis defaults to the Continuous Analysis Type described above. Ceci ne peut pas être modifié.This cannot be changed. La plus grande différence entre l’analyse d’une mesure/colonne synthétisée et une colonne numérique non synthétisée est le niveau auquel l’analyse est effectuée.The biggest difference between analyzing a measure/summarized column and an unsummarized numeric column is the level at which the analysis runs.

Dans le cas de colonnes non synthétisées, l’analyse est toujours effectuée au niveau de la table.In the case of unsummarized columns, the analysis always runs at the table level. Dans l’exemple du prix des maisons ci-dessus, nous avons analysé la métrique House Price (Prix de la maison) pour voir ce qui influence l’augmentation/diminution du prix d’une maison.In the house price example above, we analyzed the House Price metric to see what influences a house price to increase/decrease. L’analyse s’effectue automatiquement au niveau de la table.The analysis automatically runs on the table level. Notre table a un ID unique pour chaque maison, de sorte que l’analyse s’effectue au niveau de la maison.Our table has a unique ID for each house so the analysis runs at a house level.

Table de mesures

Pour les mesures et les colonnes synthétisées, nous ne savons pas immédiatement à quel niveau les analyser.For measures and summarized columns, we don't immediately know what level to analyze them at. Si House Price (Prix de la maison) était synthétisé sous forme de Moyenne, nous devrions déterminer à quel niveau nous voulons que le prix moyen d’une maison soit calculé.If House Price was summarized as an Average, we would need to consider what level we would like this average house price calculated. S’agit-il du prix moyen d’une maison au niveau du voisinage ?Is it the average house price at a neighborhood level? Ou peut-être au niveau régional ?Or perhaps a regional level?

Les mesures et les colonnes synthétisées sont automatiquement analysées au niveau des champs Expliquer par utilisés.Measures and summarized columns are automatically analyzed at the level of the Explain by fields used. Imaginez que nous avons trois champs dans Expliquer par qui nous intéressent : Kitchen Quality (Qualité de la cuisine), Building Type (Type de construction) et Air Conditioning (Air conditionné).Imagine we have three fields in Explain By we are interested in: Kitchen Quality, Building Type and Air Conditioning. Average House Price (Prix moyen d’une maison) est calculé pour chaque combinaison unique de ces trois champs.Average House Price would be calculated for each unique combination of those three fields. Il est souvent utile de passer à une vue tabulaire pour voir à quoi ressemblent les données évaluées.It is often helpful to switch to a table view to take a look at what the data being evaluated looks like.

Table de mesures

Cette analyse est une synthèse très globale et il est donc difficile pour le modèle de régression de trouver des modèles dans les données à partir desquels il peut apprendre.This analysis is very summarized and so it will be hard for the regression model to find any patterns in the data it can learn from. Nous devons exécuter l’analyse à un niveau plus détaillé pour obtenir de meilleurs résultats.We should run the analysis at a more detailed level to get better results. Si nous voulions analyser le prix des maisons au niveau des maisons, nous devrions ajouter explicitement le champ ID à l’analyse.If we wanted to analyze the house price at the house level we would need to explicitly add the ID field to the analysis. Néanmoins, nous ne voulons pas que l’ID des maisons soit considéré comme un influenceur.Nevertheless, we don't want the house ID to be considered an influencer. Il n’est pas très utile d’apprendre que quand l’ID de la maison augmente, le prix d’une maison augmente.It is not helpful to learn that as house ID increases, the price of a house increase. C’est là où l’option du champ Développer par se révèle pratique.This is where the Expand By field well option comes in handy. Vous pouvez utiliser Développer par pour ajouter des champs que vous voulez utiliser pour définir le niveau de l’analyse sans rechercher de nouveaux influenceurs.You can use Expand By to add fields you want to use for setting the level of the analysis without looking for new influencers.

Regardez à quoi ressemble la visualisation une fois que nous ajoutons ID à Développer par.Take a look at what the visualization looks like once we add ID to Expand By. Une fois que vous avez défini le niveau auquel vous voulez que votre mesure soit évaluée, l’interprétation des influenceurs est exactement la même que pour les colonnes numériques non synthétisées.Once you have defined the level at which you want your measure evaluated, interpreting influencers is exactly the same as for unsummarized numeric columns.

Table de mesures

Si vous voulez en savoir plus sur la façon dont vous pouvez analyser des mesures avec la visualisation des influenceurs clés, regardez le tutoriel suivant.If you would like to learn more about how you can analyze measures with the key influencers visualization please watch the following tutorial.

Considérations et résolution des problèmesConsiderations and troubleshooting

Quelles sont les limitations du visuel ?What are the limitations for the visual?

Le visuel Influenceur clés présente certaines limitations :The key influencers visual has some limitations:

  • La requête directe n’est pas prise en chargeDirect Query is not supported
  • La connexion active à Azure Analysis Services et à SQL Server Analysis Services n’est pas prise en chargeLive Connection to Azure Analysis Services and SQL Server Analysis Services is not supported
  • La publication sur le web n’est pas prise en chargePublish to web is not supported
  • .NET Framework 4.6 ou une version ultérieure est requis.NET Framework 4.6 or higher is required

Question numérique

Je reçois une erreur indiquant qu’aucun influenceur ou segment n’a été trouvé. Pourquoi ?I see an error that no influencers or segments were found. Why is that?

Erreur : aucun influenceur trouvé

Cette erreur se produit quand vous avez inclus des champs dans Expliquer par, mais qu’aucun influenceur n’a été trouvé.This error occurs when you included fields in Explain by but no influencers were found.

  • Vous avez inclus la métrique que vous analysiez à la fois dans Analyser et dans Expliquer par.You included the metric you were analyzing in both Analyze and Explain by. Supprimez-la de Expliquer par.Remove it from Explain by.
  • Vos champs explicatifs ont trop de catégories avec peu d’observations.Your explanatory fields have too many categories with few observations. La visualisation a donc plus de difficulté à déterminer quels facteurs sont des influenceurs.This situation makes it hard for the visualization to determine which factors are influencers. Il est difficile de généraliser d’après seulement quelques observations.It’s hard to generalize based on only a few observations. Si vous analysez un champ numérique, vous pouvez passer de l’analyse par catégorie à l’analyse en continu dans le volet de mise en forme sous la carte Analyse.If you are analyzing a numeric field you may want to switch from Categorical Analysis to Continuous Analysis in the Formatting Pane under the Analysis card.
  • Vos facteurs explicatifs ont assez d’observations pour effectuer des généralisations, mais la visualisation n’a trouvé aucune corrélation significative à signaler.Your explanatory factors have enough observations to generalize, but the visualization didn't find any meaningful correlations to report.

Je reçois une erreur indiquant que la métrique que je suis en train d’analyser n’a pas suffisamment de données pour exécuter l’analyse. Pourquoi ?I see an error that the metric I'm analyzing doesn't have enough data to run the analysis on. Why is that?

Erreur : données insuffisantes

La visualisation examine les tendances des données d’un groupe par rapport à celles d’autres groupes.The visualization works by looking at patterns in the data for one group compared to other groups. Par exemple, elle recherche le nombre de clients ayant attribué des évaluations faibles par rapport au nombre de clients ayant attribué des évaluations élevées.For example, it looks for customers who gave low ratings compared to customers who gave high ratings. Si les données dans votre modèle ont seulement quelques observations, il est difficile de trouver des tendances.If the data in your model has only a few observations, patterns are hard to find. Si la visualisation n’a pas suffisamment de données pour trouver des influenceurs significatifs, elle signale que davantage de données sont nécessaires pour exécuter l’analyse.If the visualization doesn’t have enough data to find meaningful influencers, it indicates that more data is needed to run the analysis.

Nous recommandons au moins 100 observations pour l’état sélectionné.We recommend that you have at least 100 observations for the selected state. Dans ce cas, l’état correspond aux clients qui renouvellent leur contrat.In this case, the state is customers who churn. Vous avez également besoin d’au moins 10 observations pour les états que vous utilisez à des fins de comparaison.You also need at least 10 observations for the states you use for comparison. Dans ce cas, l’état de la comparaison correspond aux clients qui ne renouvellent pas leur contrat.In this case, the comparison state is customers who don't churn.

Si vous analysez un champ numérique, vous pouvez passer de l’analyse par catégorie à l’analyse en continu dans le volet de mise en forme sous la carte Analyse.If you are analyzing a numeric field you may want to switch from Categorical Analysis to Continuous Analysis in the Formatting Pane under the Analysis card.

Je reçois une erreur indiquant que quand l’analyse n’est pas synthétisée, elle s’effectue toujours au niveau des lignes de sa table parente. La modification de ce niveau via des champs « Développer par» n’est pas autorisée. Pourquoi ?I see an error that when 'Analyze' is not summarized, the analysis always runs at the row level of its parent table. Changing this level via 'Expand by' fields is not allowed. Why is that?

Lors de l’analyse d’une colonne numérique ou de catégorie, l’analyse s’effectue toujours au niveau de la table.When analyzing a numeric or categorical column, the analysis always runs at the table level. Par exemple, si vous analysez des prix de maisons et que votre table contient une colonne ID, l’analyse s’effectue automatiquement au niveau de l’ID des maisons.For example, if you are analyzing house prices and your table contains an ID column, the analysis will automatically run at the house ID level.

Quand vous analysez une mesure ou une colonne synthétisée, vous devez spécifier explicitement à quel niveau vous voulez que l’analyse soit effectuée.When you are analyzing a measure or summarized column, you need to explicitly state at which level you would like the analysis to run at. Vous pouvez utiliser Développer par pour changer le niveau de l’analyse pour les mesures et les colonnes synthétisées sans ajouter de nouveaux influenceurs.You can use Expand by to change the level of the analysis for measures and summarized columns without adding new influencers. Si House price (Prix de la maison) était défini comme mesure, vous pourriez ajouter la colonne d’ID de maison à Développer par pour changer le niveau de l’analyse.If House price was defined as a measure you could add the house ID column to Expand by to change the level of the analysis.

Je reçois une erreur indiquant qu’un champ dans Expliquer par n’est pas lié de manière unique à la table contenant la métrique que je suis en train d’analyser. Pourquoi ?I see an error that a field in Explain by isn't uniquely related to the table that contains the metric I'm analyzing. Why is that?

L’analyse s’exécute au niveau table du champ en cours d’analyse.The analysis runs on the table level of the field that's being analyzed. Par exemple, si vous analysez les commentaires des clients pour votre service, vous pouvez avoir une table qui indique si un client a donné une évaluation élevée ou faible.For example, if you analyze customer feedback for your service, you might have a table that tells you whether a customer gave a high rating or a low rating. Dans ce cas, votre analyse s’exécute au niveau de la table des clients.In this case, your analysis is running at the customer table level.

Si vous avez une table associée qui est définie à un niveau plus précis que celle qui contient votre métrique, vous obtenez cette erreur.If you have a related table that's defined at a more granular level than the table that contains your metric, you see this error. Voici un exemple :Here's an example:

  • Vous analysez ce qui incite les clients à attribuer des évaluations faibles à votre service.You analyze what drives customers to give low ratings of your service.
  • Vous souhaitez vérifier si l’appareil sur lequel le client consomme votre service influence son évaluation.You want to see if the device on which the customer is consuming your service influences the reviews they give.
  • Un client peut consommer le service de plusieurs façons.A customer can consume the service in multiple different ways.
  • Dans l’exemple suivant, le client 10000000 utilise un navigateur et une tablette pour interagir avec le service.In the following example, customer 10000000 uses both a browser and a tablet to interact with the service.

Table associée définie à un niveau plus granulaire que celle qui contient votre métrique

Si vous essayez d’utiliser la colonne de l’appareil en tant que facteur explicatif, vous recevez l’erreur suivante :If you try to use the device column as an explanatory factor, you see the following error:

Erreur Colonne incorrecte

Cette erreur s’affiche parce que l’appareil n’est pas défini au niveau client.This error appears because the device isn't defined at the customer level. Un client peut consommer le service sur plusieurs appareils.One customer can consume the service on multiple devices. Pour que la visualisation trouve des tendances, l’appareil doit être un attribut du client.For the visualization to find patterns, the device must be an attribute of the customer. Il existe plusieurs solutions qui dépendent de votre compréhension de l’entreprise :There are several solutions that depend on your understanding of the business:

  • Vous pouvez changer la synthèse des appareils à compter.You can change the summarization of devices to count. Par exemple, utilisez le décompte si le nombre d’appareils peut affecter le score attribué par un client.For example, use count if the number of devices might affect the score that a customer gives.
  • Vous pouvez faire pivoter la colonne de l’appareil pour voir si l’utilisation du service sur un appareil spécifique influence l’évaluation d’un client.You can pivot the device column to see if consuming the service on a specific device influences a customer’s rating.

Dans cet exemple, les données ont été croisées pour créer de nouvelles colonnes pour les navigateurs, les appareils mobiles et les tablettes (veillez à supprimer et à recréer vos relations dans la vue de modélisation après avoir croisé vos données).In this example, the data was pivoted to create new columns for browser, mobile, and tablet (make sure you delete and re-create your relationships in the modeling view after pivoting your data). Vous pouvez désormais utiliser ces appareils spécifiques dans Expliquer par.You can now use these specific devices in Explain by. Tous les appareils sont des influenceurs, le navigateur ayant le plus grand impact sur le score attribué par le client.All devices turn out to be influencers, and the browser has the largest effect on customer score.

Plus précisément, les clients qui n’utilisent pas le navigateur pour consommer le service sont 3,79 fois plus susceptibles d’attribuer un faible score que ceux qui en utilisent un.More precisely, customers who don't use the browser to consume the service are 3.79 times more likely to give a low score than the customers who do. Plus bas dans la liste, pour « mobile », l’inverse est vrai.Lower down in the list, for mobile the inverse is true. Les clients qui utilisent l’application mobile sont plus susceptibles d’attribuer un faible score que ceux qui ne l’utilisent pas.Customers who use the mobile app are more likely to give a low score than the customers who don’t.

Résolu

Je reçois un avertissement signalant que les mesures n’ont pas été incluses dans mon analyse. Pourquoi ?I see a warning that measures weren't included in my analysis. Why is that?

Erreur : mesures non incluses

L’analyse s’exécute au niveau table du champ en cours d’analyse.The analysis runs on the table level of the field that's being analyzed. Si vous analysez le taux d’attrition des clients, vous pouvez avoir une table qui indique si un client a renouvelé son contrat ou non.If you analyze customer churn, you might have a table that tells you whether a customer churned or not. Dans ce cas, votre analyse s’exécute au niveau de la table de clients.In this case, your analysis runs at the customer table level.

Les mesures et agrégats sont par défaut analysés à ce niveau table.Measures and aggregates are by default analyzed at the table level. S’il y avait une mesure des dépenses mensuelles moyennes, elle serait analysée au niveau de la table des clients.If there were a measure for average monthly spending, it would be analyzed at the customer table level.

Si la table des clients n’a pas d’identificateur unique, vous ne pouvez pas évaluer la mesure et elle est ignorée par l’analyse.If the customer table doesn't have a unique identifier, you can't evaluate the measure and it's ignored by the analysis. Pour éviter cette situation, vérifiez que la table avec votre métrique a un identificateur unique.To avoid this situation, make sure the table with your metric has a unique identifier. Dans ce cas, il s’agit de la table de clients et l’identificateur unique est l’ID du client.In this case, it's the customer table and the unique identifier is customer ID. Vus pouvez également ajouter facilement une colonne d’index à l’aide de Power Query.It’s also easy to add an index column by using Power Query.

Je reçois un avertissement signalant que la mesure que je suis en train d’analyser a plus de 10 valeurs uniques, et que cela peut avoir une incidence sur la qualité de mon analyse. Pourquoi ?I see a warning that the metric I'm analyzing has more than 10 unique values and that this amount might affect the quality of my analysis. Why is that?

La visualisation d’intelligence artificielle peut analyser les champs de catégorie et les champs numériques.The AI visualization can analyze categorical fields and numeric fields. Dans le cas des champs de catégorie, vous pouvez avoir par exemple l’attrition (oui ou non) et la satisfaction du client (élevée, moyenne ou faible).In the case of categorical fields, an example may be Churn is Yes or No, and Customer Satisfaction is High, Medium, or Low. L’augmentation du nombre de catégories à analyser signifie qu’il y a moins d’observations par catégorie.Increasing the number of categories to analyze means there are fewer observations per category. Dans cette situation, il est difficile pour la visualisation de trouver des tendances dans les données.This situation makes it harder for the visualization to find patterns in the data.

Quand vous analysez des champs numériques, vous avez l’option de les traiter comme du texte, auquel cas vous exécutez la même analyse que pour des données de catégorie (analyse par catégorie).When analyzing numeric fields you have a choice between treating the numeric fields like text in which case you will run the same analysis as you do for categorical data (Categorical Analysis). Si vous avez beaucoup de valeurs distinctes, nous vous recommandons de passer à l’analyse continue, ce qui signifie que nous pouvons déduire des tendances quand les nombres augmentent ou diminuent plutôt que de les traiter comme des valeurs distinctes.If you have lots of distinct values we recommend you switch the analysis to Continuous Analysis as that means we can infer patterns from when numbers increase or decrease rather than treating them as distinct values. Vous pouvez passer de l’analyse par catégorie à l’analyse en continu dans le volet de mise en forme sous la carte Analyse.You can switch from Categorical Analysis to Continuous Analysis in the Formatting Pane under the Analysis card.

Pour trouver des influenceurs plus forts, nous vous recommandons de regrouper les valeurs similaires dans une même unité.To find stronger influencers, we recommend that you group similar values into a single unit. Par exemple, si vous avez une métrique pour le prix, vous obtiendrez sans doute de meilleurs résultats en regroupant les prix similaires dans des catégories comme « Élevé », « Moyen » et « Faible » au lieu d’utiliser des niveaux de prix individuels.For example, if you have a metric for price, you're likely to obtain better results by grouping similar prices into High, Medium, and Low categories vs. using individual price points.

Avertissement lié à la présence de plus de 10 facteurs uniques

Il y a des facteurs dans mes données qui devraient visiblement être des influenceurs clés, mais qui ne le sont pas. À quoi cela peut-il être dû ?There are factors in my data that look like they should be key influencers, but they aren't. How can that happen?

Dans l’exemple suivant, les clients qui sont des consommateurs attribuent des évaluations faibles (14,93 % des évaluations).In the following example, customers who are consumers drive low ratings, with 14.93% of ratings that are low. Le rôle d’administrateur présente également une proportion élevée d’évaluations faibles (13,42 %), mais n’est pas considéré comme un influenceur.The administrator role also has a high proportion of low ratings, at 13.42%, but it isn't considered an influencer.

La raison de cette détermination est que la visualisation prend également en compte le nombre de points de données quand elle trouve des influenceurs.The reason for this determination is that the visualization also considers the number of data points when it finds influencers. L’exemple suivant a plus de 29 000 consommateurs et 10 fois moins d’administrateurs, environ 2 900.The following example has more than 29,000 consumers and 10 times fewer administrators, about 2,900. Seuls 390 d’entre eux ont donné une évaluation faible.Only 390 of them gave a low rating. Le visuel n’a pas suffisamment de données pour déterminer s’il a détecté une tendance avec les évaluations des administrateurs ou s’il s’agit simplement d’une déduction hasardeuse.The visual doesn’t have enough data to determine whether it found a pattern with administrator ratings or if it’s just a chance finding.

Détermination des influenceurs

Comment calculer les influenceurs clés pour l’analyse par catégorie ?How do you calculate key influencers for categorical analysis?

En arrière-plan, la visualisation d’intelligence artificielle utilise ML.NET pour exécuter une régression logistique qui calcule les influenceurs clés.Behind the scenes, the AI visualization uses ML.NET to run a logistic regression to calculate the key influencers. Une régression logistique est un modèle statistique qui compare différents groupes.A logistic regression is a statistical model that compares different groups to each other.

Si vous voulez voir ce qui contribue à des évaluations faibles, la régression logistique examine en quoi les clients qui ont attribué un score faible diffèrent de ceux ayant attribué un score élevé.If you want to see what drives low ratings, the logistic regression looks at how customers who gave a low score differ from the customers who gave a high score. Si vous avez plusieurs catégories (scores élevés, neutres et faibles par exemple), vous examinez en quoi les clients qui ont attribué une évaluation faible diffèrent de ceux n’ayant pas attribué une telle évaluation.If you have multiple categories, such as high, neutral, and low scores, you look at how the customers who gave a low rating differ from the customers who didn't give a low rating. Dans ce cas, en quoi les clients qui ont attribué un score faible diffèrent de ceux ayant attribué une évaluation élevée ou neutre ?In this case, how do the customers who gave a low score differ from the customers who gave a high rating or a neutral rating?

La régression logistique recherche des tendances dans les données, autrement dit des indices suggérant en quoi les clients qui ont donné une évaluation faible peuvent différer de ceux ayant donné une évaluation élevée.The logistic regression searches for patterns in the data and looks for how customers who gave a low rating might differ from the customers who gave a high rating. Elle peut ainsi détecter que les clients qui ont de nombreux tickets de support présentent un pourcentage beaucoup plus élevé d’évaluations faibles que ceux qui en ont peu ou aucun.It might find, for example, that customers with more support tickets give a higher percentage of low ratings than customers with few or no support tickets.

La régression logistique prend également en compte le nombre de points de données présents.The logistic regression also considers how many data points are present. Par exemple, si les clients qui jouent un rôle d’administrateur attribuent des scores proportionnellement plus négatifs, mais qu’il n’y a que quelques administrateurs, ce facteur n’est pas considéré comme influent.For example, if customers who play an admin role give proportionally more negative scores but there are only a few administrators, this factor isn't considered influential. Cette détermination tient au fait qu’il n’y a pas assez de points de données disponibles pour déduire une tendance.This determination is made because there aren't enough data points available to infer a pattern. Un test statistique (appelé test de Wald) est utilisé pour déterminer si un facteur est considéré comme un influenceur.A statistical test, known as a Wald test, is used to determine whether a factor is considered an influencer. Le visuel utilise une valeur p de 0,05 pour déterminer le seuil.The visual uses a p-value of 0.05 to determine the threshold.

Comment calculer les influenceurs clés pour l’analyse numérique ?How do you calculate key influencers for numeric analysis?

En arrière-plan, la visualisation d’intelligence artificielle utilise ML.NET pour exécuter une régression linéaire qui calcule les influenceurs clés.Behind the scenes, the AI visualization uses ML.NET to run a linear regression to calculate the key influencers. Une régression linéaire est un modèle statistique qui examine comment le résultat du champ que vous analysez change en fonction de vos facteurs explicatifs.A linear regression is a statistical model that looks at how the outcome of the field you are analyzing changes based on your explanatory factors.

Par exemple, si nous analysons le prix des maisons, une régression linéaire examine l’impact d’une cuisine d’excellente qualité sur le prix.For example, if we are analyzing house prices, a linear regression will look at the impact having an excellent kitchen will have on the house price. Les maisons équipées d’une cuisine d’excellente qualité sont-elles généralement plus chères ou moins chères que les maisons n’offrant pas une telle cuisine ?Do houses with excellent kitchens generally have lower or higher house prices compared to houses without excellent kitchens?

La régression linéaire prend également en compte le nombre de points de données.The linear regression also considers the number of data points. Par exemple, si les maisons avec des courts de tennis ont des prix plus élevés mais que très peu de maisons ont un court de tennis, ce facteur n’est pas considéré comme influent.For example, if houses with tennis courts have higher prices but we have very few houses that have a tennis court, this factor is not considered influential. Cette détermination s’explique par le fait qu’il n’y a pas assez de points de données disponibles pour déduire une tendance.This determination is made because there aren't enough data points available to infer a pattern. Un test statistique (appelé test de Wald) est utilisé pour déterminer si un facteur est considéré comme un influenceur.A statistical test, known as a Wald test, is used to determine whether a factor is considered an influencer. Le visuel utilise une valeur p de 0,05 pour déterminer le seuil.The visual uses a p-value of 0.05 to determine the threshold.

Comment les segments sont calculés ?How do you calculate segments?

En arrière-plan, la visualisation d’intelligence artificielle utilise ML.NET pour exécuter un arbre de décision afin de trouver des sous-groupes intéressants.Behind the scenes, the AI visualization uses ML.NET to run a decision tree to find interesting subgroups. L’objectif de l’arbre de décision est d’obtenir un sous-groupe de points de données qui est relativement élevé dans la métrique qui vous intéresse.The objective of the decision tree is to end up with a subgroup of data points that's relatively high in the metric you're interested in. Il peut s’agir de clients ayant donné des évaluations faibles ou de maisons avec des prix élevés.This could be customers with low ratings or houses with high prices.

L’arbre de décision prend chaque facteur explicatif et tente d’identifier quel facteur lui donne la meilleure division.The decision tree takes each explanatory factor and tries to reason which factor gives it the best split. Par exemple, si vous filtrez les données pour inclure uniquement les grandes entreprises, cela permettra-il de séparer les clients qui nous ont donné une évaluation élevée de ceux qui ont donné une évaluation faible ?For example, if you filter the data to include only large enterprise customers, will that separate out customers who gave a high rating vs. a low rating? Ou peut-être est-il préférable de filtrer les données pour inclure uniquement les clients qui ont commenté la sécurité ?Or perhaps is it better to filter the data to include only customers who commented about security?

Une fois que l’arbre de décision effectue une division, il prend le sous-groupe de données et détermine quelle serait la meilleure division suivante pour ces données.After the decision tree does a split, it takes the subgroup of data and determines the next best split for that data. Dans ce cas, le sous-groupe est constitué des clients qui ont commenté la sécurité.In this case, the subgroup is customers who commented on security. Après chaque division, il prend également en compte le nombre de points de données de ce groupe afin de déterminer s’il est suffisamment représentatif pour en déduire une tendance, ou s’il pourrait simplement s’agir d’une anomalie dans les données (et non d’un segment réel).After each split, it also considers whether it has enough data points for this group to be representative enough to infer a pattern from or whether it's an anomaly in the data and not a real segment. Un autre test statistique est appliqué pour vérifier la signification statistique de la condition de division, avec une valeur p égale à 0,05.Another statistical test is applied to check for the statistical significance of the split condition with p-value of 0.05.

Une fois l’exécution de l’arbre de décision terminée, il prend toutes les divisions (commentaires sur la sécurité et grande entreprise par exemple) et crée des filtres Power BI.After the decision tree finishes running, it takes all the splits, such as security comments and large enterprise, and creates Power BI filters. Cette combinaison de filtres est empaqueté en tant que segment dans le visuel.This combination of filters is packaged up as a segment in the visual.

Pourquoi certains facteurs deviennent des influenceurs ou cessent d’en être à mesure que je déplace davantage de champs dans le champ Expliquer par ?Why do certain factors become influencers or stop being influencers as I move more fields into the Explain by field?

La visualisation évalue tous les facteurs explicatifs ensemble.The visualization evaluates all explanatory factors together. Un facteur peut être un influenceur en soi, mais il peut ne pas l’être quand il est considéré avec d’autres facteurs.A factor might be an influencer by itself, but when it's considered with other factors it might not. Supposons que vous souhaitiez analyser les facteurs contribuant au prix élevé d’une maison, avec le nombre de chambres et la taille de la maison comme facteurs explicatifs :Suppose you want to analyze what drives a house price to be high, with bedrooms and house size as explanatory factors:

  • En soi, un nombre de chambres plus élevé peut faire augmenter le prix de la maison.By itself, more bedrooms might be a driver for house prices to be high.
  • Le fait d’inclure la taille de la maison dans l’analyse signifie que nous pouvons désormais observer ce qui se passe au niveau des chambres en maintenant la taille de la maison constante.Including house size in the analysis means you now look at what happens to bedrooms while house size remains constant.
  • Si la taille de la maison est fixée à 140 mètres carrés, il est peu probable que le fait d’augmenter de manière continue le nombre de chambres augmentera sensiblement le prix de la maison.If house size is fixed at 1,500 square feet, it's unlikely that a continuous increase in the number of bedrooms will dramatically increase the house price.
  • Le nombre de chambres ne sera peut-être pas un facteur aussi important qu’il l’était avant la prise en compte de la taille de la maison.Bedrooms might not be as important of a factor as it was before house size was considered.

Étapes suivantesNext steps