Tutoriel : Mettre en forme et combiner des données dans Power BI Desktop

Avec Power BI Desktop, vous pouvez vous connecter à différents types de sources de données, puis mettre en forme les données en fonction de vos besoins, de façon à créer des rapports visuels à partager avec d’autres. Mettre en forme des données consiste à transformer les données, c’est-à-dire à renommer des colonnes ou des tables, à changer du texte en nombres, à supprimer des lignes, à définir la première ligne comme en-têtes, etc. Combiner des données consiste à se connecter à plusieurs sources de données, à les mettre en forme en fonction des besoins, puis à les regrouper dans une requête utile.

Ce didacticiel vous montre comment effectuer les opérations suivantes :

  • Mettre en forme des données avec l’Éditeur Power Query.
  • Se connecter à différentes sources de données.
  • Combiner ces sources de données et créer un modèle de données utilisable dans des rapports.

Ce tutoriel montre comment mettre en forme une requête avec Power BI Desktop et présente les tâches les plus courantes. Pour plus d’informations sur la requête utilisée ici, y compris sur sa création de toutes pièces, consultez Prise en main de Power BI Desktop.

L’Éditeur Power Query de Power BI Desktop fait largement appel aux menus contextuels (clic droit) ainsi qu’au ruban Transformer. La plupart des éléments que vous pouvez sélectionner dans le ruban sont aussi accessibles en cliquant avec le bouton droit sur un élément, par exemple une colonne, puis en choisissant une option dans le menu qui s’affiche.

Mettre en forme les données

Quand vous mettez en forme des données dans l’Éditeur Power Query, vous lui donnez des instructions pas à pas pour ajuster les données à votre place à mesure qu’elles sont chargées et présentées. La source de données d’origine n’est pas affectée : seule cette vue particulière des données est ajustée, c’est-à-dire mise en forme.

Les étapes que vous spécifiez (par exemple, renommage d’une table, transformation d’un type de données ou suppression d’une colonne) sont enregistrées par l’Éditeur Power Query. Chaque fois que cette requête se connecte à la source de données, l’Éditeur Power Query effectue ces étapes, si bien que les données sont toujours mises en forme comme vous le spécifiez. Ce processus se produit chaque fois que vous utilisez l’Éditeur Power Query ou qu’une personne utilise votre requête partagée, par exemple, dans le service Power BI. Ces étapes sont capturées, de manière séquentielle, dans le volet Paramètres des requêtes, sous Étapes appliquées. Nous allons passer en revue chacune de ces étapes dans les paragraphes suivants.

Applied steps in Query Settings

Dans Prise en main de Power BI Desktop, nous allons utiliser les données sur la retraite que nous avons récupérées en nous connectant à une source de données web, puis nous les mettrons en forme selon nos besoins. Nous ajouterons une colonne personnalisée pour calculer le classement en fonction de toutes les données qui représentent des facteurs d’égalité, puis nous comparerons cette colonne à la colonne existante, Rank (Classement).

  1. Dans le ruban Ajouter une colonne, sélectionnez Colonne personnalisée pour ajouter une colonne personnalisée.

    Select Custom Column

  2. Dans la fenêtre Colonne personnalisée, dans Nouveau nom de colonne, entrez New Rank (Nouveau classement). Dans Formule de colonne personnalisée, entrez les données suivantes :

    ([Cost of living] + [Weather] + [Health care quality] + [Crime] + [Tax] + [Culture] + [Senior] + [#"Well-being"]) / 8
    
  3. Vérifiez que le message d’état indique Aucune erreur de syntaxe n’a été détectée, puis sélectionnez OK.

    Custom Column page with no snytanx errors

  4. Pour maintenir la cohérence des données de la colonne, transformez les nouvelles valeurs de la colonne en nombres entiers. Pour les modifier, cliquez avec le bouton droit sur l’en-tête de la colonne, puis sélectionnez Modifier le type > Nombre entier.

    Si vous avez besoin de sélectionner plusieurs colonnes, sélectionnez une colonne, maintenez la touche Maj enfoncée, sélectionnez les colonnes adjacentes supplémentaires, puis cliquez avec le bouton droit sur un en-tête de colonne. Vous pouvez également utiliser la touche Ctrl pour sélectionner des colonnes non adjacentes.

    Select Whole Number column data

  5. Pour transformer des types de données de colonne, ce qui consiste à transformer le type de données actuel en un autre, sélectionnez Texte de données : Texte dans le ruban Transformer.

    Select Data Type Text

  6. Dans Paramètres de requête, la liste Étapes appliquées reflète les étapes de mise en forme appliquées aux données. Pour supprimer une étape du processus de mise en forme, sélectionnez le X à gauche de l’étape.

    Dans l’image suivante, la liste Étapes appliquées reflète les étapes ajoutées jusqu’à présent :

    • Source : connexion au site web.

    • Table extraite à partir de code HTML : sélection de la table.

    • Type changé : changement des colonnes de nombre basées sur du texte du type Texte en Nombre entier.

    • Personnalisée ajoutée : ajout d’une colonne personnalisée.

    • Type changé1 : dernière étape appliquée.

      List of Applied Steps

Ajuster les données

Avant d’utiliser cette requête, nous devons apporter quelques modifications pour ajuster ses données :

  • Ajuster les classements en supprimant une colonne.

    Nous avons décidé que la colonne Cost of living (Coût de la vie) n’était pas un facteur déterminant pour nos résultats. Après avoir supprimé cette colonne, nous constatons que les données sont inchangées.

  • Corriger quelques erreurs.

    Comme nous avons supprimé une colonne, nous devons réajuster nos calculs dans la colonne New Rank en modifiant notamment une formule.

  • Trier les données.

    Trions les données en fonction des colonnes New Rank et Rank.

  • Remplacer les données.

    Nous allons voir comment remplacer une valeur spécifique et souligner la nécessité d’insérer une Étape appliquée.

  • Changer le nom de la table.

    Sachant que Table 0 n’est pas un descripteur utile pour la table, nous allons changer son nom.

  1. Pour supprimer la colonne Cost of living (Coût de la vie), sélectionnez-la, choisissez l’onglet Accueil dans le ruban, puis sélectionnez Supprimer les colonnes.

    Select Remove Columns

    Vous remarquerez que les valeurs de New Rank n’ont pas changé du fait de l’ordre des étapes. Sachant que l’Éditeur Power Query enregistre les étapes de manière séquentielle, mais indépendamment les unes des autres, vous pouvez monter ou descendre chaque étape appliquée dans la séquence.

  2. Cliquez avec le bouton droit sur une étape. L’Éditeur Power Query fournit un menu qui vous permet d’effectuer les tâches suivantes :

    • Renommer : renommez l’étape.
    • Supprimer : supprimez l’étape.
    • SupprimerJusqu’à la fin : supprimez l’étape active et toutes celles qui suivent.
    • Déplacer avant : montez l’étape dans la liste.
    • Déplacer après : descendez l’étape dans la liste.
  3. Déplacez la dernière étape, Colonnes supprimées, juste au-dessus de l’étape Personnalisée ajoutée.

    Move up step in Applied Steps

  4. Sélectionnez l’étape Personnalisée ajoutée.

    Notez que les données indiquent à présent Error (Erreur), ce que nous devrons examiner.

    Error result in column data

    Il existe plusieurs façons d’obtenir des informations sur chaque erreur. Si vous sélectionnez la cellule sans cliquer directement sur le mot Erreur, l’Éditeur Power Query affiche les informations de l’erreur.

    Error information in Power Query Editor

    Si vous sélectionnez le mot Erreur directement, l’Éditeur Power Query crée une étape appliquée dans le volet Paramètres de requête et affiche les informations de l’erreur.

  5. Comme nous n’avons pas besoin d’afficher d’informations sur les erreurs, sélectionnez Annuler.

  6. Pour corriger les erreurs, sélectionnez la colonne New Rank, puis affichez la formule de données de la colonne en cochant la case Barre de formule à partir de l’onglet Affichage.

    Select Formula Bar

  7. Supprimez le paramètre Cost of living et décrémentez le diviseur en modifiant la formule comme suit :

     Table.AddColumn(#"Removed Columns", "New Rank", each ([Weather] + [Health care quality] + [Crime] + [Tax] + [Culture] + [Senior] + [#"Well-being"]) / 7)
    
  8. Sélectionnez la coche verte à gauche de la zone de formule ou appuyez sur Entrée.

L’Éditeur Power Query remplace les données par les valeurs modifiées et l’étape Personnalisée ajoutée se termine sans erreur.

Notes

Vous pouvez aussi sélectionner Supprimer les erreurs via le ruban ou le menu contextuel pour supprimer les lignes qui présentent des erreurs. Ceci dit, comme nous voulons garder les données dans la table pour ce tutoriel, nous n’allons pas le faire.

  1. Triez les données en fonction de la colonne New Rank. Sélectionnez d’abord la dernière étape appliquée, Type modifié1 pour afficher les données les plus récentes. Ensuite, sélectionnez la liste déroulante située en regard de l’en-tête de colonne New Rank, puis choisissez Tri croissant.

    Sort data in New Rank column

    Les données sont maintenant triées en fonction de la colonne New Rank. Cependant, si vous examinez la colonne Rank, vous remarquerez que les données ne sont pas triées correctement quand la valeur de New Rank est égale. Nous corrigerons cela à l’étape suivante.

  2. Pour corriger le problème de tri des données, sélectionnez la colonne New Rank et remplacez la formule figurant dans la Barre de formule par la formule suivante :

     = Table.Sort(#"Changed Type1",{{"New Rank", Order.Ascending},{"Rank", Order.Ascending}})
    
  3. Sélectionnez la coche verte à gauche de la zone de formule ou appuyez sur Entrée.

    Les lignes sont à présent classées en fonction des colonnes New Rank et Rank. En outre, vous pouvez sélectionner n’importe quelle étape appliquée dans la liste et poursuivre la mise en forme des données à ce stade de la séquence. L’Éditeur Power Query insère automatiquement une nouvelle étape immédiatement après l’étape appliquée actuellement sélectionnée.

  4. Dans Étape appliquée, sélectionnez l’étape qui précède la colonne personnalisée, à savoir l’étape Colonnes supprimées. Nous allons remplacer ici la valeur de classement Weather (Météo) en Arizona. Cliquez avec le bouton droit sur la cellule contenant le classement Weather (Météo) de l’Arizona, puis sélectionnez Remplacer les valeurs. Faites attention à l’étape appliquée qui est actuellement sélectionnée.

    Select Replace Values for column

  5. Sélectionnez Insérer.

    Comme nous insérons une étape, l’Éditeur Power Query nous avertit que l’ajout d’étapes peut occasionner la rupture de la requête.

    Insert Step verification

  6. Remplacez la valeur de données par 51.

    L’Éditeur Power Query remplace les données pour l’Arizona. Quand vous créez une étape appliquée, l’Éditeur Power Query lui attribue un nom basé sur l’action, en l’occurrence Valeur remplacée. Si plusieurs étapes ont le même nom dans votre requête, l’Éditeur Power Query ajoute un numéro séquentiel à chaque étape appliquée suivante pour les différencier.

  7. Sélectionnez la dernière étape appliquée, Lignes triées.

    Notez que les données ont changé en ce qui concerne le nouveau classement de l’Arizona. La raison de ce changement est que nous avons inséré l’étape Valeur remplacée au bon endroit, avant l’étape Personnalisée ajoutée.

  8. Enfin, nous voulons modifier le nom de cette table par quelque chose de plus explicite. Dans le volet Paramètres de requête, sous Propriétés, entrez le nouveau nom de la table, puis sélectionnez Entrer. Nommez cette table RetirementStats.

    Rename table in Query Settings

    Au moment de créer des rapports, il est particulièrement utile d’avoir des noms de table descriptifs, notamment quand il s’agit de se connecter à plusieurs sources de données qui figurent toutes dans le volet Champs de la vue Rapport.

    Les données sont maintenant mises en forme comme nous le souhaitions. À présent, connectons-nous à une autre source de données et combinons des données.

Combiner des données

Les données sur les différents États sont intéressantes et pourront servir à des analyses complémentaire ou à créer d’autres requêtes. Toutefois, elles posent un problème : la plupart de ces données utilisent une abréviation à deux lettres pour les codes d’États, à la place du nom complet de l’État. Nous devons pouvoir associer les noms des États à leurs abréviations.

Par chance, il existe une autre source de données publique qui remplit précisément cette fonction, mais un effort important de mise en forme sera nécessaire pour la connecter à la table relative à la retraite. Pour mettre en forme les données, effectuez ces étapes :

  1. Dans le ruban Accueil de l’Éditeur Power Query, sélectionnez Nouvelle source > Web.

  2. Entrez l’adresse du site web pour les abréviations des États, https://en.wikipedia.org/wiki/List_of_U.S._state_abbreviations , puis sélectionnez Se connecter.

    Le navigateur affiche le contenu du site web.

    Navigator page

  3. Sélectionnez Codes and abbreviations.

    Conseil

    Quelques efforts de mise en forme sont nécessaires pour réduire les données de ce tableau à ce que nous voulons. Existe-t-il un moyen plus rapide ou plus facile d’effectuer les étapes suivantes ? Oui, il est possible de créer une relation entre les deux tables et de mettre en forme les données en fonction de cette relation. Les étapes suivantes restent utiles pour apprendre à travailler avec des tables. Cependant, les relations peuvent vous aider à utiliser rapidement les données de plusieurs tables.

Pour mettre en forme les données, effectuez ces étapes :

  1. Supprimez la ligne du haut. Comme elle est le résultat de la façon dont la table de cette page web a été créée, nous n’en avons pas besoin. Dans le ruban Accueil, sélectionnez Supprimer les lignes > Supprimer les lignes du haut.

    Select Remove Top Rows

    La fenêtre Supprimer les lignes du haut s’affiche, dans laquelle vous pouvez spécifier le nombre de lignes à supprimer.

    Notes

    Si Power BI importe accidentellement les en-têtes sous la forme d’une ligne dans votre table de données, vous pouvez sélectionner Utiliser la première ligne comme en-tête dans l’onglet Accueil ou dans l’onglet Transformer du ruban pour corriger votre table.

  2. Supprimez les 26 lignes du bas. Ces lignes correspondent à des territoires américains, que nous n’avons pas besoin d’inclure. Dans le ruban Accueil, sélectionnez Supprimer les lignes > Supprimer les lignes du bas.

    Select Remove Bottom Rows

  3. Comme la table RetirementStats ne contient pas d’informations pour Washington DC, nous devons la filtrer hors de la liste. Sélectionnez la flèche déroulante Region Status (Statut de la région), puis décochez la case en regard de Federal district (District fédéral).

    Clear Federal district check box

  4. Supprimez quelques colonnes inutiles. Comme nous avons besoin seulement du mappage de chaque État avec son abréviation à deux lettres officielle, nous pouvons supprimer plusieurs colonnes. Commencez par sélectionner une colonne, puis maintenez enfoncée la touche CTRL et sélectionnez les autres colonnes à supprimer. À partir de l’onglet Accueil du ruban, sélectionnez Supprimer les colonnes > Supprimer les colonnes.

    Remove column

    Notes

    C’est le bon moment de préciser que la séquence des étapes appliquées dans l’Éditeur Power Query est importante et qu’elle peut affecter la mise en forme des données. Il est également important de savoir comment une étape peut avoir un impact sur une étape ultérieure. Si vous supprimez une étape de la section Étapes appliquées, les étapes suivantes peuvent ne pas se comporter comme prévu initialement, en raison de l’impact de la séquence des étapes de la requête.

    Notes

    Quand vous redimensionnez la fenêtre de l’Éditeur Power Query pour réduire sa largeur, certains éléments du ruban sont condensés pour optimiser l’espace visible. Quand vous augmentez la largeur de la fenêtre de l’Éditeur Power Query, les éléments de ruban sont étendus pour optimiser la zone agrandie du ruban.

  5. Renommez les colonnes et la table. Il existe plusieurs façons de renommer une colonne : tout d’abord, sélectionnez la colonne, puis cliquez sur Renommer sous l’onglet Transformer du ruban, ou cliquez avec le bouton droit et sélectionnez Renommer. Dans l’image suivante, les flèches indiquent les deux options ; vous ne devez en choisir qu’une seule.

    Rename column in Power Query Editor

  6. Renommez les colonnes State Name (Nom de l’état) et State Code (Code de l’état). Pour renommer la table, entrez le Nom dans le volet Paramètres de requête. Nommez cette table StateCodes.

Combiner les requêtes

Maintenant que nous avons mis en forme la table StateCodes comme nous le voulions, combinons ces deux tables (ou requêtes) en une seule. Les tables dont nous disposons à présent étant le résultat des requêtes que nous avons appliquées aux données, elles sont souvent appelées requêtes.

Deux méthodes principales permettent de combiner des requêtes : la fusion et l’ajout.

  • Pour ajouter une ou plusieurs colonnes à une autre requête, vous fusionnez les requêtes.
  • Pour ajouter des lignes de données à une requête existante, vous ajoutez la requête.

Ici, nous voulons fusionner les requêtes. Pour ce faire, procédez comme suit :

  1. Dans le volet gauche de l’Éditeur Power Query, sélectionnez la requête dans laquelle vous voulez fusionner l’autre requête. Dans ce cas, il s’agit de RetirementStats.

  2. Sélectionnez Fusionner les requêtes > Fusionner les requêtes sous l’onglet Accueil du ruban.

    Select Merge Queries

    Vous serez peut-être invité à définir les niveaux de confidentialité pour faire en sorte que les données soient combinées sans inclure ni transférer des données que vous ne voulez pas transférer.

    La fenêtre Fusionner s’affiche. Elle vous invite à sélectionner la table à fusionner dans la table déjà sélectionnée, puis les colonnes correspondantes à utiliser pour la fusion.

  3. Sélectionnez State (État) dans la table RetirementStats, puis sélectionnez la requête StateCodes.

    Quand vous sélectionnez les colonnes correspondantes, le bouton OK est activé.

    Merge window

  4. Sélectionnez OK.

    L’Éditeur Power Query crée une colonne à la fin de la requête avec le contenu de la table (requête) qui a été fusionnée avec la requête existante. Toutes les colonnes de la requête fusionnée sont condensées dans la colonne, mais vous pouvez Développer la table et ajouter les colonnes de votre choix.

    NewColumn column

  5. Pour développer la table fusionnée et sélectionner les colonnes à inclure, sélectionnez l’icône de développement (Expand icon).

    La fenêtre Développer apparaît.

    NewColumn in query

  6. Dans ce cas, seule la colonne State Code nous intéresse. Sélectionnez cette colonne, décochez Utiliser le nom de la colonne d’origine comme préfixe, puis sélectionnez OK.

    Si nous avions laissé la case Utiliser le nom de colonne d’origine comme préfixe cochée, la colonne fusionnée aurait été nommée NewColumn.State Code.

    Notes

    Vous voulez savoir comment afficher la table NewColumn ? Vous pouvez faire des essais et si les résultats ne vous satisfont pas, supprimez simplement cette étape de la liste Étapes appliquées dans le volet Paramètres d’une requête. Votre requête retourne à l’état précédant l’application de l’étape Développer. Vous pouvez faire cela autant de fois que vous le voulez jusqu’à ce que le processus de développement vous convienne.

    Nous disposons désormais d’une seule requête (table) combinant deux sources de données, chacune d’entre elles ayant été mise en forme pour répondre à nos besoins. Cette requête peut servir de base pour de nombreuses autres connexions de données intéressantes, comme des statistiques sur le coût du logement, des données démographiques ou des opportunités de travail dans un État.

  7. Pour appliquer vos changements et fermer l’Éditeur Power Query, sélectionnez Fermer et appliquer sous l’onglet Accueil du ruban.

    Le jeu de données transformé s’affiche dans Power BI Desktop, prêt à l’usage pour la création de rapports.

    Select Close & Apply

Étapes suivantes

Pour plus d’informations sur Power BI Desktop et ses fonctionnalités, consultez les ressources suivantes :