Tutoriel : Fabric pour les utilisateurs de Power BI

Dans ce tutoriel, vous apprenez à utiliser des flux de données Gen2 et des pipelines pour ingérer des données dans un Lakehouse et créer un modèle dimensionnel. Vous apprenez également à générer automatiquement un beau rapport pour afficher les derniers chiffres de vente du début à la fin en seulement 45 minutes.

Allons-y !

  • Préparer et charger des données dans un lakehouse
  • Générer un modèle dimensionnel dans un lakehouse
  • Créer automatiquement un rapport avec la création rapide

Prérequis

Créer un lakehouse pour stocker des données

Nous commençons par créer un lakehouse pour stocker nos données, des flux de données Gen2 pour préparer et transformer des colonnes et un pipeline pour gérer l’orchestration d’une activité d’actualisation planifiée et de messagerie.


  1. Accédez à votre espace de travail et sélectionnez Nouveau. Puis sélectionnez Afficher tout.

    Screenshot of the Show all option in the new item menu.

  2. Dans l’écran de création d’un nouvel élément, sélectionnez Lakehouse sous la catégorie Engineering données.

    Screenshot of Data engineering items.

  3. Définissez le nom du Lakehouse sur SalesLakehouse. Sélectionnez ensuite Créer.

    Screenshot of naming a name Lakehouse.

  4. Une fois dans l’éditeur Lakehouse, sélectionnez Nouveau flux de données Gen2.

    Notes

    Vous pouvez également sélectionner Obtenir des données dans le ruban, puis Nouveau flux de données Gen2.

    Screenshot of Get data drop down in the Lakehouse editor.

Préparer et charger des données dans votre lakehouse

Effectuez les étapes suivantes pour charger des données dans votre lakehouse :

  1. Une fois dans l’éditeur Power Query Online du flux de données Gen2, sélectionnez Importer à partir d’un modèle Power Query et choisissez le fichier de modèle téléchargé à partir des prérequis.

    Screenshot of watermarks in the Dataflows Gen2 editor.

  2. Sélectionnez la requête DimDate sous le groupe de requêtes du Chargement des données, puis sélectionnez Configurer une connexion. Si nécessaire, définissez le type d’authentification sur Anonyme avant de sélectionner Se connecter.

    Screenshot of the configure connection menu.

  3. La requête DimDate étant sélectionnée, dans la fenêtre d’aperçu des données, remplacez le type de données de la colonne DateKey par Date/Heure en sélectionnant l’icône en haut à gauche.

    Screenshot of changing data types within the Power Query editor.

  4. Sélectionnez Remplacer actuel dans la fenêtre Modifier le type de colonne.

    Screenshot of the change column type menu.

Ajouter une destination de données

Effectuez les étapes suivantes pour ajouter une destination de données :

  1. La table DimDate étant sélectionnée, sous l’onglet Accueil, sélectionnez Ajouter une destination de données, puis sélectionnez l’élément du menu d’option Lakehouse.

    Screenshot of the get data destination Lakehouse option.

  2. Si nécessaire, définissez l’authentification sur Compte d’organisation, puis sélectionnez Suivant.

    Screenshot of the Connect to data destination menu.

  3. Dans le navigateur, sélectionnez l’espace de travail utilisé pour ce tutoriel et développez pour afficher tous les éléments Lakehouse. Sélectionnez SalesLakehouse et vérifiez que la Nouvelle table par défaut est sélectionnée avant de sélectionner Suivant pour continuer.

    Screenshot of the destination target navigator item.

  4. Définissez la Méthode de mise à jour sur Remplacer, puis sélectionnez Enregistrer les paramètres.

    Attention

    La définition de la méthode de mise à jour sur Remplacer supprime toutes les données existantes et les remplace par les nouvelles données à chaque actualisation suivante.

    Screenshot of the destination settings menu option.

    Remarque

    Dans le coin inférieur droit de l’éditeur Power Query Online, vous trouverez les paramètres de la destination des données configurés pour votre requête, avec lesquels vous pouvez personnaliser ou supprimer davantage.

    Screenshot of the configured data destination.

  5. Avant de passer à la section suivante de ce tutoriel, veillez à effectuer les mêmes étapes que celles que vous avez effectuées précédemment dans cette section pour configurer Lakehouse comme destination de données pour chacune des requêtes suivantes.

    Requête
    DimCustomer
    DimEmployee
    DimProduct
    DimStore
  6. Sélectionnez la requête FactOnlineSales sous le groupe de requêtes Transformation des données et, sous l’onglet Accueil, sélectionnez Ajouter une destination de données, puis sélectionnez l’option Lakehouse.

    Screenshot of the Data destination Lakehouse target option.

  7. Si nécessaire, définissez l’authentification sur Compte d’organisation, puis sélectionnez Suivant.

    Screenshot of the Connect to data destination menu.

  8. Dans le navigateur, sélectionnez l’espace de travail utilisé pour ce tutoriel et développez pour afficher tous les éléments Lakehouse. Sélectionnez SalesLakehouse et vérifiez que la Nouvelle table par défaut est sélectionnée avant de sélectionner Suivant pour continuer.

    Screenshot of the destination target navigator window.

  9. Définissez la Méthode de mise à jour sur Ajouter, puis sélectionnez Enregistrer les paramètres.

    Notes

    Ce processus insère des données, en conservant les lignes existantes dans la table à chaque actualisation suivante.

    Screenshot of the destination settings menu selection.

  10. Sélectionnez Publier pour enregistrer votre flux de données et quitter l’éditeur Power Query Online.

    Screenshot of the publish button within Power Query Online.

  11. Pointez au-dessus du flux de données créé dans votre espace de travail, sélectionnez les points de suspension (...) et l’option Propriétés.

    Screenshot of the dataflows properties in a workspace.

  12. Remplacez le nom du flux de données par OnlineSalesDataflow, puis sélectionnez Enregistrer.

    Screenshot of renaming a dataflow option.

Orchestrer un pipeline de données

À l’aide de pipelines, nous orchestrons d’abord l’actualisation de notre flux de données. Si une erreur se produit, nous envoyons un e-mail Outlook personnalisé qui inclut d’importants détails.

  1. Sélectionnez l’élément Lakehouse nommé SalesLakehouse dans votre espace de travail.

    Screenshot of renaming an existing dataflow.

  2. Une fois dans l’éditeur Lakehouse, sélectionnez Nouveau pipeline de données.

    Notes

    Vous pouvez également sélectionner Obtenir des données dans le ruban, puis Nouveau pipeline de données.

    Screenshot of watermarks in the Lakehouse editor.

  3. Définissez le nom du pipeline sur SalesPipeline. Sélectionnez ensuite Créer.

    Screenshot of the pipeline name menu option.

  4. Fermez l’assistant Copie des données en sélectionnant Annuler. Si vous êtes invité à confirmer la sortie de la fenêtre de copie des données, sélectionnez Oui, annuler.

    Screenshot of the copy data assistant menu.

  5. Une fois dans l’éditeur de pipeline, sélectionnez Ajouter une activité de pipeline, puis Flux de données.

    Notes

    Vous pouvez également sélectionner Flux de données depuis le ruban.

    Screenshot of the pipeline watermark canvas and the add activity option.

  6. Sélectionnez l’activité de flux de données dans l’éditeur de pipeline et remplacez son Name par OnlineSalesActivity dans la section Général.

    Screenshot of the dataflow name value.

  7. L’activité de flux de données étant toujours sélectionnée, sélectionnez Paramètres et choisissez OnlineSalesDataflow dans la liste Flux de données. Si nécessaire pour mettre à jour la liste, sélectionnez l’icône Actualiser.

    Screenshot of the dataflow selection setting.

  8. Sélectionnez l’onglet Activités, puis l’activité Office365 Outlook.

    Notes

    Si une fenêtre Octroyer un consentement s’affiche, sélectionnez Ok, connectez-vous avec votre compte d’organisation, puis sélectionnez Autoriser l’accès.

    Screenshot of the Office365 Outlook activity information.

  9. Sélectionnez l’activité Office365 Outlook dans l’éditeur de pipeline et remplacez son Name par Mail en cas d’échec dans la section Général.

    Screenshot of the Office365 Outlook activity name.

  10. L’activité Office365 Outlook étant toujours sélectionnée, sélectionnez Paramètres. Mettez à jour le champ À avec votre adresse e-mail et l’Objet avec Échec du pipeline. Sélectionnez Ajouter un contenu dynamique [Alt+Maj+D] pour le corps du mail.

    Notes

    D’autres options de configuration d’e-mail telles que De (Envoyer en tant que), Cc, Cci, étiquette de confidentialité et bien plus encore sont disponibles depuis les Propriétés avancées.

    Screenshot of the Office365 Outlook settings.

  11. Dans le générateur d’expressions de pipeline, collez le bloc de code d’expression suivant :

    @concat(
        'Pipeline: '
        , 
        , '<br>'
        , 'Workspace: '
        , 
        , '<br>'
        , 'Time: '
        , 
    )
    

    Screenshot of the Office365 Outlook activity with expression builder.

  12. Sélectionnez Variables système et insérez les variables suivantes en sélectionnant le nom correspondant dans le tableau suivant.

    Nom de la valeur Lignes Variable système
    Pipeline : 3 ID du pipeline
    Espace de travail : 6 ID de l’espace de travail

    Screenshot of the pipeline system variables.

  13. Sélectionnez Fonctions et insérez la fonction suivante en sélectionnant le nom correspondant dans le tableau suivant. Quand vous avez terminé, sélectionnez OK.

    Nom de la valeur Lignes Variable système
    Time : 9 utcnow

    Screenshot of pipeline functions.

  14. Sélectionnez OnlineSalesActivity et, dans les options de chemin d’accès disponibles, sélectionnez et maintenez la touche « X » (En cas d’échec) pour créer une flèche qui sera supprimée sur l’activité Mail en cas d’échec. Cette activité est désormais appelée si OnlineSalesActivity échoue.

    Screenshot of the on failure path.

  15. Sous l’onglet Accueil, sélectionnez Planifier. Une fois que vous avez mis à jour les configurations suivantes, sélectionnez Appliquer pour enregistrer vos modifications.

    Nom Valeur
    Exécution planifiée Activé
    Répéter Quotidien
    Temps 12:00:00 AM

    Screenshot of on failure branch.

  16. Sous l’onglet Accueil, sélectionnez Exécuter. Si une fenêtre de dialogue s’affiche, sélectionnez l’option Enregistrer et exécuter pour continuer.

    Screenshot of the run option from the home tab.

    Pour surveiller l’état actuel du pipeline, vous pouvez afficher la table Sortie, qui affiche la progression actuelle de l’activité. La table s’actualisera régulièrement par elle-même, ou vous pouvez sélectionner manuellement l’icône d’actualisation pour la mettre à jour.

    Screenshot of the current pipeline activity progress.

  17. Lorsque l’état retourne Réussi, vous pouvez passer à la section suivante du tutoriel en retournant dans votre espace de travail.

    Screenshot of the side rail with workspace selection.

Créer un modèle sémantique dans Lakehouse

Les données que vous avez chargées sont presque prêtes pour la création de rapports. Nous allons d’abord utiliser le point de terminaison SQL pour créer des relations et des vues SQL dans notre lakehouse. Cela nous permet d’accéder facilement à nos données dans un modèle sémantique, qui est un modèle de métadonnées contenant des objets de base de données physiques abstraits et modifiés en dimensions logiques. Il est conçu pour présenter des données à des fins d’analyse en fonction de la structure de l’entreprise.

Créer des relations

Ce modèle est un schéma en étoile que vous pouvez voir à partir des entrepôts de données : il ressemble à une étoile. Le centre de l’étoile est une table de faits. Les tables environnantes sont appelées tables de dimension ; elles sont liées à la table de faits par des relations.


  1. Dans l’affichage de l’espace de travail, sélectionnez l’élément Point de terminaison SQL nommé SalesLakehouse.

    Screenshot of the SQL endpoint item in a workspace.

  2. Une fois dans l’explorateur, sélectionnez la vue Modèle en bas de l’écran pour commencer à créer des relations.

    Screenshot of the Model view selection.

  3. Créez une relation en faisant glisser et en déposant la colonne CustomerKey de la table FactOnlineSales vers CustomerKey de la table DimCustomer.

  4. Une fois dans la fenêtre Créer une relation, vérifiez que vous avez sélectionné les tables, colonnes et paramètres appropriés, comme indiqué dans le tableau suivant. Sélectionnez Confirmer pour continuer.

    Rendre cette relation active De : Table 1 (colonne) Vers : Table 2 (colonne) Cardinalité Direction du filtrage croisé
    FactOnlineSales (CustomerKey) DimCustomer (CustomerKey) Plusieurs à un (*:1) Unique

    Screenshot of Relationship between the FactOnlineSales and DimCustomer table.

  5. Effectuez ces mêmes étapes pour chacune des tables et colonnes restantes répertoriées dans le tableau suivant pour créer des relations.

    Rendre cette relation active De : Table 1 (colonne) Vers : Table 2 (colonne) Cardinalité Direction du filtrage croisé
    FactOnlineSales (ProductKey) DimProduct (ProductKey) Plusieurs à un (*:1) Unique
    FactOnlineSales (StoreKey) DimStore (StoreKey) Plusieurs à un (*:1) Unique
    FactOnlineSales (DateKey) DimDate (DateKey) Plusieurs à un (*:1) Unique
    DimStore (StoreKey) DimEmployee (StoreKey) Plusieurs à un (*:1) Les deux

    L’image suivante présente une vue terminée du modèle sémantique avec toutes les relations créées incluses.

    Screenshot of table relationships in the model view pane.

Écrire une mesure en DAX

Nous allons écrire une mesure de base qui calcule le montant total des ventes.

  1. Sélectionnez la table FactOnlineSales dans le dossier Tables. Dans l’onglet Accueil, sélectionnez Nouvelle mesure.

    Screenshot of table relationships in the model view.

  2. Dans l’éditeur de formule, copiez et collez ou tapez la mesure suivante pour calculer le montant total des ventes. Cochez la case pour valider.

    Total Sales Amount = SUM(FactOnlineSales[SalesAmount])
    

    Screenshot of Select the check mark to commit a DAX measure.

Créer une vue SQL

Nous allons écrire une instruction SQL qui calcule le montant total des ventes par mois. Nous enregistrerons ensuite cette instruction en tant que vue dans notre lakehouse. Cela nous permettra d’accéder facilement au montant total des ventes par mois à l’avenir.

  1. Dans l’onglet Accueil, sélectionnez Nouvelle requête SQL.

    Screenshot of New SQL query from the home tab.

  2. Dans l’éditeur de requête, copiez et collez ou tapez la requête ci-dessous pour calculer le montant total des ventes par numéro de mois dans l’ordre décroissant. Une fois entré, sélectionnez Exécuter pour afficher les résultats.

    SELECT 
    MONTH(DateKey) as "MonthNumber",
    SUM(SalesAmount) as "TotalSalesAmount"
    FROM FactOnlineSales
    GROUP BY MONTH(DateKey)
    

    Screenshot of SQL query editor.

  3. Mettez en surbrillance le texte complet de la requête, puis sélectionnez Enregistrer en tant que vue.

    Screenshot of Save as view option.

  4. Dans la fenêtre Enregistrer en tant que vue, définissez le Nom de la vue sur TotalSalesByMonth, puis sélectionnez OK.

    Screenshot of Save as view window.

  5. Dans l’explorateur, développez la section Vues et sélectionnez TotalSalesByMonth pour afficher les résultats dans l’Aperçu des données.

    Screenshot of Views with the Lakehouse explorer.

    Une fois que vous avez terminé d’explorer l’éditeur de point de terminaison SQL, vous pouvez passer à la section suivante du tutoriel en retournant dans votre espace de travail.

    Screenshot of the side rail and selection of the workspace.

Créer automatiquement un rapport

Maintenant que vous avez modélisé vos données, il est temps de visualiser et d’explorer vos données à l’aide de la création rapide.


  1. Dans l’affichage de l’espace de travail, pointez au-dessus du type d’élément Jeu de données (par défaut) et du nom de l’élément SalesLakehouse. Sélectionnez les points de suspension ( ... ) et choisissez Créer automatiquement un rapport.

    Screenshot of the Autocreate report option with a workspace.

    Un rapport est généré automatiquement pour vous et est mis à jour dynamiquement en fonction des sélections de colonnes dans le volet Vos données.

    • Le rapport affiché peut différer de l’image ci-dessous.

    Screenshot of the finished Auto-create report.

  2. Sélectionnez Enregistrer dans le ruban pour enregistrer une copie dans l’espace de travail actuel

    • Pour accéder à l’expérience de création visuelle complète, vous pouvez sélectionner Modifier dans le ruban.

    Screenshot of the Save button when visualizing data.

  3. Dans la boîte de dialogue Enregistrer votre rapport, tapez Sales Summary dans le champ Entrer un nom pour votre rapport. Sélectionnez Enregistrer une fois l’opération terminée.

    Screenshot of the Save button completing its process when visualizing data.

Vous pouvez en savoir plus sur la création rapide.

Félicitations ! Vous avez terminé ce tutoriel ! Si vous avez créé un espace de travail pour le tutoriel, vous pouvez choisir de le supprimer maintenant. Vous pouvez également supprimer les éléments individuels qui ont été créés au cours du tutoriel.

Nous espérons que ce tutoriel a montré comment les utilisateurs de Power BI peuvent facilement fournir des insights sur les données à n’importe quel niveau d’échelle avec Microsoft Fabric.