Analyse des données de page web à l’aide de Power BI Desktop (didacticiel)Analyzing Web page data using Power BI Desktop (tutorial)

Dans ce didacticiel, vous allez apprendre à importer une table de données à partir d’une page web et à créer un rapport pour visualiser ces données.In this tutorial, you learn how to import a table of data from a Web page and create a report to visualize this data. Dans le cadre de ce processus, vous naviguez dans des tables via une page web et appliquez des étapes de transformation de données pour donner une nouvelle forme à la table.As part of this process, you navigate across tables available on a web page, and apply data transformation steps to bring the table into a new shape.

Contenu de cet article :In this article:

  • Tâche 1 : se connecter à une source de données webTask 1: Connect to a web data source
  • Tâche 2 : mettre en forme les données dans la vue RequêteTask 2: Shape data in the Query view
    • Étape 1 : supprimer des colonnes pour afficher uniquement les colonnes dignes d’intérêtStep 1: Remove Other Columns to only display columns of interest
    • Étape 2 : remplacer des valeurs pour nettoyer les valeurs d’une colonne sélectionnéeStep 2: Replace Values to clean up values in a selected column
    • Étape 3 : filtrer les valeurs d’une colonneStep 3: Filter values in a column
    • Étape 4 : renommer une colonneStep 4: Rename a column
    • Étape 5 : filtrer les valeurs null d’une colonneStep 5: Filter null values in a column
    • Étape 6 : renommer une requêteStep 6: Rename a query
    • Étapes de requête crééesQuery Steps created
  • Tâche 3 : créer des visualisations en utilisant la vue RapportTask 3: Create visualizations using the Report view
    • Étape 1 : charger la requête dans votre rapportStep 1: Load the query to your report
    • Étape 2 : créer une visualisation CarteStep 2: Create a Map visualization

Tâche 1 : se connecter à une source de données webTask 1: Connect to a web data source

Dans la tâche 1, vous importez une table de résumé de tournoi à partir de la page Wikipédia du championnat d’Europe de football de l’UEFA à l’adresse suivante : http://en.wikipedia.org/wiki/UEFA_European_Football_ChampionshipIn task 1, you import a Tournament Summary table from the UEFA European Football Championship Wikipedia page at the following location: http://en.wikipedia.org/wiki/UEFA_European_Football_Championship

Ajouter une source de données d’une page WikipédiaAdd a Wikipedia page data source

  1. Dans la boîte de dialogue Prise en main ou sous l’onglet Accueil du ruban, sélectionnez Obtenir des données.In the Getting Started dialog or in the Home ribbon tab, select Get Data.
  2. Dans la boîte de dialogue Obtenir des données qui s’affiche, vous pouvez choisir parmi une large gamme de sources de données pour importer des données dans Power BI Desktop.This brings up the Get Data dialog, where you can pick from a wide range of data sources to import data into Power BI Desktop. Nous allons sélectionner Web, qui est disponible sous le groupe Toutes ou Autre.We will select Web which is available under the All or Other group.
  3. Dans la boîte de dialogue Contenu web, dans la zone de texte URL, collez l’URL Wikipédia (http://en.wikipedia.org/wiki/UEFA_European_Football_Championship).In the Web Content dialog box, in the URL text box, paste the Wikipedia URL (http://en.wikipedia.org/wiki/UEFA_European_Football_Championship).
  4. Cliquez sur OK.Click OK.

Une fois établie la connexion à la page web, la liste des tables disponibles dans cette page Wikipédia apparaît dans la boîte de dialogue Navigateur.After establishing a connection to the web page, you see a list of tables available on this Wikipedia page in the Navigator dialog. Vous pouvez cliquer sur chacune de ces tables pour afficher un aperçu des données.You can single-click on each of these tables to preview the data.

Dans le volet gauche du Navigateur, sélectionnez la table Results[edit] des résultats récapitulatifs du tournoi, ou sélectionnez la table Results[edit] et sélectionnez Modifier.In the Navigator left-pane, select the Results[edit] table for the Tournament Summary results, or select the Results[edit] table and select Edit. Cela nous permettra de remodeler cette table avant de la charger dans le rapport, car les données ne se présentent pas dans la forme nécessaire pour notre analyse.This will allow us to reshape this table before loading it to the Report, since the data is not in the shape that we need for our analysis.

Nous obtiendrons ainsi un aperçu de la table dans la vue Requête, où nous pourrons appliquer un ensemble d’étapes de transformation pour nettoyer les données.This will land a preview of the table in the Query view, where we can apply a set of transformation steps to clean up the data.

Tâche 2 : mettre en forme les données de la table subjectTask 2: Shape data in the subject table

La table subject étant sélectionnée pour votre requête de données, vous pouvez apprendre à effectuer différentes étapes de mise en forme et de nettoyage de données.Now that you have the subject table selected for your data query, you learn how to perform various data shaping and cleansing steps.

Étape 1 : supprimer des colonnes pour afficher uniquement les colonnes dignes d’intérêtStep 1: Remove Other Columns to only display columns of interest

Dans cette étape, vous supprimez toutes les colonnes sauf Year et Final Winner.In this step, you remove all columns except Year and Final Winners.

  1. Dans la grille d’aperçu de la requête, sélectionnez les colonnes Year et Final Winner (utilisez Ctrl + clic.In the Query Preview grid, select the Year and Final Winners columns (use CTRL + Click).
  2. Cliquez avec le bouton droit sur un en-tête de colonne dans la grille d’ aperçu de la requête, puis cliquez sur Supprimer d’autres colonnes pour supprimer les colonnes non sélectionnées.Right-click a column header in the Query Preview grid, and click Remove Other Columns to remove the unselected columns. Notez que vous pouvez également effectuer cette opération dans le groupe Gérer les colonnes de l’onglet Accueil du ruban.Note that this operation is also available in the Home ribbon tab, in the Manage Columns group.

Étape 2 : remplacer des valeurs pour nettoyer les valeurs d’une colonne sélectionnéeStep 2: Replace Values to clean up values in a selected column

Dans cette étape, vous remplacez le suffixe Details dans la colonne Year.In this step, you replace the Details suffix in the Year column. Ce suffixe étant sur une ligne à part, il n’est pas visible dans l’aperçu de la table.Note that this suffix is on a new line so it is not visible in the table preview. Toutefois, si vous cliquez sur l’une des cellules comportant une valeur numérique dans la colonne Year, vous verrez la valeur complète dans la vue détaillée.However, if you click in one of the cells with a numeric value in the Year column, you will see the full value in the detailed view.

  1. Sélectionnez la colonne Year.Select the Year column.
  2. Dans le ruban de la vue Requête, cliquez sur Remplacer les valeurs sous l’onglet Accueil ou cliquez avec le bouton droit sur la colonne Year, puis cliquez sur Remplacer les valeurs pour remplacer Details par une chaîne vide.In the Query view ribbon, click Replace Values under the Home tab or right-click the Year column, and click Replace Values to replace Details with empty text.
  3. Dans la boîte de dialogue Remplacer les valeurs, tapez Details dans la zone de texte Valeur à rechercher et laissez la zone de texte Remplacer par vide.In the Replace Values dialog box, type Details in the Value to Find text box and leave the Replace With text box empty.
  4. Cliquez sur OK.Click OK.

Étape 3 : filtrer les valeurs d’une colonneStep 3: Filter values in a column

Dans cette étape, vous filtrez la colonne Year pour afficher les lignes qui ne contiennent pas « Year ».In this step, you filter the Year column to display rows that do not contain “Year”.

  1. Cliquez sur la flèche déroulante de filtre dans la colonne Year.Click the filter drop down arrow on the Year column.
  2. Dans la liste déroulante Filtrer, décochez l’option Year.In the Filter drop-down, clear the Year option.
  3. Cliquez sur OK.Click OK.

Étape 4 : renommer une colonneStep 4: Rename a column

Les données de la colonne Year étant nettoyées, nous allons nous pencher sur la colonne Final Winner.Now that we have cleaned up the data in the Year column, we are going to work on the Final Winner column.

Dans la mesure où seule la liste des vainqueurs nous intéresse, nous pouvons renommer cette colonne Country.Since we are only looking at the list of winners, we can rename this column to Country.

  1. Sélectionnez la colonne Final Winner dans l’aperçu de la requête.Select the Final Winner column in the Query preview.
  2. Dans la vue Requête du ruban, sous l’onglet Transformer et le groupe N’importe quelle colonne, sélectionnez l’option Renommer.In the Query view ribbon, under the Transform tab and Any Column group, you will find Rename.
  3. Cela rend le nom de colonne modifiable.This will make the column name editable. Nous allons renommer cette colonne Country.We will rename this column to Country.

Étape 5 : filtrer les valeurs null d’une colonneStep 5: Filter out null values in a column

Nous devons également filtrer les valeurs null de la colonne Country.We also need to filter out null values in the Country column. Pour ce faire, nous pouvons utiliser le menu Filtrer vu à l’étape 3 ou procéder comme suit :In order to do this, we could use the filter menu as we saw in Step 3, or alternatively we can:

  1. Dans la colonne Country, cliquez avec le bouton droit sur une cellule qui contient une valeur null.Right-click on one of the cells in the Country column that contain a null value.
  2. Sélectionnez Filtres de texte -> N’est pas égal à dans le menu contextuel.Select Text Filters -> Does not Equal in the context menu.
  3. Cette opération crée une étape de filtre permettant de supprimer les lignes qui contiennent la valeur null dans la colonne Country.This creates a new filter step to remove rows with null values in the Country column.

Étape 6 : nommer une requêteStep 6: Name a query

Dans cette étape, vous nommez votre dernière requête Euro Cup Winners.In this step, you name your final query Euro Cup Winners.

  1. Dans le volet Paramètres d’une requête, dans la zone de texte Nom, entrez Euro Cup Winners.In the Query Settings pane, in the Name text box, enter Euro Cup Winners.

Tâche 3 : créer des visualisations à l’aide de la vue RapportTask 3: Create visualizations using the Report view

Les données ayant la forme nécessaire pour notre analyse, nous pouvons charger la table résultante dans notre rapport et créer quelques visualisations.Now that we have converted the data into the shape that we need for our analysis, we can load the resulting table into our Report and create a few visualizations.

Étape 1 : charger la requête dans votre rapportStep 1: Load the query to your report

Pour charger les résultats de la requête dans Power BI Desktop et créer le rapport, nous sélectionnons Fermer et charger dans le ruban Accueil.In order to load the query results to Power BI Desktop and create a report, we select Close & Load from the Home ribbon.

Cette opération déclenche l’évaluation de la requête et le chargement de la sortie de table dans le rapport.This will trigger evaluation of the query and load of the table output to the Report. Dans Power BI Desktop, sélectionnez l’icône Rapport pour afficher la vue Rapport dans Power BI Desktop.In Power BI Desktop, select the Report icon to see Power BI Desktop in Report view.

Les champs de la table résultants apparaissent dans le volet Champs à droite de la vue Rapport.You can see the resulting table fields in the Fields pane at the right of the Report view.

Étape 2 : créer une visualisation CarteStep 2: Create a Map visualization

Pour créer une visualisation, nous pouvons faire glisser-déplacer des champs de la liste Champs dans le canevas de rapport.In order to create a visualization, we can drag fields from the Field list and drop them in the Report canvas.

  1. Faites glisser-déplacer le champ Country dans le canevas de rapport.Drag the Country field and drop it in the Report canvas. Cette opération crée une visualisation dans le canevas de rapport.This will create a new visualization in the Report canvas. Dans ce cas, étant donné que nous disposons d’une liste de pays, nous obtenons une visualisation Carte.In this case, since we have a list of countries, it will create a Map visualization.

  2. Nous pouvons facilement modifier le type de visualisation en cliquant sur une autre icône dans le volet Visualisation.We can easily change the type of visualization by clicking on a different icon in the Visualization pane.

  3. Nous allons conserver le type de visualisation Carte. Nous pouvons aussi redimensionner la visualisation en faisant glisser un angle de la visualisation jusqu’à obtenir la taille souhaitée.We are going to stay with the Map visualization type to Map, We can also resize the visualization by dragging from one of the corners of the visualization up to the desired size.

  4. Notez qu’actuellement tous les points de la carte ont la même taille.Note that currently all the points in the map have the same size. Nous voulons modifier cela afin que la taille du point représentant chaque pays soit proportionnelle au nombre de tournois de la coupe d’Europe gagnés par le pays concerné.We want to change this so that countries with more Euro Cup tournaments won are represented with a larger point in the map. Pour ce faire, nous pouvons faire glisser le champ Year de la liste Champs jusqu’à la zone Valeurs dans la moitié inférieure du volet Champs.In order to do thiso, we can drag the Year field in the Fields list to the Values box in the lower half of the Fields pane.

Comme vous pouvez le voir, il est très facile de personnaliser les visualisations dans votre rapport, afin de présenter les données de la façon souhaitée.As you can see, it is very easy to customize visualizations in your report, in order to present the data in the way that you want. Power BI Desktop fournit une expérience de bout en bout transparente, allant de la récupération de données d’un large éventail de sources de données à la visualisation de ces données au moyen de méthodes interactives et enrichies, en passant par leur mise en forme en fonction des besoins d’analyse.Power BI Desktop provides a seamless end-to-end experience from getting data from a wide range of data sources and shaping it to meet your analysis needs to visualizing this data in rich and interactive ways. Une fois que votre rapport est prêt, vous pouvez le charger dans Power BI et créer des tableaux de bord basés sur celui-ci, que vous pouvez partager avec d’autres utilisateurs de Power BI.Once your report is ready, you can upload it to Power BI and create dashboards based on it, which you can share with other Power BI users.

Ainsi prend fin le didacticiel Importation de données à partir du web.This concludes the Importing Data from the Web tutorial. Vous pouvez télécharger le fichier Power BI Desktop complet ici.You can download the completed Power BI Desktop file here.

Où obtenir des informations supplémentaires ?Where else can I get more information?