Jeux de données dans le service Power BI

Cet article fournit une explication technique des jeux de données Power BI.

Types de jeux de données

Les jeux de données Power BI représentent une source de données prêtes pour la création de rapports et la visualisation. Il existe cinq types de jeux de données différents, créés de la manière suivante :

  • Connexion à un modèle de données existant non hébergé dans une capacité Power BI
  • Chargement d'un fichier Power BI Desktop contenant un modèle
  • Chargement d'un classeur Excel (contenant un ou plusieurs tableaux Excel et/ou un modèle de données de classeur), ou chargement d'un fichier CSV (valeurs séparées par des virgules)
  • Utilisation du service Power BI pour créer un jeu de données push
  • Utilisation du service Power BI pour créer un jeu de données de streaming ou de streaming hybride

À l'exception des jeux de données de streaming, le jeu de données représente un modèle de données qui tire parti des technologies de modélisation éprouvées d’Analysis Services.

Notes

Dans notre documentation, les termes jeux de données et modèles sont parfois utilisés de manière interchangeable. Généralement, du point de vue du service Power BI, il s'agit d’un jeu de données, et du point de vue du développement, on parle alors d’un modèle. Dans le contexte de notre documentation, ces termes signifient à peu près la même chose.

Modèles hébergés à l'extérieur

Il existe deux types de modèles hébergés externes : SQL Server Analysis Services et Azure Analysis Services.

La connexion à un modèle SQL Server Analysis Services implique l'installation de la passerelle de données locale, qu'il s'agisse d'une infrastructure en tant que service (IaaS) hébergée localement ou sur une machine virtuelle. Azure Analysis Services n'a pas besoin de passerelle.

La connexion à Analysis Services est souvent utile lorsqu'il existe des investissements de modèle existants, qui font généralement partie d'un entrepôt de données d'entreprise (EDW). Power BI permet d’établir une connexion active avec Analysis Services, en appliquant des autorisations d’accès aux données avec l'identité de l'utilisateur du rapport Power BI. Pour SQL Server Analysis Services, les modèles multidimensionnels (cubes) et les modèles tabulaires sont pris en charge. Comme le montre l'image suivante, un jeu de données de connexion active transmet les requêtes à des modèles hébergés à l'extérieur.

Un jeu de données de connexion active transmet les requêtes à un modèle hébergé à l'extérieur

Modèles développés avec Power BI Desktop

Power BI Desktop, une application client destinée au développement Power BI, peut être utilisée pour développer un modèle. Le modèle représente en fait un modèle tabulaire Analysis Services. Les modèles peuvent être développés en important des données à partir de flux de données, qui peuvent ensuite être intégrées à des sources de données externes. Bien que les détails sur la façon dont la modélisation peut être réalisée sortent du cadre de cet article, il est important de comprendre qu'il existe trois différents types, ou modes, de modèles pouvant être développés en utilisant Power BI Desktop. Ces modes déterminent si les données sont importées dans le modèle ou si elles restent dans la source de données. Les trois modes sont : Import, DirectQuery et Composite. Pour plus d'informations sur chaque mode, voir l’article Modes de jeu de données dans le service Power BI.

Les modèles hébergés à l'extérieur et les modèles Power BI Desktop peuvent renforcer la sécurité au niveau des lignes (RLS) afin de limiter les données récupérées pour un utilisateur donné. Par exemple, les utilisateurs affectés au groupe de sécurité Vendeurs ne peuvent voir que les données des rapports pour la ou les régions de vente auxquelles ils sont affectés. Les rôles RLS sont dynamiques ou statiques. Les rôles dynamiques filtrent par utilisateur du rapport, tandis que les rôles statiques appliquent les mêmes filtres à tous les utilisateurs affectés au rôle. Pour plus d’informations, consultez Sécurité au niveau des lignes (SNL) avec Power BI.

Modèles de classeur Excel

La création de jeux de données basés sur des classeurs Excel ou des fichiers CSV entraîne la création automatique d'un modèle. Les tableaux Excel et les données CSV sont importés pour créer des tableaux de modèles, tandis qu'un modèle de données de classeur Excel est transposé pour créer un modèle Power BI. Dans tous les cas, les données variables sont importées dans un modèle.

Récapitulatif

Il est donc possible de distinguer les jeux de données Power BI qui représentent des modèles :

  • Ils sont soit hébergés dans le service Power BI, soit hébergés en externe par Analysis Services.
  • Ils peuvent stocker des données importées, émettre des demandes d'interrogation en transit aux sources de données sous-jacentes, ou utiliser une combinaison des deux.

Voici un résumé des faits importants concernant les jeux de données Power BI qui représentent des modèles :

  • Les modèles hébergés SQL Server Analysis Services nécessitent une passerelle pour effectuer des requêtes de connexion active.
  • Modèles hébergés par Power BI qui importent des données :
    • Pour être interrogés, ces modèles doivent être entièrement chargés en mémoire.
    • Nécessitent un rafraîchissement pour maintenir les données à jour, et doivent impliquer des passerelles lorsque les données source ne sont pas accessibles directement sur Internet.
  • Les modèles hébergés par Power BI qui utilisent le mode de stockage DirectQuery nécessitent une connectivité aux données source. Lorsque le modèle est interrogé, Power BI envoie des requêtes aux données source pour récupérer les données actuelles. Ce mode doit impliquer des passerelles lorsque les données source ne sont pas accessibles directement sur Internet.
  • Des modèles peuvent appliquer des règles RLS, en utilisant des filtres pour limiter l'accès aux données à certains utilisateurs.

Considérations

Pour déployer et gérer Power BI avec succès, il est important de comprendre où les modèles sont hébergés, leur mode de stockage, les dépendances par rapport aux passerelles, la taille des données importées, ainsi que le type et la fréquence de rafraîchissement. Ces configurations peuvent toutes avoir un impact significatif sur les ressources de capacité de Power BI. De plus, la conception même du modèle, y compris ses requêtes de préparation des données, ses relations et ses calculs, s'ajoutent à ces diverses considérations.

Il est également important de comprendre que les modèles d'importation hébergés par Power BI peuvent être actualisés selon un calendrier, ou déclenchés à la demande par un utilisateur du service Power BI.

Étapes suivantes