Tutoriel : Enregistrer des éléments de données dans Azure Data Catalog

Important

Azure Data Catalog sera mis hors service le 15 mai 2024.

Les nouveaux comptes Azure Data Catalog ne peuvent plus être créés.

Pour les fonctionnalités de catalogue de données mises à jour, utilisez le service Microsoft Purview, qui offre une gouvernance des données unifiée pour l’ensemble de votre patrimoine de données.

Si vous utilisez déjà Azure Data Catalog, vous devez créer un plan de migration pour que votre organisation passe à Microsoft Purview d’ici le 15 mai 2024.

Dans ce tutoriel, vous utilisez l’outil de référencement pour inscrire des ressources de données de l’exemple de base de données avec le catalogue. L’inscription est le processus par lequel les métadonnées structurelles clés (telles que les noms, les types et les emplacements) sont extraites de la source de données et des ressources qu’elle contient, puis copiées dans le catalogue. La source de données et les ressources de données restent au même endroit, mais les métadonnées sont utilisées par le catalogue pour faciliter leur découverte et leur compréhension.

Dans ce tutoriel, vous allez apprendre à :

  • Inscrire des ressources de données
  • Rechercher des ressources de données
  • Annoter les ressources de données
  • Se connecter aux ressources de données
  • Gérer les ressources de données
  • Supprimer des ressources de données

Prérequis

Pour configurer Data Catalog, vous devez être le propriétaire ou le copropriétaire d’un abonnement Azure.

Inscrire des ressources de données

Référencer une source de données

Dans cet exemple, nous inscrirons des ressources de données (tableaux) d’un exemple de base de données pour Azure SQL Database. Vous pouvez cependant utiliser n’importe quelle source de données prise en charge si vous préférez travailler avec des données plus familières et mieux adaptées à votre rôle. Pour obtenir la liste des sources de données prises en charge, consultez Sources de données prises en charge.

Le nom de la base de données que nous utilisons dans ce tutoriel est RLSTest.

Vous pouvez désormais inscrire des ressources de données de l’exemple de base de données à l’aide d’Azure Data Catalog.

  1. Accédez à la page d’accueil Azure Data Catalog, puis sélectionnez Publier des données.

    Le catalogue de données est ouvert avec le bouton Publier des données sélectionné.

  2. Sélectionnez Lancer l’application pour télécharger, installer et exécuter l’outil de référencement sur votre ordinateur.

    Dans la page Publier des données, le bouton Lancer l’application est sélectionné.

  3. Dans la page Bienvenue, sélectionnez Se connecter, puis entrez vos informations d’identification.

    Dans la page d’accueil, le bouton Se connecter est sélectionné.

  4. Dans la page Microsoft Azure Data Catalog, sélectionnez SQL Server, puis Suivant.

    Dans la page Microsoft Azure Data Catalog, le bouton SQL Server est sélectionné. Ensuite, le bouton suivant est sélectionné.

  5. Entrez les propriétés de connexion SQL Server pour votre exemple de base de données dans Azure SQL Database, puis sélectionnez SE CONNECTER.

    Dans la page des propriétés de connexion du serveur SQL, les zones de texte sont mises en surbrillance pour ces attributs : Nom du serveur, Nom d’utilisateur, Mot de passe et Base de données. Le bouton Se connecter est ensuite sélectionné.

  6. Enregistrez les métadonnées de votre ressource de données. Dans cet exemple, vous inscrivez les objets Product à partir de l’exemple d’espace de noms :

    1. Dans l’arborescence Hiérarchie du serveur, développez votre exemple de base de données, puis sélectionnez SalesLT.

    2. Appuyez sur la touche CTRL, puis sélectionnez Product, ProductCategory, ProductDescription et ProductModel.

    3. Sélectionnez la flèche de déplacement de la sélection (>). Cette action déplace tous les objets sélectionnés dans la liste Objets à inscrire .

      Dans la hiérarchie du serveur, Sales L T est sélectionné. Dans la liste d’Objets disponibles, le produit, la catégorie du produit, la description du produit, le modèle du produit et les objets de description du modèle de production sont surlignés. Ensuite le déplacement sélectionné > est sélectionné.

    4. Sélectionnez Include a Preview (Inclure un aperçu) pour inclure un aperçu instantané des données. L’instantané inclut jusqu’à 20 enregistrements de chaque table et est copié dans le catalogue.

    5. Sélectionnez Inclure le profil de données pour inclure un instantané des statistiques des objets du profil de données (par exemple, les valeurs minimale, maximale et moyenne d’une colonne ou le nombre de lignes).

    6. Dans le champ Ajouter des étiquettes, entrez sales, product, azure sql. Cette action ajoute des étiquettes de recherche à ces ressources de données. Les étiquettes sont un excellent moyen d’aider les utilisateurs à trouver une source de données inscrite.

    7. Spécifiez le nom d’un expert pour ces données (facultatif).

      Dans les objets à inscrire, ces noms sont affichés : produit, catégorie de produit, description du produit, modèle de produit et description du produit du modèle de produit. Ensuite, les options « Inclure l’aperçu » et « Inclure le profil de données » sont sélectionnées. Ensuite, trois balises sont ajoutées au champ de balise : ventes, produit et Azure SQL.

    8. Sélectionnez S’INSCRIRE. Azure Data Catalog enregistre les objets que vous avez sélectionnés. Dans cet exercice, les objets sélectionnés dans votre exemple de base de données sont inscrits. L’outil de référencement extrait les métadonnées de la ressource de données et les copie dans le service Azure Data Catalog. Les données restent où elles se trouvent actuellement. Les données restent sous le contrôle des administrateurs et des stratégies du système d’origine.

      Dans la fenêtre Microsoft Azure Data Catalog, tous les objets nouvellement inscrits sont affichés dans la liste Objets à inscrire. En haut de la fenêtre, une notification indique que le processus d’inscription des objets sélectionnés est terminé. Le bouton Afficher le portail est ensuite sélectionné.

    9. Pour voir les objets sources de données que vous avez inscrits, sélectionnez Afficher le portail. Dans le portail Azure Data Catalog, vérifiez que les quatre tables et la base de données sont affichées en mode Grille (la barre de recherche doit être vide).

      Dans la fenêtre Microsoft Azure Data Catalog, il existe de nouvelles vignettes dans l’affichage grille pour chacun des objets inscrits.

Dans cet exercice, vous avez inscrit des objets de l’exemple de base de données pour Azure SQL Database afin que les utilisateurs de votre organisation puissent les découvrir facilement.

Dans l’exercice suivant, vous apprenez à découvrir les ressources de données inscrites.

Découvrir les ressources de données

Dans Azure Data Catalog, la découverte utilise deux mécanismes principaux : la recherche et le filtrage.

La recherche est conçue pour être intuitive et puissante. Par défaut, les termes de recherche sont comparés à toutes les propriétés du catalogue, notamment aux annotations fournies par l’utilisateur.

Le filtrage est conçu pour compléter la recherche. Vous pouvez sélectionner des caractéristiques spécifiques telles que les experts, le type de source de données, le type d’objet et les balises, pour afficher les ressources de données correspondantes et pour limiter les résultats de la recherche aux ressources correspondantes.

En combinant la recherche et le filtrage, vous pouvez parcourir rapidement les sources de données qui sont inscrites auprès d’Azure Data Catalog.

Dans cet exercice, vous utilisez le portail Azure Data Catalog pour découvrir les ressources de données que vous avez enregistrées dans l’exercice précédent. Pour plus d’informations sur la syntaxe de recherche, consultez l’article Data Catalog Search syntax reference (Informations de référence sur la syntaxe de recherche dans Data Catalog) .

Voici quelques exemples de découverte des ressources de données dans le catalogue.

La recherche de base vous permet d’effectuer des recherches dans le catalogue en utilisant un ou plusieurs termes de recherche. Les résultats sont toutes les ressources correspondant à une propriété quelconque avec un ou plusieurs termes spécifiés.

  1. Sélectionnez Accueil dans le portail Azure Data Catalog. Si vous avez fermé le navigateur web, accédez à la page d’accueil Azure Data Catalog.

  2. Dans la zone de recherche, entrez product et appuyez sur ENTRÉE.

    Dans le portail Azure Data Catalog, le bouton Accueil est sélectionné. Ensuite, dans la zone de recherche; « produit » a été saisi.

  3. Vérifiez que les quatre tables et la base de données s’affichent dans les résultats. Vous pouvez basculer entre le mode Grille et le mode Liste en sélectionnant les boutons de la barre d’outils, comme l’illustre l’image suivante. Le mot clé de recherche est mis en surbrillance dans les résultats de recherche, car l’option Mettre en surbrillance est ACTIVÉE. Vous pouvez également spécifier le nombre de résultats par page dans les résultats de recherche.

    Dans la barre de recherche, « produits » est toujours entré, et les options de liste et d’affichage grille sont mises en surbrillance en regard de la barre de recherche. L’option « Résultats par page » est définie sur 10 et l’option « Surbrillance » est définie sur « on », de sorte que 10 résultats sont affichés sur la page, avec toutes les références à « produit » mises en surbrillance.

    Le panneau Recherches et le panneau Propriétés s’affichent respectivement à gauche et à droite. Le panneau Recherches vous permet de modifier les critères de recherche et de filtrer les résultats. Le panneau Propriétés affiche les propriétés d’un objet sélectionné dans la grille ou liste.

  4. Sélectionnez Product dans les résultats de la recherche. Sélectionnez les onglets Aperçu, Colonnes, Profil de données et Documentation, ou sélectionnez la flèche pour développer le volet inférieur.

    En haut des résultats de la recherche, le bouton « Aperçu » est sélectionné.

    L’aperçu des données de la table Product s’affiche dans l’onglet Aperçu.

  5. Sélectionnez l’onglet Colonnes pour rechercher des informations sur les colonnes (comme le nom et le type de données) dans la ressource de données.

  6. Sélectionnez l’onglet Profil de données pour voir le profilage des données (par exemple, le nombre de lignes, la taille des données ou la valeur minimale dans une colonne) dans la ressource de données.

Découvrir les ressources de données à l’aide de la fonction de recherche d’étendue de la propriété

L’étendue de la propriété vous permet de découvrir les ressources de données dans lesquelles le terme recherché correspond à la propriété spécifiée.

  1. Désactivez le filtre Table sous Type d’objet dans Filtres.

  2. Dans la zone de recherche, entrez tags:product et appuyez sur ENTRÉE. Consultez l’article Data Catalog Search syntax reference (Informations de référence sur la syntaxe de recherche dans Data Catalog) pour connaître toutes les propriétés que vous pouvez utiliser pour effectuer des recherches dans le catalogue de données.

  3. Vérifiez que les tables et la base de données s’affichent dans les résultats.

    « Balises : produit » est entré dans la barre de recherche, et le filtre Type d’objet affichant « Table » a été sélectionné.

  1. Dans le volet Recherches de la section Recherche actuelle, entrez un nom pour la recherche, puis sélectionnez Enregistrer.

    Dans le volet de recherche, « Recherche par étiquette de produit » a été entré comme nom pour la recherche. Ensuite, le bouton « Enregistrer » est sélectionné.

  2. Vérifiez que la recherche enregistrée s’affiche sous Recherches enregistrées.

  3. Sélectionnez l’une des actions que vous pouvez effectuer sur la recherche enregistrée (Renommer, Supprimer, Définir comme recherche par défaut).

Parenthèses de regroupement

Les parenthèses de regroupement vous permettent de grouper les parties de la requête à isoler logiquement, notamment avec des opérateurs booléens.

  1. Dans la zone de recherche, entrez name:product AND (tags:product AND objectType:table) et appuyez sur ENTRÉE.

  2. Vérifiez que seule la table Product s’affiche dans les résultats de la recherche.

    Dans la barre de recherche « nom : produit ET ( balises : produit ET Type d'objet : table ) » a été entré. La table produit est le seul résultat de recherche retourné.

Opérateurs de comparaison

Les opérateurs de comparaison vous permettent d’utiliser des comparaisons autres que l’égalité pour les propriétés comportant des types de données numériques et de date.

  1. Dans la zone de recherche, entrez lastRegisteredTime:>"06/09/2016".

  2. Désactivez le filtre Table sous Type d’objet.

  3. Appuyez sur Entrée.

  4. Vérifiez que les tables Product, ProductCategory et ProductDescription ainsi que la base de données SQL que vous avez inscrites s’affichent dans les résultats de la recherche.

    Dans la barre de recherche, la dernière Heure Enregistrée : > 06/09/2016 a été saisie. Les tables Produit, Catégorie du produit, Description du produit ont été renvoyées. La base de données SQL a également été renvoyée.

Consultez Guide pratique pour découvrir les ressources de données pour obtenir des informations détaillées sur la découverte des ressources de données. Pour plus d’informations sur la syntaxe de recherche, consultez Informations de référence sur la syntaxe de recherche de Data Catalog.

Annoter les ressources de données

Dans cet exercice, vous utilisez le portail Azure Data Catalog pour annoter (ajouter des informations comme des descriptions, des mots clés ou des experts) des ressources de données existantes dans le catalogue. Les annotations complètent les métadonnées structurelles extraites de la source de données pendant l’inscription. Elles facilitent considérablement la découverte et la compréhension des ressources de données.

Dans cet exercice, vous annotez une ressource de données unique (ProductPhoto). Vous ajoutez un nom convivial et une description à la ressource de données ProductPhoto.

  1. Accédez à la page d’accueil Azure Data Catalog et recherchez avec tags:product les ressources de données que vous avez inscrites.

  2. Sélectionnez ProductModel dans les résultats de la recherche.

  3. Entrez Images de produit comme Nom convivial et Photos de produit pour les documents marketing comme Description.

    Dans le volet Propriétés, le nom, le nom convivial et la description de la ressource sélectionnée sont affichés. Les informations sont modifiables.

    La Description aide les autres utilisateurs à découvrir et à comprendre pourquoi et comment utiliser la ressource de données sélectionnée. Vous pouvez également ajouter des balises supplémentaires et afficher les colonnes. Vous pouvez rechercher et filtrer les ressources de données à l’aide des métadonnées descriptives que vous avez ajoutées au catalogue.

Vous pouvez également effectuer les étapes suivantes de cette page :

  • Ajouter des experts pour la ressource de données. Sélectionnez Ajouter dans la zone Experts.

  • Ajouter des balises au niveau du jeu de données. Sélectionnez Ajouter dans la zone Balises. Une balise peut être une balise utilisateur ou une balise glossaire. L’édition Standard de Data Catalog comprend un glossaire métier qui permet aux administrateurs de catalogue de définir une taxonomie commerciale centrale. Les utilisateurs du catalogue peuvent ensuite annoter les ressources de données avec la terminologie du glossaire. Pour plus d’informations, consultez l’article Comment configurer le glossaire métier pour un balisage géré

  • Ajouter des balises au niveau des colonnes. Sélectionnez Ajouter sous Balises pour la colonne que vous souhaitez annoter.

  • Ajouter une description au niveau des colonnes. Entrez une description pour une colonne. Vous pouvez également afficher les métadonnées de description extraites de la source de données.

  • Ajoutez des informations sur le champ Demander l’accès pour expliquer aux utilisateurs comment demander un accès à la ressource de données.

  • Sélectionnez l’onglet Documentation et fournissez une documentation pour la ressource de données. La documentation Azure Data Catalog vous permet d’utiliser votre catalogue de données comme référentiel de contenu pour créer une narration complète de vos ressources de données.

Vous pouvez également ajouter une annotation à plusieurs ressources de données. Par exemple, vous pouvez sélectionner toutes les ressources de données que vous avez inscrites et leur spécifier un expert.

La case à cocher dans la ligne de titre du tableau des résultats est sélectionnée. Toutes les ressources retournées ont été sélectionnées lorsque cette case à cocher dans la ligne de titre a été sélectionnée. Les modifications dans la fenêtre « Propriétés » affectent toutes les ressources sélectionnées.

Azure Data Catalog prend en charge une approche basée sur le crowdsourcing pour les annotations. Tous les utilisateurs de Data Catalog peuvent ajouter des balises (utilisateur ou de glossaire), des descriptions et d’autres métadonnées. Ainsi, les utilisateurs ajoutent une perspective sur une ressource de données et son utilisation, et la partagent avec d’autres utilisateurs.

Consultez l’article How to annotate data assets (Annotation des ressources de données) pour obtenir des informations détaillées sur l’annotation des ressources de données.

Se connecter aux ressources de données

Dans cet exercice, vous ouvrez les ressources de données dans un outil client intégré (Excel) et dans un outil non intégré (SQL Server Management Studio) à l’aide des informations de connexion.

Notes

Il est important de rappeler qu’Azure Data Catalog ne vous donne pas accès à la source de données elle-même : il vous permet simplement de découvrir et de comprendre plus facilement cette source de données. Lorsque vous vous connectez à une source de données, l’application cliente que vous choisissez utilise vos informations d’identification Windows ou vous invite, si nécessaire, à saisir vos informations d’identification. Si l’accès à la source de données ne vous a pas été préalablement accordé, vous devez obtenir cet accès avant de pouvoir vous connecter.

Se connecter à une ressource de données à partir d’Excel

  1. Sélectionnez Produit dans les résultats de la recherche. Dans la barre d’outils, sélectionnez Ouvrir dans, puis Excel.

    Le produit est sélectionné dans la table des résultats retournés. Le bouton Ouvrir dans est sélectionné et Excel est sélectionné dans le menu déroulant.

  2. Sélectionnez Ouvrir dans la fenêtre contextuelle de téléchargement. Cette expérience peut varier en fonction du navigateur.

  3. Dans la fenêtre Avis de sécurité Microsoft Excel, sélectionnez Activer.

    Dans la fenêtre contextuelle Avis de sécurité Microsoft Excel, le bouton Activer est sélectionné.

  4. Conservez les valeurs par défaut dans la boîte de dialogue Importer des données, puis sélectionnez OK.

    Dans la boîte de dialogue Importer des données, OK est sélectionné.

  5. La source de données s’affiche dans Excel.

    Toutes les données sont affichées dans le tableau Excel.

SQL Server Management Studio

Dans cet exercice, vous vous êtes connecté aux ressources de données découvertes à l’aide d’Azure Data Catalog. Le portail Azure Data Catalog vous permet de vous connecter directement à l’aide d’applications clientes intégrées au menu Ouvrir dans . Vous pouvez également vous connecter avec l’application de votre choix en utilisant les informations d’emplacement de connexion incluses dans les métadonnées des ressources. Par exemple, vous pouvez utiliser SQL Server Management Studio pour vous connecter à Azure SQL Database afin d’accéder aux données des ressources de données inscrites dans ce tutoriel.

  1. Ouvrez SQL Server Management Studio.

  2. Dans la boîte de dialogue Se connecter au serveur, entrez le nom du serveur dans le volet Propriétés du portail Azure Data Catalog.

  3. Utilisez l’authentification et les informations d’identification appropriées pour accéder à la ressource de données. Si vous n’avez pas accès à la ressource, utilisez les informations du champ Demander l’accès pour l’obtenir.

    Dans la boîte de dialogue Informations de connexion, le champ Demander l’accès est mis en surbrillance.

Sélectionnez Afficher les chaînes de connexion pour afficher et copier les chaînes de connexion ADO.NET, ODBC et OLEDB dans le Presse-papiers pour les utiliser dans votre application.

Gérer les ressources de données

Dans cette étape, vous apprenez à configurer la sécurité de vos ressources de données. Data Catalog ne permet pas aux utilisateurs d’accéder aux données proprement dites. Le propriétaire de la source de données contrôle l’accès aux données.

Data Catalog vous permet de découvrir les sources de données et d’afficher les métadonnées relatives aux sources inscrites dans le catalogue. Il peut arriver, cependant, que seuls certains utilisateurs ou groupes soient autorisés à accéder à une source de données. Pour ces scénarios, vous pouvez utiliser Data Catalog pour vous approprier les ressources de données inscrites et contrôler la visibilité des ressources que vous détenez.

Notes

Les fonctionnalités de gestion décrites dans cet exercice sont disponibles uniquement dans l’édition Standard d’Azure Data Catalog, et non dans l’édition gratuite. Dans Azure Data Catalog, vous pouvez vous approprier des ressources de données, ajouter des copropriétaires aux ressources de données et définir la visibilité de ces ressources.

S’approprier les ressources de données et restreindre leur visibilité

  1. Accédez à la page d’accueil Azure Data Catalog. Dans la zone de texte Recherche, entrez tags:cycles et appuyez sur ENTRÉE.

  2. Sélectionnez un élément dans la liste des résultats, puis Appropriation dans la barre d’outils.

  3. Dans la section Gestion du panneau Propriétés, sélectionnez Appropriation.

    L’élément Produit est sélectionné dans la liste des résultats et, dans l’onglet Propriétés, dans la section Gestion, le bouton Prendre possession est mis en surbrillance.

  4. Pour restreindre la visibilité, choisissez Propriétaires et ces utilisateurs dans la section Visibilité, puis sélectionnez Ajouter. Entrez les adresses de messagerie des utilisateurs dans la zone de texte et appuyez sur ENTRÉE.

    Dans l’onglet Propriétés, dans la section Gestion, le bouton Ajouter sous Propriétaires est sélectionné. Ensuite, sous Visibilité, le bouton Propriétaires et ces utilisateurs est sélectionné. Ensuite, sous Visibilité, le bouton Ajouter est sélectionné.

Supprimer les ressources de données

Dans cet exercice, vous utilisez le portail Azure Data Catalog pour supprimer les aperçus de données des ressources de données inscrites et pour supprimer les ressources de données du catalogue.

Dans Azure Data Catalog, vous pouvez supprimer une ou plusieurs ressources.

  1. Accédez à la page d’accueil Azure Data Catalog.

  2. Dans la zone de texte Recherche, entrez tags:cycles, puis sélectionnez ENTRÉE.

  3. Sélectionnez un élément dans la liste des résultats, puis sélectionnez Supprimer dans la barre d’outils, comme illustré dans l’image suivante :

    La vignette Produit est sélectionnée dans une liste de résultats de recherche, et le bouton Supprimer est sélectionné dans la barre d’outils supérieure.

    Si vous utilisez le mode Liste, la case à cocher se situe à gauche de l’élément, comme indiqué dans l’image suivante :

    En mode Liste, la zone de sélection se trouve à gauche de l’élément de résultat de recherche. La ressource Produit est sélectionnée et le bouton Supprimer est sélectionné dans la barre d’outils supérieure.

    Vous pouvez également sélectionner et supprimer plusieurs ressources de données comme indiqué dans l’image suivante :

    Azure Data Catalog -- Supprimer plusieurs ressources de donnéesEn mode Liste, plusieurs ressources ont été sélectionnées et le bouton Supprimer est sélectionné dans la barre d’outils supérieure.

Notes

Par défaut, le catalogue permet aux utilisateurs d’inscrire n’importe quelle source de données et de supprimer toutes les ressources de données préalablement inscrites. Les fonctionnalités de gestion incluses dans l’édition Standard d’Azure Data Catalog offrent des options supplémentaires qui permettent l’appropriation de ressources, ce qui limite les fonctions de découverte et de suppression des ressources à certains utilisateurs.

Nettoyer les ressources

Procédez de la manière décrite dans Supprimer les ressources de données pour nettoyer les ressources que vous avez utilisées en suivant ce tutoriel.

Résumé

Dans ce didacticiel, vous avez exploré les fonctionnalités essentielles d’Azure Data Catalog, notamment l’inscription, l’annotation, la découverte et la gestion des ressources de données d’entreprise. Maintenant que vous avez terminé ce didacticiel, il est temps de passer à la pratique. Vous pouvez commencer dès aujourd’hui en enregistrant les sources de données que vous et votre équipe utilisez, et en invitant vos collègues à utiliser le catalogue.

Étapes suivantes