Bonnes pratiques de déploiement de Microsoft Purview (anciennement Azure Purview)

Cet article est un guide pour déployer Correctement Microsoft Purview (anciennement Azure Purview) en production dans votre patrimoine de données. Il est destiné à vous aider à élaborer des stratégies et à mettre en phase votre déploiement de la recherche au renforcement de votre environnement de production. Il est préférable de l’utiliser en tandem avec notre liste de vérification du déploiement.

Remarque

Ces bonnes pratiques couvrent le déploiement des solutions de gouvernance des données unifiées Microsoft Purview. Pour plus d’informations sur les solutions de conformité et de risque Microsoft Purview, accédez ici. Pour plus d’informations sur Microsoft Purview en général, accédez ici.

Si vous recherchez un guide de déploiement strictement technique, utilisez la liste de contrôle du déploiement.

Si vous créez un plan de déploiement de Microsoft Purview et que vous souhaitez prendre en compte les meilleures pratiques à mesure que vous développez votre stratégie de déploiement, suivez l’article ci-dessous. Ce guide décrit les tâches qui peuvent être effectuées par phases au cours d’un mois ou plus pour développer votre processus de déploiement pour Microsoft Purview. Même les organisations qui ont déjà déployé Microsoft Purview peuvent utiliser ce guide pour s’assurer qu’elles tirent le meilleur parti de leur investissement.

Un déploiement bien planifié de votre plateforme de gouvernance des données peut offrir les avantages suivants :

  • Meilleure découverte des données
  • Collaboration analytique améliorée
  • Retour sur investissement maximal

Ce guide fournit des informations sur un cycle de vie de déploiement complet, de la planification initiale à un environnement mature en suivant ces étapes :

Phase Description
Identifier les objectifs et les objectifs Tenez compte de ce que l’ensemble de votre organization souhaite et a besoin de la gouvernance des données.
Collecte de questions Quelles sont les questions que vous et votre équipe pourriez avoir au début, et où pouvez-vous chercher pour commencer à y répondre ?
Créer un processus pour passer en production Créez une stratégie de déploiement par phases adaptée à votre organization.
Renforcement de la plateforme Continuez à développer votre déploiement jusqu’à maturité.

La plupart des applications et fonctionnalités de Microsoft Purview ont également leurs propres pages de meilleures pratiques individuelles. Ils sont souvent référencés tout au long de ce guide de déploiement, mais vous pouvez tous les trouver dans la table des matières sous Concepts , puis Meilleures pratiques et instructions.

Identifier les objectifs et les objectifs

De nombreuses organisations ont commencé leur parcours de gouvernance des données en développant des solutions individuelles qui répondent aux exigences spécifiques des groupes isolés et des domaines de données dans l’organization. Bien que les expériences puissent varier en fonction du secteur, du produit et de la culture, la plupart des organisations ont du mal à maintenir des contrôles et des stratégies cohérents pour ces types de solutions.

Voici quelques-uns des objectifs courants de gouvernance des données que vous pouvez identifier dans les premières phases pour créer une expérience complète de gouvernance des données :

  • Optimisation de la valeur métier de vos données
  • Activation d’une culture des données dans laquelle les consommateurs de données peuvent facilement trouver, interpréter et approuver les données
  • Amélioration de la collaboration entre différentes unités commerciales pour fournir une expérience de données cohérente
  • Favoriser l’innovation en accélérant l’analytique des données pour tirer parti des avantages du cloud
  • Réduction du temps de découverte des données par le biais d’options en libre-service pour différents groupes de compétences
  • Réduction du délai de commercialisation pour la livraison de solutions d’analytique qui améliorent le service à leurs clients
  • Réduction des risques opérationnels dus à l’utilisation d’outils spécifiques à un domaine et de technologies non prises en charge

L’approche générale consiste à décomposer ces objectifs généraux en différentes catégories et objectifs. En voici quelques exemples :

Catégorie Objectif
Découverte Administration utilisateurs doivent être en mesure d’analyser les sources de données Azure et non Azure (y compris les sources locales) pour collecter automatiquement des informations sur les ressources de données.
Classification La plateforme doit classer automatiquement les données en fonction d’un échantillonnage des données et autoriser le remplacement manuel à l’aide de classifications personnalisées.
Modèle de consommation Les utilisateurs professionnels doivent être en mesure de trouver des informations sur chaque ressource pour les métadonnées métier et techniques.
Lignée Chaque ressource doit afficher une vue graphique des jeux de données sous-jacents afin que les utilisateurs comprennent les sources d’origine et les modifications qui ont été apportées.
Collaboration La plateforme doit permettre aux utilisateurs de collaborer en fournissant des informations supplémentaires sur chaque ressource de données.
Reporting Les utilisateurs doivent être en mesure d’afficher les rapports sur le patrimoine de données, y compris les données sensibles et les données qui nécessitent un enrichissement supplémentaire.
Gouvernance des données La plateforme doit permettre à l’administrateur de définir des stratégies de contrôle d’accès et d’appliquer automatiquement l’accès aux données en fonction de chaque utilisateur.
Flux de travail La plateforme doit avoir la possibilité de créer et de modifier un workflow afin de faciliter le scale-out et l’automatisation de diverses tâches au sein de la plateforme.
Intégration D’autres technologies tierces telles que la création de tickets ou l’orchestration doivent être en mesure de s’intégrer à la plateforme via un script ou des API REST.

Identifier les scénarios clés

Les services de gouvernance Microsoft Purview peuvent être utilisés pour gérer de manière centralisée la gouvernance des données dans le patrimoine de données d’une organization couvrant les environnements cloud et locaux. Pour réussir l’implémentation, vous devez identifier les scénarios clés qui sont critiques pour l’entreprise. Ces scénarios peuvent franchir les limites de l’unité commerciale ou affecter plusieurs personnages utilisateur amont ou en aval.

Ces scénarios peuvent être écrits de différentes façons, mais vous devez inclure au moins ces cinq dimensions :

  1. Persona : qui sont les utilisateurs ?
  2. Système source : quelles sont les sources de données telles que Azure Data Lake Storage Gen2 ou Azure SQL Database ?
  3. Zone d’impact : quelle est la catégorie de ce scénario ?
  4. Scénarios détaillés : comment les utilisateurs utilisent Microsoft Purview pour résoudre les problèmes ?
  5. Résultat attendu : quels sont les critères de réussite ?

Les scénarios doivent être spécifiques, actionnables et exécutables avec des résultats mesurables. Voici quelques exemples de scénarios que vous pouvez utiliser :

Scénario Détails Persona
Cataloguer les ressources critiques pour l’entreprise J’ai besoin d’informations sur chaque jeu de données pour avoir une bonne compréhension de ce qu’il s’agit. Ce scénario inclut des données de métadonnées métier et techniques sur le jeu de données dans le catalogue. Les sources de données incluent Azure Data Lake Storage Gen2, Azure Synapse DW et/ou Power BI. Ce scénario inclut également des ressources locales telles que SQL Server. Analyste d’entreprise, Scientifique des données, Ingénieurs Données
Découvrir les ressources critiques pour l’entreprise J’ai besoin d’un moteur de recherche capable de rechercher dans toutes les métadonnées du catalogue. Je devrais pouvoir effectuer une recherche à l’aide d’un terme technique, d’un terme commercial avec une recherche simple ou complexe à l’aide de caractères génériques. Analyste d’entreprise, Scientifique des données, Ingénieurs Données, Administration données
Suivre les données pour comprendre leur origine et résoudre les problèmes de données Je dois disposer d’une traçabilité des données pour effectuer le suivi des données dans les rapports, les prédictions ou les modèles jusqu’à leur source d’origine. J’ai également besoin de comprendre les modifications apportées aux données et où les données se sont stockées tout au long du cycle de vie des données. Ce scénario doit prendre en charge les pipelines de données hiérarchisés Azure Data Factory et Databricks. Ingénieurs Données, Scientifique des données
Enrichir des métadonnées sur des ressources de données critiques Je dois enrichir le jeu de données dans le catalogue avec des métadonnées techniques générées automatiquement. La classification et l’étiquetage en sont quelques exemples. Ingénieurs Données, propriétaire du domaine/de l’entreprise
Gouverner les ressources de données avec une expérience utilisateur conviviale J’ai besoin d’un glossaire métier pour les métadonnées spécifiques à l’entreprise. Les utilisateurs professionnels peuvent utiliser Microsoft Purview pour les scénarios en libre-service afin d’annoter leurs données et de permettre aux données d’être facilement découvertes via la recherche. Propriétaire de domaine/entreprise, analyste d’entreprise, Scientifique des données, Ingénieurs Données

Points d’intégration à Microsoft Purview

Il est probable qu’un organization mature dispose déjà d’un catalogue de données. La question clé est de savoir s’il faut continuer à utiliser la technologie existante et à se synchroniser avec le Mappage de données Microsoft Purview et Data Catalog ou non. Pour gérer la synchronisation avec des produits existants dans un organization, Microsoft Purview fournit des API REST Atlas. Les API Atlas fournissent un mécanisme puissant et flexible qui gère à la fois les scénarios d’envoi (push) et d’extraction (pull). Les informations peuvent être publiées sur Microsoft Purview à l’aide des API Atlas pour le démarrage ou pour envoyer (push) les dernières mises à jour d’un autre système dans Microsoft Purview. Les informations disponibles dans Microsoft Purview peuvent également être lues à l’aide des API Atlas, puis synchronisées avec les produits existants.

Pour d’autres scénarios d’intégration tels que la création de tickets, l’interface utilisateur personnalisée et l’orchestration, vous pouvez utiliser des API Atlas et des points de terminaison Kafka. En général, il existe quatre points d’intégration avec Microsoft Purview :

  • Ressource de données : Cela permet à Microsoft Purview d’analyser les ressources d’un magasin afin d’énumérer ces ressources et de collecter toutes les métadonnées disponibles les concernant. Par conséquent, pour SQL, il peut s’agir d’une liste de bases de données, de tables, de procédures stockées, de vues et de données de configuration les concernant conservées dans des emplacements tels que sys.tables. Pour quelque chose comme Azure Data Factory (ADF), il peut s’agir d’énumérer tous les pipelines et d’obtenir des données sur le moment où ils ont été créés, la dernière exécution, l’état actuel.
  • Traçabilité : cela permet à Microsoft Purview de collecter des informations à partir d’un système d’analyse/mutation de données sur la façon dont les données se déplacent. Pour quelque chose comme Spark, il peut s’agir de collecter des informations à partir de l’exécution d’un notebook pour voir quelles données le notebook a ingérées, comment il l’a transformé et où il les a générées. Pour quelque chose comme SQL, il peut s’agir d’analyser les journaux des requêtes pour rétroconcevoir les opérations de mutation exécutées et ce qu’elles ont fait. Nous prenons en charge la traçabilité basée sur l’envoi et l’extraction en fonction des besoins.
  • Classification : Cela permet à Microsoft Purview de prendre des échantillons physiques à partir de sources de données et de les exécuter via notre système de classification. Le système de classification détermine la sémantique d’un élément de données. Par exemple, nous savons peut-être qu’un fichier est un fichier Parquet et comporte trois colonnes et que la troisième est une chaîne. Mais les classifieurs que nous exécutons sur les exemples nous indiquent que la chaîne est un nom, une adresse ou un numéro de téléphone. L’activation de ce point d’intégration signifie que nous avons défini comment Microsoft Purview peut ouvrir des objets tels que des notebooks, des pipelines, des fichiers Parquet, des tables et des conteneurs.
  • Expérience incorporée : les produits qui ont une expérience de type « studio » (par exemple, ADF, Synapse, SQL Studio, PBI et Dynamics) veulent généralement permettre aux utilisateurs de découvrir les données avec lesquelles ils souhaitent interagir et de trouver des emplacements pour générer des données. Le catalogue de Microsoft Purview peut vous aider à accélérer ces expériences en fournissant une expérience d’incorporation. Cette expérience peut se produire au niveau de l’API ou de l’expérience utilisateur au choix du partenaire. En incorporant un appel à Microsoft Purview, le organization peut tirer parti de la carte du patrimoine de données de Microsoft Purview pour rechercher des ressources de données, consulter la traçabilité, case activée schémas, examiner les évaluations, les contacts, etc.

Collecte de questions

Une fois que votre organization est d’accord sur les objectifs et les objectifs de haut niveau, il y aura de nombreuses questions de plusieurs groupes. Il est essentiel de rassembler ces questions afin d’élaborer un plan pour répondre à toutes les préoccupations. Veillez à inclure des groupes pertinents au fur et à mesure que vous rassemblez ces questions. Vous pouvez utiliser notre documentation pour commencer à y répondre.

Voici quelques exemples de questions que vous pouvez rencontrer pendant la phase initiale :

Même si vous n’avez peut-être pas la réponse immédiate à la plupart de ces questions, la collecte de questions peut aider votre organization à structurer ce projet et à vous assurer que toutes les exigences « obligatoires » peuvent être satisfaites.

Inclure les bonnes parties prenantes

Pour garantir la réussite de l’implémentation de Microsoft Purview pour l’ensemble de votre organization, il est important d’impliquer les bonnes parties prenantes. Seules quelques personnes sont impliquées dans la phase initiale. Toutefois, à mesure que l’étendue s’étend, vous aurez besoin d’un plus grand nombre de personnes pour contribuer au projet et fournir des commentaires.

Voici quelques parties prenantes clés que vous souhaiterez peut-être inclure :

Persona Rôles
Responsable des données Le CDO supervise une gamme de fonctions qui peuvent inclure la gestion des données, la qualité des données, la master la gestion des données, la science des données, l’aide à la décision et la création d’une stratégie de données. Ils peuvent être le sponsor du projet d’implémentation Microsoft Purview.
Propriétaire du domaine/de l’entreprise Un homme d’affaires qui influence l’utilisation des outils et a un contrôle budgétaire
Analyste de données Capable d’encadrer un problème métier et d’analyser les données pour aider les dirigeants à prendre des décisions commerciales
Architecte de données Concevoir des bases de données pour des applications métier stratégiques, ainsi que concevoir et implémenter la sécurité des données
Ingénieurs Données Exploiter et gérer la pile de données, extraire des données de différentes sources, intégrer et préparer des données, configurer des pipelines de données
Scientifique des données Créer des modèles analytiques et configurer des produits de données accessibles par les API
Administration de base de données Posséder, suivre et résoudre les incidents et demandes liés à la base de données dans le cadre de contrats de niveau de service (SLA) ; Peut configurer des pipelines de données
DevOps Développement et implémentation d’applications métier ; peut inclure l’écriture de scripts et des fonctionnalités d’orchestration
Spécialiste de la sécurité des données Évaluer la sécurité globale du réseau et des données, qui implique des données entrantes et sortantes de Microsoft Purview

Créer un processus pour passer en production

Ci-dessous, nous avons fourni un plan de déploiement potentiel en quatre phases qui inclut des tâches, des liens utiles et des critères d’acceptation pour chaque phase :

  1. Phase 1 : Pilote
  2. Phase 2 : Produit minimum viable
  3. Phase 3 : Préproduction
  4. Phase 4 : Production

Phase 1 : Pilote

Dans cette phase, Microsoft Purview doit être créé et configuré pour un petit ensemble d’utilisateurs. En règle générale, il s’agit simplement d’un groupe de 2 à 3 personnes travaillant ensemble pour exécuter des scénarios de bout en bout. Ils sont considérés comme les défenseurs de Microsoft Purview dans leur organization. L’objectif main de cette phase est de s’assurer que les fonctionnalités clés peuvent être satisfaites et que les parties prenantes appropriées sont au courant du projet.

Tâches à effectuer

Tâche Détails Durée
Rassembler & s’entendre sur les exigences Discutez avec toutes les parties prenantes pour rassembler un ensemble complet d’exigences. Différents personnages doivent participer pour s’entendre sur un sous-ensemble d’exigences à remplir pour chaque phase du projet. Une semaine
Navigation dans le portail de gouvernance Microsoft Purview Découvrez comment utiliser Microsoft Purview à partir de la page d’accueil. Un jour
Configurer ADF pour la traçabilité Identifiez les pipelines clés et les ressources de données. Rassemblez toutes les informations requises pour vous connecter à un compte ADF interne. Un jour
Analysez une source de données telle qu’Azure Data Lake Storage Gen2 ou un serveur SQL. Ajoutez la source de données et configurez une analyse. Vérifiez que l’analyse détecte correctement toutes les ressources. Deux jours
Rechercher et parcourir Autoriser les utilisateurs finaux à accéder à Microsoft Purview et à effectuer des scénarios de recherche et de navigation de bout en bout. Un jour

Critères d’acceptation

  • Le compte Microsoft Purview est créé correctement dans organization abonnement sous le locataire organization.
  • Un petit groupe d’utilisateurs avec plusieurs rôles peut accéder à Microsoft Purview.
  • Microsoft Purview est configuré pour analyser au moins une source de données.
  • Les utilisateurs doivent être en mesure d’extraire les valeurs clés de Microsoft Purview, telles que :
    • Rechercher et parcourir
    • Lignée
  • Les utilisateurs doivent être en mesure d’attribuer la propriété de la ressource dans la page des ressources.
  • Présentation et démonstration pour sensibiliser les principales parties prenantes.
  • Adhésion de la direction pour approuver davantage de ressources pour la phase MVP.

Phase 2 : Produit minimum viable

Une fois que vous avez les exigences convenues et que vous avez participé aux unités commerciales pour intégrer Microsoft Purview, l’étape suivante consiste à travailler sur une version de produit minimum viable (MVP). Dans cette phase, vous allez étendre l’utilisation de Microsoft Purview à un plus grand nombre d’utilisateurs qui auront plus de besoins horizontalement et verticalement. Il existe des scénarios clés qui doivent être respectés horizontalement pour tous les utilisateurs, tels que les termes du glossaire, la recherche et la navigation. Il y aura également des exigences détaillées verticalement pour chaque division ou groupe afin de couvrir des scénarios spécifiques de bout en bout, tels que la traçabilité de Azure Data Lake Storage à Azure Synapse DW à Power BI.

Tâches à effectuer

Tâche Détails Durée
Analyser Azure Synapse Analytics Commencer à intégrer vos sources de base de données et les analyser pour remplir les ressources clés Deux jours
Créer des classifications et des règles personnalisées Une fois vos ressources analysées, vos utilisateurs peuvent se rendre compte qu’il existe d’autres cas d’usage pour une classification supplémentaire en plus des classifications par défaut de Microsoft Purview. 2-4 semaines
Analyser Power BI Si votre organization utilise Power BI, vous pouvez analyser Power BI afin de collecter toutes les ressources de données utilisées par les scientifiques des données ou les analystes de données qui ont des exigences pour inclure la traçabilité de la couche de stockage. 1-2 semaines
Importer les termes du glossaire Dans la plupart des cas, votre organization peut déjà développer une collection de termes de glossaire et d’affectation de termes à des ressources. Cela nécessite un processus d’importation dans Microsoft Purview via .csv fichier. Une semaine
Ajouter des contacts à des ressources Pour les principales ressources, vous pouvez établir un processus pour autoriser d’autres personnages à attribuer des contacts ou à les importer via des API REST. Une semaine
Ajouter des étiquettes sensibles et analyser Cela peut être facultatif pour certaines organisations, en fonction de l’utilisation de l’étiquetage à partir de Microsoft 365. 1-2 semaines
Obtenir des informations sensibles et de classification Pour les rapports et les insights dans Microsoft Purview, vous pouvez accéder à cette fonctionnalité pour obtenir différents rapports et fournir une présentation à la direction. Un jour
Intégrer davantage d’utilisateurs à l’aide d’utilisateurs gérés par Microsoft Purview Cette étape nécessite que le Administration Microsoft Purview fonctionne avec le Administration Azure Active Directory pour établir de nouveaux groupes de sécurité afin d’accorder l’accès à Microsoft Purview. Une semaine

Critères d’acceptation

  • Intégration réussie d’un plus grand groupe d’utilisateurs à Microsoft Purview (50+)
  • Analyser les sources de données critiques pour l’entreprise
  • Importer et affecter tous les termes critiques du glossaire
  • Test réussi de l’étiquetage important sur les ressources clés
  • Scénarios minimaux réussis pour les utilisateurs des unités commerciales ayant participé

Phase 3 : Préproduction

Une fois la phase MVP passée, il est temps de planifier le jalon de préproduction. Vous pouvez inclure l’analyse sur des sources de données locales telles que SQL Server. S’il existe une lacune dans les sources de données non prises en charge par Microsoft Purview, il est temps d’explorer l’API Atlas pour comprendre d’autres options.

Tâches à effectuer

Tâche Détails Durée
Affiner votre analyse à l’aide de l’ensemble de règles d’analyse Votre organization aura de nombreuses sources de données pour la préproduction. Il est important de définir au préalable des critères clés pour l’analyse afin que les classifications et l’extension de fichier puissent être appliquées de manière cohérente dans l’ensemble du tableau. 1-2 jours
Évaluer la disponibilité des régions pour l’analyse de chacune de vos sources en vérifiant les pages sources En fonction de la région des sources de données et des exigences organisationnelles en matière de conformité et de sécurité, vous pouvez envisager les régions qui doivent être disponibles pour l’analyse. Un jour
Comprendre le concept de pare-feu lors de l’analyse Cette étape nécessite une exploration de la façon dont le organization configure son pare-feu et comment Microsoft Purview peut s’authentifier pour accéder aux sources de données à des fins d’analyse. Un jour
Comprendre Private Link concept lors de l’analyse Si votre organization utilise Private Link, vous devez jeter les bases de la sécurité réseau pour inclure Private Link dans les exigences. Un jour
Analyser les SQL Server locales Cette option est facultative si vous avez des SQL Server locales. L’analyse nécessite la configuration d’un Integration Runtime auto-hébergé et l’ajout de SQL Server en tant que source de données. 1-2 semaines
Utiliser l’API REST Microsoft Purview pour les scénarios d’intégration Si vous avez besoin d’intégrer Microsoft Purview à d’autres technologies tierces telles que l’orchestration ou le système de tickets, vous pouvez explorer la zone API REST. 1-4 semaines
Comprendre la tarification de Microsoft Purview Cette étape fournit les organization informations financières importantes pour prendre une décision. 1-5 jours

Critères d’acceptation

  • Intégration réussie d’au moins une unité commerciale avec tous les utilisateurs
  • Analyser une source de données locale telle que SQL Server
  • Preuve de concept au moins un scénario d’intégration à l’aide de l’API REST
  • Terminer un plan pour passer en production, qui doit inclure des domaines clés sur l’infrastructure et la sécurité

Phase 4 : Production

Les phases ci-dessus doivent être suivies pour créer une gestion efficace du cycle de vie des données, qui constitue la base d’une meilleure gouvernance des programmes. La gouvernance des données aidera vos organization à se préparer aux tendances croissantes telles que l’IA, Hadoop, l’IoT et la blockchain. Ce n’est que le début pour de nombreux aspects des données et de l’analytique, et il y en a beaucoup d’autres qui peuvent être discutés. Le résultat de cette solution offrirait les avantages suivants :

  • Axée sur l’entreprise : solution alignée sur les besoins et les scénarios de l’entreprise par rapport aux exigences techniques.
  • Future Ready : une solution optimise les fonctionnalités par défaut de la plateforme et utilise les pratiques standardisées du secteur pour les activités de configuration ou de script afin de prendre en charge les progrès/l’évolution de la plateforme.

Tâches à effectuer

Tâche Détails Durée
Analyser les sources de données de production avec le pare-feu activé Si cela est facultatif lorsque le pare-feu est en place, mais qu’il est important d’explorer les options permettant de renforcer votre infrastructure. 1-5 jours
Activer Private Link Si cette option est facultative lorsque Private Link est utilisé. Sinon, vous pouvez ignorer ce paramètre, car il s’agit d’un critère obligatoire lorsque Private est activé. 1-5 jours
Créer un workflow automatisé Le flux de travail est important pour automatiser les processus tels que l’approbation, l’escalade, la révision et la gestion des problèmes. 2-3 semaines
Créer une documentation sur l’opération La gouvernance des données n’est pas un projet unique. Il s’agit d’un programme continu visant à alimenter la prise de décision pilotée par les données et à créer des opportunités pour l’entreprise. Il est essentiel de documenter les procédures clés et les normes métier. Une semaine

Critères d’acceptation

  • Intégration réussie de toutes les unités commerciales et de leurs utilisateurs
  • Répondre aux exigences d’infrastructure et de sécurité pour la production
  • Répondre à tous les cas d’usage requis par les utilisateurs

Renforcement de la plateforme

D’autres étapes de renforcement peuvent être effectuées :

  • Augmentez la posture de sécurité en activant l’analyse sur les ressources de pare-feu ou en utilisant Private Link
  • Affiner l’analyse d’étendue pour améliorer les performances de l’analyse
  • Utiliser des API REST pour exporter des métadonnées et des propriétés critiques pour la sauvegarde et la récupération
  • Utiliser le workflow pour automatiser la création de tickets et les événements afin d’éviter les erreurs humaines
  • Utilisez des stratégies pour gérer l’accès aux ressources de données via le portail de gouvernance Microsoft Purview.

Considérations relatives au cycle de vie

Un autre aspect important à inclure dans votre processus de production est la façon dont les classifications et les étiquettes peuvent être migrées. Microsoft Purview a plus de 90 classifieurs système. Vous pouvez appliquer des classifications système ou personnalisées sur des ressources de fichier, de table ou de colonne. Les classifications sont comme des balises d’objet et sont utilisées pour marquer et identifier le contenu d’un type spécifique trouvé dans votre patrimoine de données pendant l’analyse. Les étiquettes de confidentialité sont utilisées pour identifier les catégories de types de classification dans les données de votre organisation, puis regrouper les stratégies que vous souhaitez appliquer à chaque catégorie. Il utilise les mêmes types d’informations sensibles que Microsoft 365, ce qui vous permet d’étendre vos stratégies de sécurité et votre protection existantes à l’ensemble de votre contenu et de votre patrimoine de données. Il peut analyser et classer automatiquement des documents. Par exemple, si vous avez un fichier nommé multiple.docx et qu’il contient un numéro d’identification national dans son contenu, Microsoft Purview ajoute une classification telle que numéro d’identification national de l’UE dans la page Détails de la ressource.

Dans le Mappage de données Microsoft Purview, il existe plusieurs domaines dans lesquels les administrateurs de catalogue doivent garantir la cohérence et les bonnes pratiques de maintenance tout au long de leur cycle de vie :

  • Ressources de données : les sources de données doivent être réanalysées dans les environnements. Il n’est pas recommandé d’analyser uniquement en développement, puis de les régénérer à l’aide d’API en production. La main raison est que les scanneurs Microsoft Purview effectuent beaucoup plus de « câblage » en arrière-plan sur les ressources de données, ce qui peut être complexe pour les déplacer vers un autre instance Microsoft Purview. Il est beaucoup plus facile d’ajouter simplement la même source de données en production et d’analyser à nouveau les sources. La meilleure pratique générale consiste à disposer d’une documentation sur toutes les analyses, connexions et mécanismes d’authentification utilisés.
  • Ensembles de règles d’analyse : il s’agit de votre collection de règles affectées à une analyse spécifique, comme le type de fichier et les classifications à détecter. Si vous n’avez pas autant d’ensembles de règles d’analyse, il est possible de les recréer manuellement via production. Cela nécessite un processus interne et une bonne documentation. Toutefois, si vos ensembles de règles changent sur une base quotidienne ou hebdomadaire, cela peut être résolu en explorant l’itinéraire de l’API REST.
  • Classifications personnalisées : vos classifications peuvent également ne pas changer régulièrement. Au cours de la phase initiale du déploiement, la compréhension des différentes exigences pour créer des classifications personnalisées peut prendre un certain temps. Toutefois, une fois réglé, cela nécessitera peu de changements. Il est donc recommandé ici de migrer manuellement toutes les classifications personnalisées sur ou d’utiliser l’API REST.
  • Glossaire : il est possible d’exporter et d’importer des termes de glossaire via l’expérience utilisateur. Pour les scénarios d’automatisation, vous pouvez également utiliser l’API REST.
  • Stratégies de modèle d’ensemble de ressources : cette fonctionnalité est avancée pour toutes les organisations classiques à appliquer. Dans certains cas, votre Azure Data Lake Storage a des conventions d’affectation de noms de dossiers et une structure spécifique qui peuvent entraîner des problèmes pour que Microsoft Purview génère le jeu de ressources. Votre unité commerciale peut également vouloir modifier la construction de l’ensemble de ressources avec davantage de personnalisations pour répondre aux besoins de l’entreprise. Pour ce scénario, il est préférable de suivre toutes les modifications via l’API REST et de documenter les modifications via une plateforme de gestion de version externe.
  • Attribution de rôle : c’est là que vous contrôlez qui a accès à Microsoft Purview et les autorisations dont il dispose. Microsoft Purview dispose également de l’API REST pour prendre en charge l’exportation et l’importation d’utilisateurs et de rôles, mais ce n’est pas compatible avec l’API Atlas. Il est recommandé d’attribuer un groupe de sécurité Azure et de gérer l’appartenance au groupe à la place.

Déplacement de locataires

Le déplacement de locataires n’est actuellement pas pris en charge pour Microsoft Purview.

Prochaines étapes