L’étape suivante consiste à utiliser Azure Data Factory pour créer un pipeline pour extraire les données de Microsoft 365 vers le compte stockage Azure à l’aide de Microsoft Graph data connect.

Créer un pipeline Azure Data Factory

  1. Ouvrez un navigateur et allez sur votre portail Azure.

  2. Connectez-vous à l’aide d’un compte accordant des droits d’administrateur général à vos locataires Azure Microsoft 365 client.

  3. Dans la barre latérale, sélectionnez Créer une ressource.

  4. Recherchez le type de ressource Data Factory et utilisez les valeurs suivantes pour le créer, puis sélectionnez Créer.

    1. Abonnement : sélectionnez votre abonnement Azure

    2. Groupe de ressources : GraphDataConnect

    3. Région : sélectionnez une région Azure dans la même région que Microsoft 365 région

    4. Nom : dfM365toBlobStorage

    5. Version : V2

      Capture d’écran montrant la création réussie du nouveau service Azure Data Factory dans le portail Azure.

    6. Dans l’onglet Configuration de Git , veillez à configurer Git ou à sélectionner l’option Configurer Git ultérieurement.

  5. Une fois la ressource Azure Data Factory créée, sélectionnez la vignette Auteur et Moniteur pour lancer l’éditeur en plein écran Azure Data Factory.

    Capture d’écran montrant l’interface utilisateur du portail Azure pour le service Data Factory. L’utilisateur clique sur le bouton Auteur et moniteur.

  6. Passez de la vue d’ensemble à l’expérience Gérer en la sélectionnant dans le navigation gauche.

  7. Par défaut, Azure Data Factory utilise un runtime d’intégration qui résolvant automatiquement la région. Étant donné que Connecter données nécessite que votre source et destination, ainsi que votre runtime d’intégration existent dans la même région Microsoft 365, nous vous recommandons de créer un runtime d’intégration avec une région fixe.

    1. Sélectionnez Integration runtimesNew > .

    2. Sélectionnez Azure, Auto-hébergé et Continue.

    3. Sélectionnez Azure pour l’environnement réseau et continuez.

      Capture d’écran montrant l’interface utilisateur du portail Azure pour le service Data Factory. L’utilisateur sélectionne l’option Azure pour l’environnement réseau.

    4. Utilisez les détails suivants pour terminer le formulaire sur l’écran final, puis sélectionnez Créer.

      • Nom : nom de votre runtime d’intégration
      • Description : entrez une description
      • Région : sélectionnez la région qui correspond à Microsoft 365 région
      • Configuration du réseau virtuel (prévisualisation) : désactivée
  8. Passez de l’expérience Gérer à l’expérience Auteur en la sélectionnant dans le navigation gauche.

  9. Créez un pipeline en sélectionnant l’icône plus , puis le pipeline.

    Capture d’écran montrant l’interface utilisateur du portail Azure pour le service Data Factory. L’utilisateur crée un pipeline.

    • Faites glisser l’activité Copier les données de la section Déplacer et transformer sur l’surface de conception.

      Capture d’écran montrant l’interface utilisateur du portail Azure pour le service Data Factory. L’utilisateur fait glisser l’activité de copie des données dans l’éditeur sur le côté droit de l’écran.

    • Sélectionnez l’activité dans le concepteur.

    • Sélectionnez l’onglet Général et donnez-lui un nom et une description.

      • Nom : CopyFromM365toBlobStorage
      • Description : description de votre souhaitez.
    • Dans le volet de l’éditeur d’activités sous le concepteur, sélectionnez l’onglet Source, puis Nouveau.

    • Recherchez le jeu de Office 365 données, sélectionnez-le, puis sélectionnez le bouton Continuer.

      Capture d’écran montrant l’interface utilisateur du portail Azure pour le service Data Factory. L’utilisateur sélectionne le jeu Office 365 données dans l’interface utilisateur, puis sélectionne le bouton Continuer par la suite.

    • Le concepteur met à jour l’onglet Source avec les paramètres Microsoft 365 connecteur de connexion.

    • Sélectionnez l’option Ouvrir en côté du champ Jeu de données source.

    • Dans les paramètres du tableau, sélectionnez l’onglet Connexion , puis le bouton Nouveau.

    • Dans la boîte de dialogue qui s’affiche, entrez l’ID d’application et l’ID secret de l’application Azure AD précédemment créés respectivement dans les champs ID principal de service et Clé principale de service, puis sélectionnez Créer.

    • Sélectionnez le runtime d’intégration que vous avez précédemment créé dans le Connecter via la droptime d’intégration.

      Capture d’écran montrant l’interface utilisateur du portail Azure pour le service Data Factory. L’utilisateur configure le runtime d’intégration avec la clé principale du service.

    • Après avoir créé la Microsoft 365, pour le champ Table, sélectionnez BasicDataSet_v0. Message_v0.

    • Passez d’Office365Table à Pipeline > Source. Utilisez les valeurs suivantes pour le filtre Date.

      • Nom de la colonne : CreatedDateTime
      • Heure de début (UTC) : sélectionner une date antérieure à la date actuelle
      • Heure de fin (UTC) : sélectionner la date actuelle
      • Sélectionnez Importer le schéma dans la section Colonnes de sortie.
    • Sélectionnez l’activité Copier les données dans l’onglet Pipeline, puis l’onglet Sink .

      • Sélectionnez le bouton Nouveau, sélectionnez Azure Blob Stockage, puis le bouton Continuer.
      • Sélectionnez Binaire comme format pour les données, puis sélectionnez le bouton Continuer.
      • Nommez le jeu de données M365JsonFile et créez un service lié s’il n’existe pas déjà.
    • Dans le tableau, sélectionnez l’onglet Connexion , puis Nouveau.

    • Définissez les valeurs suivantes dans la boîte de dialogue, puis sélectionnez Terminer.

      • Méthode d’authentification : principal de service
      • Abonnement Azure : sélectionner tout
      • Stockage de compte : mgdcm365datastore
        • Il s’agit du compte de stockage créé précédemment dans cet exercice.
      • Client : entrez l’ID de votre client Azure
      • ID principal de service : entrez l’ID de l’application Azure AD que vous avez créée précédemment
      • Clé principale de service : entrez la clé de hachage de l’application Azure AD que vous avez créée précédemment
    • En de côté du champ Chemin d’accès au fichier, sélectionnez Parcourir.

    • Sélectionnez le nom du conteneur de stockage que vous avez créé précédemment.

      Capture d’écran montrant l’interface utilisateur du portail Azure pour le service Data Factory. L’utilisateur configure le conteneur et le chemin d’accès au fichier dans les propriétés du conteneur.

  10. Une fois le pipeline créé, sélectionnez le bouton Valider tout en haut du concepteur.

  11. Après avoir validé (et corrigé les problèmes trouvés), sélectionnez le bouton Publier tout en haut du concepteur.

Exécuter le pipeline Azure Data Factory

Une fois le pipeline créé, il est maintenant temps de l’exécuter.

Notes

L’apparition de la demande de consentement peut prendre plusieurs minutes et il n’est pas rare que l’ensemble du processus (démarrage, demande de consentement et après approbation du consentement à la fin de l’exécution du pipeline) prenne plus de 40 minutes.

  1. Dans le concepteur Azure Data Factory, avec le pipeline ouvert, sélectionnez Ajouter un déclencheur > Déclencheur maintenant.

    Capture d’écran montrant l’interface utilisateur du portail Azure pour le service Data Factory pour montrer comment activer un déclencheur dans le pipeline.

  2. Après avoir commencé le travail, dans le menu de la barre latérale, sélectionnez Surveiller pour afficher les travaux en cours d’exécution.

  3. Dans la barre de navigation de gauche, recherchez l’onglet Pipeline s’exécute et sélectionnez-le. Sélectionnez le pipeline sous la colonne Nom du pipeline pour afficher l’activité s’exécute. Ce pipeline s’affiche comme étant en cours.

    Capture d’écran montrant l’interface utilisateur du portail Azure pour Data Factory, qui affiche la liste d’exécute le pipeline.

  4. Une fois que vous êtes dans l’affichage Activité s’exécute, allez à la section Activité s’exécute, qui se trouve dans le côté inférieur de la page.

  5. Pointez sur le nom de l’activité et sélectionnez l’option bascule. L’onglet Détails est alors mis en avant.

    Capture d’écran montrant l’interface utilisateur du portail Azure pour l’activité de fabrique de données s’exécute, l’utilisateur sélectionne les googles dans le nom de l’activité pour ouvrir l’onglet Détails.

  6. Dans l’écran Détails , recherchez l’état de l’activité du pipeline comme le montre l’image suivante. Dans ce cas, vous pouvez voir qu’il est dans l’état RequestingConsent.

    Capture d’écran montrant l’interface utilisateur du portail Azure pour le service Data Factory où l’état de chargement de la demande est définie sur « RequestingConsent ».

  7. À ce stade, l’activité est suspendue en interne jusqu’à ce qu’une personne approuve manuellement la demande de consentement via le Centre d'administration Microsoft 365 ou via PowerShell.