Share via


Forum aux questions sur la Connexion aux données Microsoft Graph

La Connexion aux données Microsoft Graph permet aux développeurs de créer des applications que les clients peuvent utiliser pour fournir un accès géré à leurs jeux de données Microsoft Graph à grande échelle. Cet article fournit des conseils qui vous aideront à tirer parti de la fonctionnalité Microsoft Graph Data Connect. Pour une présentation de la Connexion aux données Microsoft Graph, consultez la vue d’ensemble.

Pour plus de questions, consultez résolution des problèmes ou contactez l’équipe Data Connect.

La Connexion aux données Microsoft Graph est-elle pour moi ?

Les API Microsoft Graph Data Connect et Microsoft Graph permettent d’accéder aux mêmes données sous-jacentes, mais de manière très différente. Microsoft Graph Data Connect est conçu pour extraire de grandes quantités de jeux de données en bloc, évolutifs sur l’ensemble de votre organization, tandis que les API Microsoft Graph conviennent pour accéder à de petites quantités de données à partir d’utilisateurs et de groupes sélectionnés dans votre organization.

Par exemple, vous pouvez utiliser Microsoft Graph Data Connect pour effectuer une extraction initiale des données de la dernière année de messagerie, puis utiliser les API Microsoft Graph pour analyser les e-mails en temps réel. Microsoft Graph Data Connect et les API Microsoft Graph sont des outils différents pour différents travaux. Veillez à utiliser la méthode d’accès la mieux adaptée à votre scénario. Pour plus d’informations, consultez Quand dois-je utiliser Microsoft API Graph ou Microsoft Graph Data Connect.

Dans quels scénarios les entreprises utilisent-elles des données Microsoft 365 ?

Il existe un certain nombre de cas d’usage qui peuvent être alimentés par des données Microsoft 365. Voici quelques-uns des principaux scénarios qui intéressent les clients :

  • Analyse de la relation client : Pour les chefs d’entreprise commerciaux, allez au-delà des insights CRM traditionnels et comprenez les interactions et les relations client en fonction des modèles de communication et de collaboration.

  • Business Process Analytics : pour de meilleures opérations, découvrez comment le travail transite réellement par le organization au jour le jour. Identifiez les processus manuels et les goulots d’étranglement de flux de travail qui doivent être automatisés ou optimisés.

  • Analyse de la sécurité et de la conformité : pour sécuriser les données sensibles, découvrez comment les employés utilisent et partagent des informations sensibles. Implémentez la détection des anomalies, le renseignement sur les menaces, l’analyse des journaux d’audit, la gestion des risques et l’investigation juridique.

  • Personnes Productivity Analytics : Pour conduire la transformation, exportez vos Viva métriques de productivité, afin de pouvoir convertir des insights en solutions avec l’adoption numérique, les réunions et le contenu intelligents, les espaces de travail hybrides et le changement culturel.

En quoi Viva Insights et Microsoft Graph Data Connect diffèrent-ils ?  

Viva Insights et Microsoft Graph Data Connect sont complémentaires. Bien que les deux s’appuient sur Microsoft 365, Viva Insights et Data Connect servent différents publics et besoins.

Lorsque les clients recherchent des insights et des analyses au-delà de Viva Insights, Data Connect fournit l’extensibilité pour répondre à des exigences personnalisées. Par exemple, il propose des enregistrements et des transcriptions d’appels Teams, ainsi que des jeux de données SharePoint Online, qui ne sont pas actuellement dans l’étendue de Viva Insights. En outre, les données brutes de connexion aux données fournissent des détails granulaires qui ne sont pas autrement disponibles à partir de Viva Insights.

Y a-t-il une surcharge initiale avec Microsoft Graph Data Connect ?

Étant donné que la Connexion aux données est conçue pour extraire de grandes quantités de données en bloc, un traitement initial s’impose avant l’extraction des données. Cette surcharge est d’environ 45 minutes, ce qui signifie que tous les pipelines prennent au moins autant de temps, quelle que soit la taille des données. Si la surcharge initiale est trop longue pour votre cas d’usage, contactez l’équipe Microsoft Graph Data Connect.

Remarque

Votre administrateur de locataire doit approuver et donner son consentement dans les 24 heures suivant le lancement du pipeline. Si le consentement n’est pas donné dans les 24 heures, il expire et vous devrez redémarrer le processus de consentement en lançant à nouveau vos pipelines. Le temps de surcharge n’inclut pas le temps pris dans l’approbation du consentement.

Dans quelles régions Microsoft Graph Data Connect est-il disponible ?

Microsoft Graph Data Connect est actuellement disponible dans plusieurs régions des zones géographiques suivantes : Amérique du Nord, Europe, Asie-Pacifique, Royaume-Uni/Grande-Bretagne et Australie. D’autres régions seront disponibles à l’avenir.

Pour obtenir la liste des régions et mappages Office vers Azure, consultez Jeu de données, régions et récepteurs.

Quels jeux de données sont disponibles via Microsoft Graph Data Connect ?

Les types de jeux de données suivants sont disponibles :

  • De base : jeux de données générés à partir de contenu brut créé par le client et d’entrées à partir d’applications et de services Microsoft 365 (par exemple, des jeux de données Microsoft Entra ID, Outlook ou Teams). 

  • Nettoyé : jeux de données générés par normalisation et déduplication à partir de jeux de données de base, ou jeux de données créés à partir de signaux d’activité ou de comportement de l’utilisateur dans Microsoft 365 (par exemple, SharePoint, Office 365 jeux de données).  

  • Organisé : jeux de données personnalisés générés pour un cas d’usage ou des scénarios d’analyse spécifiques, ou jeux de données d’applications d’analyse Microsoft 365 internes pour leur extensibilité, par exemple, Viva Insights métriques).

Plusieurs jeux de données pour chacun des éléments suivants sont disponibles :

  • Teams
  • Outlook
  • Identifiant Microsoft Entra
  • OneDrive/Sharepoint
  • Viva Insights

De nouveaux jeux de données sont régulièrement ajoutés à Microsoft Graph Data Connect. Pour obtenir la liste complète, consultez Jeu de données, régions et récepteurs.

Quels jeux de données sont en préversion et lesquels sont généralement disponibles ?

Les jeux de données pour OneDrive/SharePoint et Viva Insights sont actuellement disponibles pour les clients en préversion ou pour ceux qui disposent de la licence Viva Insights, respectivement.

Pour plus d’informations sur les jeux de données généralement disponibles ou en préversion uniquement, consultez Jeu de données, régions et récepteurs.

Comment la facturation est-elle calculée ?

Microsoft Graph Data Connect facture les clients sur une base mensuelle et effectue également un arrondi fractionnable lors du calcul de la facture. Chaque exécution de pipeline est facturée séparément.

Par exemple, un client a 20 exécutions de pipeline au cours du mois, chacune produisant 500 lignes. Au total, le client exécute des pipelines pour 10 000 lignes ce mois-là. Toutefois, leur facture ne sera pas de 10 000 lignes/1 000 lignes = 10 unités.

Au lieu de cela, le client sera facturé pour 20 unités, car Microsoft Graph Data Connect arrondit les fractions. Étant donné que 500 lignes /1 000 lignes = 0,5 et 0,5 est une fraction, elle arrondit jusqu’à 1. Le client sera facturé une unité par exécution de pipeline, ce qui se traduit par 20 unités facturées au total.

Que puis-je faire si un jeu de données n’est pas encore pris en charge pour mon locataire ?

Pour les jeux de données tels que OneDrive/SharePoint et Viva Insights, assurez-vous que vous répondez aux critères décrits dans Jeux de données, régions et récepteurs. Ces jeux de données ne sont disponibles que pour les clients qui ont choisi de les utiliser explicitement.

Pour toute question, contactez l’équipe Microsoft Graph Data Connect.

Pour quels scénarios Microsoft Graph Data Connect est-il le mieux adapté ?

Les organisations qui peuvent exploiter les jeux de données volumineux qui alimentent leurs outils de productivité peuvent obtenir des informations considérables sur les défis et les opportunités qu’elles peuvent rencontrer. Les clients créent des applications dans plusieurs scénarios, tels que les réseaux de organization pour les nalytics de productivité des personnes, le surpartage des informations pour l’analytique de la sécurité et de la conformité, les forces de la relation vendeur pour l’analytique de la relation client, etc.

Mes données peuvent-elles rester dans l’abonnement de l’organisation avec la Connexion aux données Microsoft Graph ?

Microsoft Graph Data Connect respecte la limite de locataire de votre organisation lors de la remise des jeux de données demandés. Les ressources Azure et les services Microsoft 365 doivent se trouver dans le même Microsoft Entra location pour accéder à votre jeu de données Microsoft 365. L’accès aux jeux de données interlocataires n’est pas disponible aujourd’hui.

Les principaux du service sont-ils requis avec la Connexion aux données Microsoft Graph ?

Lorsque vous créez le pipeline Azure Synapse ou Data Factory, vous devez fournir un principal de service au service lié Microsoft 365. Dans Azure, un principal de service est une identité de sécurité qui représente une application ou un service (par opposition à un utilisateur). La Connection aux données Microsoft Graph utilise ce principal de service comme identité lors de l’obtention d’un accès autorisé à vos données Microsoft 365.

Si vous créez une application managée Azure que d’autres utilisateurs peuvent utiliser dans leurs clients, vous fournissez toujours un principal de service pour l’application à utiliser. Ce principal de service existe dans votre client (le serveur de publication). Toutefois, si l’application a besoin d’autres principaux de service, votre client (le programme d’installation) les crée dans son propre client. Par exemple, votre pipeline Azure Synapse ou Azure Data Factory a probablement besoin d’accéder à une ressource de stockage dans Azure. Le client crée le principal de service avec des autorisations sur le compte de stockage que le pipeline doit utiliser.

Pour plus d’informations sur la création de votre application avec Azure Synapse ou Azure Data Factory, consultez le guide de démarrage rapide Connexion aux données.

Comment puis-je case activée pour les demandes PAM (Privileged Access Management) en attente ?

Avant que la Connexion aux données Microsoft Graph puisse copier vos données, un administrateur doit approuver une demande Privileged Access Management (PAM). PAM est le mécanisme utilisé pour autoriser votre pipeline de données à accéder aux données de Microsoft 365.

La première fois que vous déclenchez un pipeline, il attend qu’un administrateur Microsoft 365 (ou un délégué désigné) approuve la demande d’accès. Bien que l’état du pipeline indique In progress (En cours), l’activité de copie sous-jacente passe à l’état ConsentPending (En attente de consentement) jusqu’à ce que l’approbation soit accordée, comme illustré sur la capture d’écran suivante.

Capture d’écran du volet d’état d’exécution du pipeline, avec l’état ConsentPending (En attente de consentement)

Pendant le développement, il est judicieux de s’assurer que les exécutions de votre pipeline ne sont pas bloquées sur consentPending, en particulier après avoir apporté une modification à votre pipeline. Par exemple, si vous ajoutez un champ supplémentaire au schéma, la prochaine exécution du pipeline émet une nouvelle demande PAM qui doit être approuvée. Ne perdez pas de temps à attendre un pipeline en attente de votre approbation.

Notez que les demandes de consentement expirent après 24 heures si elles ne sont pas approuvées et que le pipeline échoue. En outre, l’approbation PAM n’est valide que pendant 6 mois (sauf si elle est révoquée).

Comment puis-je approuver les demandes PAM via le Centre d’administration Microsoft 365 ?

Pour les approuver à l’aide de l’expérience utilisateur PAM, visitez l’interface PAM sur le Portail d’administration de Microsoft 365. Le Centre d’administration offre un moyen simple et convivial d’afficher et d’approuver/refuser/révoquer des demandes PAM.

Pour approuver une demande :

  • Lorsque vous activez Microsoft Graph Data Connect, vous devez être dans le groupe de l’approbateur.
  • Les utilisateurs doivent avoir un rôle global Administration.
  • Une licence Exchange Online doit être attribuée aux utilisateurs.

Procédez comme suit pour approuver ou refuser une demande PAM :

  1. Connectez-vous à l’interface PAM à Centre d'administration Microsoft 365.
  2. Dans le volet droit, cliquez sur Paramètres>Org Settings>Services>Microsoft Graph Data Connect.
  3. Recherchez la requête.
  4. Passez en revue les détails de la demande.
  5. Ajoutez le nettoyage de liste de refus si nécessaire.
  6. Approuvez ou refusez la demande.

Pour plus d’informations, consultez le guide de démarrage rapide De connexion aux données.

Tant que l’étendue des données extraites reste la même pour les jeux de données, les colonnes, les utilisateurs, etc., l’exécution du pipeline ne déclenche PAS de nouvelle demande de consentement. Au lieu de cela, le pipeline utilise le consentement approuvé qui durera 6 mois. L’exécution d’un pipeline avec la même étendue pour différentes dates ne déclenche PAS non plus un nouveau consentement.

Une nouvelle demande de consentement est déclenchée si l’étendue des données change, par exemple en ajoutant un nouveau jeu de données, en sélectionnant d’autres colonnes ou en ajoutant d’autres utilisateurs. Un nouveau consentement peut également être déclenché lors de la modification du nom du pipeline ou de l’activité dans Azure Synapse ou Azure Data Factory.

Pourquoi ai-je besoin d’un deuxième utilisateur pour approuver les demandes PAM ?

Lorsque vous demandez l’exécution d’un pipeline de jeu de données, le service Microsoft Graph Data Connect vérifie, puis déclenche une demande d’approbation PAM si nécessaire. La demande est envoyée au groupe d’approbateurs défini pour le locataire lors de l’activation de Microsoft Graph Data Connect dans le Centre Administration Microsoft.

Toutefois, même si ce compte fait partie du groupe d’approbateurs que vous avez configuré, vous ne pouvez pas l’utiliser pour approuver la demande PAM, car les auto-approbations ne sont pas autorisées. Si vous essayez, le message d’erreur suivant apparaîtra sur le portail PAM : « Le demandeur et l’approbateur sont les mêmes. L’auto-approbation n’est pas autorisée. »

Pour le développement, vous pourrez créer un deuxième compte en plus de celui de l’administrateur qui approuve les demandes. L’émetteur de la demande et l’approbateur doivent tous deux disposer de comptes Exchange Online actifs.

Puis-je dédupliquer les e-mails en cas de besoin ?

Lorsque vous extrayez des e-mails du jeu de données Message, il existe souvent plusieurs objets JSON pour le même e-mail. Ces doublons existent car, lorsqu’un e-mail est envoyé à plusieurs personnes, une copie de celui-ci est adressée à la boîte aux lettres de chaque destinataire. Étant donné que le jeu de données est extrait de chaque boîte aux lettres, il contient toutes les copies entre les utilisateurs. Dans certains scénarios, il peut être nécessaire de conserver chaque copie, mais dans d’autres, vous souhaiterez peut-être supprimer les doublons.

Vous pouvez dédupliquer les objets JSON exportés en fonction de la internetMessageId des messages : deux messages avec le même internetMessageId sont des copies dupliquées de la même instance. Comme les doublons peuvent se trouver dans différents objets blob, vous devez procéder à la déduplication sur tous les objets blob et non séparément sur chaque objet blob.

Puis-je utiliser le champ puser pour déterminer l’utilisateur approprié ?

Les données extraites incluent des métapropriétés qui n’existent pas lorsque les API Microsoft Graph correspondantes sont utilisées. Plus précisément, le champ puser peut être utile pour déterminer à partir de quel utilisateur les données ont été extraites. Si vous disposez de deux copies du même e-mail dans des boîtes aux lettres différentes, vous pouvez utiliser le champ puser pour déterminer quelle copie provient de quelle boîte aux lettres. Le champ puser est également utile pour les jeux de données tels que le jeu de données Manager. Le fichier JSON exporté contient des informations sur un responsable, mais cela n’est utile que si vous savez de qui il s’agit. Le champ puser vous indique à quel gestionnaire correspond cet objet JSON.

La configuration de client en mode hybride est-elle prise en charge ?

Si votre configuration Microsoft 365 comporte des utilisateurs dans Exchange Online et d’autres dans Exchange en local, les utilisateurs qui se trouvent dans Exchange en local ne sont pas pris en charge. Malheureusement, nous ne prenons actuellement pas en charge la Connexion des données pour les utilisateurs Exchange locaux.

Les comptes de ressource sont-ils pris en charge ?

Nous ne prenons actuellement pas en charge l’accès aux messages ou événements à partir des comptes de ressource.

Pourquoi est-ce que je vois parfois plusieurs fichiers par exécution de pipeline ADF, mais d’autres fois un seul fichier par exécution ?

La Connexion aux données Microsoft Graph prend la liste des utilisateurs pour chaque exécution de pipeline, puis distribue l’extraction et la curation du jeu de données sur plusieurs travaux qui s’exécutent en parallèle. Pour chaque exécution parallèle, un fichier de sortie est généré dans le récepteur de données défini par vous. Dans certains cas, si la liste d’utilisateurs est petite, elles peuvent être mappées dans un travail d’extraction et de curation, et dans ce cas, un seul fichier de sortie est généré dans le récepteur de données.