Подключение к данным Microsoft Graph: часто задаваемые вопросы

Подключение к данным Microsoft Graph позволяет разработчикам создавать приложения, которые пользователи смогут использовать для предоставления управляемого доступа к масштабным наборам данных Microsoft Graph. В этой статье содержатся советы, которые помогут вам воспользоваться преимуществами функции Microsoft Graph Data Connect. Для знакомства с подключением к данным Microsoft Graph см. обзорную статью.

Дополнительные вопросы см. в разделе Устранение неполадок или обратитесь к команде Data Connect.

Подходит ли мне функция подключения к данным Microsoft Graph?

Microsoft Graph Data Connect и API Microsoft Graph предоставляют доступ к тем же базовым данным, но очень разными способами. Microsoft Graph Data Connect предназначен для массового извлечения больших объемов наборов данных, масштабируемых для всей организации. в то время как API Microsoft Graph подходят для доступа к небольшому объему данных от выбранных пользователей и групп в вашей организации.

Например, вы можете использовать Microsoft Graph Data Connect для первоначального извлечения данных электронной почты за последний год, а затем использовать API Microsoft Graph для анализа сообщений электронной почты в режиме реального времени. Microsoft Graph Data Connect и API Microsoft Graph — это разные инструменты для разных заданий. Важно продумать, какой метод лучше подходит к вашему сценарию. Дополнительные сведения см. в разделе Когда следует использовать Microsoft API Graph или Microsoft Graph Data Connect.

Для каких сценариев компании используют данные Microsoft 365?

Существует любое количество вариантов использования, которые можно использовать на основе данных Microsoft 365. Ниже приведены некоторые основные сценарии, которые интересуют клиентов.

  • Аналитика отношений с клиентами. Для коммерческих бизнес-лидеров выйдите за рамки традиционных аналитических сведений CRM и изучите взаимодействие с клиентами и отношения на основе шаблонов общения и совместной работы.

  • Аналитика бизнес-процессов. Чтобы улучшить операции, ознакомьтесь с тем, как работает организация на ежедневной основе. Укажите ручные процессы и узкие места рабочих процессов, которые должны быть автоматизированы или оптимизированы.

  • Аналитика безопасности и соответствия требованиям. Чтобы защитить конфиденциальные данные, узнайте, как сотрудники используют конфиденциальную информацию и обмен ими. Реализуйте обнаружение аномалий, аналитику угроз, анализ журналов аудита, управление рисками и юридическую экспертизу.

  • Люди Аналитика производительности. Для преобразования экспортируйте метрики производительности Viva, чтобы можно было преобразовать аналитические сведения в решения с цифровым внедрением, интеллектуальными собраниями и контентом, гибридными рабочими местами и культурными изменениями.

Чем отличаются Viva Insights и Microsoft Graph Data Connect?  

Viva Insights и Microsoft Graph Data Connect дополняют друг друга. Хотя оба используют Microsoft 365, Viva Insights и Data Connect обслуживают разные аудитории и потребности.

Когда клиенты ищут аналитические сведения и аналитику за пределами Viva Insights, Data Connect обеспечивает расширяемость для удовлетворения пользовательских требований. Например, он предлагает записи звонков и расшифровки Teams, а также наборы данных SharePoint Online, которые в настоящее время не область для Viva Insights. Кроме того, необработанные данные Data Connect предоставляют детализированные сведения, которые в противном случае недоступны из Viva Insights.

Есть ли первоначальные затраты на Microsoft Graph Data Connect?

Так как подключение к данным предназначено для массового извлечения больших объемов данных, возникают дополнительные затраты времени перед тем, как можно будет извлечь данные. Эти затраты составляют около 45 минут. Это означает, что этот период требуется для всех конвейеров вне зависимости от размера данных. Если начальные затраты слишком длительны для вашего варианта использования, обратитесь к команде Microsoft Graph Data Connect.

Примечание.

Администратору клиента потребуется утвердить и дать согласие в течение 24 часов после запуска конвейера. Если согласие не предоставлено в течение 24 часов, его срок действия истекает, и вам потребуется перезапустить процесс согласия, снова запустив конвейеры. Время накладных расходов не включает время, затраченного на утверждение согласия.

В каких регионах доступно Подключение к данным Microsoft Graph?

Microsoft Graph Data Connect в настоящее время доступен в нескольких регионах в следующих регионах: Северная Америка, Европа, Азиатско-Тихоокеанский регион, Соединенное Королевство/Великобритания и Австралия. Другие регионы будут доступны в будущем.

Список регионов Office и Azure и сопоставлений см. в разделе Набор данных, регионы и приемники.

Какие наборы данных доступны через Microsoft Graph Data Connect?

Доступны следующие типы наборов данных:

  • Базовый. Наборы данных, созданные из необработанного содержимого, созданного клиентом, и входные данные из приложений и служб Microsoft 365 (например, наборы данных Microsoft Entra ID, Outlook или Teams). 

  • Очищено: наборы данных, созданные путем нормализации и дедупликации из базовых наборов данных или наборов данных, созданных на основе действий или сигналов поведения пользователя в Microsoft 365 (например, SharePoint Office 365 наборы данных).  

  • Курируемо: наборы данных, настраиваемые для конкретных сценариев использования или сценариев аналитики, а также наборы данных из сторонних приложений аналитики Microsoft 365 для их расширяемости, например Viva Insights метрик).

Доступно несколько наборов данных для каждого из следующих:

  • Teams
  • Outlook
  • Microsoft Entra ID
  • OneDrive/Sharepoint
  • Viva Insights

Новые наборы данных регулярно добавляются в Microsoft Graph Data Connect. Полный список см. в разделе Набор данных, регионы и приемники.

Какие наборы данных находятся в предварительной версии, а какие являются общедоступными?

Наборы данных для OneDrive/SharePoint и Viva Insights в настоящее время доступны для пользователей в предварительной версии или для тех, у кого есть лицензия на Viva Insights соответственно.

Сведения о наборах данных, которые являются общедоступными или доступны только в предварительной версии, см. в разделе Набор данных, регионы и приемники.

Как вычисляется выставление счетов?

Microsoft Graph Data Connect взимает плату с клиентов ежемесячно, а также выполняет дробное округление при расчете счета. Плата за каждое выполнение конвейера оплачивается отдельно.

Например, клиент имеет 20 запусков конвейера в течение месяца, каждый из которых дает 500 строк. В общей сложности клиент запускает конвейеры для 10 000 строк в этом месяце. Однако их счет не будет составлять 10 000 строк/1000 строк = 10 единиц.

Вместо этого клиенту будет выставлен счет за 20 единиц, так как Microsoft Graph Data Connect округляет доли. Так как 500 строк /1000 строк = 0,5 и 0,5 — это дробь, она округляется до 1. Клиенту будет выставляться плата за одну единицу за каждый запуск конвейера, что приведет к выставлению счетов в общей сложности 20 единиц.

Что делать, если набор данных еще не поддерживается для моего клиента?

Для таких наборов данных, как OneDrive или SharePoint и Viva Insights, убедитесь, что вы соответствуете критериям, описанным в разделе Наборы данных, регионы и приемники. Эти наборы данных доступны только клиентам, явно согласившимся на них.

По вопросам обратитесь к команде Microsoft Graph Data Connect.

Для каких сценариев лучше всего подходит Microsoft Graph Data Connect?

Организации, которые могут использовать большие наборы данных, используемых их инструментами для повышения производительности, могут получить прекрасные аналитические данные о трудностях и возможностях, с которыми они могут столкнуться. Клиенты создают приложения в нескольких сценариях, таких как сети организации для повышения производительности людей, общий доступ к информации для аналитики безопасности и соответствия требованиям, сильные стороны отношений с продавцами для аналитики отношений с клиентами и многое другое.

Могут ли мои данные остаться в рамках подписки организации с помощью подключения к данным Microsoft Graph?

Microsoft Graph Data Connect учитывает границу клиента организации при доставке запрошенных наборов данных. Ресурсы Azure и службы Microsoft 365 должны находиться в одном Microsoft Entra клиенте для доступа к набору данных Microsoft 365. Доступ к набору данных между клиентами сейчас недоступен.

Требуются ли для подключения к данным Microsoft Graph субъекты службы?

При создании конвейера Azure Synapse или фабрики данных необходимо предоставить субъект-службу связанной службе Microsoft 365. В Azure субъект-служба — это объект безопасности, представляющий приложение или службу (в отличие от пользователя). Подключение к данным Microsoft Graph использует этот субъект-службу в качестве удостоверения при получении авторизованного доступа к вашим данным Microsoft 365.

Если вы создаете управляемое приложение Azure для других пользователей с целью применения в клиентах, вам также нужно предоставить субъект-службу для использования приложением. Этот субъект-служба существует в вашем клиенте (клиенте издателя). Но если приложению требуются другие субъекты-службы, пользователю (установщику) нужно создать их в собственном клиенте. Например, Azure Synapse или конвейеру Фабрика данных Azure, скорее всего, потребуется доступ к ресурсу хранилища в Azure. Пользователю требуется создать субъект-службу с разрешениями на доступ к учетной записи хранилища для использования конвейером.

Дополнительные сведения о создании приложения с помощью Azure Synapse или Фабрика данных Azure см. в кратком руководстве по Подключению к данным.

Как проверка для ожидающих запросов управления привилегированным доступом (PAM)?

Прежде чем подключение к данным Microsoft Graph сможет скопировать ваши данные администратор должен утвердить запрос на управление привилегированным доступом (PAM). Управление привилегированным доступом — это механизм, используемый для разрешения доступа вашего конвейера данных к данным в Microsoft 365.

При первом запуске конвейера ожидается утверждение запроса на доступ администратором Microsoft 365 (или назначенным делегатом). Хотя состояние конвейера отображается как Выполняется, базовому действию копирования будет соответствовать состояние ConsentPending до получения утверждения, как показано на снимке экрана ниже.

Снимок экрана: область состояния работы конвейера с состоянием ConsentPending

При разработке рекомендуется проверять, что канал не застрял в состоянии ConsentPending, особенно после внесения изменений в конвейер. Например, при добавлении дополнительного поля в схему следующий запуск конвейера приводит к созданию запроса PAM, требующего утверждения. Не теряйте время с конвейером, ожидающим вашего утверждения.

Обратите внимание, что срок действия запросов на согласие истекает через 24 часа, если он не утвержден и конвейер завершится ошибкой. Кроме того, утверждение PAM действует только в течение 6 месяцев (если не отозвано).

Как утвердить запросы PAM в Центре администрирования Microsoft 365?

Для утверждения с помощью пользовательского интерфейса PAM откройте пользовательский интерфейс PAM в Центре администрирования Microsoft 365. Центр администрирования предоставляет простой и понятный способ просмотра, утверждения, отклонения или отзыва запросов PAM.

Чтобы утвердить запрос, выполните приведенные далее действия.

  • При включении Microsoft Graph Data Connect необходимо находиться в группе утверждающего.
  • У пользователей должна быть роль глобальной Администратор.
  • Пользователям должна быть назначена лицензия на Exchange Online.

Чтобы утвердить или отклонить запрос PAM, выполните следующие действия.

  1. Войдите в интерфейс PAM на Центр администрирования Microsoft 365.
  2. На правой панели щелкните Параметры>Организации Параметры>Службы>Microsoft Graph Data Connect.
  3. Найдите запрос.
  4. Просмотрите сведения о запросе.
  5. При необходимости добавьте очистку списка запретов.
  6. Утвердить или отклонить запрос.

Дополнительные сведения см. в кратком руководстве По подключению к данным.

Пока область извлекаемых данных остается неизменным для наборов данных, столбцов, пользователей и т. д., выполнение конвейера НЕ будет вызывать новый запрос на согласие. Вместо этого конвейер будет использовать утвержденное согласие, которое будет длиться 6 месяцев. Запуск конвейера с тем же область для разных дат не приведет к активации нового согласия.

При изменении область данных будет активирован новый запрос на согласие, например добавление нового набора данных, выбор дополнительных столбцов или добавление других пользователей. Новое согласие также может быть активировано при изменении имени конвейера или действия в Azure Synapse или Фабрика данных Azure.

Почему для утверждения запросов PAM требуется второй пользователь?

При запросе конвейера набора данных служба Microsoft Graph Data Connect проверит и при необходимости активирует запрос на утверждение PAM. Запрос отправляется в группу утверждающих лиц, определенную для клиента при включении Microsoft Graph Data Connect в Центре Администратор Майкрософт.

Однако даже если эта учетная запись входит в группу утверждающих, которую вы настроили, вы не можете использовать ее для утверждения запроса PAM, так как самостоятельное утверждение запрещено. При попытке появится сообщение об ошибке в портале PAM: "Запрашивающий и утверждающий совпадают. Самостоятельное утверждение запрещено".

При разработке рекомендуется использовать вторую учетную запись помимо администратора, утверждающего запросы. Как отправитель, так и утверждающий должны иметь активные учетные записи Exchange Online.

Можно ли при необходимости выполнять дедупликацию сообщений электронной почты?

При извлечении сообщений электронной почты из набора данных Message часто создается несколько объектов JSON одного сообщения. Эти дубликаты существуют, так как при отправке сообщения нескольким пользователям создается его копия в почтовом ящике каждого получателя. Так как набор данных извлекается из каждого почтового ящика, он содержит все копии от разных пользователей. В некоторых случаях может требоваться сохранение всех копий, но в остальных случаях рекомендуется удалять дубликаты.

Выполнить дедупликацию экспортированных объектов JSON можно на основе параметра internetMessageId сообщений: два сообщения с одинаковым значением internetMessageId являются копиями одного экземпляра. Так как дубликаты могут существовать в разных BLOB-объектах, дедупликацию необходимо выполнять во всех BLOB-объектах, а не в отдельных BLOB-объектах.

Можно ли использовать поле "Puser" для определения соответствующего пользователя?

Извлеченные данные содержат некоторые свойства Meta, не существующие при использовании соответствующего API Microsoft Graph. В частности, поле puser может быть полезно для определения пользователя, данные о котором извлечены. В сценарии с двумя копиями одного сообщения электронной почты в разных почтовых ящиках вы можете использовать поле puser, чтобы определить, из какого почтового ящика получена каждая копия. Поле puser также удобно применять для наборов данных, например для набора данных Manager. Экспортированные объекты JSON содержат сведения о руководителе, но они полезны, только если вы знаете, кем он руководит. Поле puser указывает, чей руководитель соответствует этому объекту JSON.

Поддерживается ли настройка клиента в гибридном режиме?

Если в вашей настройке Microsoft 365 есть некоторые пользователи в Exchange Online и некоторые пользователи в локальной службе Exchange, то пользователи, которые находятся в локальной службе Exchange, не будут поддерживаться. К сожалению, на данный момент подключение к данным для локальных пользователей Exchange не поддерживается.

Поддерживаются ли учетные записи ресурсов?

В настоящее время мы не поддерживаем доступ к сообщениям или событиям из учетных записей ресурсов.

Почему в одном конвейере ADF иногда может быть несколько файлов, а в других случаях на каждый запуск приходится только один файл?

Подключение к данным Microsoft Graph берет список пользователей для каждого запуска устройства, а затем распределяет извлечение набора данных и курирование по нескольким заданиям, которые выполняются параллельно. Для каждого параллельного запуска в определенном вами источнике данных создается один выходной файл. В некоторых случаях, если список пользователей небольшой, его можно сопоставить с одним заданием извлечения и курсирования, и в таких случаях в источнике данных будет создан только один выходной файл.