соединитель Microsoft Graph Azure Data Lake Storage 2-го поколения

Соединитель Microsoft Graph Azure Data Lake Storage 2-го поколения позволяет пользователям в вашей организации искать файлы, хранящиеся в учетныхзаписях хранения Хранилище BLOB-объектов Azure и Azure Data Lake 2-го поколения.

Примечание.

Общие инструкции по настройке соединителей см. в статье Настройка соединителя Microsoft Graph .

Эта статья предназначена для всех, кто настраивает, запускает и отслеживает соединитель Azure Data Lake Storage 2-го поколения. Он дополняет общий процесс настройки и содержит инструкции, применимые только к соединителю Azure Data Lake Storage 2-го поколения. В этой статье также содержатся сведения об ограничениях.

В этой статье мы используем службу хранилища Azure в качестве универсального термина для Хранилище BLOB-объектов Azure и хранилища Azure Data Lake 2-го поколения.

Шаг 1. Добавление соединителя в Центр администрирования Microsoft 365

Добавление соединителя Azure Data Lake Storage 2-го поколения

(Дополнительные сведения см. в общих инструкциях по настройке )

Шаг 2. Присвойте соединению имя

Следуйте общим инструкциям по настройке.

Шаг 3. Настройка параметров подключения

Введите строка подключения основного хранилища. Эта строка необходима для предоставления доступа к учетной записи хранения. Чтобы найти строка подключения, перейдите в портал Azure и перейдите в раздел Ключи соответствующей учетной записи хранения Azure.

Если вы предпочитаете не предоставлять AccountKey (параметр в основном хранилище строка подключения), предоставьте доступ к службе соединителей Microsoft Graph для следующих ролей:

  • Средство чтения данных BLOB-объектов хранилища
  • Участник данных очереди хранилища
  • Делегирование BLOB-объектов хранилища

Перейдите на вкладку контроль доступа учетной записи хранения Azure и следуйте инструкциям, чтобы предоставить доступ к следующему приложению:

  • Идентификатор приложения first party: 56c1da01-2129-48f7-9355-af6d59d42766
  • Имя приложения первой стороны: Служба соединителя Graph

Уведомления об учетной записи хранения и очереди (необязательно)

Поддержка обработки изменений в режиме реального времени в службе соединителей Graph может быть добавлена в будущем. В этом случае мы будем отслеживать уведомления об изменениях службы хранилища Azure, хранящиеся в очереди. Вам потребуется создать очередь в той же учетной записи, что и учетная запись хранения Azure.

После создания очереди перейдите на вкладку События на странице очереди, чтобы настроить подписку на события. Выберите все события BLOB-объектов, которые будет получать очередь, и подключите очередь к учетной записи хранения Azure.

Проверка подключения

Проверьте подключение, нажав кнопку Проверить подключение .

Примечание.

Проверка подключения должна быть выполнена успешно, прежде чем перейти к следующему разделу конфигурации. Учетная запись хранения с поддержкой ADLS 2-го поколения должна иметь контейнер и по крайней мере один файл в качестве минимума для успешного выполнения тестового подключения . Если содержимое не существует, возникает ошибка подключения.

Шаг 4. Назначение меток свойств

Для каждой метки можно назначить свойство источника, выбрав в меню параметров. Хотя этот шаг не является обязательным, наличие некоторых меток свойств повысит релевантность поиска и обеспечит лучшие результаты поиска для конечных пользователей.

Шаг 5. Управление схемой

На экране Управление схемой можно изменить атрибуты схемы, связанные со свойствами: Запрос, Поиск, Извлечение и Уточнение. Вы также можете добавить необязательные псевдонимы и выбрать свойство Content .

Шаг 6. Управление разрешениями поиска

Azure Data Lake 2-го поколения

Вы можете принять списки контроль доступа (ACL) из учетной записи хранения Azure Data Lake 2-го поколения. Если заданы эти разрешения на поиск, содержимое поиска обрезается в зависимости от разрешений пользователя, выполнившего вход Microsoft Entra идентификатора. Кроме того, вы можете сделать все содержимое, индексированные из вашей учетной записи хранения, видимым для всех в вашей организации. В этом случае все в вашей организации будут иметь доступ ко всем данным в вашей учетной записи хранения.

Соединитель Azure Data Lake Storage 2-го поколения поддерживает разрешения на поиск, видимые всем или только пользователям с доступом к этому источнику данных. Индексированные данные, отображаемые в результатах поиска, могут быть видны пользователям в организации, имеющим доступ к каждому элементу.

Хранилище BLOB-объектов Azure

Для подключения к Хранилище BLOB-объектов Azure все содержимое, индексированное из настроенного источника, отображается всем в вашей организации. Списки управления доступом не поддерживаются на уровне BLOB-объектов в Хранилище BLOB-объектов Azure.

Шаг 7. Установка расписания обновления

На экране Параметры обновления можно задать интервал добавочного обхода и полный интервал обхода контента. Интервалы по умолчанию для соединителя Azure Data Lake Storage 2-го поколения — 15 минут для добавочного обхода контента и одна неделя для полного обхода контента.

Шаг 8. Проверка подключения

Следуйте общим инструкциям по настройке.

Ограничения

Опубликованное подключение для Хранилище BLOB-объектов Azure не может быть перенастроено для Azure Data Lake Storage 2-го поколения источника и наоборот. В таких сценариях рекомендуется настроить новое подключение.

Кроме того, размер файлов должен быть не более 4 МБ для обхода. В настоящее время поддерживаются следующие типы файлов:

  • Word (docx, .docm, .dotx, .dotm)
  • PowerPoint (.pptm, .pptx, .potm, .potx, .ppam, .ppsm, .ppsx)
  • Excel (.xlsx, XLSM)
  • Устаревшие форматы Office (.doc, .dot и т. д.)
  • Текст (.txt)
  • HTML
  • PDF

Двоичные файлы, такие как изображения (.jpg, .bmp и т. д.), не поддерживаются. Например, если файл .docx содержит только изображения, его можно пропустить, так как он не возвращает содержимое.