Поделиться через


Подключение к Azure Data Lake 1-го поколения в Microsoft Purview

В этой статье описывается процесс регистрации источника данных Azure Data Lake Storage 1-го поколения в Microsoft Purview, включая инструкции по проверке подлинности и взаимодействию с источником Azure Data Lake Storage 1-го поколения.

Примечание.

Azure Data Lake Storage 2-го поколения теперь общедоступна. Рекомендуется начать использовать его уже сегодня. Дополнительные сведения см. на странице продукта.

Поддерживаемые возможности

Извлечение метаданных Полная проверка Добавочное сканирование Сканирование с заданной областью Классификация Присвоение подписей Политика доступа Линии Общий доступ к данным Динамическое представление
Да Да Да Да Да Да Нет Ограниченное** Нет Нет

** Происхождение данных поддерживается, если набор данных используется в качестве источника или приемника в Фабрике данных действие Copy

Предварительные требования

Регистрация

В этом разделе вы сможете зарегистрировать источник данных ADLS 1-го поколения и настроить соответствующий механизм проверки подлинности, чтобы обеспечить успешное сканирование источника данных.

Действия по регистрации

Перед настройкой проверки источника данных важно зарегистрировать источник данных в Microsoft Purview.

  1. Откройте портал управления Microsoft Purview, выполнив следующие действия.

  2. Перейдите к схеме данных —> источники

    Снимок экрана: ссылка на открытие портала управления Microsoft Purview

    Снимок экрана: переход по ссылке

  3. Создайте иерархию коллекции с помощью меню Коллекции и назначьте разрешения отдельным вложенным коллекциям при необходимости.

    Снимок экрана: меню коллекции для создания иерархии коллекций

  4. Перейдите к соответствующей коллекции в меню Источники и щелкните значок Зарегистрировать , чтобы зарегистрировать новый источник данных ADLS 1-го поколения.

    Снимок экрана: коллекция, используемая для регистрации источника данных

  5. Выберите источник данных Azure Data Lake Storage 1-го поколения и нажмите кнопку Продолжить.

    Снимок экрана: выбор источника данных

  6. Укажите подходящее имя для источника данных, выберите соответствующую подписку Azure, имя существующей учетной записи Data Lake Store и коллекцию и нажмите кнопку Применить.

    Снимок экрана: сведения, которые необходимо ввести для регистрации источника данных

  7. Учетная запись хранения ADLS 1-го поколения будет отображаться в выбранной коллекции.

    Снимок экрана: источник данных, сопоставленный с коллекцией для запуска сканирования

Проверка

Предварительные требования для сканирования

Чтобы иметь доступ к сканированию источника данных, необходимо настроить метод проверки подлинности в учетной записи хранения ADLS 1-го поколения. Поддерживаются следующие варианты:

Примечание.

Если для учетной записи хранения включен брандмауэр, при настройке проверки необходимо использовать метод проверки подлинности управляемого удостоверения.

  • Управляемое удостоверение, назначаемое системой (рекомендуется) — как только создается учетная запись Microsoft Purview, в клиенте Azure AD автоматически создается системное управляемое удостоверение. В зависимости от типа ресурса для выполнения проверок требуются определенные назначения ролей RBAC для SAMI Microsoft Purview.

  • Управляемое удостоверение, назначаемое пользователем (предварительная версия). Как и управляемое системой удостоверение, управляемое удостоверение, назначаемое пользователем, — это ресурс учетных данных, который можно использовать для проверки подлинности Microsoft Purview в Azure Active Directory. Дополнительные сведения см. в руководстве по управляемому удостоверению, назначаемому пользователем.

  • Субъект-служба . В этом методе можно создать новый или использовать существующий субъект-службу в клиенте Azure Active Directory.

Проверка подлинности для сканирования

Использование управляемого удостоверения, назначаемого системой или пользователем, для сканирования

Важно предоставить учетной записи Microsoft Purview разрешение на сканирование источника данных ADLS 1-го поколения. Вы можете добавить системное управляемое удостоверение или управляемое удостоверение, назначаемое пользователем, на уровне подписки, группы ресурсов или ресурса, в зависимости от того, на какие разрешения на сканирование у него должны быть.

Примечание.

Чтобы добавить управляемое удостоверение в ресурс Azure, необходимо быть владельцем подписки.

  1. На портал Azure найдите подписку, группу ресурсов или ресурс (например, учетную запись хранения Azure Data Lake Storage 1-го поколения), которые вы хотите разрешить сканировать каталогу.

  2. Выберите Обзор, а затем — Обозреватель данных.

    Снимок экрана: учетная запись хранения

  3. Выберите Access в верхней области навигации.

    Снимок экрана: обозреватель данных для учетной записи хранения

  4. Выберите Выбрать и добавьте имя Microsoft Purview (которое является системным управляемым удостоверением) или назначаемое пользователем управляемое удостоверение (предварительная версия), которое уже зарегистрировано в Microsoft Purview, в меню Выбрать пользователя или группу .

  5. Выберите Разрешения на чтение и выполнение . Обязательно выберите Эта папка и все дочерние элементы, а также Запись разрешения на доступ и запись разрешений по умолчанию в параметрах Добавить, как показано на снимке экрана ниже. Нажмите кнопку ОК.

    Снимок экрана: сведения о назначении разрешений для учетной записи Microsoft Purview

Совет

Запись разрешения на доступ — это запись разрешения для текущих файлов и папок. Запись разрешений по умолчанию — это запись разрешений, которая будет наследоваться новыми файлами и папками. Чтобы предоставить разрешение только существующим файлам, выберите запись разрешения на доступ. Чтобы предоставить разрешение на сканирование файлов и папок, которые будут добавлены в будущем, включите запись разрешения по умолчанию.

Использование субъекта-службы для сканирования

Создание субъекта-службы

Если необходимо создать субъект-службу, необходимо зарегистрировать приложение в клиенте Azure AD и предоставить доступ к субъекту-службе в источниках данных. Эту операцию может выполнять глобальный администратор Azure AD или другие роли, например администратор приложений.

Получение идентификатора приложения субъекта-службы
  1. Скопируйте идентификатор приложения (клиента) в обзоре уже созданного субъекта-службы .

    Снимок экрана: идентификатор приложения (клиента) для субъекта-службы

Предоставление субъекту-службе доступа к учетной записи ADLS 1-го поколения

Важно предоставить субъекту-службе разрешение на сканирование источника данных ADLS 2-го поколения. Вы можете добавить доступ для субъекта-службы на уровне подписки, группы ресурсов или ресурса в зависимости от необходимых ему разрешений.

Примечание.

Чтобы добавить субъект-службу в ресурс Azure, необходимо быть владельцем подписки.

  1. Предоставьте субъекту-службе доступ к учетной записи хранения, открыв учетную запись хранения и выбрав Обзор -->Data Explorer

    Снимок экрана: учетная запись хранения

  2. Выберите Access в верхней области навигации.

    Снимок экрана: обозреватель данных для учетной записи хранения

  3. Выберите Выбрать и добавьте субъект-службу в выборе пользователя или группы .

  4. Выберите Разрешения на чтение и выполнение . Обязательно выберите Эта папка и все дочерние элементы, а также Запись разрешения на доступ и запись разрешений по умолчанию в параметрах Добавить. Нажмите кнопку ОК.

    Снимок экрана: сведения о назначении разрешений для субъекта-службы

Создание сканирования

  1. Откройте учетную запись Microsoft Purview и выберите Открыть портал управления Microsoft Purview.

  2. Перейдите к схеме данных -->Sources , чтобы просмотреть иерархию коллекций.

    Снимок экрана: иерархия коллекций

  3. Щелкните значок Создать сканирование под источником данных ADLS 1-го поколения, зарегистрированным ранее.

    Снимок экрана: источник данных с новым значком сканирования

При использовании управляемого удостоверения, назначаемого системой или пользователем

Укажите имя для сканирования, выберите управляемое удостоверение, назначаемое системой или пользователем, в разделе Учетные данные, выберите соответствующую коллекцию для сканирования и выберите Проверить подключение. При успешном подключении нажмите кнопку Продолжить.

Снимок экрана: параметр управляемого удостоверения для запуска проверки

При использовании субъекта-службы

  1. Введите имя для сканирования, выберите соответствующую коллекцию для сканирования и выберите + Создать в разделе Учетные данные.

    Снимок экрана: параметр субъекта-службы

  2. Выберите соответствующее подключение к хранилищу ключей и имя секрета , которое использовалось при создании субъекта-службы. Идентификатор субъекта-службы — это идентификатор приложения (клиента), скопированный, как указано ранее.

    Снимок экрана: параметр хранилища ключей субъекта-службы

  3. Выберите Проверить подключение. При успешном подключении нажмите кнопку Продолжить.

    Снимок экрана: тестовое подключение для субъекта-службы

Определение области и выполнение сканирования

  1. Вы можете область сканирование в определенные папки и вложенные папки, выбрав соответствующие элементы в списке.

    Область сканирования

  2. Затем выберите набор правил сканирования. Вы можете выбрать системный набор правил по умолчанию, существующие настраиваемые наборы правил или создать новый встроенный набор правил.

    Набор правил сканирования

  3. При создании нового набора правил проверки выберите типы файлов , которые будут включены в правило сканирования.

    Типы файлов набора правил сканирования

  4. Вы можете выбрать правила классификации , которые будут включены в правило сканирования.

    Правила классификации набора правил сканирования

    Выбор набора правил сканирования

  5. Выберите триггер сканирования. Вы можете настроить расписание или запустить проверку один раз.

    Триггер сканирования

    Выбор триггера сканирования

  6. Просмотрите проверку и выберите Сохранить и запустить.

    проверка проверки

Просмотр сканирования

  1. Перейдите к источнику данных в коллекции и выберите Просмотреть сведения, чтобы проверка состояние сканирования.

    просмотр сканирования

  2. Сведения о сканировании указывают ход проверки в состоянии последнего запуска и количество отсканированных и классифицированных ресурсов.

    просмотр сведений о сканировании

  3. Состояние последнего запуска будет обновлено на Выполняется, а затем завершено после успешного выполнения всей проверки.

    Просмотр выполняется сканирование

    Просмотр завершенной проверки

Управление сканированием

После завершения сканирования можно управлять или выполнять их снова.

  1. Выберите имя сканирования для управления сканированием.

    управление сканированием

  2. Вы можете запустить сканирование еще раз, изменить сканирование и удалить сканирование

    управление параметрами сканирования

    Примечание.

    • При удалении сканирования ресурсы каталога, созданные на основе предыдущих проверок, не удаляются.
    • Ресурс больше не будет обновляться с изменениями схемы, если исходная таблица изменилась и вы повторно просканируете исходную таблицу после изменения описания на вкладке схемы Microsoft Purview.
  3. Можно снова выполнить добавочную илиполную проверку .

    управление полным или добавочным сканированием

    управление результатами сканирования

Дальнейшие действия

Теперь, когда вы зарегистрировали источник, следуйте приведенным ниже руководствам, чтобы узнать больше о Microsoft Purview и ваших данных.