Настройка доступа к данным для приема

В этой статье описывается, как администраторы могут настроить доступ к данным в контейнере в Azure Data Lake Storage 2-го поколения (ADLS 2-го поколения), чтобы пользователи Azure Databricks могли загружать данные из ADLS 2-го поколения в таблицу в Azure Databricks.

В этой статье описаны следующие способы настройки безопасного доступа к исходным данным:

  • (Рекомендуется) Создайте том каталога Unity.

  • Создайте внешнее расположение каталога Unity с учетными данными хранилища.

  • Запустите вычислительный ресурс, использующий субъект-службу.

  • Создайте временные учетные данные (маркер SAS BLOB-объектов).

Подготовка к работе

Прежде чем настроить доступ к данным в ADLS 2-го поколения, убедитесь, что у вас есть следующие возможности:

  • Данные в контейнере в учетной записи хранения Azure. Сведения о создании контейнера см. в статье "Создание контейнера " в документации по службе хранилища Azure.

  • Чтобы получить доступ к данным с помощью тома каталога Unity (рекомендуется), READ VOLUME привилегии тома. Дополнительные сведения см. в разделе "Создание и работа с томами" и привилегиями каталога Unity и защищаемыми объектами.

  • Чтобы получить доступ к данным с помощью внешнего расположения каталога Unity, READ FILES привилегия в внешнем расположении. Дополнительные сведения см. в статье "Создание внешнего расположения для подключения облачного хранилища к Azure Databricks".

  • Чтобы получить доступ к данным с помощью вычислительного ресурса с субъектом-службой, разрешения администратора рабочей области Azure Databricks.

  • Чтобы получить доступ к данным с помощью временных учетных данных, выполните следующее:

    • Разрешения администратора рабочей области Azure Databricks.
    • Разрешения в учетной записи Azure для создания маркеров SAS BLOB-объектов. Это позволяет создавать временные учетные данные.
  • Хранилище SQL Databricks. Дополнительные сведения см. в разделе Создание хранилища SQL.

  • Опыт работы с пользовательским интерфейсом SQL Databricks.

Настройка доступа к облачному хранилищу

Используйте один из следующих методов для настройки доступа к ADLS 2-го поколения:

Очистка

Вы можете очистить связанные ресурсы в облачной учетной записи и Azure Databricks, если вы больше не хотите их хранить.

Удаление учетной записи хранения ADLS 2-го поколения

  1. Войдите на портал Azure для своей учетной записи Azure, обычно по адресу https://portal.azure.com.
  2. Перейдите к учетной записи хранения и откройте ее.
  3. Нажмите Удалить.
  4. Введите имя учетной записи хранения и нажмите кнопку " Удалить".

Остановка хранилища SQL

Если вы не используете хранилище SQL для других задач, его следует остановить, чтобы избежать дополнительных затрат.

  1. В SQL на боковой панели щелкните Хранилища SQL.
  2. Рядом с именем хранилища SQL щелкните Остановить.
  3. При появлении запроса щелкните Остановить снова.

Следующие шаги

Выполнив действия, описанные в этой статье, пользователи могут выполнить COPY INTO команду, чтобы загрузить данные из контейнера ADLS 2-го поколения в рабочую область Azure Databricks.