Создание кластера в Data Lake Storage 2-го поколения на портале Azure

Портал Azure — это веб-инструмент управления службами и ресурсами, размещенными в облаке Microsoft Azure. Из этой статьи вы узнаете, как создавать кластеры Azure HDInsight под управлением Linux с помощью портала Azure. Дополнительные сведения см. в статье Создание кластеров HDInsight.

Предупреждение

Счета за кластеры HDInsight выставляются пропорционально в минутах, независимо от их использования. Обязательно удалите кластер, когда завершите его использование. Дополнительные сведения см. в статье Удаление кластера HDInsight с помощью браузера, PowerShell или классического интерфейса Azure CLI.

Если у вас нет подписки Azure, создайте бесплатную учетную запись, прежде чем приступить к работе.

Чтобы создать кластер HDInsight, который использует Data Lake Storage 2-го поколения в качестве хранилища, выполните следующие действия по настройке учетной записи хранения с иерархическим пространством имен.

Создание управляемого удостоверения, назначаемого пользователем

Создайте управляемое удостоверение, назначаемое пользователем, если у вас его еще нет.

  1. Войдите на портал Azure.
  2. Щелкните Создать ресурс слева вверху.
  3. В поле поиска введите назначаемое пользователем и щелкните Управляемое удостоверение, назначаемое пользователем.
  4. Нажмите кнопку Создать.
  5. Укажите имя управляемого удостоверения, выберите подходящую подписку, группу ресурсов и расположение.
  6. Нажмите кнопку Создать.

Дополнительные сведения о работе управляемых удостоверений в Azure HDInsight см. в статье Управляемые удостоверения в Azure HDInsight.

Create a user-assigned managed identity.

Создание учетной записи хранения для использования с Data Lake Storage 2-го поколения

Создайте учетную запись хранения для использования с Azure Data Lake Storage Gen2.

  1. Войдите на портал Azure.
  2. Щелкните Создать ресурс слева вверху.
  3. В поле поиска введите учетная запись и щелкните Учетная запись хранения.
  4. Нажмите кнопку Создать.
  5. На экране создания учетной записи хранения:
    1. Выберите подходящую подписку и группу ресурсов.
    2. Укажите имя учетной записи хранения для использования с Data Lake Storage 2-го поколения.
    3. Откройте вкладку Дополнительно.
    4. Щелкните Включено рядом с пунктом Иерархическое пространство имен в разделе Data Lake Storage 2-го поколения.
    5. Щелкните Просмотреть и создать.
    6. Нажмите кнопку Создать.

Дополнительные сведения о других параметрах во время создания учетной записи хранения см. в статье Краткое руководство: создание учетной записи хранения для Azure Data Lake Storage 2-го поколения.

Screenshot showing storage account creation in the Azure portal.

Настройка разрешений для управляемого удостоверения в Data Lake Storage 2-го поколения

В учетной записи хранения назначьте управляемое удостоверение пользователю с ролью Владелец для данных больших двоичных объектов хранилища.

  1. Войдите в свою учетную запись хранения на портале Azure.

  2. Выберите Управление доступом (IAM) .

  3. Выберите "Добавить" > "Добавить назначение ролей".

    Screenshot showing Access control (IAM) page with Add role assignment menu open.

  4. На вкладке Роль выберите Владелец данных BLOB-объектов хранилища.

    Screenshot showing Add role assignment page with Role tab selected.

  5. На вкладке "Участники" выберите "Управляемое удостоверение" и нажмите "Выбрать участников".

  6. Выберите свою подписку, затем выберите Управляемое удостоверение, назначаемое пользователем, после чего выберите свое управляемое удостоверение, назначаемое пользователем.

  7. Чтобы назначить роль, на вкладке Проверка и назначение выберите Проверка и назначение.

    Назначаемое пользователем удостоверение, которое вы выбрали, теперь отображается в выбранной роли.

    Дополнительные сведения о назначении ролей см. в статье Назначение ролей Azure с помощью портала Azure

  8. После завершения первоначальной настройки вы можете создать кластер на портале. Кластер должен быть расположен в том же регионе Azure, что и учетная запись хранения. На вкладке меню создания кластера Хранилище выберите следующие параметры.

    • В поле Тип первичного хранилища выберите Azure Data Lake Storage 2-го поколения.

    • В поле Основная учетная запись хранения найдите и выберите созданную учетную запись хранения для использования с Azure Data Lake Storage 2-го поколения.

    • В разделе Удостоверение выберите недавно созданное управляемое удостоверение, назначаемое пользователем.

      Storage settings for using Data Lake Storage Gen2 with Azure HDInsight.

    Примечание.

    • Чтобы добавить дополнительную учетную запись хранения для использования с Data Lake Storage 2-го поколения, просто назначьте созданное ранее управляемое удостоверение учетной записи хранения новому хранилищу Data Lake Storage 2-го поколения, которое вы хотите добавить, на уровне учетной записи хранения. Обратите внимание, что добавление дополнительной учетной записи хранения для использования с Data Lake Storage 2-го поколения с помощью колонки "Дополнительные учетные записи хранения" в HDInsight не поддерживается.
    • Вы можете включить RA-GRS или RA-ZRS в учетной записи хранения BLOB-объектов Azure, используемой HDInsight. Однако создание кластера для дополнительной конечной точки RA-GRS или RA-ZRS не поддерживается.
    • HDInsight не поддерживает настройку Data Lake Storage 2-го поколения в качестве хранилища, геоизбыточного между зонами, с доступом на чтение (RA-GZRS) или хранилища, геоизбыточного между зонами (GZRS).

Удаление кластера

См. статью Удаление кластера HDInsight с помощью браузера, PowerShell или Azure CLI.

Устранение неполадок

Если при создании кластеров HDInsight возникли проблемы, см. раздел Создание кластеров.

Следующие шаги

Вы успешно создали кластер HDInsight. Теперь узнайте, как работать с кластером.

Кластеры Apache Spark

Кластеры Apache Hadoop

Кластеры Apache HBase