Creación de clústeres basados en Linux en HDInsight mediante Azure Portal

El Portal de Azure es una herramienta de administración basada en web para servicios y recursos hospedados en la nube de Microsoft Azure. En este artículo aprenderá a crear clústeres de Azure HDInsight basados en Linux mediante el portal. Puede encontrar más detalles en Creación de clústeres de HDInsight.

Advertencia

La facturación de los clústeres de HDInsight se prorratea por minuto, tanto si se usan como si no. Por consiguiente, asegúrese de eliminar el clúster cuando termine de usarlo. Consulte Eliminación de un clúster de HDInsight.

El Portal de Azure expone la mayor parte de las propiedades del clúster. Mediante las plantillas de Azure Resource Manager puede ocultar una gran cantidad de detalles. Para más información, consulte Creación de clústeres de Apache Hadoop en HDInsight con plantillas de Resource Manager.

Si no tiene una suscripción a Azure, cree una cuenta gratuita antes de empezar.

Creación de clústeres

Nota

La característica que requiere una transferencia segura aplica todas las solicitudes a su cuenta mediante una conexión segura. Esta característica solo es compatible con la versión de clúster de HDInsight 3.6 o posterior. Para más información, consulte Creación de un clúster de Apache Hadoop con cuentas de almacenamiento de transferencia segura en Azure HDInsight.

  1. Inicie sesión en Azure Portal.

  2. En el menú superior, seleccione + Crear un recurso.

    Create a new cluster in the Azure portal

  3. Seleccione Analytics>Azure HDInsight para ir a la página Crear clúster de HDInsight.

Aspectos básicos

HDInsight create cluster basics

En la pestaña Básico, especifique la siguiente información:

Propiedad Descripción
Subscription En la lista desplegable, seleccione la suscripción de Azure que se usa para el clúster.
Resource group En la lista desplegable, seleccione el grupo de recursos existente o seleccione Crear.
Nombre del clúster Escriba un nombre único global.
Region En la lista desplegable, seleccione una región donde crear el clúster.
Tipo de clúster Haga clic en Seleccionar tipo de clúster para abrir una lista. En la lista, seleccione el tipo de clúster que desee. Los clústeres de HDInsight se presentan en distintos tipos. Estos corresponden a la carga de trabajo o la tecnología para los que el clúster está optimizado. No hay ningún método compatible para crear un clúster que combine varios tipos.
Versión En la lista desplegable, seleccione una versión. Use la versión predeterminada si no sabe qué opción elegir. Para obtener más información, consulte Versiones de clústeres de HDInsight.
Nombre de usuario de inicio de sesión del clúster Proporcione el nombre de usuario; el valor predeterminado es admin.
Contraseña de inicio de sesión de clúster Proporcione la contraseña.
Confirmar la contraseña de inicio de sesión del clúster Reescriba la contraseña.
Nombre de usuario de Secure Shell (SSH) Proporcione el nombre de usuario; el valor predeterminado es sshuser.
Uso de la contraseña de inicio de sesión del clúster para SSH Si desea la misma contraseña de SSH que la contraseña de administrador que especificó anteriormente, active la casilla Usar la contraseña de inicio de sesión del clúster para SSH. De no ser así, especifique una CONTRASEÑA o CLAVE PÚBLICA para autenticar al usuario de SSH. Es recomendable usar una clave pública. Elija Seleccionar en la parte inferior para guardar la configuración de las credenciales. Para más información, consulte Connect to HDInsight (Apache Hadoop) by using SSH (Conexión a través de SSH con HDInsight [Apache Hadoop]).

Seleccione Siguiente: Almacenamiento >> para avanzar a la pestaña siguiente.

Storage

Advertencia

A partir del 15 de junio de 2020 los clientes no podrán crear una nueva entidad de servicio mediante HDInsight. Consulte Creación de una entidad de servicio y certificados mediante Azure Active Directory.

HDInsight create cluster storage

Almacenamiento principal

En la lista desplegable de Tipo de almacenamiento principal, seleccione el tipo de almacenamiento predeterminado. Los campos siguientes que va a completar variarán en función de la selección. Para Azure Storage:

  1. En Método de selección, elija Seleccionar un elemento de la lista o Usar clave de acceso.

    • En Seleccionar un elemento de la lista, seleccione la Cuenta de almacenamiento principal en la lista desplegable o seleccione Crear.
    • En Usar clave de acceso, escriba su Nombre de la cuenta de almacenamiento. A continuación, proporcione la Clave de acceso.
  2. En Contenedor, acepte el valor predeterminado o escriba uno nuevo.

Azure Storage adicional

Opcional: Seleccione Agregar Azure Storage para un almacenamiento de clúster adicional. No se admite el uso de una cuenta de almacenamiento adicional en una región diferente a la del clúster de HDInsight.

Configuración de metastores

Opcional: Especifique una instancia existente de SQL Database para guardar los metadatos de Apache Hive, Apache Oozie o Apache Ambari fuera del clúster. La instancia de Azure SQL Database usada para el metastore debe permitir la conectividad con otros servicios de Azure, incluido Azure HDInsight. Al crear una instancia de Metastore, no asigne nombre a una base de datos con guiones. Estos caracteres podrían provocar que el proceso de creación del clúster produzca errores.

Importante

En el caso de las formas de clúster que admiten metastores, el metastore predeterminado proporciona una instancia de Azure SQL Database con un límite de 5 DTU de nivel básico (no actualizable) . Esto resulta adecuado para la realización de pruebas básicas. En el caso de las cargas de trabajo de producción o de gran volumen, se recomienda migrar a un metastore externo.

Seleccione Seguridad y redes >> para avanzar a la pestaña siguiente.

Seguridad y redes

HDInsight create cluster security networking

En la pestaña Seguridad y redes, especifique la información siguiente:

Propiedad Descripción
Paquete de seguridad de la empresa Opcional: Active la casilla para usar Enterprise Security Package. Para obtener más información, consulte Configuración de clúster de HDInsight con Enterprise Security Package mediante Azure Active Directory Domain Services.
TLS Opcional: Seleccione una versión de TLS de la lista desplegable. Para más información, consulte Seguridad de la capa de transporte.
Virtual network Opcional: Seleccione una red virtual y una subred existentes de la lista desplegable. Para obtener más información, consulte Planeamiento de la implementación de una red virtual para clústeres de Azure HDInsight. El artículo incluye los requisitos de configuración específicos de la red virtual.
Configuración de cifrado de disco Opcional: Active la casilla para usar el cifrado. Para obtener más información, consulte Cifrado de disco mediante claves administradas por el cliente.
Proxy de REST de Kafka Esta opción solo está disponible para el tipo de clúster Kafka. Para más información, consulte Uso de un proxy de REST.
Identidad Opcional: Seleccione una identidad de servicio asignada por el usuario existente de la lista desplegable. Para obtener más información, consulte Identidades administradas en Azure HDInsight.

Seleccione Siguiente: Configuración y precios >> para avanzar a la pestaña siguiente.

Configuración y precios

HDInsight create cluster configuration

En la pestaña Configuración y precios, especifique la información siguiente:

Propiedad Descripción
+ Agregar aplicación Opcional: Seleccione las aplicaciones que desee. De Microsoft, de proveedores de software independientes (ISV) o también puede desarrollarlas. Para más información, consulte Instalación de aplicaciones durante la creación del clúster.
Tamaño del nodo Opcional: Seleccione un nodo de otro tamaño.
Número de nodos Opcional: Especifique el número de nodos para el tipo de nodo especificado. Si planea crear más de 32 nodos de trabajo, seleccione un tamaño de nodo principal con al menos ocho núcleos y 14 GB de RAM. Planee los nodos al crear el clúster o mediante el escalado del clúster después de la creación.
Habilitar escalado automático Opcional: Active la casilla para habilitar la característica. Para más información, consulte Escalado automático de clústeres de Azure HDInsight.
+ Agregar acción de script Opcional: Esta opción funciona si quiere usar un script personalizado para personalizar un clúster, conforme se crea el clúster. Para más información sobre las acciones de script, consulte Personalización de clústeres de HDInsight basados en Linux mediante acciones de script.

Seleccione Revisar y crear >> para validar la configuración del clúster y avanzar a la pestaña final.

Revisar y crear

HDInsight create cluster summary

Revise la configuración. Seleccione Crear para crear el clúster.

El clúster tarda algo de tiempo en crearse, normalmente unos 20 minutos. Supervise las notificaciones para comprobar el proceso de aprovisionamiento.

Después de la creación

Una vez completado el proceso de creación, seleccione Ir al recurso en la notificación Implementación correcta. La ventana del clúster ofrece la siguiente información.

HDI Azure portal cluster overview

Algunos de los iconos de la ventana se explican de la siguiente manera:

Propiedad Descripción
Información general Proporciona toda la información esencial sobre el clúster. Algunos ejemplos son el nombre, el grupo de recursos al que pertenece, la ubicación, el sistema operativo y la dirección URL del panel del clúster.
Paneles de clúster Le dirige al portal de Ambari asociado al clúster.
SSH e inicio de sesión del clúster Proporciona la información necesaria para acceder al clúster mediante SSH.
Eliminar Elimina el clúster de HDInsight.

Eliminación del clúster

Consulte Eliminación de un clúster de HDInsight con el explorador, PowerShell o la CLI de Azure.

Solución de problemas

Si experimenta problemas con la creación de clústeres de HDInsight, consulte los requisitos de control de acceso.

Pasos siguientes

Ha creado correctamente un clúster de HDInsight. Ahora puede aprender a trabajar con el clúster.