Selección de una SKU para el clúster de Azure Data Explorer

Artículo
02/04/2024

Al crear un nuevo clúster u optimizar un clúster para una carga de trabajo cambiante, Azure Data Explorer ofrece varias SKU de máquina virtual entre las que elegir. Estas SKU de proceso se han elegido cuidadosamente para ofrecer el costo más óptimo posible para cualquier carga de trabajo.

El servicio Azure Data Explorer administra completamente el tamaño y la SKU de la máquina virtual del clúster de administración de datos. Estos vienen determinados por factores como el tamaño de la máquina virtual del motor y la carga de trabajo de ingesta.

Puede cambiar la SKU de proceso del clúster en cualquier momento mediante el escalado vertical del clúster. Es mejor empezar con el tamaño más pequeño de la SKU que se adapte al escenario inicial. También puede usar las recomendaciones de Azure Advisor para optimizar la SKU de proceso.

La Calculadora de precios se puede usar para calcular el precio del clúster de Azure Data Explorer, en función de las cargas de trabajo y el volumen de datos.

Sugerencia

Al comprar una reserva, se puede adelantar el pago del clúster, de las máquinas virtuales usadas en el clúster y de los costos de los recursos de almacenamiento durante un período de uno a tres años. Estas instancias reservadas (RI) se compran por separado y pueden ahorrar una cantidad significativa de dinero protegiendo las mejores tarifas para el clúster de Azure Data Explorer. Para obtener más información, consulte Pago por adelantado de las unidades de incremento de Azure Data Explorer con la capacidad reservada de Azure Data Explorer.

Selección de un tipo de clúster

Azure Data Explorer ofrece dos tipos de clústeres:

Producción (con SLA): los clústeres de producción contienen al menos dos nodos para el clúster del motor y al menos dos nodos para el clúster de administración de datos. Estos clústeres funcionan en el Acuerdo de Nivel de Servicio de Azure Data Explorer.
Desarrollo/pruebas (sin Acuerdo de Nivel de Servicio): los clústeres de desarrollo y pruebas contienen un único nodo para el clúster del motor y un único nodo para el clúster de administración de datos. Estos clústeres son la configuración de menor costo debido a su recuento de instancias bajas. Para esta configuración de clúster, no hay redundancia ni ningún Acuerdo de Nivel de Servicio.

Comparación de desarrollo y producción

Los clústeres de desarrollo son excelentes para la evaluación del servicio, la configuración de una canalización de ingesta, la realización de una prueba de concepto (PoC) o una validación del escenario. Entre las principales diferencias entre los clústeres de desarrollo y los clústeres de producción se incluyen:

Los clústeres de desarrollo tienen un tamaño limitado y no pueden crecer más allá de un solo nodo
El incremento de Azure Data Explorer no se cobra en el caso de los clústeres de desarrollo
Para los clústeres de desarrollo no hay ningún Acuerdo de Nivel de Servicio

Tipos de SKU de proceso

Los clústeres de Azure Data Explorer admiten varias SKU para diferentes tipos de cargas de trabajo. Cada SKU ofrece una proporción de almacenamiento de SSD y CPU distinta para ayudarle a dimensionar correctamente su implementación y crear soluciones rentables para la carga de trabajo analítica empresarial.

Proceso optimizado

Proporciona una alta relación entre núcleos y memoria caché, y el menor costo por núcleo.
SSD local para una baja latencia de E/S.

Almacenamiento optimizado

Proporciona un almacenamiento mayor que oscila entre 1 terabyte (TB) y 4 TB por nodo de motor, y el menor costo por gigabyte (GB).
Adecuada para cargas de trabajo que requieren almacenamiento para grandes volúmenes de datos.
Ciertas SKU usan Premium Storage (PS) conectado al nodo del motor en lugar de SSD locales. El acceso a PS es más lento que a los SSD locales, por lo que las SKU con PS son más costosas y tienen menos rendimiento que las SKU con un disco SSD local conectado.

Selección y optimización de la SKU de proceso

Selección de la SKU de proceso durante la creación del clúster

Cuando cree un clúster de Azure Data Explorer, seleccione la SKU de máquina virtual óptima para la carga de trabajo planeada. Use los siguientes atributos para ayudarle a elegir la SKU correcta para el entorno:

Atributo	Detalles
Costo por GB	Alto costo con proceso optimizado. Bajo coste con SKU optimizadas para almacenamiento.
Costo por núcleo	Bajo costo con proceso optimizado. Alto costo con SKU optimizadas para almacenamiento.
Precios de RI	El descuento de RI varía según la región y la SKU.

Nota

El costo de proceso es la parte más importante del costo de un clúster.

Optimización de la SKU de proceso del clúster

Para optimizar la SKU de proceso del clúster, configure el escalado vertical y compruebe las recomendaciones de Azure Advisor.

Con varias opciones de SKU de proceso entre las que elegir, puede optimizar los costos de los requisitos frecuentes de rendimiento y memoria caché activa para su escenario. Elija una SKU optimizada para proceso para obtener un rendimiento óptimo cuando haya elevados volúmenes de consultas. Elija una SKU optimizada para almacenamiento para obtener el mejor rendimiento al consultar grandes volúmenes de datos que deben almacenarse en caché.

Es preferible usar algunos nodos de máquinas virtuales más grandes que usen más RAM a usar muchas máquinas virtuales más pequeñas. Más RAM es necesaria para algunos tipos de consulta que ponen más demandas en RAM, como las consultas que utilizan combinaciones. Por lo tanto, al escalar el clúster, se recomienda escalar verticalmente a una SKU mayor y escalar horizontalmente agregando más nodos según sea necesario.

Nota

Cambiar o escalar verticalmente la SKU del clúster puede provocar una interrupción del servicio de uno a tres minutos. El rendimiento de las consultas puede verse afectado durante la migración de la SKU y la extensión del impacto puede variar en función de los patrones de uso.

Disponibilidad de SKU

La disponibilidad de SKU varía en función de los siguientes factores:

Región: no todas las SKU están disponibles en todas las regiones o zonas de disponibilidad. Para obtener más información, consulte cada página de la SKU para obtener disponibilidad regional.
Suscripción: algunas SKU solo pueden estar disponibles para tipos de suscripción específicos. Si una SKU no está disponible para la suscripción en una ubicación o zona que satisfaga sus necesidades empresariales, envíe una solicitud de SKU al soporte técnico de Azure.

Opciones de SKU

Las siguientes series de SKU están disponibles para máquinas virtuales del clúster de Azure Data Explorer. Las familias de SKU de las categorías optimizadas para proceso y almacenamiento se clasifican en orden de recomendación.

Optimizada para almacenamiento

Serie de SKU	Configuración de vCPU disponible	Tipo de SKU	Admite Premium Storage
Lasv3	8, 16 , 32	AMD	No
Lsv3	8, 16 , 32	Intel	No
Easv4, Easv5, ECasv5	8, 16	AMD	Sí
Esv4, Esv5	8, 16	Intel	Sí
DSv2	8, 16	Intel	Sí

Proceso optimizado

Serie de SKU	Configuración de vCPU disponible	Tipo de SKU	Admite Premium Storage
Eadsv5, ECadsv5	2, 4, 8, 16	AMD	No
Edv4, Edv5	2, 4, 8, 16	Intel	No
Eav4	2, 4, 8, 16	AMD	No
Dv2	2, 4, 8, 16	Intel	No

Nota

Todas las SKU optimizadas para proceso con 2 núcleos se pueden configurar como clústeres de desarrollo.

Se recomienda usar clústeres L32asv3 / L32sv3 solo en casos de uso con clústeres L16asv3/L16sv3 muy grandes que alcancen el límite de nodos de clúster de 1000 o clústeres con tasas de solicitud simultáneas extremadamente altas. ECasv5 y ECadsv5 son SKU de computación confidencial. Para más información, lea acerca de las máquinas virtuales de computación confidencial. En el caso de las SKU de ECasv5 optimizadas para almacenamiento, en caso de que use su propia clave administrada por el cliente (CMK), el cifrado de CMK se realiza en las cuentas de almacenamiento y en los discos de premium storage.

Con el aislamiento de proceso y almacenamiento de Azure Data Explorer, puede comenzar con la SKU más rentable y pasar a otra SKU después de la consolidación del patrón de uso o la pérdida de datos.
Consulte la lista de SKU de proceso por región actualizada mediante ListSkus API de Azure Data Explorer.

Tamaño de memoria caché

Azure Data Explorer reserva una parte del tamaño de disco que se muestra en cada una de las especificaciones de SKU de proceso de Azure que se van a usar para las operaciones de clúster. El tamaño exacto de la memoria caché para cada SKU está disponible en la sección correspondiente a la selección de SKU del portal.

Aprenda a usar la calculadora de precios

Selección de una SKU para el clúster de Azure Data Explorer

Selección de un tipo de clúster

Comparación de desarrollo y producción

Tipos de SKU de proceso

Selección y optimización de la SKU de proceso

Selección de la SKU de proceso durante la creación del clúster

Optimización de la SKU de proceso del clúster

Disponibilidad de SKU

Opciones de SKU

Tamaño de memoria caché

Comentarios

Comentarios

Recursos adicionales

Selección de una SKU para el clúster de Azure Data Explorer

Selección de un tipo de clúster

Comparación de desarrollo y producción

Tipos de SKU de proceso

Selección y optimización de la SKU de proceso

Selección de la SKU de proceso durante la creación del clúster

Optimización de la SKU de proceso del clúster

Disponibilidad de SKU

Opciones de SKU

Tamaño de memoria caché

Contenido relacionado

Comentarios

Comentarios

Recursos adicionales