Recomendaciones de Azure Advisor para el grupo de SQL dedicado en Azure Synapse Analytics

En este artículo se describen las recomendaciones de grupos de SQL dedicados disponibles en Azure Advisor.

El grupo de SQL dedicado proporciona recomendaciones para garantizar que la carga de trabajo de almacenamiento de datos esté optimizada de forma coherente para el rendimiento. Las recomendaciones están totalmente integradas con Azure Advisor para ofrecerle los procedimientos recomendados directamente en Azure Portal. El grupo de SQL dedicado recopila las recomendaciones de telemetría y superficies de la carga de trabajo activa diariamente. Los escenarios de recomendaciones admitidas se describen a continuación junto con instrucciones sobre cómo aplicar las acciones recomendadas.

Compruebe sus recomendaciones ya mismo.

Asimetría de datos

La asimetría de datos puede provocar cuellos de botella de recursos o movimientos de datos adicionales al ejecutar una carga de trabajo. En la siguiente documentación se describe cómo identificar la asimetría de datos y evitar que suceda al seleccionar una clave de distribución óptima.

Ninguna estadística o estadísticas obsoletas

La existencia de estadísticas deficientes puede afectar gravemente al rendimiento de las consultas, ya que puede dar lugar a que el optimizador de consultas de SQL genere planes de consulta deficientes. En la documentación siguiente se describen los procedimientos recomendados para crear y actualizar estadísticas:

Para ver la lista de las tablas afectadas por estas recomendaciones, ejecute el script de T-SQL siguiente. Advisor ejecuta continuamente el mismo script de T-SQL para generar estas recomendaciones.

Replicación de tablas

Para obtener recomendaciones sobre tablas replicadas, Advisor detecta los candidatos de tabla en función de las siguientes características físicas:

  • Tamaño de la tabla replicada
  • Número de columnas
  • Tipo de distribución de la tabla
  • Número de particiones

Advisor aprovecha continuamente la heurística basada en la carga de trabajo, como la frecuencia de acceso a la tabla, las filas devueltas como promedio y los umbrales relativos al tamaño y la actividad del almacenamiento de datos para asegurarse de que se generaron recomendaciones de alta calidad.

La sección siguiente describe la heurística basada en la carga de trabajo que puede encontrar en Azure Portal para cada recomendación de tabla replicada:

  • Promedio de análisis: porcentaje promedio de filas devueltas de la tabla para cada acceso a la tabla durante los siete últimos días.
  • Lectura frecuente, sin actualización: indica que la tabla no se actualizó durante los siete últimos días, mientras se muestra la actividad de acceso.
  • Relación de lectura y actualización: la relación entre la frecuencia con que se accedió a la tabla y cuándo se actualizó durante los siete últimos días.
  • Actividad: mide el uso basado en la actividad de acceso. Esta actividad compara la actividad de acceso a la tabla en relación con la actividad de acceso promedio a la tabla en el almacenamiento de datos durante los siete últimos días.

Actualmente Advisor solo mostrará como máximo cuatro candidatos de tabla replicada simultáneamente con índices de almacén de columnas agrupados, dando prioridad a la máxima actividad.

Importante

La recomendación de la tabla replicada no es infalible y no tiene en cuenta las operaciones de movimiento de datos de las cuentas. Estamos trabajando para agregar esto como un método heurístico, pero mientras tanto, debe validar siempre la carga de trabajo después de aplicar la recomendación. Para más información sobre las tablas replicadas, visite la siguiente documentación.

Uso de la memoria caché adaptable (Gen2)

Si tiene un gran espacio de trabajo, puede experimentar un porcentaje de aciertos de caché bajo y un uso elevado de la memoria caché. En este escenario, debe escalar verticalmente para aumentar la capacidad de la memoria caché y volver a ejecutar la carga de trabajo. Para más información, visite la siguiente documentación.

Contención de tempdb

El rendimiento de las consultas puede reducirse si hay una gran contención de tempdb. La contención de tempdb puede producirse a través de tablas temporales definidas por el usuario o cuando hay una gran cantidad de movimiento de datos. En este escenario, puede escalar para obtener más asignación de tempdb y configurar las clases de recursos y la administración de cargas de trabajo para proporcionar más memoria a las consultas.

Error de configuración de la carga de datos

Debe cargar siempre los datos desde una cuenta de almacenamiento que esté en la misma región que el grupo de SQL dedicado para minimizar la latencia. Use la instrucción COPY para la ingesta de datos de alto rendimiento y divida los archivos preconfigurados en la cuenta de almacenamiento para maximizar el rendimiento. Si no puede usar la instrucción COPY, puede usar la API SqlBulkCopy o bcp con un tamaño de lote alto para mejorar el rendimiento. Consulte Procedimientos recomendados para la carga de datos para obtener instrucciones adicionales sobre la carga de datos.