Query Store Usage Scenarios (Escenarios de uso del Almacén de consultas)

Artículo
04/03/2023

Se aplica a:SQL Server Azure SQL Database Azure SQL Managed Instance Azure Synapse Analytics

El Almacén de consultas se puede usar en un gran número de escenarios en los que es fundamental controlar y procurar un rendimiento de carga de trabajo de predicción. Estos son algunos ejemplos que se pueden tener en cuenta:

Localizar y solucionar consultas con regresiones de elección del plan
Identificación y optimización de las consultas que consumen más recursos
Pruebas A/B
Mantener la estabilidad del rendimiento al actualizar a una versión más reciente de SQL Server
Identificación y mejora de las cargas de trabajo puntuales
Para obtener más información sobre cómo configurar y administrar el almacén de consultas, consulte Optimización del rendimiento mediante el almacén de consultas.
Para obtener información sobre cómo detectar información procesable y ajustar el rendimiento con el almacén de consultas, consulte Optimización del rendimiento mediante el almacén de consultas.
Para obtener más información sobre cómo funciona el almacén de consultas en Base de datos SQL de Azure, vea Funcionamiento del almacén de consultas de Base de datos SQL de Azure.

Localizar y solucionar consultas con regresiones de elección del plan

Durante su ejecución de consultas normal, el optimizador de consultas puede decidir adoptar un plan diferente porque las entradas importantes ahora son distintas, ya sea porque la cardinalidad de los datos ha cambiado, porque se han creado, modificado o eliminado índices, porque se han actualizado estadísticas, etc. El nuevo plan suele ser mejor o aproximadamente igual que el que se usó anteriormente. Sin embargo, hay casos en los que el nuevo plan es considerablemente peor. Esta situación es conocida como "regresión de cambio de elección de plan". Antes de que existiera el Almacén de consultas, este era un problema difícil de identificar y corregir, ya que SQL Server no proporcionaba un almacén de datos integrado donde los usuarios pudieran buscar los planes de ejecución usados a lo largo del tiempo.

Con el Almacén de consultas puede hacer lo siguiente rápidamente:

Identificar todas las consultas cuyas métricas de ejecución se hayan degradado en el período especificado (última hora, día, semana, etc.). Use la opción Consultas con regresión de SQL Server Management Studio para acelerar el análisis.
Entre las consultas con regresión, es fácil distinguir las que tenían varios planes y que se degradaron debido a una mala elección del plan. Use el panel Resumen del plan en Consultas devueltas para visualizar todos los planes de una consulta devuelta y su rendimiento de consulta en el tiempo.
Forzar el plan anterior del historial, si está confirmado que es mejor. Use el botón Forzar plan de Consultas con regresión para aplicar el plan seleccionado para la consulta.

Screenshot of the Query Store showing a plan summary.

Para ver una descripción detallada del escenario, consulte el blog Query Store: A flight data recorder for your database (Almacén de consultas: una caja negra de su base de datos).

Identificación y optimización de las consultas que consumen más recursos

Aunque la carga de trabajo puede generar miles de consultas, normalmente solo unas pocas usan realmente la mayor parte de los recursos del sistema y, por tanto, requieren su atención. Entre las consultas que más recursos consumen suelen estar las consultas con regresión o aquellas que se pueden ajustar para mejorarlas.

La forma más sencilla de empezar a explorar es abrir Principales consultas que consumen recursos en Management Studio. La interfaz de usuario se divide en tres paneles: un histograma con las consultas que consumen más recurso (izquierda), un resumen del plan para la consulta seleccionada (derecha) y un plan de consulta visual para el plan seleccionado (abajo). Seleccione Configurar para controlar la cantidad de consultas que quiere analizar y el intervalo de tiempo que le interesa. También puede elegir entre diferentes dimensiones de consumo de recursos (duración, CPU, memoria, E/S, número de ejecuciones) y la base (promedio, mínima, máxima, total, desviación estándar).

Screenshot of the Query Store showing that you can identify and tune top resource consuming queries.

Eche un vistazo al resumen del plan a la derecha para analizar el historial de ejecuciones y conocer los distintos planes y sus correspondientes estadísticas en tiempo de ejecución. Use el panel inferior para examinar los distintos planes o compararlos visualmente poniéndolos uno al lado del otro (para ello, use el botón Comparar).

Cuando identifique una consulta con un rendimiento deficiente, la acción dependerá de la naturaleza del problema:

Si la consulta se ejecutó con varios planes y el último plan es mucho peor que el anterior, puede usar el mecanismo de forzado de plan para procurar que SQL Server use siempre el mejor plan posible en futuras ejecuciones.
Compruebe si el optimizador sugiere que faltan índices en el plan XML. Si así es, cree el índice que falta y use el Almacén de consultas para evaluar el rendimiento de la consulta después de haber creado ese índice.
Asegúrese de que las estadísticas están actualizadas para las tablas subyacentes utilizadas por la consulta.
Asegúrese de que los índices usados por la consulta están desfragmentados.
Considere si merece la pena volver a escribir una consulta costosa. Por ejemplo, puede aprovechar las ventajas de la parametrización de consultas y reducir el uso de SQL dinámico. Implemente una lógica óptima al leer los datos (aplique el filtrado de datos en la base de datos, no en la aplicación).

Pruebas A/B

Use el Almacén de consultas para comparar el rendimiento de una carga de trabajo antes y después del cambio de aplicación.

La siguiente lista contiene ejemplos en los que se puede usar el Almacén de consultas para evaluar el impacto del cambio de entorno o aplicación en el rendimiento de la carga de trabajo:

Implementar una nueva versión de la aplicación.
Agregar nuevo hardware al servidor.
Crear índices que faltan en las tablas a las que hacen referencia las consultas costosas.
Aplicar una directiva de filtrado para la seguridad de nivel de fila. Para obtener más información, vea Optimizing Row Level Security with Query Store (Optimización de la seguridad de nivel de fila con el Almacén de consultas).
Agregar versiones de sistema temporales a tablas que las aplicaciones de OLTP modifican con frecuencia.

En cualquiera de estos escenarios es válido el siguiente flujo de trabajo:

Ejecute la carga de trabajo con el Almacén de consultas antes de efectuar el cambio previsto para generar una base de rendimiento.
Realice el cambio de aplicación en el momento controlado de su elección.
Siga ejecutando la carga de trabajo el tiempo suficiente como para generar una imagen de rendimiento del sistema tras el cambio.
Compare los resultados de los pasos 1 y 3.
1. Abra Consumo general de base de datos para conocer el impacto en toda la base de datos.
2. Abra Consultas que más recursos consumen (o ejecute su propio análisis con Transact-SQL) para analizar el impacto del cambio en las consultas más importantes.
Decida si mantener el cambio o revertirlo si el nuevo rendimiento es inaceptable.

En la siguiente ilustración se muestra el análisis del Almacén de consultas (paso 4) cuando se crea un índice que falta. Abra el panel Resumen del plan en Consultas que más recursos consumen para obtener una vista de la consulta que debería verse afectada por la creación del índice:

Screenshot showing the Query Store analysis (step 4) in case of missing index creation.

También puede comparar los planes anterior y posterior a la creación del índice poniéndolos uno al lado del otro (con la opción de barra de herramientas "Comparar los planes de la consulta seleccionada en una ventana independiente" que está marcada con un cuadrado de color rojo en la barra de herramientas).

Screenshot showing the Query Store and the Compare the plans for the selected query in a separate window toolbar option.

El plan anterior a la creación del índice (con el número 1, arriba) muestra una sugerencia de falta de índice y puede observar que Clustered Index Scan fue el operador más caro de la consulta (enmarcado en un rectángulo rojo).

El plan posterior a la creación del índice (con el número 15, abajo) tiene ahora Index Seek (Nonclustered), lo que reduce el costo total de la consulta y mejora el rendimiento (enmarcado en un rectángulo verde).

Según el análisis, probablemente lo más conveniente sea mantener el índice, ya que el rendimiento de la consulta ha mejorado.

Mantener la estabilidad del rendimiento al actualizar a una versión más reciente de SQL Server

Antes de SQL Server 2014 (12.x), los usuarios corrían el riesgo de sufrir una regresión del rendimiento al actualizar a la versión más reciente de la plataforma. Esto se debía a que la versión más reciente del optimizador de consultas se activaba inmediatamente después de que se instalaran los nuevos bits.

A partir de SQL Server 2014 (12.x), todos los cambios del optimizador de consultas están vinculados al nivel de compatibilidad de la base de datos más reciente, por lo que los planes no se cambian en el momento de la actualización, sino cuando un usuario cambia COMPATIBILITY_LEVEL a la versión más reciente. Esta función, junto con el Almacén de consultas, confiere al usuario un enorme control sobre el rendimiento de las consultas en el proceso de actualización. En la siguiente imagen se muestra el flujo de trabajo de actualización recomendado:

Diagram showing the recommended upgrade workflow.

Actualice SQL Server sin cambiar el nivel de compatibilidad de la base de datos. No expone los últimos cambios del optimizador de consultas, pero sí las características más recientes de SQL Server, incluido el Almacén de consultas.
Habilite el Almacén de consultas. Para obtener más información, vea Mantenimiento del Almacén de consultas ajustado a la carga de trabajo.
Permita al Almacén de consultas capturar consultas y planes y establezca una base de rendimiento con el nivel de compatibilidad de base de datos de origen o anterior. Continúe en este paso el tiempo suficiente para capturar todos los planes y obtener una base estable. Puede ser la duración de un ciclo comercial habitual de una carga de trabajo de producción.
Pase al nivel de compatibilidad de base de datos más reciente: exponga la carga de trabajo al optimizador de consultas más reciente para crear posibles nuevos planes.
Use el Almacén de consultas para realizar correcciones de regresión y análisis: las nuevas mejoras del optimizador de consultas suelen producir mejores planes. Con todo, el Almacén de consultas proporcionará una forma fácil de identificar las regresiones de elección del plan y de corregirlas mediante el mecanismo de forzado de plan. A partir de SQL Server 2017 (14.x), si se usa la característica de corrección automática de planes, este paso es automático.

a. Para los casos en los que hay regresiones, fuerce el plan anterior de eficacia demostrada en el Almacén de consultas.

b. Si hay planes de consulta que no se hayan podido forzar o si el rendimiento sigue siendo insuficiente, considere la posibilidad de revertir el nivel de compatibilidad de la base de datos al valor anterior y, después, póngase en contacto con el servicio de atención al cliente de Microsoft.

Sugerencia

Use la tarea de SQL Server Management Studio Actualizar base de datos para actualizar el nivel de compatibilidad de la base de datos de la base de datos. Consulte Actualización de bases de datos mediante el Asistente para la optimización de consultas para más información.

Identificación y mejora de las cargas de trabajo puntuales

Algunas cargas de trabajo no tienen consultas dominantes que se puedan optimizar para mejorar el rendimiento general de la aplicación. Estas cargas de trabajo se suelen caracterizar por un número relativamente grande de consultas diferentes, y todas ellas consumen parte de los recursos del sistema. Al ser únicas, estas consultas se ejecutan con poca frecuencia (normalmente una sola vez, de ahí la nomenclatura “ad hoc”), por lo que su consumo de tiempo de ejecución no es crítico. Por otro lado, dado que la aplicación genera nuevas consultas netas todo el tiempo, se dedica una parte significativa de los recursos del sistema a compilar consultas, lo que no resulta óptimo. Esta situación tampoco es ideal para el Almacén de consultas, dado que el elevado número de consultas y planes acapara el espacio que tiene reservado, lo que significa que el Almacén de consultas probablemente acabe en modo de solo lectura muy rápidamente. Si activó la directiva de limpieza según el tamaño (muy recomendable para mantener el almacén de consultas siempre en funcionamiento), el proceso en segundo plano limpiará las estructuras del almacén de consultas prácticamente todo el tiempo, lo que también consume muchos recursos del sistema.

La vista Consultas que más recursos consumen ofrece una primera indicación de la naturaleza ad hoc de la carga de trabajo:

Screenshot of the Top Resource Consuming Queries view showing that the majority of top resources consuming queries is only executed once.

Use la métrica Recuento de ejecuciones para analizar si las consultas principales son ad hoc (para ello, debe ejecutar el almacén de consultas con QUERY_CAPTURE_MODE = ALL). En el diagrama anterior, puede ver que el 90 % de las Consultas que más recursos consumen se ejecuta solo una vez.

Opcionalmente, puede ejecutar un script de Transact-SQL para obtener el número total de textos de consulta, consultas y planes en el sistema, y conocer sus diferencias comparando los valores query_hash y query_plan_hash:

--Do cardinality analysis when suspect on ad hoc workloads
SELECT COUNT(*) AS CountQueryTextRows FROM sys.query_store_query_text;  
SELECT COUNT(*) AS CountQueryRows FROM sys.query_store_query;  
SELECT COUNT(DISTINCT query_hash) AS CountDifferentQueryRows FROM  sys.query_store_query;  
SELECT COUNT(*) AS CountPlanRows FROM sys.query_store_plan;  
SELECT COUNT(DISTINCT query_plan_hash) AS  CountDifferentPlanRows FROM  sys.query_store_plan;

Este es un posible resultado que puede obtener en el caso de cargas de trabajo con consultas ad hoc:

Screenshot of the potential result you can get in case of workload with ad hoc queries.

El resultado de la consulta muestra que, a pesar del gran número de planes y consultas en el Almacén de consultas, query_hash y query_plan_hash no son realmente diferentes. Una relación entre textos de consulta únicos y hashes de consulta únicos que esté muy por encima de 1 es indicativa de que esa carga de trabajo es una buena candidata para la parametrización, dado que la única diferencia entre las consultas es la constante literal (parámetro) que se proporciona como parte del texto de la consulta.

Normalmente, esta situación puede ocurrir si la aplicación genera consultas (en lugar de llamar a procedimientos almacenados o a consultas con parámetros) o si depende de marcos de trabajo de asignación relativos a objetos que generan consultas de forma predeterminada.

Si tiene el control del código de la aplicación, sopese la posibilidad de volver a escribir la capa de acceso a los datos para que se usen procedimientos almacenados o consultas parametrizadas. Pese a todo lo anterior, esta situación también se puede mejorar considerablemente sin cambios en la aplicación. Basta con forzar la parametrización de consultas de toda la base de datos (todas las consultas) o de las plantillas de consulta individuales con el mismo query_hash.

El método de las plantillas de consulta individuales requiere crear una guía de plan:

--Apply plan guide for the selected query template 
DECLARE @stmt nvarchar(max);  
DECLARE @params nvarchar(max);  
EXEC sp_get_query_template   
    N'<your query text goes here>',  
    @stmt OUTPUT,   
    @params OUTPUT;  
  
EXEC sp_create_plan_guide   
    N'TemplateGuide1',   
    @stmt,   
    N'TEMPLATE',   
    NULL,   
    @params,   
    N'OPTION (PARAMETERIZATION FORCED)';

Una solución con guías de plan es más precisa, pero requiere más trabajo.

Si todas las consultas (o la mayoría de ellas) son aptas para la parametrización automática, considere la posibilidad de configurar PARAMETERIZATION = FORCED para toda la base de datos. Para obtener más información, consulte Directrices para usar la parametrización forzada.

--Apply forced parameterization for entire database  
ALTER DATABASE <database name> SET PARAMETERIZATION FORCED;

Después de aplicar cualquiera de estos pasos, Principales consultas que consumen recursos mostrará una imagen distinta de la carga de trabajo.

Screenshot of the Top Resource Consuming Queries view showing a different picture of your workload.

En algunos casos, la aplicación puede generar una gran cantidad de consultas diferentes que no son aptas para la parametrización automática. En ese caso, verá un gran número de consultas en el sistema, pero la relación entre las consultas únicas y los query_hash únicos estará bastante próxima a 1.

En ese caso, es posible que quiera habilitar la opción del servidor Optimizar para cargas de trabajo ad hoc para no desperdiciar memoria caché con consultas que probablemente no vuelvan a ejecutarse. Para evitar que se capturen esas consultas en el Almacén de consultas, establezca QUERY_CAPTURE_MODE en AUTO.

EXEC sys.sp_configure N'show advanced options', N'1' RECONFIGURE WITH OVERRIDE
GO
EXEC sys.sp_configure N'optimize for ad hoc workloads', N'1'
GO
RECONFIGURE WITH OVERRIDE
GO 
  
ALTER DATABASE [QueryStoreTest] SET QUERY_STORE CLEAR;  
ALTER DATABASE [QueryStoreTest] SET QUERY_STORE = ON   
    (OPERATION_MODE = READ_WRITE, QUERY_CAPTURE_MODE = AUTO);