Share via


Consulta de datos de acceso esporádico con ventanas de acceso frecuente

Las ventanas de acceso frecuente permiten consultar datos de acceso esporádico de forma eficaz sin necesidad de exportar datos ni usar otras herramientas. Use ventanas de acceso frecuente cuando el tamaño de los datos de acceso esporádico sea grande y los datos pertinentes procedan de cualquier momento del pasado. Las ventanas de acceso frecuente se definen en la directiva de caché.

Azure Data Explorer almacena sus datos en almacenamiento a largo plazo confiable y almacena en caché una parte de estos datos en los nodos del clúster. La directiva de caché rige qué datos se almacenan en caché. Los datos almacenados en caché se consideran de acceso frecuente, mientras que el resto de los datos se consideran de acceso esporádico.

Para consultar datos de acceso esporádico, Azure Data Explorer un paso de carga que requiere tener acceso a una capa de almacenamiento con una latencia mucho mayor que el disco local. Cuando la consulta se limita a un pequeño período de tiempo, a menudo se las denomina consultas "en un momento dado", la cantidad de datos que se van a recuperar normalmente es pequeña y la consulta se completa rápidamente. Por ejemplo, los análisis forenses que consultan datos de telemetría de un día determinado del pasado entran en esta categoría. El efecto en la duración de la consulta depende del tamaño de los datos que se extrajeron del almacenamiento y puede ser significativo. Si se va a analizar una gran cantidad de datos de acceso esporádico, el rendimiento de las consultas podría mejorar si se usan ventanas de acceso frecuente.

En este documento se muestra cómo se usan las ventanas de acceso frecuenta para consultar datos de acceso esporádico.

Prerrequisitos

Configuración de la escalabilidad automática en un clúster

Después de cambiar la directiva de caché, el clúster almacena automáticamente en caché los datos pertinentes en sus discos. Tendrá que escalar el clúster para adaptarse al disco adicional necesario para la nueva definición de caché. Se recomienda configurar el clúster para usar la configuración de optimización del escalado automático.

  1. En Azure Portal, vaya al recurso de clúster de Azure Data Explorer. En Configuración, seleccione Escalar horizontalmente.

  2. En la ventana Escalar horizontalmente, seleccione Escalabilidad automática optimizada.

  3. Seleccione un recuento de instancias mínimo y máximo. El escalado automático del clúster oscila entre estos dos números, en función de la carga.

  4. Seleccione Guardar.

    Método de escalabilidad automática optimizada.

Ahora puede esperar un rendimiento óptimo durante el uso de las ventanas de acceso frecuente.

Establecimiento de ventanas de acceso frecuente

Las ventanas de acceso frecuente forman parte de la sintaxis de comandos de la directiva de caché y se establecen con el comando .alter policy caching.

Nota

La actualización completa de la caché de disco del clúster puede tardar hasta una hora según la definición de la directiva de caché actualizada.

  1. Utilice el comando .show policy caching para tomar nota de la directiva de almacenamiento en caché inicial.

    .show table MyDatabase.MyTable policy caching 
    
  2. Modifique la directiva de caché mediante la siguiente sintaxis. Se pueden definir varias ventanas de acceso frecuente para una sola base de datos o tabla.

    .alter <entity_type> <database_or_table_or_materialized-view_name> policy caching 
          hot = <timespan> 
          [, hot_window = datetime(*from*) .. datetime(*to*)] 
          [, hot_window = datetime(*from*) .. datetime(*to*)] 
          ...
    

    Donde:

    • from: hora de inicio de la ventana de acceso frecuente (datetime)
    • to: hora de finalización de la ventana de acceso frecuente (datetime)

    Por ejemplo, las consultas que se ejecutan con la siguiente configuración examinarán los últimos 14 días de datos, en datos que se mantienen durante tres años.

    .alter table MyTable policy caching 
            hot = 14d,
            hot_window = datetime(2021-01-01) .. datetime(2021-02-01),
            hot_window = datetime(2021-04-01) .. datetime(2021-05-01)
    

Ejecutar consulta

Ejecute la consulta, o consultas, que desee durante el período de tiempo especificado en las ventanas de uso frecuente.

Reversión de configuración

  1. Use la configuración de caché original recuperada anteriormente en Establecimiento de ventanas de acceso en caliente.
  2. Revierta la directiva de caché a la configuración original con el comando .alter policy caching.

Como ha configurado la escalabilidad automática optimizada para ese clúster, el clúster se reducirá a su tamaño original.