Creare un avviso di metrica con soglie dinamiche

Le soglie dinamiche applicano l'apprendimento automatico avanzato e usano un set di algoritmi e metodi per:

  • Informazioni sul comportamento cronologico delle metriche
  • Analizzare le metriche nel tempo e identificare modelli quali modelli orari, giornalieri o settimanali
  • Riconoscere le anomalie che indicano possibili problemi del servizio
  • Calcolare la soglia più appropriata per la metrica

Quando si usano soglie dinamiche, non è necessario conoscere la soglia "corretta" per ogni metrica, perché le soglie dinamiche calcolano automaticamente le soglie più appropriate.

È consigliabile configurare le regole di avviso con soglie dinamiche in queste metriche:

  • Percentuale CPU macchina virtuale
  • Tempo di esecuzione della richiesta HTTP di Application Insights

Le soglie dinamiche consentono di:

  • Creare avvisi scalabili per centinaia di serie di metriche con una regola di avviso. Se si dispone di un minor numero di regole di avviso, è necessario dedicare meno tempo alla creazione e alla gestione delle regole di avviso. Gli avvisi scalabili sono particolarmente utili per più dimensioni o per più risorse, ad esempio per tutte le risorse in una sottoscrizione.
  • Creare regole senza dover conoscere la soglia da configurare. Usando le soglie dinamiche, è possibile configurare gli avvisi delle metriche usando concetti di alto livello, senza avere una conoscenza approfondita del dominio sulla metrica
  • Configurare gli avvisi delle metriche usando concetti di alto livello senza una conoscenza approfondita del dominio sulla metrica
  • Evitare soglie rumorose (bassa precisione) o wide (richiamo basso) che non hanno un modello previsto
  • Gestire metriche rumorose (ad esempio CPU o memoria del computer) e metriche con bassa dispersione (ad esempio disponibilità e frequenza di errore)

È possibile usare soglie dinamiche in:

  • la maggior parte della piattaforma di Monitoraggio di Azure e delle metriche personalizzate
  • metriche comuni relative alle applicazioni e all'infrastruttura
  • metriche rumorose, ad esempio CPU del computer o memoria
  • metriche con bassa dispersione, ad esempio la disponibilità e la frequenza degli errori Vedere le metriche non supportate dalle soglie dinamiche per un elenco di metriche non supportate dalle soglie dinamiche.

È possibile configurare soglie dinamiche usando:

Calcolo della soglia di avviso e anteprima

Quando viene creata per la prima volta una regola di avviso, le soglie dinamiche usano 10 giorni di dati cronologici per calcolare modelli stagionali orari o giornalieri. Il grafico visualizzato nell'anteprima dell'avviso riflette i dati. Dopo aver creato una regola di avviso, le soglie dinamiche usano continuamente tutti i dati cronologici disponibili per apprendere e regolare le soglie in modo che siano più accurate. Dopo tre settimane, le soglie dinamiche hanno dati sufficienti per identificare anche i modelli settimanali e il modello viene modificato in modo da includere la stagionalità settimanale. Le regole di avviso che usano soglie dinamiche non attivano un avviso prima di raccogliere tre giorni e almeno 30 campioni di dati delle metriche.

Il sistema riconosce automaticamente interruzioni prolungate e le rimuove dall'algoritmo di apprendimento di soglia. Se si verifica un'interruzione prolungata, le soglie dinamiche comprendono i dati e rilevano i problemi di sistema con lo stesso livello di riservatezza di prima dell'interruzione.

Considerazioni sull'uso di soglie dinamiche

  • Per garantire un calcolo accurato della soglia, gli avvisi che usano soglie dinamiche non attivano un avviso prima di raccogliere tre giorni e almeno 30 campioni di dati delle metriche. Di conseguenza, le nuove risorse o le risorse mancanti non attivano un avviso finché non sono disponibili dati sufficienti.
  • Per rilevare la stagionalità settimanale, le soglie dinamiche richiedono almeno tre settimane di dati cronologici. Alcuni modelli dettagliati, ad esempio modelli bi-orari o semi-settimanali, potrebbero non essere rilevati.
  • Se il comportamento di una metrica è stato modificato di recente, le modifiche non verranno immediatamente riflesse nei limiti superiori e inferiori della soglia dinamica. I bordi vengono calcolati in base ai dati delle metriche degli ultimi 10 giorni. Quando si visualizzano i bordi soglia dinamica per una determinata metrica, esaminare la tendenza delle metriche nell'ultima settimana e non solo per le ultime ore o giorni.
  • Le soglie dinamiche sono valide per rilevare deviazioni significative, anziché problemi in continua evoluzione. Le modifiche al comportamento lente probabilmente non attiveranno un avviso.

Problemi noti relativi alla sensibilità di soglia dinamica

  • Se una regola di avviso che usa soglie dinamiche è troppo rumorosa o si attiva troppo, potrebbe essere necessario ridurre la sensibilità della regola di avviso delle soglie dinamiche. Usare una delle seguenti opzioni:

    • Sensibilità soglia: impostare la sensibilità su Bassa per essere più tollerante per le deviazioni.
    • Numero di violazioni (in Impostazioni avanzate): configurare la regola di avviso per l'attivazione solo se si verificano diverse deviazioni entro un determinato periodo di tempo. Questa impostazione rende la regola meno soggetta alle deviazioni temporanee.
  • È possibile che venga visualizzata una regola di avviso che usa soglie dinamiche non viene attivata o non è sufficientemente sensibile, anche se è configurata con sensibilità elevata. Ciò può verificarsi quando la distribuzione della metrica è altamente irregolare. Prendere in considerazione una delle soluzioni seguenti per risolvere il problema:

    • Passare al monitoraggio di una metrica complementare adatta allo scenario, se applicabile. Ad esempio, verificare la presenza di modifiche nella frequenza di esito positivo anziché nella frequenza di errori.
    • Provare a selezionare un valore diverso per Granularità aggregazione (periodo).
    • Controllare se negli ultimi 10 giorni è stata apportata una modifica drastica del comportamento delle metriche, ad esempio un'interruzione. Una modifica brusca può influire sulle soglie superiori e inferiori calcolate per la metrica e renderle più ampie. Attendere alcuni giorni fino a quando l'interruzione non viene più presa nel calcolo delle soglie. È anche possibile modificare la regola di avviso per usare l'opzione Ignora dati prima nelle impostazioni avanzate.
    • Se i dati hanno una stagionalità settimanale, ma non è disponibile una cronologia sufficiente per la metrica, le soglie calcolate possono comportare limiti generali e inferiori. Ad esempio, il calcolo può trattare i giorni feriali e i fine settimana nello stesso modo e creare bordi estesi che non sempre soddisfano i dati. Questo problema dovrebbe risolversi dopo la disponibilità di una cronologia delle metriche sufficiente. Viene quindi rilevata la stagionalità corretta e le soglie calcolate vengono aggiornate di conseguenza.
  • Quando un valore della metrica presenta grandi fluttuazioni, le soglie dinamiche possono creare un modello wide intorno ai valori delle metriche, che possono comportare un limite inferiore o superiore del previsto. Questo scenario può verificarsi quando:

    • La sensibilità è impostata su bassa.
    • La metrica presenta un comportamento irregolare con varianza elevata, che appare come picchi o cali nei dati.

    Valutare la possibilità di rendere il modello meno sensibile scegliendo una maggiore sensibilità o selezionando un periodo di lookback più grande. È anche possibile usare l'opzione Ignora dati prima di escludere una recente irregolarità dai dati cronologici usati per compilare il modello.

Configurare soglie dinamiche

Seguire la procedura per creare o modificare una regola di avviso usando queste impostazioni

  1. Nella scheda Condizioni ,
    1. Nel campo Soglie selezionare Dinamico.
    2. Nel tipo di aggregazione è consigliabile non selezionare Massimo.
    3. Nel campo Operatore selezionare Maggiore di a meno che il comportamento non rappresenti l'utilizzo dell'applicazione.
    4. In Sensibilità soglia selezionare Media o Bassa per ridurre il rumore degli avvisi.
    5. Nel campo Controlla ogni, valutare la possibilità di abbassare la frequenza in base all'impatto aziendale dell'avviso.
    6. Nel periodo lookback impostare la finestra di visualizzazione indietro su almeno 15 minuti. Ad esempio, se il controllo ogni campo è impostato su 5 minuti, il periodo di lookback deve essere di almeno 3 minuti.
  2. Continuare con il resto del processo per creare una regola di avviso.

Nota

Le regole di avviso delle metriche create tramite il portale vengono create nello stesso gruppo di risorse della risorsa di destinazione.

Informazioni sui grafici a soglie dinamiche

Il grafico seguente mostra una metrica, i limiti delle soglie dinamiche e alcuni avvisi generati quando il valore non rientra nelle soglie consentite.

Screenshot that shows a metric, its dynamic thresholds limits, and some alerts that fired.

Usare le informazioni seguenti per interpretare il grafico:

  • Linea blu: la metrica misurata effettiva nel tempo.
  • Area ombreggiata blu: mostra l'intervallo consentito per la metrica. Se i valori delle metriche rimangono all'interno di questo intervallo, non viene attivato alcun avviso.
  • Punti blu: se si seleziona parte del grafico e quindi si passa il puntatore del mouse sulla linea blu, sotto il cursore viene visualizzato un punto blu che mostra un singolo valore di metrica aggregato.
  • Popup con punto blu: mostra il valore della metrica misurata (il punto blu) e i valori superiori e inferiori dell'intervallo consentito.
  • Punto rosso con un cerchio nero: mostra il primo valore della metrica fuori dall'intervallo consentito. Questo valore genera un avviso di metrica e lo inserisce in uno stato attivo.
  • Punti rossi: indica altri valori misurati all'esterno dell'intervallo consentito. Non attivano più avvisi delle metriche, ma l'avviso rimane nello stato attivo.
  • Area rossa: mostra l'ora in cui il valore della metrica è esterno all'intervallo consentito. L'avviso rimane nello stato attivo purché i valori misurati successivi non siano compresi nell'intervallo consentito, ma non vengono attivati nuovi avvisi.
  • Fine dell'area rossa: quando la linea blu si trova all'interno dei valori consentiti, l'area rossa si arresta e la linea del valore misurato diventa blu. Lo stato dell'avviso della metrica attivato al momento del punto rosso con contorno nero viene impostato su risolto.

Metriche non supportate dalle soglie dinamiche

Le soglie dinamiche sono supportate per la maggior parte delle metriche, ma alcune metriche non possono usare soglie dinamiche.

La tabella seguente elenca le metriche non supportate dalle soglie dinamiche.

Tipo di risorsa Nome metrica
Microsoft.ClassicStorage/storageAccounts UsedCapacity
Microsoft.ClassicStorage/storageAccounts/blobServices BlobCapacity
Microsoft.ClassicStorage/storageAccounts/blobServices BlobCount
Microsoft.ClassicStorage/storageAccounts/blobServices IndexCapacity
Microsoft.ClassicStorage/storageAccounts/fileServices FileCapacity
Microsoft.ClassicStorage/storageAccounts/fileServices FileCount
Microsoft.ClassicStorage/storageAccounts/fileServices FileShareCount
Microsoft.ClassicStorage/storageAccounts/fileServices FileShareSnapshotCount
Microsoft.ClassicStorage/storageAccounts/fileServices FileShareSnapshotSize
Microsoft.ClassicStorage/storageAccounts/fileServices FileShareQuota
Microsoft.Compute/disks Byte letti da disco composito/sec
Microsoft.Compute/disks Operazioni di lettura disco composito/sec
Microsoft.Compute/disks Byte scrittura disco composito/sec
Microsoft.Compute/disks Operazioni di scrittura su disco composito/sec
Microsoft.ContainerService/managedClusters NodesCount
Microsoft.ContainerService/managedClusters PodCount
Microsoft.ContainerService/managedClusters CompletedJobsCount
Microsoft.ContainerService/managedClusters RestartingContainerCount
Microsoft.ContainerService/managedClusters OomKilledContainerCount
Microsoft.Devices/IotHubs TotalDeviceCount
Microsoft.Devices/IotHubs Connessione edDeviceCount
Microsoft.Devices/IotHubs TotalDeviceCount
Microsoft.Devices/IotHubs Connessione edDeviceCount
Microsoft.DocumentDB/databaseAccounts CassandraConnectionClosures
Microsoft.EventHub/clusters Dimensione
Microsoft.EventHub/namespaces Dimensione
Microsoft.IoTCentral/IoTApps connectedDeviceCount
Microsoft.IoTCentral/IoTApps provisionedDeviceCount
Microsoft.Kubernetes/connectedClusters NodesCount
Microsoft.Kubernetes/connectedClusters PodCount
Microsoft.Kubernetes/connectedClusters CompletedJobsCount
Microsoft.Kubernetes/connectedClusters RestartingContainerCount
Microsoft.Kubernetes/connectedClusters OomKilledContainerCount
Microsoft.MachineLearningServices/workspaces/onlineEndpoints RequestsPerMinute
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments DeploymentCapacity
Microsoft.Maps/accounts CreatorUsage
Microsoft.Media/mediaservices/streamingEndpoints EgressBandwidth
Microsoft.Network/applicationGateways Velocità effettiva
Microsoft.Network/azureFirewalls Velocità effettiva
Microsoft.Network/expressRouteGateways ExpressRouteGatewayPacketsPerSecond
Microsoft.Network/expressRouteGateways ExpressRouteGatewayNumberOfVmInVnet
Microsoft.Network/expressRouteGateways ExpressRouteGatewayFrequencyOfRoutesChanged
Microsoft.Network/virtualNetworkGateways ExpressRouteGatewayBitsPerSecond
Microsoft.Network/virtualNetworkGateways ExpressRouteGatewayPacketsPerSecond
Microsoft.Network/virtualNetworkGateways ExpressRouteGatewayNumberOfVmInVnet
Microsoft.Network/virtualNetworkGateways ExpressRouteGatewayFrequencyOfRoutesChanged
Microsoft.ServiceBus/namespaces Dimensione
Microsoft.ServiceBus/namespaces Messaggi
Microsoft.ServiceBus/namespaces ActiveMessages
Microsoft.ServiceBus/namespaces DeadletteredMessages
Microsoft.ServiceBus/namespaces ScheduledMessages
Microsoft.ServiceFabricMesh/applications AllocatedCpu
Microsoft.ServiceFabricMesh/applications AllocatedMemory
Microsoft.ServiceFabricMesh/applications ActualCpu
Microsoft.ServiceFabricMesh/applications ActualMemory
Microsoft.ServiceFabricMesh/applications ApplicationStatus
Microsoft.ServiceFabricMesh/applications ServiceStatus
Microsoft.ServiceFabricMesh/applications ServiceReplicaStatus
Microsoft.ServiceFabricMesh/applications ContainerStatus
Microsoft.ServiceFabricMesh/applications RestartCount
Microsoft.Storage/storageAccounts UsedCapacity
Microsoft.Storage/storageAccounts/blobServices BlobCapacity
Microsoft.Storage/storageAccounts/blobServices BlobCount
Microsoft.Storage/storageAccounts/blobServices BlobProvisionedSize
Microsoft.Storage/storageAccounts/blobServices IndexCapacity
Microsoft.Storage/storageAccounts/fileServices FileCapacity
Microsoft.Storage/storageAccounts/fileServices FileCount
Microsoft.Storage/storageAccounts/fileServices FileShareCount
Microsoft.Storage/storageAccounts/fileServices FileShareSnapshotCount
Microsoft.Storage/storageAccounts/fileServices FileShareSnapshotSize
Microsoft.Storage/storageAccounts/fileServices FileShareCapacityQuota
Microsoft.Storage/storageAccounts/fileServices FileShareProvisionedIOPS

Passaggi successivi