Monitorare le prestazioni, l'integrità e l'utilizzo di Azure Esplora dati con le metriche

Le metriche di Azure Esplora dati forniscono indicatori chiave per l'integrità e le prestazioni delle risorse del cluster di Azure Esplora dati. Usare le metriche descritte in dettaglio in questo articolo per monitorare l'utilizzo, l'integrità e le prestazioni del cluster di Azure Esplora dati nello scenario specifico come metriche autonome. È anche possibile usare le metriche come base per i dashboard operativi di Azure e gli avvisi di Azure.

Per altre informazioni su Esplora metriche di Azure, vedere Esplora metriche.

Prerequisiti

Usare le metriche per monitorare le risorse di Azure Esplora dati

  1. Accedere al portale di Azure.
  2. Nel riquadro sinistro del cluster di Azure Esplora dati cercare le metriche.
  3. Selezionare Metriche per aprire il riquadro delle metriche e iniziare l'analisi nel cluster. Cercare e selezionare le metriche nel portale di Azure.

Usare il riquadro delle metriche

Nel riquadro delle metriche selezionare metriche specifiche da tenere traccia, scegliere come aggregare i dati e creare grafici delle metriche da visualizzare nel dashboard.

Le selezioni Spazio dei nomirisorsa e metrica sono prese selezionate per il cluster di Esplora dati di Azure. I numeri nell'immagine seguente corrispondono all'elenco numerato riportato di seguito. Illustrano diverse opzioni per la configurazione e la visualizzazione delle metriche.

Riquadro Metriche.

  1. Per creare un grafico delle metriche, selezionare Nome metrica e aggregazione pertinente per metrica. Per altre informazioni sulle diverse metriche, vedere Metriche di Azure Esplora dati supportate.
  2. Selezionare Aggiungi metrica per visualizzare più metriche tracciate nello stesso grafico.
  3. Selezionare + Nuovo grafico per visualizzare più grafici in una sola visualizzazione.
  4. Usare la selezione ora per modificare l'intervallo di tempo (impostazione predefinita: ultime 24 ore).
  5. Usare Aggiungi filtro e Applica suddivisione per le metriche con dimensioni.
  6. Selezionare Aggiungi al dashboard per aggiungere la configurazione del grafico ai dashboard in modo da poterla visualizzare di nuovo.
  7. Impostare Nuova regola di avviso per visualizzare le metriche usando i criteri impostati. La nuova regola di avviso includerà la risorsa di destinazione, la metrica, la suddivisione e le dimensioni di filtro del grafico. Modificare queste impostazioni nel riquadro di creazione della regola di avviso.

Metriche di Azure Esplora dati supportate

Le metriche di Azure Esplora dati offrono informazioni dettagliate sulle prestazioni complessive e sull'uso delle risorse, nonché informazioni su azioni specifiche, ad esempio l'inserimento o la query. Le metriche in questo articolo sono state raggruppate in base al tipo di utilizzo.

I tipi di metriche sono:

Per un elenco alfabetico delle metriche di Monitoraggio di Azure per Esplora dati di Azure, vedere Metriche del cluster di Azure Esplora dati supportate.

Metriche del cluster

Le metriche del cluster tengono traccia dell'integrità generale del cluster. Ad esempio, l'uso e la velocità di risposta delle risorse e dell'inserimento.

Metrica Unità Aggregazione Descrizione della metrica Dimensioni
Utilizzo della cache (deprecato) Percentuale Avg, Max, Min Percentuale di risorse della cache allocate attualmente utilizzate del cluster. La cache corrisponde alle dimensioni dell'unità SSD allocata per l'attività utente in base ai criteri di cache definiti.

Un utilizzo medio della cache non superiore all'80% è uno stato sostenibile per un cluster. Se l'utilizzo medio della cache è superiore all'80%, il cluster deve essere
con scalabilità fino a un piano tariffario ottimizzato per l'archiviazione o
con scalabilità orizzontale a più istanze. In alternativa, adattare i criteri di cache a un minor numero di giorni nella cache. Se l'utilizzo della cache supera il 100%, le dimensioni dei dati da memorizzare nella cache sono maggiori delle dimensioni totali della cache nel cluster.
Questa metrica è deprecata e presentata solo per la compatibilità con le versioni precedenti. Usare invece la metrica "Fattore di utilizzo della cache".
Nessuno
Fattore di utilizzo della cache Percentuale Avg, Max, Min Percentuale di spazio su disco utilizzato dedicato per la cache ad accesso frequente nel cluster.
Il 100% indica che lo spazio su disco assegnato ai dati ad accesso frequente viene utilizzato in modo ottimale. Non è necessaria alcuna azione e il cluster è completamente corretto.
Meno del 100% indica che lo spazio su disco assegnato per i dati ad accesso frequente non è completamente utilizzato.
Più del 100% significa che lo spazio su disco del cluster non è sufficiente per contenere i dati ad accesso frequente, come definito dai criteri di memorizzazione nella cache. Per garantire che sia disponibile spazio sufficiente per tutti i dati ad accesso frequente, è necessario ridurre la quantità di dati ad accesso frequente o aumentare il numero di istanze del cluster. È consigliabile abilitare la scalabilità automatica.
Nessuno
CPU Percentuale Avg, Max, Min Percentuale di risorse di calcolo allocate attualmente utilizzate dai computer del cluster.

Una CPU media non superiore all'80% è sostenibile per un cluster. Il valore massimo della CPU è pari al 100%, il che significa che non sono disponibili altre risorse di calcolo per elaborare i dati.
Quando un cluster non funziona correttamente, controllare il valore massimo della CPU per determinare se sono presenti CPU specifiche bloccate.
Nessuno
Utilizzo inserimento Percentuale Avg, Max, Min Percentuale di risorse effettive usate per inserire i dati dalle risorse totali allocate, nei criteri di capacità, per eseguire l'inserimento. I criteri di capacità predefiniti prevedono un massimo di 512 operazioni di inserimento simultanee oppure il 75% delle risorse del cluster investito nell'inserimento.

Un utilizzo medio dell'inserimento non superiore all'80% è uno stato sostenibile per un cluster. Il valore massimo di utilizzo dell'inserimento è pari al 100%, il che significa che viene usata tutta la capacità di inserimento nel cluster e che potrebbe essere creata una coda di inserimento.
Nessuno
InstanceCount Conteggio Media Numero totale di istanze.
Keep alive Conteggio Media Tiene traccia della velocità di risposta del cluster.

Se il cluster è completamente reattivo, viene restituito il valore 1, mentre se il cluster è bloccato o disconnesso, viene restituito 0.
Numero totale di comandi limitati Conteggio Media, Max, Min, Sum Numero di comandi limitati (rifiutati) nel cluster, poiché è stato raggiunto il numero massimo consentito di comandi simultanei (paralleli). Nessuno
Numero totale di extent Conteggio Media, Max, Min, Sum Numero totale di extent di dati nel cluster.

Le modifiche apportate a questa metrica possono implicare modifiche di grandi dimensioni della struttura dei dati e un carico elevato nel cluster, poiché l'unione degli extent di dati è un'attività pesante della CPU.
Nessuno
Latenza dei follower Millisecondi Media, Max, Min I database follower sincronizzano le modifiche nei database leader. A causa della sincronizzazione, è previsto un ritardo dei dati di pochi secondi fino a pochi minuti nella disponibilità dei dati.

Questa metrica misura la lunghezza del ritardo temporale. Il ritardo di tempo dipende da diversi fattori, ad esempio la dimensione complessiva e la frequenza dei dati inseriti nel leader, il numero di database seguiti, la frequenza delle operazioni interne eseguite sul leader (operazioni merge/ricompilazione).

Si tratta di una metrica a livello di cluster: i follower rilevano i metadati di tutti i database seguiti. Questa metrica rappresenta la latenza del processo.
Nessuno

Esportare le metriche

Le metriche di esportazione tengono traccia dell'integrità e delle prestazioni generali delle operazioni di esportazione, ad esempio lateness, risultati, numero di record e utilizzo.

Metrica Unità Aggregazione Descrizione della metrica Dimensioni
Numero di esportazione continuo di record esportati Conteggio Sum Numero di record esportati in tutti i processi di esportazione continua. ContinuousExportName
Ritardo massimo esportazione continua Conteggio Max Ritardo (in minuti) segnalato dai processi di esportazione continui nel cluster. Nessuno
Numero di esportazioni continue in sospeso Conteggio Max Numero di processi di esportazione continua in sospeso. Questi processi sono pronti per l'esecuzione, ma in attesa in una coda, probabilmente a causa di capacità insufficiente.
Risultato esportazione continua Conteggio Conteggio Risultato errore/esito positivo di ogni esecuzione di esportazione continua. ContinuousExportName
Utilizzo esportazione Percentuale Max Capacità di esportazione usata, fuori dalla capacità totale di esportazione nel cluster (tra 0 e 100). Nessuno

Metriche di inserimento

Le metriche di inserimento tengono traccia dell'integrità generale e delle prestazioni delle operazioni di inserimento, ad esempio latenza, risultati e volume. Per perfezionare l'analisi:

Metrica Unità Aggregazione Descrizione della metrica Dimensioni
Conteggio BLOB batch Conteggio Media, Max, Min Numero di origini dati in un batch completato per l'inserimento. Database
Durata batch Secondi Media, Max, Min Durata della fase di batch nel flusso di inserimento. Database
Dimensioni dei batch Byte Media, Max, Min Dimensioni dei dati non compresse in un batch aggregato per l'inserimento. Database
Batch elaborati Conteggio Somma, Max, Min Numero di batch completati per l'inserimento.
Batching Type: trigger per la chiusura di un batch.
Per un elenco completo dei tipi di batch, vedere Tipi di batch.
Database, tipo di batch
BLOB ricevuti Conteggio Somma, Max, Min Numero di BLOB ricevuti dal flusso di input da un componente.

Usare la suddivisione per analizzare ogni componente.
Database, Tipo di componente, Nome componente
BLOB elaborati Conteggio Somma, Max, Min Numero di BLOB elaborati da un componente.

Usare la suddivisione per analizzare ogni componente.
Database, Tipo di componente, Nome componente
BLOB eliminati Conteggio Somma, Max, Min Numero di BLOB eliminati definitivamente da un componente. Per ogni BLOB di questo tipo viene inviata una Ingestion result metrica con un motivo di errore.

Usare la suddivisione per analizzare ogni componente.
Database, Tipo di componente, Nome componente
Latenza di individuazione Secondi Media Tempo da dati inqueue fino all'individuazione da connessioni dati. Questa volta non è inclusa nella latenza stage o nelle metriche di latenza di inserimento .

La latenza di individuazione può aumentare nelle situazioni seguenti:
  • Quando vengono usate connessioni dati tra aree.

  • Nelle connessioni dati di Hub eventi, se il numero di partizioni di Hub eventi non è sufficiente per il volume di uscita dei dati.
Tipo di componente, nome componente
Eventi ricevuti Conteggio Somma, Max, Min Numero di eventi ricevuti dalle connessioni dati dal flusso di input. Tipo di componente, nome componente
Eventi elaborati Conteggio Somma, Max, Min Numero di eventi elaborati dalle connessioni dati. Tipo di componente, nome componente
Eventi eliminati Conteggio Somma, Max, Min Numero di eventi eliminati definitivamente dalle connessioni dati. Per ogni evento di questo tipo viene inviata una Ingestion result metrica con un motivo di errore. Tipo di componente, nome componente
Eventi elaborati (per hub Event/IoT) (deprecato) Conteggio Max, Min, Sum Numero totale di eventi letti da Hub eventi/ hub IoT e elaborati dal cluster. Questi eventi possono essere suddivisi in base allo stato: Ricevuto, Rifiutato, Elaborato.
Questa metrica è deprecata e presentata solo per la compatibilità con le versioni precedenti. Usare invece le metriche "Eventi ricevuti", "Eventi elaborati" e "Eventi eliminati".
Stato
Latenza di inserimento Secondi Media, Max, Min Latenza dei dati inseriti, dal momento in cui i dati sono stati ricevuti nel cluster fino a quando non sono pronti per la query. Il periodo di latenza dell'inserimento dipende dallo scenario di inserimento.
Ingestion Kind: Inserimento di streaming o inserimento in coda
Tipo di inserimento
Risultati inserimento Conteggio Sum Numero totale di origini non riuscite o riuscite da inserire.
Status: esito positivo per l'inserimento o la categoria di errori per gli errori. Per un elenco completo delle possibili categorie di errori, vedere Codici di errore di inserimento in Azure Esplora dati.
Failure Status Type: indica se l'errore è permanente o temporaneo. Per l'inserimento riuscito, questa dimensione è None.

Nota:
  • Hub eventi e hub IoT eventi di inserimento vengono pre-aggregati in un BLOB e quindi trattati come singola origine da inserire. Pertanto, gli eventi pre-aggregati vengono visualizzati come un singolo risultato di inserimento dopo la pre-aggregazione.

  • Gli errori temporanei vengono riprovati internamente un numero limitato di volte. Ogni errore temporaneo viene segnalato come risultato di inserimento temporaneo. Pertanto, un singolo inserimento può comportare più di un risultato di inserimento.
Stato, tipo di stato errore
Ingestion volume (in MB) (Volume inserimento (in MB)) Conteggio Max, Sum Dimensioni totali dei dati inseriti nel cluster (in MB) prima della compressione. Database
Lunghezza coda Conteggio Media Numero di messaggi in sospeso nella coda di input di un componente. Il componente gestione batch include un messaggio per BLOB. Il componente gestione inserimento include un messaggio per batch. Un batch è un singolo comando di inserimento con uno o più BLOB. Tipo di componente
Messaggio meno recente della coda Secondi Media Tempo in secondi dal momento in cui è stato inserito il messaggio meno recente nella coda di input di un componente. Tipo di componente
Byte delle dimensioni dei dati ricevute Byte Media, Somma Dimensioni dei dati ricevuti dalle connessioni dati dal flusso di input. Tipo di componente, nome componente
Latenza delle fasi Secondi Media Tempo da quando un messaggio viene accettato da Azure Esplora dati, fino a quando il relativo contenuto non viene ricevuto da un componente di inserimento per l'elaborazione.

Usare i filtri e selezionare Component Type > StorageEngine per visualizzare la latenza totale di inserimento.
Database, tipo di componente

Metriche di inserimento di streaming

Le metriche di inserimento in streaming tengono traccia dei dati di inserimento di streaming e della frequenza delle richieste, della durata e dei risultati.

Metrica Unità Aggregazione Descrizione della metrica Dimensioni
Streaming Ingest Data Rate (Velocità dati inserimento streaming) Conteggio RateRequestsPerSecond Volume totale di dati inseriti nel cluster. Nessuno
Streaming Ingest Duration (Durata inserimento streaming) Millisecondi Media, Max, Min Durata totale di tutte le richieste di inserimento di streaming. Nessuno
Streaming Ingest Request Rate (Frequenza richieste inserimento streaming) Conteggio Count, Avg, Max, Min, Sum Numero totale di richieste di inserimento in streaming. Nessuno
Streaming Ingest Result (Risultato inserimento streaming) Conteggio Media Numero totale di richieste di inserimento in streaming in base al tipo di risultato. Risultato

Metriche di query

Le metriche delle prestazioni delle query tengono traccia della durata della query e il numero totale di query simultanee o limitate.

Metrica Unità Aggregazione Descrizione della metrica Dimensioni
Durata delle query Millisecondi Media, Min, Max, Sum Tempo totale fino a quando non vengono ricevuti i risultati della query (non include latenza di rete). QueryStatus
QueryResult Conteggio Conteggio Numero totale di query. QueryStatus
Numero totale di query simultanee Conteggio Media, Max, Min, Sum Numero di query eseguite in parallelo nel cluster. Questa metrica è un buon modo per stimare il carico nel cluster. Nessuno
Numero totale di query limitate Conteggio Media, Max, Min, Sum Numero di query limitate (rifiutate) nel cluster. Il numero massimo di query simultanee (parallele) consentite è definito nei criteri di limite della frequenza delle richieste. Nessuno

Metriche di visualizzazione materializzate

Metrica Unità Aggregazione Descrizione della metrica Dimensioni
MaterializedViewHealth 1, 0 Media Il valore è 1 se la visualizzazione è considerata integra, in caso contrario 0. Database, MaterializedViewName
MaterializedViewAgeSeconds Secondi Media L'oggetto age della vista è definito dall'ora corrente meno l'ultimo tempo di inserimento elaborato dalla visualizzazione. Il valore della metrica è tempo in secondi (il valore inferiore è, la visualizzazione è "più sana"). Database, MaterializedViewName
MaterializedViewResult 1 Media La metrica include una Result dimensione che indica il risultato dell'ultimo ciclo di materializzazione (vedere la metrica MaterializedViewResult per informazioni dettagliate sui valori possibili). Il valore della metrica è sempre uguale a 1. Database, MaterializedViewName, Risultato
MaterializedViewRecordsInDelta Conteggio record Media Numero di record attualmente nella parte non elaborata della tabella di origine. Per altre informazioni, vedere come funzionano le visualizzazioni materializzate Database, MaterializedViewName
MaterializedViewExtentsRebuild Numero di extent Media Numero di extent necessari per gli aggiornamenti nel ciclo di materializzazione. Database, MaterializedViewName
MaterializedViewDataLoss 1 Max La metrica viene attivata quando i dati di origine non elaborati si avvicinano alla conservazione. Indica che la visualizzazione materializzata non è integra. Database, MaterializedViewName, Tipo