Capacità di un'istanza di Gestione API di Azure

SI APPLICA A: Sviluppatore | Basic | Standard | Premium

La capacità è la metrica di Monitoraggio di Azure più importante per prendere decisioni informate sull'opportunità di dimensionare o aggiornare un'istanza di Gestione API per gestire un carico maggiore. La costruzione è complessa e impone determinati comportamenti.

Questo articolo descrive che cos'è la capacità e il relativo comportamento. Illustra come accedere alle metriche di capacità nel portale di Azure e suggerisce quando prendere in considerazione il ridimensionamento o l'aggiornamento dell'istanza di Gestione API.

Importante

Questo articolo illustra come monitorare e ridimensionare l'istanza di Gestione API di Azure in base alla metrica di capacità. Tuttavia, è altrettanto importante comprendere cosa accade quando una singola istanza di Gestione API ha effettivamente raggiunto la sua capacità. Gestione API di Azure non applicherà la limitazione a livello di servizio per impedire un overload fisico delle istanze. Quando un'istanza raggiunge la capacità fisica, si comporta in modo simile a qualsiasi server Web in overload che non è in grado di elaborare le richieste in ingresso: la latenza aumenterà, le connessioni verranno eliminate, si verificheranno errori di timeout e così via. Ciò significa che i client API devono essere preparati a gestire questa possibilità come fanno con qualsiasi altro servizio esterno (ad esempio, applicando criteri di ripetizione dei tentativi).

Prerequisiti

Per eseguire i passaggi in questo articolo è necessario avere quanto segue:

Disponibilità

Importante

L'aggregazione massima della metrica di capacità è supportata solo nel livello Premium di API Management.

Che cos'è la capacità

Diagramma che illustra la metrica Capacity.

La capacità è un indicatore del carico in un'istanza di Gestione API, Tale panoramica indica l'utilizzo delle risorse (CPU, memoria) e le lunghezze delle code di rete. L'utilizzo della CPU e della memoria indicano l'utilizzo delle risorse per:

  • Servizi del piano dati di Gestione API, ad esempio l'elaborazione delle richieste, che possono includere l'inoltro delle richieste o l'esecuzione di criteri.
  • Servizi del piano di gestione di Gestione API, ad esempio le azioni di gestione applicate tramite il portale di Azure o Azure Resource Manager, o il carico proveniente dal portale per sviluppatori.
  • Processi del sistema operativo selezionati, inclusi i processi che comportano costi per handshake TSL su nuove connessioni.
  • Aggiornamenti della piattaforma, ad esempio aggiornamenti del sistema operativo nelle risorse di calcolo sottostanti per l'istanza.
  • Numero di API distribuite, indipendentemente dall'attività, che possono utilizzare capacità aggiuntiva.

La capacità totale è una media dei valori per ogni unità di un'istanza di Gestione API.

Anche se la metrica della capacità è progettata per individuare problemi con l'istanza di Gestione API, esistono casi in cui i problemi non si riflettono nelle modifiche apportate alla metrica della capacità.

Comportamento delle metriche di capacità

A causa di come è costruita, nel mondo reale sono molte le variabili che possono influire sulla capacità, ad esempio:

  • Modelli di connessione (nuova connessione su richiesta o riutilizzo della connessione esistente)
  • Dimensioni di richiesta e risposta
  • Criteri configurati per ogni API o numero di client che inviano richieste.

A una maggiore complessità delle operazioni sulle richieste corrisponde un utilizzo maggiore della capacità. Ad esempio, i criteri di trasformazione complessi usano molta più CPU rispetto a un semplice inoltro di richieste. La capacità aumenterà anche in presenza di risposte lente dal servizio back-end.

Importante

La capacità non è una misurazione diretta del numero di richieste elaborate.

Picchi delle metriche di capacità

I picchi di capacità possono anche verificarsi a intermittenza o essere maggiori di zero, anche in assenza di richieste in fase di elaborazione. Ciò si verifica a causa di azioni specifiche del sistema o della piattaforma e non devono essere presi in considerazione quando si decide se ridimensionare un'istanza.

La metrica di capacità bassa non significa necessariamente che l'istanza di Gestione API non stia riscontrando problemi.

Usare il portale di Azure per esaminare la capacità

Metriche di capacità

  1. Accedere all'istanza di Gestione API nel portale di Azure.

  2. Nel menu a sinistra, in Monitoraggio, selezionare Metriche.

  3. Selezionare la metricaCapacità tra le metriche disponibili e lasciare l'aggregazione predefinita Media.

    Suggerimento

    Se l'istanza è stata distribuita in più posizioni, è sempre consigliabile esaminare una suddivisione delle metriche di capacità in base alla posizione per evitare interpretazioni errate.

  4. Per suddividere la metrica in base alla posizione, nella sezione in alto selezionare Applica separazione e quindi selezionare Posizione.

  5. Selezionare un intervallo di tempo desiderato dalla barra superiore della sezione.

    È anche possibile impostare un avviso di metrica che si attivi se si verifica qualcosa di imprevisto. Ad esempio per ricevere una notifica quando l'istanza di Gestione API supera la relativa capacità di picco prevista per oltre 20 minuti.

    Suggerimento

    È possibile configurare avvisi per ricevere una segnalazione quando il servizio sta per esaurire la capacità oppure usare il ridimensionamento automatico di Monitoraggio di Azure per aggiungere automaticamente un'unità Gestione API di Azure. L'operazione di ridimensionamento può richiedere circa 30 minuti, pertanto è consigliabile pianificare le regole di conseguenza.
    È consentito solo il ridimensionamento della località master.

Usare la capacità per prendere decisioni per la scalabilità

La capacità è la metrica per prendere decisioni sull'opportunità di ridimensionare un'istanza di Gestione API per gestire un carico maggiore. Di seguito sono riportate le considerazioni generali:

  • Esaminare una tendenza a lungo termine e una media.
  • Ignorare i picchi improvvisi che molto probabilmente non sono legati a un aumento del carico (per la spiegazione, vedere la sezione Comportamento delle metriche di capacità).
  • Come regola generale, l'aggiornamento o il ridimensionamento dell'istanza, quando il valore di capacità supera il 60-70% per un periodo di tempo prolungato, ad esempio 30 minuti. Valori diversi possono essere più adatti a servizi o scenari specifici.
  • Se l'istanza è configurata con una sola unità, aggiornare o ridimensionare l'istanza quando il valore di capacità supera il 40% per un lungo periodo. Questa raccomandazione si basa sulla necessità di riservare capacità per gli aggiornamenti del sistema operativo guest nella piattaforma del servizio sottostante.

Suggerimento

Se si è in grado di stimare il traffico in anticipo, testare l'istanza di Gestione API sui carichi di lavoro previsti. È possibile aumentare il carico delle richieste nel tenant gradualmente e monitorare il valore delle metriche di capacità corrispondenti al carico di picco. Seguire i passaggi della sezione precedente per usare il portale di Azure per ottenere maggiori informazioni sulla quantità di capacità usata in qualsiasi momento.

Passaggi successivi