Kapacitet hos en Azure API Management-instans
Kapacitet är det viktigaste måttet Azure Monitor fatta välgrundade beslut om du vill skala en API Management instans för att hantera mer belastning. Dess konstruktion är komplex och inför ett visst beteende.
Den här artikeln förklarar vad kapaciteten är och hur den beter sig. Den visar hur du kommer åt kapacitetsmått i Azure Portal och föreslår när du ska överväga att skala eller uppgradera API Management instansen.
Viktigt
Den här artikeln beskriver hur du kan övervaka och skala din Azure API Management-instans baserat på dess kapacitetsmått. Det är dock lika viktigt att förstå vad som händer när en API Management instans faktiskt har nått sin kapacitet. Azure API Management kommer inte att tillämpa någon begränsning på tjänstnivå för att förhindra en fysisk överbelastning av instanserna. När en instans når sin fysiska kapacitet fungerar den ungefär som överlagrade webbserverer som inte kan bearbeta inkommande begäranden: svarstiden ökar, anslutningar tas bort, tidsgränsfel uppstår osv. Det innebär att API-klienter bör vara förberedda på att hantera den här möjligheten på liknande sätt som med andra externa tjänster (t.ex. genom att tillämpa återförsöksprinciper).
Förutsättningar
Om du vill följa stegen i den här artikeln måste du ha:
En aktiv Azure-prenumeration.
Om du inte har en Azure-prenumerationkan du skapa ett kostnads fritt konto innan du börjar.
En APIM-instans. Mer information finns i Skapa en Azure API Management instans.
Tillgänglighet
Viktigt
Den här funktionen är tillgänglig på nivån Premium, standard, Basic och Developer för API Management.
Vad är kapacitet

Kapacitet är en indikator för belastning på en API Management instans. Den återspeglar resursanvändningen (CPU, minne) och nätverkskölängder. Processor- och minnesanvändningen visar resursförbrukningen genom att:
- API Management tjänster för dataplanet, till exempel bearbetning av begäranden, vilket kan omfatta vidarebefordran av begäranden eller körning av en princip.
- API Management tjänster på hanteringsplanet, till exempel hanteringsåtgärder som tillämpas via Azure-portalen eller ARM, eller belastning som kommer från utvecklarportalen.
- Valda operativsystemprocesser, inklusive processer som omfattar kostnader för TLS-handskakningar för nya anslutningar.
Total kapacitet är ett genomsnitt av sina egna värden från varje enhet i API Management instans.
Även om kapacitetsmåttet är utformat för att visa problem med din API Management instans finns det fall där problem inte återspeglas i ändringarna i kapacitetsmåttet.
Beteende för kapacitetsmått
På grund av dess konstruktion kan kapaciteten i verkligheten påverkas av många variabler, till exempel:
- anslutningsmönster (ny anslutning på en begäran jämfört med att återanvända den befintliga anslutningen)
- storleken på en begäran och ett svar
- principer som konfigurerats för varje API eller antalet klienter som skickar begäranden.
Ju mer komplexa åtgärder som utförs på begärandena, desto högre blir kapacitetsförbrukningen. Till exempel förbrukar komplexa transformeringsprinciper mycket mer CPU än en enkel vidarebefordran av förfrågningar. Långsamma svar från backend-tjänsten ökar också det.
Viktigt
Kapaciteten är inte ett direkt mått på antalet begäranden som bearbetas.

Kapaciteten kan också ha en tillfällig topp eller vara större än noll även om inga begäranden bearbetas. Det inträffar på grund av system- eller plattformsspecifika åtgärder och bör inte beaktas när du bestämmer om en instans ska skalas.
Mått med låg kapacitet innebär inte nödvändigtvis att API Management instansen inte har några problem.
Använda Azure-portalen för att undersöka kapaciteten

Gå till APIM-instansen i Azure Portal.
Välj Mått.
I det lila avsnittet väljer du Kapacitetsmått från tillgängliga mått och lämnar standardvärdet Genomsnittlig aggregering.
Tips
Du bör alltid titta på en uppdelning av kapacitetsmått per plats för att undvika felaktiga tolkningar.
I det gröna avsnittet väljer du Plats för att dela måttet efter dimension.
Välj en önskad tidsram från det översta fältet i avsnittet.
Du kan ställa in en måttavisering så att du får veta när något oväntat inträffar. Du kan till exempel få meddelanden när din APIM-instans har överstiger den förväntade toppkapaciteten i över 20 minuter.
Tips
Du kan konfigurera aviseringar så att du vet när din tjänst börjar få ont om kapacitet eller använda Azure Monitor autoskalningsfunktioner för att automatiskt lägga till en Azure API Management enhet. Skalningsåtgärden kan ta cirka 30 minuter, så du bör planera dina regler därefter.
Endast skalning av huvudplatsen tillåts.
Använda kapacitet för skalningsbeslut
Kapacitet är måttet för att fatta beslut om du vill skala en API Management instans för att hantera mer belastning. Tänk på att:
- Titta på en långsiktig trend och ett medelvärde.
- Om du ignorerar plötsliga toppar som troligen inte är relaterade till någon ökning av belastningen (se avsnittet Kapacitetsmåttbeteende för förklaring).
- Uppgradera eller skala din instans när kapacitetens värde överskrider 60 % eller 70 % under en längre tidsperiod (till exempel 30 minuter). Olika värden kan fungera bättre för din tjänst eller ditt scenario.
Tips
Om du kan beräkna trafiken i förväg kan du testa DIN APIM-instans på arbetsbelastningar som du förväntar dig. Du kan öka begärandebelastningen på din klientorganisation gradvis och övervaka vilket värde för kapacitetsmåttet som motsvarar den högsta belastningen. Följ stegen i föregående avsnitt för att använda Azure Portal för att förstå hur mycket kapacitet som används vid en given tidpunkt.