Kapacita instance služby Azure API Management

Kapacita je nejdůležitější Azure monitor metrika pro rozhodování o tom, jestli se má škálovat API Management instance, aby se vešlo více zátěže. Jeho konstrukce je složitá a ukládá určité chování.

Tento článek vysvětluje, co je kapacita a jak se chová. Ukazuje, jak získat přístup k metrikám kapacity v Azure Portal a navrhuje, kdy zvažte škálování nebo upgrade instance API Management.

Důležité

Tento článek popisuje, jak můžete na základě metriky kapacity monitorovat a škálovat svou instanci Azure API Management. Je ale stejně důležité pochopit, co se stane, když konkrétní instance API Management skutečně dosáhla své kapacity. Azure API Management nepoužije žádné omezování na úrovni služby, aby se zabránilo fyzickému přetížení instancí. Když instance dosáhne své fyzické kapacity, bude se chovat podobně jako jakýkoli přetížený webový server, který nedokáže zpracovat příchozí požadavky: latence se zvýší, připojení se zahozena a dojde k chybám časového limitu atd. To znamená, že klienti rozhraní API by měli být připravení pracovat s touto možností podobně jako u jakékoli jiné externí služby (např. použitím zásad opakování).

Požadavky

Chcete-li postupovat podle kroků v tomto článku, musíte mít:

Dostupnost

Důležité

tato funkce je dostupná na úrovních API Management Premium, Standard, Basic a Developer .

Co je kapacita

Diagram, který vysvětluje metriku kapacity.

Kapacita je indikátorem zatížení instance API Management. Odráží využití prostředků (CPU, paměť) a délky fronty sítě. Využití CPU a paměti odhalí spotřebu prostředků pomocí:

  • API Management služby datové roviny, jako je například zpracování požadavků, které můžou zahrnovat předávací požadavky nebo spustit zásadu.
  • API Management služby roviny správy, jako jsou akce správy použité prostřednictvím webu Azure Portal nebo ARM, nebo načtení z portálu pro vývojáře.
  • Vybrané procesy operačního systému včetně procesů, které zahrnují náklady na handshake TLS u nových připojení.

Celková kapacita je průměrem vlastních hodnot z každé jednotky instance API Management.

I když je metrika kapacity navržená tak, aby surfoval problémy s instancí API Management, existují případy, kdy se problémy neprojeví ve změnách metriky kapacity.

Chování metriky kapacity

Z důvodu jeho konstrukce může být v reálné kapacitě ovlivněno mnoha proměnnými, například:

  • vzorce připojení (nové připojení k žádosti a opětovné použití existujícího připojení)
  • velikost žádosti a odpovědi
  • zásady nakonfigurované pro každé rozhraní API nebo počet klientů, kteří odesílají požadavky.

Složitější operace s požadavky jsou, čím vyšší bude spotřeba kapacity . Komplexní zásady transformace například využívají mnohem více PROCESORů než jednoduché předávání požadavků. Pomalé odpovědi služby back-endu se zvýší.

Důležité

Kapacita není přímá míra počtu zpracovávaných požadavků.

Špičky metrik kapacity

Kapacita může být také přerušovaná nebo je větší než nula, i když nejsou zpracovávány žádné požadavky. Důvodem je, že se jedná o akce specifické pro systém nebo platformu a nemělo by se vzít v úvahu při rozhodování, zda chcete škálovat instanci.

Metrika s nízkou kapacitou nemusí nutně znamenat, že vaše instance API Management nemá žádné problémy.

Použití webu Azure Portal k prohlédnutí kapacity

Metrika kapacity

  1. V Azure Portalpřejděte na svou instanci APIM.

  2. Vyberte Metriky.

  3. V části fialová vyberte metrika kapacity z dostupných metrik a nechte výchozí průměrnou agregaci.

    Tip

    Vždy byste se měli podívat na rozpis metrik kapacity na umístění, abyste se vyhnuli špatným interpretům.

  4. V zelené části vyberte umístění pro rozdělení metriky podle dimenze.

  5. Z horního panelu oddílu vyberte požadovaný časový rámec.

    Můžete nastavit výstrahu metriky, abyste měli jistotu, že se děje něco neočekávaného. Můžete například dostávat oznámení, když vaše instance APIM překročila očekávanou kapacitu špičky na více než 20 minut.

    Tip

    Můžete nakonfigurovat výstrahy, které vám pomůžou zjistit, kdy vaše služba má nedostatečnou kapacitu, nebo použít funkci Azure Monitor automatického škálování, která automaticky přidá jednotku Azure API Management. Operace škálování může trvat přibližně 30 minut, takže pravidla byste měli naplánovat odpovídajícím způsobem.
    Je povoleno pouze škálování hlavního umístění.

Využijte kapacitu pro rozhodování o škálování

Kapacita je metrika pro rozhodování o tom, jestli se má škálovat instance API Management, aby se vešlo více zátěže. Rozmyslete si:

  • Podívejte se na dlouhodobý trend a průměr.
  • Ignorují se náhlé špičky, které s největší pravděpodobně nesouvisejí se zvýšením zátěže (vysvětlení najdete v části "chování metriky kapacity").
  • Upgrade nebo škálování instance, pokud hodnota kapacity přesáhne 60% nebo 70% po delší dobu (například 30 minut). Pro vaši službu nebo scénář můžou fungovat lepší i jiné hodnoty.

Tip

Pokud máte v úmyslu odhadnout svůj provoz předem, otestujte instanci APIM na úlohách, které očekáváte. Zatížení žádosti v tenantovi můžete postupně zvyšovat a monitorovat, jakou hodnotu metriky kapacity odpovídají zatížení vaší špičky. Postupujte podle kroků v předchozí části a použijte Azure Portal k pochopení, kolik kapacity se v daném okamžiku používá.

Další kroky