Skalbarhet och prestanda

Webbplatser och program med höga prestanda och hög trafik har två huvudfaktorer att överväga med Personanpassare för skalbarhet och prestanda:

  • Hålla korta svarstider vid rankning av API-anrop
  • Se till att träningsdataflödet håller sig med händelseindata

Personanpassning kan snabbt returnera en rangordning, där merparten av anropets varaktighet är dedikerad till kommunikation via REST API. Azure kommer att autoskala möjligheten att svara på begäranden snabbt.

Scenarier med låg latens

Vissa program kräver korta svarstider när du returnerar en rangordning. Korta svarstider är nödvändiga:

  • För att hålla användaren från att vänta en märkbar tid innan rangordnat innehåll visas.
  • För att hjälpa en server med extrem trafik ska du undvika att få begränsad beräkningstid och nätverksanslutningar.

Skalbarhet och träningsgenomflöde

Personanpassaren uppdaterar en modell som tränas om baserat på meddelanden som skickas asynkront av API:erna Personanpassare efter rangordning och belöning. Dessa meddelanden skickas med hjälp av en Azure EventHub för programmet.

Det är osannolikt att de flesta program når det maximala genomflödet för sammanfogning och träning för Personanpassare. När du når den här maxlängden går det inte att sakta ned programmet, men det innebär att Event Hub-köer fylls internt snabbare än de kan rensas.

Så här beräknar du dataflödeskraven

  • Beräkna det genomsnittliga antalet byte per rangordningshändelse och lägg till längden på kontexten och åtgärdens JSON-dokument.
  • Dividera 20 MB/s med detta beräknade genomsnittliga byte.

Om din genomsnittliga nyttolast till exempel har 500 funktioner och var och en är uppskattningsvis 20 tecken är varje händelse cirka 10 kB. Med dessa uppskattningar är 20 000 000/10 000 = 2 000 händelser/sek, vilket är cirka 173 miljoner händelser per dag.

Om du når dessa gränser kan du kontakta vårt supportteam för att få arkitekturråd.

Nästa steg

Skapa och konfigurera Personanpassare.