Škálovatelnost a výkon
Vysoce výkonné weby a aplikace s vysokým provozem mají dva hlavní faktory, které je třeba zvážit pomocí služby Personalizér pro škálovatelnost a výkon:
- Udržování nízké latence při volání rozhraní API rank
- Ujistěte se, že propustnost trénování je stále v souladu se vstupem události.
Přizpůsobení může rychle vrátit pořadí s většinou doby volání vyhrazenou pro komunikaci přes REST API. Azure bude automaticky škálovat schopnost rychle reagovat na požadavky.
Scénáře s nízkou latencí
Některé aplikace vyžadují při vracení pořadí nízkou latenci. Jsou nezbytné nízké latence:
- Aby uživatel před zobrazením seřazených obsahu nečekal na znatelné množství času.
- Pomáhá serveru, který má extrémní provoz, vyhnout se vázání nedostatku výpočetního času a síťových připojení.
Škálovatelnost a propustnost trénování
Personalizér funguje tak, že aktualizuje model, který se znovu natrénuje na základě zpráv odeslaných asynchronně pomocí personalizátoru po rozhraních Rank API a Reward API. Tyto zprávy se odesílané pro aplikaci pomocí Azure EventHubu.
Je nepravděpodobné, že většina aplikací dosáhne maximální propustnosti připojení a trénování služby Personalizér. I když dosažení tohoto maxima nezpomalí aplikaci, z toho by vyplnily fronty centra událostí interně rychleji, než je možné je vyčistit.
Odhad požadavků na propustnost
- Odhadněte průměrný počet bajtů na událost hodnocení a přičtete délky dokumentů JSON o kontextu a akci.
- Vydělí 20 MB/s tímto odhadovanou průměrnou hodnotou bajtů.
Pokud má například průměrná datová část 500 funkcí a každá z nich je odhadem 20 znaků, pak je každá událost přibližně 10 kB. S těmito odhady se jedná o 20 000 000 / 10 000 = 2 000 událostí za sekundu, což je přibližně 173 milionů událostí za den.
Pokud dosahujete těchto limitů, požádejte o radu ohledně architektury náš tým podpory.