Zkoumání a využití

V případě průzkumu může přizpůsobený uživatel pokračovat v poskytování dobrých výsledků, i když se změní chování uživatele.

Když přizpůsobené přizpůsobuje volání pořadí, vrátí RewardActionID, který buď:

  • Používá využívání, které odpovídá nejpravděpodobnějšímu chování uživatelů na základě aktuálního modelu strojového učení.
  • Používá průzkum, který se neshoduje s akcí, která má nejvyšší pravděpodobnost v pořadí.

Přizpůsobené přizpůsobování v současnosti používá algoritmus s názvem Epsilon hlad .

Výběr nastavení průzkumu

Procentuální hodnotu provozu, který se má použít pro průzkum, nakonfigurujete na stránce konfigurace Azure Portal pro přizpůsobení. Toto nastavení určuje procento volání pořadí, která provádějí průzkum.

Přizpůsobení určuje, zda se má tato pravděpodobnost prozkoumat nebo zneužít při každém volání pořadí. To se liší od chování v některých architekturách A/B, které zablokují zpracování pro konkrétní ID uživatelů.

Osvědčené postupy pro výběr nastavení průzkumu

Výběr nastavení průzkumu je obchodní rozhodnutí o poměru interakcí uživatelů, které se mají prozkoumat, aby bylo možné model vylepšit.

Nastavení nuly bude mít na starosti mnoho výhod přizpůsobeného aplikace. Pomocí tohoto nastavení přizpůsobené přizpůsobování nevyužívá žádné uživatelské interakce, aby bylo možné zjistit lepší uživatelské interakce. To vede k modelování stagnation, snížení rychlosti a konečnému snížení výkonu.

Nastavení, které je příliš vysoké, bude mít na starosti výhody učení od chování uživatele. Nastavení na 100% implikuje konstantní náhodnost a jakékoli zjištěné chování uživatelů by neovlivnilo výsledek.

Je důležité, abyste neměnili chování aplikace na základě toho, jestli se vám zobrazuje, jestli se dá přizpůsobovat nebo zneužít. To by vedlo k případným posunům, které by nakonec snížily potenciální výkon.

Další kroky

Zpětnovazební učení