Mi a Personalizer?

Cikk
01/19/2024

Fontos

2023. szeptember 20-tól nem hozhat létre új Personalizer-erőforrásokat. A Personalizer szolgáltatás 2026. október 1-jén megszűnik.

Megjegyzés:

2023 júliusától az Azure AI-szolgáltatások a korábban Cognitive Servicesnek és Azure-alkalmazás lied AI-szolgáltatásoknak nevezett összes szolgáltatást magukban foglalják. A díjszabás nem változik. A Cognitive Services és a Azure-alkalmazás lied AI neve továbbra is használatos az Azure-számlázásban, a költségelemzésben, az árlistában és az ár API-kban. Az alkalmazásprogramozási felületek (API-k) és az SDK-k nem változnak kompatibilitástörően.

Az Azure AI Personalizer egy olyan AI-szolgáltatás, amely az alkalmazások a megerősítési tanulás használatával intelligensebb döntéseket hoz nagy léptékben. A Personalizer feldolgozza az alkalmazás, a forgatókönyv és/vagy a felhasználók (környezetek) állapotával kapcsolatos információkat, valamint a lehetséges döntéseket és a kapcsolódó attribútumokat (műveleteket) a legjobb döntés meghatározásához. A rendszer visszajelzést küld az alkalmazástól (jutalmak) a Personalizernek, hogy megtudja, hogyan fejlesztheti döntéshozatali képességét közel valós időben.

A Personalizer számos forgatókönyvben meghatározhatja a legjobb műveleteket:

E-kereskedelem: Milyen terméket kell megjeleníteni az ügyfeleknek a vásárlás valószínűségének maximalizálása érdekében?
Tartalomjavaslat: Melyik cikknek kell megjelennie az átkattintási arány növeléséhez?
Tartalomtervezés: Hol kell elhelyezni egy hirdetést a felhasználói előjegyzés optimalizálásához egy webhelyen?
Kommunikáció: Mikor és hogyan kell értesítést küldeni a válasz esélyének maximalizálása érdekében?

A Personalizer használatának megkezdéséhez kövesse a rövid útmutatót, vagy próbálja ki a Personalizert a böngészőben ezzel az interaktív bemutatóval.

Ez a dokumentáció a következő típusú cikkeket tartalmazza:

A rövid útmutatók lépésről lépésre útmutatást nyújtanak a beállítás és a mintakód végigvezetéséhez az API-kérések szolgáltatáshoz való indításához.
Az útmutatók útmutatást tartalmaznak a Personalizer funkcióinak és speciális képességeinek használatához.
A kódminták bemutatják, hogyan használható a Personalizer, és hogyan lehet könnyen illeszteni az alkalmazást a szolgáltatással.
Az oktatóanyagok hosszabb útmutatók, amelyek egy szélesebb körű üzleti megoldás részeként implementálják a Personalizert.
Az alapfogalmak további részleteket nyújtanak a Personalizer funkcióiról, képességeiről és alapjairól.

Hogyan működik a Personalizer?

A Personalizer megerősítési tanulással választja ki a legjobb műveletet egy adott környezethez az összes felhasználó számára az átlagos jutalom maximalizálása érdekében.

Környezet: Az alkalmazás, a forgatókönyv vagy a felhasználó döntéshez kapcsolódó állapotát leíró információk.
- Példa: A webhelyet látogató felhasználók helye, eszköztípusa, kora és kedvenc témakörei.
Műveletek: Választható elemek különálló készlete, valamint az egyes elemeket leíró attribútumok.
- Példa: Hírcikkek és az egyes cikkekben tárgyalt témakörök.
Jutalom: 0 és 1 közötti numerikus pontszám, amely azt jelzi, hogy a döntés rossz (0) vagy jó (1)
- Például: Az "1" azt jelzi, hogy egy felhasználó a javasolt cikkre kattintott, míg a "0" azt jelzi, hogy a felhasználó nem.

Rang- és reward API-k

A Personalizer lehetővé teszi, hogy csak két elsődleges API használatával kihasználja a megerősítési tanulás erejét és rugalmasságát.

A RankAPI-t az alkalmazás minden alkalommal meghívja, amikor döntést kell hoznia. Az alkalmazás egy JSON-t küld, amely a műveletek egy készletét, az egyes műveleteket leíró funkciókat és az aktuális környezetet leíró funkciókat tartalmazza. Minden Rank API-hívás eseményként ismert, és egyedi eseményazonosítóval van feljegyzve. A Personalizer ezután visszaadja a legjobb művelet azonosítóját, amely maximalizálja a mögöttes modell által meghatározott teljes átlagos jutalmat.

A RewardAPI-t az alkalmazás minden olyan visszajelzéskor meghívja, amely segíthet a Personalizernek megtudni, hogy a rank hívás által visszaadott műveletazonosító visszaadott-e értéket. Ha például egy felhasználó a javasolt hírcikkre kattintott, vagy befejezte a javasolt termék megvásárlását. A Reward API hívása valós időben (a Rang hívás után) vagy késleltetve lehet, hogy jobban megfeleljen a forgatókönyv igényeinek. A jutalompontszámot az üzleti metrikák és célkitűzések határozzák meg, és az alkalmazás algoritmusa vagy szabályai hozhatják létre. A pontszám egy valós értékű szám 0 és 1 között.

Tanulás módok

Tanonc mód Ahhoz hasonlóan, ahogyan egy tanuló megtanulja a mesterséget egy szakértő megfigyeléséből, a Tanulószerződéses mód lehetővé teszi a Personalizer számára, hogy tanuljon az alkalmazás aktuális döntési logikájának megfigyelésével. Ez segít enyhíteni az új, nem betanított modellekkel kapcsolatos úgynevezett "hidegindítási" problémát, és lehetővé teszi a Personalizernek küldött művelet- és környezetfunkciók érvényesítését. Tanulói módban a Rank API minden hívása azt az alapműveletet vagy alapértelmezett műveletet adja vissza, amelyet az alkalmazás a Personalizer használata nélkül hajtott volna végre. Ezt az alkalmazás elküldi a Rank API-ban található Personalizernek a lehetséges műveletek első elemeként.
Az online módú Personalizer a kontextusnak megfelelően a legjobb műveletet adja vissza az alapul szolgáló RL-modell alapján, és megvizsgálja az egyéb lehetséges műveleteket, amelyek javíthatják a teljesítményt. A Personalizer a Reward API-nak küldött hívásokban kapott visszajelzésekből tanul.

Vegye figyelembe, hogy a Personalizer az összes felhasználó közös információit használja a legjobb műveletek megismeréséhez az aktuális környezet alapján. A szolgáltatás nem:

A felhasználói profil adatainak megőrzése és kezelése. Az egyedi felhasználói azonosítókat nem szabad elküldeni a Personalizernek.
Naplózza az egyes felhasználók beállításait vagy előzményadatait.

Példaforgatókönyvek

Íme néhány példa arra, hogy a Personalizer segítségével kiválaszthatja a legjobban megjelenítendő tartalmat a felhasználó számára.

Tartalomtípus	Műveletek {features}	Környezeti funkciók	Visszaadott jutalomművelet azonosítója (a tartalom megjelenítése)
Hírcikkek	a. `The president...`, {national, politics, [text]} b. `Premier League ...` {global, sports, [text, image, video]} c. `Hurricane in the ...` {regional, weather, [text,image]}	Country='USA', Recent_Topics=('politika', 'üzleti'), Month='October'	A `The president...`
Filmek	1. `Star Wars` {1977, [akció, kaland, fantasy], George Lucas} 2. `Hoop Dreams` {1994, [dokumentumfilm, sport], Steve James} 3. `Casablanca` {1942, [romantika, dráma, háború], Michael Curtiz}	Device='smart TV', Screen_Size='nagy', Favorite_Genre='klasszikusok'	3. `Casablanca`
E-kereskedelmi termékek	i. `Product A` {3 kg, $$$$, szállítás 1 nap alatt} ii. `Product B` {20 kg, $$, szállítás 7 nap alatt} iii. `Product C` {3 kg, $$$, szállítás 2 nap alatt}	Device='i Telefon', Spending_Tier='low', Month='June'	ii. `Product B`

Forgatókönyv követelményei

A Personalizer használata, ha a forgatókönyv a következő:

Az egyes személyre szabási eseményekben kiválasztható műveletek vagy elemek korlátozott készlete. Minden Rank API-hívásban legfeljebb ~50 művelet javasolt. Ha több lehetséges művelettel rendelkezik, javasoljuk , hogy a Rank API meghívása előtt használjon javaslatmotort vagy egy másik mechanizmust a műveletek listájának csökkentésére.
A műveleteket leíró információk (műveleti funkciók).
Az aktuális környezetet leíró információk (környezeti funkciók).
Elegendő adatmennyiség ahhoz, hogy a Personalizer tanulhasson. Általában naponta legalább ~1000 eseményt ajánlunk, hogy a Personalizer hatékonyan tanulhasson. Ha a Personalizer nem kap elegendő adatot, a szolgáltatás tovább tart a legjobb műveletek meghatározásához.

Az MI felelős használata

A Microsoftnál elkötelezettek vagyunk a mesterséges intelligencia fejlődése mellett, amelyet az emberek elé helyező alapelvek vezérelnek. Az olyan AI-modellek, mint amilyenek a Personalizer szolgáltatásban érhetők el, jelentős potenciális előnyökkel járnak, de gondos tervezés és átgondolt megoldások nélkül az ilyen modellek helytelen vagy akár káros tartalmakat is eredményezhetnek. A Microsoft jelentős beruházásokat hajtott végre a visszaélések és a nem szándékos károk elleni védelem érdekében, a Microsoft felelősségteljes AI-használatra vonatkozó alapelveinek beépítésével, az ügyfeleket támogató tartalomszűrők létrehozásával, valamint felelős AI-megvalósítási útmutatóval az előkészített ügyfelek számára. Tekintse meg a Personalizer felelős AI-dokumentációit.

A Personalizer integrálása egy alkalmazásba

A műveletek és a környezet tervezése és megtervezése. Határozza meg, hogyan értelmezze a visszajelzést jutalompontként.

Minden létrehozott személyre szabó erőforrás egy Tanulás hurokként van definiálva. A hurok megkapja az adott tartalomra vagy felhasználói élményre vonatkozó Rang- és Reward-hívásokat, és betanított egy mögöttes RL-modellt. Vannak

Erőforrás típusa	Purpose
Tanulói mód - `E0`	Betaníthatja a Personalizert, hogy a meglévő alkalmazás befolyásolása nélkül utánozza a jelenlegi döntéshozatali logikát, mielőtt online mód használatával jobb szabályzatokat tanulhat egy éles környezetben.
Online mód – Standard, `S0`	A Personalizer az RL használatával határozza meg a legjobb műveleteket az éles környezetben.
Online mód – Ingyenes, `F0`	Próbálja ki a Personalizert korlátozott, nem éles környezetben.

A Personalizer hozzáadása az alkalmazáshoz, webhelyhez vagy rendszerhez:

A legjobb művelet meghatározásához adjon ranghívást a Personalizerhez az alkalmazásban, a webhelyen vagy a rendszerben.
Használja a legjobb műveletet a forgatókönyvben jutalomművelet-azonosítóként megadott módon.

Üzleti logika alkalmazása a felhasználói viselkedésre vagy visszajelzési adatokra a jutalompontszám meghatározásához. Például:

Működés	Kiszámított jutalompontszám
A felhasználó kiválasztott egy, a Personalizer által javasolt hírcikket	1
A felhasználó kiválasztott egy olyan hírcikket , amelyet a Personalizer nem javasolt	0
A felhasználó habozott, hogy válasszon ki egy hírcikket, körülgörgetett a meghatározhatatlanul, és végül kiválasztotta a hír cikket által javasolt Personalizer	0.5

Jutalomhívás hozzáadása 0 és 1 közötti jutalompontot küldve
- Közvetlenül a visszajelzés beérkezés után.
- Vagy valamikor később olyan helyzetekben, ahol késleltetett visszajelzés várható.
Értékelje ki a ciklust offline értékeléssel egy olyan időszak után, amikor a Personalizer jelentős adatokat kapott az online döntések meghozatalához. Az offline kiértékeléssel kódmódosítások és felhasználói hatások nélkül tesztelheti és értékelheti a Personalizer szolgáltatás hatékonyságát.

Következő lépések

A Personalizer rövid útmutatója

Share via