Vad är Personanpassning?What is Personalizer?

Viktigt

TLS 1,2 upprätthålls nu för alla HTTP-begäranden till den här tjänsten.TLS 1.2 is now enforced for all HTTP requests to this service. Mer information finns i Azure Cognitive Services Security.For more information, see Azure Cognitive Services security.

Azure-personanpassa är en molnbaserad API-tjänst som hjälper ditt klient program att välja det bästa, enda innehålls objektet för att visa varje användare.Azure Personalizer is a cloud-based API service that helps your client application choose the best, single content item to show each user. Tjänsten väljer det bästa objektet, från innehålls objekt, baserat på samlad real tids information som du tillhandahåller om innehåll och kontext.The service selects the best item, from content items, based on collective real-time information you provide about content and context.

När du har presenterat innehålls objekt för din användare övervakar systemet användar beteende och rapporterar en belönings poäng till Personanpassaren för att förbättra möjligheten att välja det bästa innehållet baserat på den Sammanhangs information som den tar emot.After you present the content item to your user, your system monitors user behavior and reports a reward score back to Personalizer to improve its ability to select the best content based on the context information it receives.

Innehåll kan vara vilken enhet som helst information, till exempel text, bilder, webb adresser eller e-postmeddelanden som du vill välja från för att visa för användaren.Content can be any unit of information such as text, images, urls, or emails that you want to select from to show to your user.

Hur väljer Personanpassare det bästa innehålls objektet?How does Personalizer select the best content item?

Personanpassare använder förstärknings inlärning för att välja det bästa objektet (åtgärd) baserat på kollektivt beteende och belönings resultat för alla användare.Personalizer uses reinforcement learning to select the best item (action) based on collective behavior and reward scores across all users. Åtgärder är innehålls objekt, till exempel nyhets artiklar, vissa filmer eller produkter att välja bland.Actions are the content items, such as news articles, specific movies, or products to choose from.

Ranknings anropet tar objektet Action, tillsammans med funktionerna i åtgärden och kontext funktionerna för att välja det översta objektet:The Rank call takes the action item, along with features of the action, and context features to select the top action item:

  • Åtgärder med funktioner – innehålls objekt med funktioner som är speciella för varje objektActions with features - content items with features specific to each item
  • Kontext funktioner – funktioner för dina användare, deras kontext eller deras miljö när du använder din appContext features - features of your users, their context or their environment when using your app

Rang anropet returnerar det ID för vilket innehålls objekt, åtgärd, som ska visas för användaren i fältet belönings åtgärds-ID .The Rank call returns the ID of which content item, action, to show to the user, in the Reward Action ID field. Den åtgärd som visas för användaren väljs med Machine Learning-modeller, vilket försöker maximera det totala antalet förmåner över tid.The action shown to the user is chosen with machine learning models, trying to maximize the total amount of rewards over time.

Det finns flera exempel scenarier:Several example scenarios are:

InnehållstypContent type Åtgärder (med funktioner)Actions (with features) Kontext funktionerContext features Returnerat åtgärds-ID för belöningReturned Reward Action ID
(Visa det här innehållet)(display this content)
Nyhets listaNews list a.a. The president...(National, politiken, [text])The president... (national, politics, [text])
b.b. Premier League ...(global, sport, [text, bild, video])Premier League ... (global, sports, [text, image, video])
c.c. Hurricane in the ...(regional, väder, [text, bild]Hurricane in the ... (regional, weather, [text,image]
Enhetens Nyheter läses frånDevice news is read from
Månad eller säsongMonth, or season
enThe president...a The president...
Film listaMovies list 1. Star Wars (1977, [Action, Adventure, fantasi], George Lucas)1. Star Wars (1977, [action, adventure, fantasy], George Lucas)
2. Hoop Dreams (1994, [dokument, idrotts], Steve Jonas2. Hoop Dreams (1994, [documentary, sports], Steve James
3. Casablanca (1942, [romantik, drama, War], Michael Curtiz)3. Casablanca (1942, [romance, drama, war], Michael Curtiz)
Enhets filmen bevakas frånDevice movie is watched from
skärm storlekscreen size
Typ av användareType of user
3.Casablanca3. Casablanca
Produkt listaProducts list i.i. Product A(3 kg, $ $ $ $, leverera på 24 timmar)Product A (3 kg, $$$$, deliver in 24 hours)
ii.ii. Product B(20 kg, $ $, 2 veckor som levereras med tull)Product B (20 kg, $$, 2 week shipping with customs)
iii.iii. Product C(3 kg, $ $ $, leverans på 48 timmar)Product C (3 kg, $$$, delivery in 48 hours)
Enhets köp läses frånDevice shopping is read from
Utgifts nivå för användareSpending tier of user
Månad eller säsongMonth, or season
ii.ii. Product B

Personanpassare använder förstärknings undervisning för att välja den enda bästa åtgärden, som kallas för belönings åtgärds-ID, baserat på en kombination av:Personalizer used reinforcement learning to select the single best action, known as reward action ID, based on a combination of:

  • Tränad modell – information om den tidigare tjänsten för att personanpassa tjänsten togs emotTrained model - past information the Personalizer service received
  • Aktuella data-/regionsspecifika åtgärder med funktioner och kontext funktionerCurrent data - Specific actions with features and context features

När du ska anropa en PersonanpassareWhen to call Personalizer

En persons rang - API anropas varje gång du presenterar innehåll i real tid.Personalizer's Rank API is called every time you present content, in real-time. Detta kallas en händelsesom anges med ett händelse-ID.This is known as an event, noted with an event ID.

Personens belönings - API kan anropas i real tid eller fördröjs för att bättre passa din infrastruktur.Personalizer's Reward API can be called in real-time or delayed to better fit your infrastructure. Du fastställer belönings poängen utifrån dina affärs behov.You determine the reward score based on your business needs. Belönings poängen är mellan 0 och 1.The reward score is between 0 and 1. Det kan vara ett enda värde, till exempel 1 för bra, och 0 för dåligt, eller ett tal som skapats av en algoritm som du skapar med tanke på dina affärs mål och mät värden.That can be a single value such as 1 for good, and 0 for bad, or a number produced by an algorithm you create considering your business goals and metrics.

Innehålls krav för personligarePersonalizer content requirements

Använd Personanpassare när ditt innehåll:Use Personalizer when your content:

  • Har en begränsad uppsättning objekt (max ~ 50) att välja från.Has a limited set of items (max of ~50) to select from. Om du har en större lista kan du använda en rekommendations motor för att minska listan till 50 objekt.If you have a larger list, use a recommendation engine to reduce the list down to 50 items.
  • Innehåller information som beskriver det innehåll som du vill rangordna: åtgärder med funktioner och kontext funktioner.Has information describing the content you want ranked: actions with features and context features.
  • Har minst ~ 1 – a innehålls relaterade händelser som är relaterade till att personanpassa ska vara effektiva.Has a minimum of ~1k/day content-related events for Personalizer to be effective. Om Personanpassaren inte får den lägsta trafik som krävs tar det längre tid för tjänsten att fastställa det enkla innehålls objektet.If Personalizer doesn't receive the minimum traffic required, the service takes longer to determine the single best content item.

Eftersom Personanpassaren använder samlad information i nära real tid för att returnera det enda bästa innehålls objektet, så är tjänsten inte:Since Personalizer uses collective information in near real-time to return the single best content item, the service doesn't:

  • Behåll och hantera information om användar profilerPersist and manage user profile information
  • Logga enskilda användares inställningar eller historikLog individual users' preferences or history
  • Kräv rensad och märkt innehållRequire cleaned and labeled content

Så här utformar och implementerar du personanpassa för ditt klient programHow to design and implement Personalizer for your client application

  1. Utforma och planera för innehåll, åtgärder och kontext.Design and plan for content, actions, and context. Fastställ belönings algoritmen för belönings poängen.Determine the reward algorithm for the reward score.

  2. Varje personanpassa resurs som du skapar betraktas som en inlärnings slinga.Each Personalizer Resource you create is considered one Learning Loop. Slingan tar emot både rang-och belönings anrop för det innehållet eller användar upplevelsen.The loop will receive the both the Rank and Reward calls for that content or user experience.

    ResurstypResource type SyftePurpose
    Lärlings lägeE0Apprentice mode E0 Träna en personanpassa modell utan att påverka ditt befintliga program och distribuera sedan till onlineutbildning i en produktions miljöTrain the Personalizer model without impacting your existing application, then deploy to Online learning behavior to a production environment
    StandardS0Standard, S0 Utbildnings beteende online i en produktions miljöOnline learning behavior in a production environment
    Kostnads friaF0Free, F0 Testa inlärnings beteendet i en miljö som inte är en produktions miljöTry Online learning behavior in a non-production environment
  3. Lägg till en Personanpassare till ditt program, din webbplats eller ditt system:Add Personalizer to your application, website, or system:

    1. Lägg till ett rang anrop till personanpassaren i ditt program, din webbplats eller ditt system för att fastställa det bästa, enda innehålls posten innan innehållet visas för användaren.Add a Rank call to Personalizer in your application, website, or system to determine best, single content item before the content is shown to the user.
    2. Visa det bästa, enda innehålls objekt, vilket är det returnerade Åtgärds-ID: t för belöning, till användare.Display best, single content item, which is the returned reward action ID, to user.
    3. Använd affärs logik för att samla in information om hur användaren beter sig för att fastställa belönings poängen, till exempel:Apply business logic to collected information about how the user behaved, to determine the reward score, such as:
    BeteendeBehavior Beräknad belönings PoängCalculated reward score
    Användaren har valt bästa, enskilt innehålls objekt (ID för belönings åtgärd)User selected best, single content item (reward action ID) 11
    Användaren har valt annat innehållUser selected other content 00
    Användaren pausade, rullade runt på ett avgörande sätt innan du väljer bästa, enskilt innehålls objekt (belönings ÅTGÄRDS-ID)User paused, scrolling around indecisively, before selecting best, single content item (reward action ID) 0,50.5
    1. Lägg till ett belönings samtal som skickar en belönings Poäng mellan 0 och 1Add a Reward call sending a reward score between 0 and 1
      • Direkt efter att ha visat ditt innehållImmediately after showing your content
      • Eller någon gång senare i ett offline-systemOr sometime later in an offline system
    2. Utvärdera din loop med en offline-utvärdering efter en användnings period.Evaluate your loop with an offline evaluation after a period of use. Med en offline-utvärdering kan du testa och utvärdera effektiviteten för tjänsten personanpassa utan att ändra din kod eller påverka användar upplevelsen.An offline evaluation allows you to test and assess the effectiveness of the Personalizer Service without changing your code or affecting user experience.

Nästa stegNext steps