Ödül puanları kişiselleştirmenin başarısını gösteriyor

Ödül puanı, kişiselleştirme seçimi olan RewardActionID'ninkullanıcı için ne kadar iyi sonuç olduğunu gösterir. Ödül puanının değeri, kullanıcı davranışı gözlemlerine göre iş mantığınız tarafından belirlenir.

Kişiselleştirme, ödüllerini değerlendirerek makine öğrenmesi modellerini eğitir.

Kişiselleştirme kaynağınız için varsayılan ödül puanını Azure portal yapılandırmayı öğrenin.

Kişiselleştirme'ye ödül puanı göndermek için Ödül API'sini kullanma

Rewards, Ödül API'si tarafından Kişiselleştirme'ye gönderilir. Genellikle ödül, 0 ile 1 arasında bir sayıdır. -1 değerine sahip olumsuz bir ödül, belirli senaryolarda mümkündür ve yalnızca pekiştirme öğrenmesi (RL) ile deneyimliysiniz. Kişiselleştirme, modeli zaman içinde mümkün olan en yüksek ödül toplamına ulaşacak şekilde eğitir.

Ödül, kullanıcı davranışı gerçekleştikten sonra gönderilir ve bunlar günler sonra da olabilir. Kişiselleştirme, bir etkinliğin ödüle sahip olmadığını kabul edilene kadar bekleyeceği maksimum süre veya varsayılan ödül, etkinlikte Ödül Bekleme Süresi ile Azure portal.

Bir etkinliğin ödül puanı, Ödül Bekleme Süresi içinde alınmamışsa Varsayılan Ödül uygulanır. Varsayılan Ödül genellikle sıfır olacak şekilde yapılandırılır.

Ödül için dikkate alınacaktır davranışlar ve veriler

Ödül puanının bağlamı için şu sinyalleri ve davranışları göz önünde bulundurabilirsiniz:

  • Seçenekler söz konusu olduğunda öneriler için doğrudan kullanıcı girişi ("X mi ifade edersiniz?").
  • Oturum uzunluğu.
  • Oturumlar arasındaki süre.
  • Kullanıcının etkileşimlerinin yaklaşım analizi.
  • Botun kullanıcıdan yararlılık ve doğruluk hakkında geri bildirim sorarak doğrudan sorular ve mini anketler.
  • Uyarılara yanıt veya uyarılara yanıt gecikmesi.

Ödül puanlarını oluşturma

İş mantığınıza göre bir Ödül puanı hesap gerekir. Puan şu şekilde temsil olabilir:

  • Bir kez gönderilen tek bir sayı
  • Hemen gönderilen bir puan (0,8 gibi) ve daha sonra gönderilen ek bir puan (genellikle 0,2).

Default Rewards

Ödül Bekleme Süresi içinde bir ödül alınmayacaksa, Derece çağrısından bu yana geçen süre, Kişiselleştirme varsayılan Ödülü bu Derece etkinliğine örtülü olarak uygular.

Birden çok faktörle ödül kazanma

Etkili kişiselleştirme için ödül puanını birden çok faktöre göre oluşturabiliriz.

Örneğin, bir video içeriği listesini kişiselleştirmek için şu kuralları uygulayabilirsiniz:

Kullanıcı davranışı Kısmi puan değeri
Kullanıcı üst öğeye tıkladı. +0,5 ödülü
Kullanıcı bu öğenin gerçek içeriğini açtı. +0,3 ödülü
Kullanıcı içeriğin 5 dakika veya %30'larını (hangisi daha uzunsa) izledi. +0,2 ödülü

Ardından toplam ödülü API'ye gönderebilirsiniz.

Ödül API'sini birden çok kez çağırma

Ödül API'sini aynı olay kimliğini kullanarak da çağırarak farklı ödül puanları gönderebilirsiniz. Kişiselleştirme bu ödülleri edince, Kişiselleştirme yapılandırmasında belirtilen şekilde bunları bir arada kullanarak bu etkinliğin son ödülüne karar verir.

Toplama değerleri:

  • İlk: Etkinlik için alınan ilk ödül puanını alır ve geri kalanını atar.
  • Toplam: eventId için toplanan tüm ödül puanlarını alır ve bunları bir araya ekler.

Ödül Bekleme Süresi'nin ardından alınan bir etkinliğin tüm ödülleri atılır ve modellerin eğitilmelerini etkilemez.

Ödül puanlarını ekleyerek, nihai ödülüniz beklenen puan aralığının dışında olabilir. Bu, hizmetin başarısız olması için bir hataya neden olmaz.

Ödül puanını hesaplamak için En İyi Yöntemler

  • Başarılı kişiselleştirmenin gerçek göstergelerini göz önünde bulundurabilirsiniz: Tıklamalar açısından düşünmek kolaydır, ancak iyi bir ödül, kullanıcılarınızı yerine elde etmek istediğiniz şeyi temel alarak elde etmektir. Örneğin, tıklamalarda ödüllendirmek, tıklamaya uygun içeriğin seçilme yollarına neden olabilir.

  • Kişiselleştirmenin ne kadar iyi çalıştığına bir ödül puanı kullanın: Bir film önerisini kişiselleştirmek, kullanıcının film izlemesini ve yüksek derecelendirmesini vermesini sağlar. Film derecelendirmesi büyük olasılıkla birçok şey (oyunculuğun kalitesi, kullanıcının havası) bağlı olduğu için kişiselleştirmenin ne kadar iyi çalıştığına iyi bir ödül sinyali değildir. Ancak, filmden ilk birkaç dakikayı izleyen kullanıcı kişiselleştirmenin daha verimli olduğunu ve 5 dakika sonra 1 ödül göndermenin daha iyi bir sinyal olduğunu ifade ediyor olabilir.

  • Rewards yalnızca RewardActionID için geçerlidir: Kişiselleştirme, RewardsActionID içinde belirtilen eylemin etkinliğini anlamak için ödülü uygular. Başka eylemler görüntülemeyi seçerseniz ve kullanıcı bu eylemlere tıklarsa ödül sıfır olmalıdır.

  • İhtiyazsız sonuçları göz önünde bulundur: Etik ve sorumlu kullanımla sorumlu sonuçlara yol açacak ödül işlevleri oluşturun.

  • Incremental Rewards kullanma: Daha küçük kullanıcı davranışları için kısmi ödül eklemek Kişiselleştirme'nin daha iyi bir ödül elde yetirmelerine yardımcı olur. Bu artımlı ödül, algoritmanın kullanıcıyla istenen son davranışa yaklaşmaya yaklaştığını öğrenmelerini sağlar.

    • Film listesi gösteriyorsanız, kullanıcı daha fazla bilgi görmek için bir süre ilkin üzerine geldiğinde kullanıcı etkileşiminin olduğunu tespit edin. Davranış, 0,1 ödül puanıyla sayılır.
    • Kullanıcı sayfayı açıp çıkış yaptı ise ödül puanı 0,2 olabilir.

Ödül bekleme süresi

Kişiselleştirme, Bir Derece çağrısının bilgilerini, modeli eğitmek için Ödül çağrılarında gönderilen ödüllerle doğrular. Bunlar farklı zamanlarda gelebilir. Kişiselleştirme, Derece çağrısı etkin olmayan bir olay olarak yapılmış ve daha sonra etkinleştirilse bile Derece çağrısının ne zaman meydana geldiğinden başlayarak sınırlı bir süre bekler.

Ödül Bekleme Süresinin süresi dolsa ve ödül bilgisi yoksa eğitim için bu etkinliğe varsayılan bir ödül uygulanır. En uzun bekleme süresi 2 gündür. Senaryo için daha uzun ödül bekleme süreleri (örneğin pazarlama e-posta kampanyalarında) gerektiriyorsa, daha uzun bekleme sürelerinin özel önizlemesini sunabilirsiniz. Ekiple iletişim kurmak Azure portal ve uygun olup olara size sun olup olana bir destek bileti açın.

Ödül bekleme süresi için en iyi yöntemler

Daha iyi sonuçlar için bu önerileri izleyin.

  • Ödül Bekleme Süresi'nin mümkün olduğu kadar kısa ve kullanıcı geri bildirimi almak için yeterli zaman bırakarak.

  • Geri bildirim almak için gereken süreden daha kısa bir süre seçme. Örneğin, bir kullanıcı videoyu 1 dakika izledikten sonra bazı ödülleriniz geliyorsa deneme uzunluğu en az iki katına çıkar.

Sonraki adımlar