Kişiselleştirme nasıl çalışır?How Personalizer works

_Öğrenme döngünüz_olan kişiselleştirici kaynağı, içeriğiniz için en iyi eylemi tahmin eden modeli oluşturmak için makine öğrenimi 'ni kullanır.The Personalizer resource, your learning loop, uses machine learning to build the model that predicts the top action for your content. Model, bu verilere yalnızca Derecelendirme ve ödül çağrılarında gönderdiğiniz verilerinize göre eğitilir.The model is trained exclusively on your data that you sent to it with the Rank and Reward calls. Her döngü birbirleriyle tamamen bağımsızdır.Every loop is completely independent of each other.

Derecelendirme ve Reward API 'Leri modeli etkilerRank and Reward APIs impact the model

Özellikler ve bağlam özellikleriyle işlemleri derecelendirme API 'sine gönderirsiniz.You send actions with features and context features to the Rank API. Derecelendirme API 'si şu iki seçenekten birini kullanmanıza karar verir:The Rank API decides to use either:

  • Yararlanma: geçmiş verilere göre en iyi eyleme karar vermeye yönelik geçerli model.Exploit: The current model to decide the best action based on past data.
  • Keşfet: en üstteki eylem yerine farklı bir eylem seçin.Explore: Select a different action instead of the top action. Bu yüzdeyi , Azure Portal, kişiselleştirici kaynağınız için yapılandırırsınız.You configure this percentage for your Personalizer resource in the Azure portal.

Ödül Puanını belirlersiniz ve bu puanı ödül API 'sine gönderirsiniz.You determine the reward score and send that score to the Reward API. Reward API 'si:The Reward API:

  • Her bir derece çağrısının özelliklerini ve yeniden puanlarını kaydederek modeli eğitmek için veri toplar.Collects data to train the model by recording the features and reward scores of each rank call.
  • , _Öğrenme ilkesinde_belirtilen yapılandırmaya göre modeli güncelleştirmek için bu verileri kullanır.Uses that data to update the model based on the configuration specified in the Learning Policy.

Kişiselleştirici çağıran sistemYour system calling Personalizer

Aşağıdaki görüntüde, derece ve geri aramaları çağırmanın mimari akışı gösterilmektedir:The following image shows the architectural flow of calling the Rank and Reward calls:

alternatif metinalt text

  1. Özellikler ve bağlam özellikleriyle işlemleri derecelendirme API 'sine gönderirsiniz.You send actions with features and context features to the Rank API.

    • Kişiselleştirici, geçerli modelden mi yararlanacağına yoksa model için yeni seçimler keşfetmesine karar verir.Personalizer decides whether to exploit the current model or explore new choices for the model.
    • Derecelendirme sonucu EventHub öğesine gönderilir.The ranking result is sent to EventHub.
  2. En üst sıra, sisteminize geri dönüş _eylem kimliği_olarak döndürülür.The top rank is returned to your system as reward action ID. Sisteminiz bu içeriği gösterir ve kendi iş kurallarınızı temel alarak bir ödül puanı belirler.Your system presents that content and determines a reward score based on your own business rules.

  3. Sisteminiz öğrenme döngüsüne geri dönüş puanı döndürür.Your system returns the reward score to the learning loop.

    • Kişiselleştirmede bir ödül alındığında, bu, EventHub öğesine gönderilir.When Personalizer receives the reward, the reward is sent to EventHub.
    • Rank ve ödül, bağıntılı.The rank and reward are correlated.
    • AI modeli, bağıntı sonuçlarına göre güncelleştirilir.The AI model is updated based on the correlation results.
    • Çıkarım altyapısı yeni modelle güncellenir.The inference engine is updated with the new model.

Kişiselleştirici, modelinize geri çekmePersonalizer retrains your model

Kişiselleştirici, Azure portal kişiselleştirici kaynağınız üzerindeki model sıklığı güncelleştirme ayarınızı temel alarak modelinize geri çeker.Personalizer retrains your model based on your Model frequency update setting on your Personalizer resource in the Azure portal.

Kişiselleştirici, Azure portal, kişiselleştirme kaynağınızın, veri saklama ayarına göre şu anda korunan tüm verileri kullanır.Personalizer uses all the data currently retained, based on the Data retention setting in number of days on your Personalizer resource in the Azure portal.

Kişiselleştirici arkasında araştırmaResearch behind Personalizer

Kişiselleştirici, Microsoft Research 'daki incelemeler, araştırma etkinlikleri ve devam eden araştırma dahil olmak üzere pekiştirmeye dayalı Learning 'in alanında son teknoloji bilimine ve araştırmasına dayalıdır.Personalizer is based on cutting-edge science and research in the area of Reinforcement Learning including papers, research activities, and ongoing areas of exploration in Microsoft Research.

Sonraki adımlarNext steps

Kişiselleştiriciye yönelik popüler senaryolar hakkında bilgi edininLearn about top scenarios for Personalizer