Cara kerja Personalizer

Sumber daya Personalizer, yaitu loop pembelajaran Anda, menggunakan pembelajaran mesin untuk membangun model yang memprediksi tindakan teratas untuk konten Anda. Model ini dilatih secara eksklusif pada data Anda yang Anda kirimkan dengan panggilan Peringkat dan Reward. Setiap loop benar-benar independen satu sama lain.

API Peringkat dan Reward memengaruhi model

Anda mengirim tindakan dengan fitur dan fitur konteks ke API Peringkat. API Peringkat memutuskan untuk menggunakan:

  • Eksploitasi: Model saat ini untuk memutuskan tindakan terbaik berdasarkan data sebelumnya.
  • Eksplorasi: Pilih tindakan lain bukan tindakan teratas. Anda mengonfigurasi persentase ini untuk sumber daya Personalizer Anda di portal Azure.

Anda menentukan skor reward dan mengirimkan skor itu ke API Reward. API Reward:

  • Mengumpulkan data untuk melatih model dengan merekam fitur dan skor reward dari setiap panggilan peringkat.
  • Menggunakan data tersebut untuk memperbarui model berdasarkan konfigurasi yang ditentukan dalam Kebijakan Pembelajaran.

Sistem Anda memanggil Personalizer

Gambar berikut menampilkan aliran arsitektur pemanggilan panggilan Peringkat dan Reward:

teks alternatif

  1. Anda mengirim tindakan dengan fitur dan fitur konteks ke API Peringkat.

    • Personalizer memutuskan apakah akan mengeksploitasi model saat ini atau mengeksplorasi pilihan baru untuk model tersebut.
    • Hasil peringkat dikirim ke EventHub.
  2. Peringkat teratas dikembalikan ke sistem Anda sebagai ID tindakan reward. Sistem Anda menyajikan konten itu dan menentukan skor reward berdasarkan aturan bisnis Anda sendiri.

  3. Sistem Anda mengembalikan skor reward ke loop pembelajaran.

    • Saat Personalizer menerima reward, reward dikirim ke EventHub.
    • Pangkat dan penghargaan berkorelasi.
    • Model AI diperbarui berdasarkan hasil korelasi.
    • Mesin inferensi diperbarui dengan model baru.

Personalizer melatih ulang model Anda

Personalizer melatih ulang model Anda berdasarkan pengaturan Pembaruan frekuensi model di sumber Personalizer Anda di portal Azure.

Personalizer menggunakan semua data yang saat ini disimpan, berdasarkan pengaturan Retensi data dalam jumlah hari pada sumber data Personalizer Anda di portal Azure.

Lakukan penelitian di belakang Personalizer

Personalizer didasarkan pada sains dan penelitian mutakhir di bidang Pembelajaran Penguatan termasuk makalah, aktivitas penelitian, dan bidang eksplorasi yang sedang berlangsung di Microsoft Research.

Langkah berikutnya

Pelajari tentang skenario teratas untuk Personalizer