¿Qué es Personalizer?
Azure Personalizer es un servicio basado en la nube que ayuda a las aplicaciones a elegir el mejor elemento de contenido y mostrárselo a los usuarios. El servicio Personalizer se puede usar para determinar qué producto sugerir a los compradores o para averiguar la posición óptima de un anuncio. Después de que el contenido se muestra al usuario, la aplicación supervisa la reacción del usuario y devuelve una puntuación de recompensa al servicio Personalizer. lo que garantiza tanto una mejora continua del modelo de Machine Learning como la capacidad de Personalizer para seleccionar el mejor elemento de contenido en función de la información contextual que recibe.
Sugerencia
El contenido es cualquier unidad de información, como texto, imágenes, direcciones URL o correos electrónicos que quiera seleccionar y mostrar a los usuarios.
Esta documentación contiene los siguientes tipos de artículos:
- Los inicios rápidos son instrucciones de inicio que le guiarán a la hora de hacer solicitudes al servicio.
- Las guías de procedimientos contienen instrucciones para usar el servicio de una manera más específica o personalizada.
- Los conceptos proporcionan explicaciones detalladas sobre la funcionalidad y las características del servicio.
- Los tutoriales son guías más largas que muestran cómo usar el servicio como componente de soluciones empresariales más amplias.
Antes de empezar, no dude en probar Personalizer con esta demostración interactiva.
¿Cómo selecciona Personalizer el mejor elemento de contenido?
Personalizer usa el aprendizaje de refuerzo para seleccionar el mejor elemento (acción) en función del comportamiento colectivo y las puntuaciones de recompensa de todos los usuarios. Las acciones son los elementos de contenido, como artículos de noticias, películas específicas o productos.
La llamada Rank toma el elemento de acción, junto con las características de la acción, y las características de contexto para seleccionar el elemento de acción superior:
- Acciones con características: elementos de contenido con características específicas de cada elemento
- Características de contexto: características de los usuarios, su contexto o su entorno cuando se usa la aplicación
La llamada Rank devuelve el identificador del elemento de contenido, acción, que se mostrará al usuario, en el campo Reward Action ID (Id. de acción de recompensa).
La acción que se muestra al usuario se elige con los modelos de Machine Learning, que intentan maximizar la cantidad total de recompensas con el paso del tiempo.
Escenarios de ejemplo
Echemos un vistazo a algunos escenarios en los que se puede usar Personalizer para seleccionar el mejor contenido que se va a representar para un usuario.
| Tipo de contenido | Acciones (con características) | Características de contexto | Identificador de acción de recompensa que se devuelve (se muestra este contenido) |
|---|---|---|---|
| Lista de noticias | a. The president... (nacional, política, [texto])b. Premier League ... (global, deportes, [texto, imagen, vídeo])c. Hurricane in the ... (regional, información meteorológica, [texto, imagen] |
Las noticias del dispositivo se leen desde Mes o temporada |
a The president... |
| Lista de películas | 1. Star Wars (1977, [acción, aventura, fantasía], George Lucas)2. Hoop Dreams (1994, [documental, deportes], Steve James3. Casablanca (1942, [romance, drama, guerra], Michael Curtiz) |
La película del dispositivo se visiona desde tamaño de pantalla Tipo de usuario |
3. Casablanca |
| Lista de productos | i. Product A (3 kg, $$$$, entrega en 24 horas)ii. Product B (20 kg, $$, envío en 2 semanas con tasas de aduanas)iii. Product C (3 kg, $$$, entrega en 48 horas) |
El envío del dispositivo se lee desde Nivel de gastos del usuario Mes o temporada |
ii. Product B |
Personalizer ha usado el aprendizaje de refuerzo para seleccionar la mejor acción individual, conocida como identificador de acción de recompensa. El modelo de Machine Learning usa:
- Un modelo entrenado: información que se ha recibido previamente del servicio dfe personalización y que se usa para mejorar el modelo de Machine Learning.
- Datos actuales: acciones específicas con características y características de contexto
¿Cuándo se utiliza Personalizer?
A la API Rank de Personalizer se le llama cada vez que una aplicación presenta contenido. Esto se conoce como un evento, anotado con un identificador de evento.
Se puede llamar a API Reward de Personalizer en tiempo real o con retardo para que se adapte mejor a su infraestructura. La puntuación de recompensa se determinará según sus necesidades empresariales. La puntuación de recompensa oscila entre 0 y 1. Esta puntuación debe ser un solo valor, por ejemplo, 1 para bueno y 0 para malo, o un número generado por un algoritmo que cree teniendo en cuenta las métricas y los objetivos empresariales.
Requisitos de contenido
Use Personalizer cuando el contenido:
- Tenga un conjunto limitado de acciones o elementos (máximo aproximado de 50) para seleccionar en cada evento de personalización. Si tiene una lista más grande, use un motor de recomendaciones para reducir la lista a 50 elementos cada vez que llame a Rank en el servicio Personalizer.
- Contenga información que describa el contenido que quiere clasificar: acciones con características y características de contexto.
- Tenga un número mínimo de eventos relacionados con contenido de 1 KB/día para que Personalizer funcione de forma efectiva. Si Personalizer no recibe el tráfico mínimo necesario, el servicio tarda más en determinar el mejor elemento de contenido.
Dado que Personalizer usa información colectiva casi en tiempo real para devolver el mejor elemento de contenido, el servicio no:
- Conserva ni administra la información de perfil de usuario
- Registra las preferencias ni el historial de usuarios individuales
- Necesita contenido limpio ni etiquetado
Diseño e implementación de Personalizer
Diseñe y planee contenido, acciones y contexto. Determine el algoritmo de recompensa para la puntuación de recompensa.
Cada recurso de Personalizer que cree se considera un bucle de aprendizaje. El bucle recibirá las llamadas Rank y Reward para ese contenido o experiencia de usuario.
Tipo de recurso Propósito Modo de aprendiz E0Aprendizaje del modelo de Personalizer sin afectar a la aplicación existente e implementación del comportamiento de aprendizaje en línea en un entorno de producción Estándar, S0Comportamiento de aprendizaje en línea en un entorno de producción Gratis, F0Comportamiento de aprendizaje en línea en un entorno que no es de producción Agregue Personalizer a su aplicación, sitio web o sistema:
- Agregue una llamada Rank a Personalizer en su aplicación, sitio web o sistema para determinar el mejor elemento de contenido antes de que se muestre el contenido al usuario.
- Muestre al usuario el mejor elemento de contenido, que es el identificador de acción de recompensa devuelto.
- Aplique la lógica de negocios a la información recopilada sobre cómo se comportará el usuario, para determinar la puntuación de recompensa, por ejemplo:
Comportamiento Puntuación de recompensa calculada El usuario seleccionó el mejor elemento de contenido (identificador de acción de recompensa) 1 El usuario seleccionó otro contenido 0 El usuario hizo una pausa, se desplazó sin decidirse, antes de seleccionar el mejor elemento de contenido (identificador de acción de recompensa) 0,5 - Agregue una llamada Reward para enviar una puntuación de recompensa entre 0 y 1
- Inmediatamente después de mostrar el contenido
- O, en algún momento posterior en un sistema sin conexión
- Evalúe el bucle con una evaluación sin conexión después de un período de uso. La evaluación sin conexión permite probar y evaluar la eficacia del servicio Personalizer sin cambiar el código o sin que se vea afectada la experiencia del usuario.
Referencia
- SDK de C#/.NET de Personalizer
- SDK de Go de Personalizer
- SDK de JavaScript de Personalizer
- SDK de Python de Personalizer
- API de REST