Directiva de aprendizaje y configuración

Importante

A partir del 20 de septiembre de 2023, no podrá crear nuevos recursos de Personalizer. El servicio Personalizer se va a retirar el 1 de octubre de 2026.

La configuración del aprendizaje determina los hiperparámetros del entrenamiento de modelo. Dos modelos de los mismos datos que se entrenan con configuraciones de aprendizaje diferentes se comportarán de manera distinta.

La directiva de aprendizaje y la configuración se establecen en el recurso de Personalizer en Azure Portal.

Importación y exportación de directivas de aprendizaje

Puede importar y exportar archivos de directivas de aprendizaje desde Azure Portal. Use este método para guardar las directivas existentes, probarlas, reemplazarlas y archivarlas en el control de código fuente como artefactos para futuras referencias y auditorías.

Aprenda a importar y exportar una directiva de aprendizaje en Azure Portal para el recurso de Personalizer.

Comprensión de la configuración de directivas de aprendizaje

La configuración de la directiva de aprendizaje no está pensada para modificarse. Cambie la configuración solo si comprende cómo afecta a Personalizer. Sin este conocimiento, podría causar problemas, como la invalidación de los modelos de Personalizer.

Personalizer usa vowpalwabbit para entrenar y puntuar los eventos. Consulte la documentación de vowpalwabbit sobre cómo editar la configuración de aprendizaje con vowpalwabbit. Una vez que tenga la propiedad arguments correcta para la línea de comandos, guarde el comando en un archivo con el siguiente formato (reemplace el valor de la propiedad arguments por el comando deseado) y cargue el archivo para importar la configuración de aprendizaje en el panel Configuración de aprendizaje y modelos de Azure Portal para el recurso de Personalizer.

El siguiente .json es un ejemplo de directiva de aprendizaje.

{
  "name": "new learning settings",
  "arguments": " --cb_explore_adf --epsilon 0.2 --power_t 0 -l 0.001 --cb_type mtr -q ::"
}

Comparación de directivas de aprendizaje

Puede comparar el rendimiento de las diferentes directivas de aprendizaje con datos anteriores en los registros de Personalizer mediante evaluaciones sin conexión.

Cargue sus propias directivas de aprendizaje para compararlas con la directiva actual de aprendizaje.

Optimización de directivas de aprendizaje

Personalizer puede crear una directiva de aprendizaje optimizada en una evaluación sin conexión. Una directiva de aprendizaje optimizada que tiene mejores recompensas en una evaluación sin conexión, tendrá mejores resultados cuando se utilice en línea en Personalizer.

Después de optimizar una directiva de aprendizaje, puede aplicarla directamente en Personalizer para que reemplace inmediatamente a la directiva actual. También puede guardar la directiva optimizada para su evaluación adicional y, posteriormente, decidir si descartarla, guardarla o aplicarla.

Pasos siguientes