Tutorial: Evaluación de datos de evaluación del cerebro
Siga este tutorial para aprender:
- Diferencia entre las evaluaciones automáticas y las personalizadas.
- Cómo navegar por la interfaz de usuario de evaluación.
- Cómo leer datos de evaluación para evaluaciones basadas en objetivos.
- Cómo leer datos de evaluación para evaluaciones basadas en recompensas.
Para obtener ayuda para ejecutar consultas de evaluación en Azure Log Analytics, siga las instrucciones de la entrada guía de datos de evaluación de consultas.
Para seguir este tutorial, debe tener una cuenta válida de Microsoft o Azure y un área de trabajo Bonsai válida aprovisionada en Azure. Si necesita una cuenta o una versión de prueba de Azure, siga las instrucciones de Microsoft account setup for Bonsai antes de continuar.
Evaluaciones automáticas frente a personalizadas
Cada evaluación consta de un conjunto de episodios de prueba en los que se pide al cerebro que evalúe la directiva con la que se está entrenando. Cada episodio recibe su propia puntuación (satisfacción del objetivo o recompensas totales) y la plataforma calcula un promedio entre estas puntuaciones para determinar los resultados generales de la evaluación.
Bonsai Las evaluaciones se incluyen en dos tipos:
- evaluaciones automáticas: configuradas y ejecutadas por como parte del proceso de entrenamiento del cerebro. Una sola sesión de entrenamiento generará varias evaluaciones automáticas.
- evaluaciones personalizadas: configuradas por los usuarios, codificadas en un archivo de configuración y ejecutadas a petición a través de la CLI o la interfaz de Bonsai usuario.
Las evaluaciones automáticas son útiles para comprender cómo aprende el cerebro y para ayudar a la plataforma a elegir directivas óptimas durante el entrenamiento. La interfaz de usuario expone resultados de evaluación automática de alto nivel en el gráfico de entrenamiento y la lista De evaluaciones para que los usuarios Bonsai puedan ver el progreso del entrenamiento. Bonsai
Las evaluaciones personalizadas son evaluaciones definidas por el usuario y ejecutadas por el usuario que le dan una imagen más detallada de cómo funciona el cerebro. Las evaluaciones personalizadas permiten evaluar el cerebro en escenarios específicos de interés y ver los resultados detallados de la evaluación en la interfaz de Bonsai usuario. Ejecute evaluaciones personalizadas durante o después del entrenamiento para obtener una imagen detallada del rendimiento del cerebro.
Importante
Los datos de evaluación automática solo son útiles como una comprobación de alto nivel sobre el comportamiento de la inteligencia artificial. Para obtener información más detallada y datos de evaluación detallados, debe diseñar y ejecutar una evaluación personalizada.
Importante
Los datos de evaluación automática solo son útiles como una comprobación de alto nivel sobre el comportamiento de la inteligencia artificial. Para obtener información más detallada y datos de evaluación detallados, debe diseñar y ejecutar una evaluación personalizada.
Interfaz de usuario de evaluación
La interfaz de usuario de evaluación incluye tres componentes clave:
- (A)Panel metadatos:muestra información general relacionada con la evaluación.
- (B)Panel rendimiento básico:muestra el resumen de alto nivel de los resultados de la evaluación
- (C)Panel de episodios:muestra los datos detallados de iteración, configuración y rendimiento de cada episodio de la evaluación.
Nota
El panel de datos del episodio solo está disponible para las evaluaciones personalizadas.
Paneles de datos
Los paneles de datos disponibles para una evaluación dependen de cómo haya elegido estructurar los conceptos de entrenamiento en Inkling:
- Los cerebros entrenados mediante objetivos incluyen metadatos, rendimiento básico, paneles de episodios y datos específicos del objetivo.
- Los cerebros entrenados con funciones de recompensa y terminal incluyen metadatos, paneles básicos de rendimiento y episodios.
Lista de evaluación
Siempre se puede acceder a la lista de evaluación desde la pestaña Entrenar de la interfaz de usuario. De forma predeterminada, la lista incluye todas las evaluaciones automáticas y personalizadas asociadas a la versión del cerebro seleccionada. Seleccione las marcas de verificación situadas junto a Automático o Personalizado para filtrar la lista de evaluaciones.
- Para mostrar los detalles de una evaluación, seleccione el nombre de la evaluación en la lista.
- Para volver a la pantalla Train predeterminada, seleccione el nombre de concepto correspondiente.
Metadatos de evaluación
Los metadatos siguientes están disponibles para todas las evaluaciones:
- Nombre de la evaluación.
- Número total de iteraciones de entrenamiento completadas por el cerebro en el momento en que se evaluó.
- Número total de episodios de la evaluación.
- La lección de concepto más reciente que el cerebro está aprendiendo (para las evaluaciones automáticas) o ha aprendido (evaluaciones personalizadas). Si el archivo inkling asociado no define lecciones en el plan de estudios, la interfaz de usuario muestra "Ninguno definido".
- Tipo de evaluación (automática o personalizada).
Las evaluaciones automáticas también muestran la fecha y hora en que se ejecutó la evaluación. Las evaluaciones personalizadas muestran una descripción de la evaluación si se proporcionó una cuando se cargó el archivo de configuración.
Nota
Bonsai no registra los resultados de los episodios que no se ejecutan. Si los valores iniciales de un episodio no son válidos según el código inkling asociado, el episodio se omite y no se incluye en los metadatos de evaluación.
Detalles de la evaluación del entrenamiento basado en objetivos
Datos de resumen
El panel de datos de resumen muestra los resultados de la evaluación de alto nivel. El panel incluye los siguientes gráficos y estadísticas para el rendimiento general del cerebro y el rendimiento específico del objetivo:
- Tasa de éxito general durante la evaluación. La tasa de éxito se define como el número de episodios en los que el cerebro alcanzó los objetivos indicados dividido por el número total de episodios registrados.
- Histograma de la distribución de la satisfacción del objetivo para cada episodio de prueba de la evaluación.
- Estadísticas de satisfacción del objetivo que proporcionan métricas cuantitativas para el histograma de satisfacción del objetivo. Actualmente, las estadísticas proporcionadas incluyen la tasa de éxito media, mínima y máxima lograda por el cerebro junto con la desviación estándar para esas métricas.
Datos del episodio
La interfaz de usuario de datos del episodio incluye tres componentes clave:
- (A) Filtrardatos de episodios:muestra un histograma que muestra el rendimiento general del cerebro de los usuarios. Puede hacer clic en una barra y filtrar el contenido de la tabla de configuración de episodios y los gráficos de iteración de episodios para mostrar solo los episodios que caben en el intervalo de rendimiento de la barra elegida. Puede seleccionar más de una barra a la vez.
- (B) Valores de configuraciónde episodios:muestra los valores de configuración de los episodios y los datos de rendimiento de cada episodio de evaluación. Puede elegir las configuraciones que desea ver en las columnas seleccionando el botón Editar. También puede usar la tabla de configuración de episodios para filtrar qué gráficos de episodios ve debajo de la tabla haciendo clic en las filas adecuadas. Si no selecciona nada, se mostrarán todos los gráficos.
- (C) Datos deiteración de episodios:proporciona una visualización de los valores de variable de estado o acción en todos los episodios. El panel de datos de iteración también permite a los usuarios visualizar cómo varía la recompensa en cada episodio. Puede seleccionar y editar el estado, la acción o las variables de recompensa que desea visualizar.
Detalles de la evaluación del entrenamiento basado en recompensas
Las evaluaciones basadas en recompensas proporcionan datos de resumen y datos de episodios.
Los datos de resumen para el entrenamiento basado en recompensas incluyen:
- Histograma de la distribución de recompensas para cada episodio de prueba de la evaluación.
- Estadísticas de recompensa que proporcionan métricas cuantitativas para el histograma de recompensa. Actualmente, las estadísticas proporcionadas incluyen las puntuaciones de recompensa media, mínima y máxima logradas por el cerebro junto con la desviación estándar para esas métricas.
Pasos siguientes
Una vez que está seguro del rendimiento del cerebro entrenado, pruebe a exportar el cerebro y probar la directiva de control localmente.