¿Qué es el diseñador de Azure Machine Learning?

El diseñador de Azure Machine Learning es una interfaz de tipo arrastrar y colocar que se usa para entrenar e implementar modelos en Azure Machine Learning. En este artículo, se describen las tareas que puede realizar en el diseñador.

Ejemplo del diseñador de Azure Machine Learning

El diseñador usa el área de trabajo de Azure Machine Learning para organizar recursos compartidos, por ejemplo:

Entrenamiento e implementación de modelos

Use un lienzo visual para crear un flujo de trabajo de aprendizaje automático completo. Entrene, pruebe e implemente modelos en el diseñador:

  • Arrastre y coloque conjuntos de datos y componentes en el lienzo.
  • Conecte los componentes para crear un borrador de canalización.
  • Enviar una ejecución de canalización mediante los recursos de proceso del área de trabajo de Azure Machine Learning.
  • Convertir las canalizaciones de entrenamiento en canalizaciones de inferencia.
  • Publicar las canalizaciones en un punto de conexión de canalización de REST para enviar una nueva canalización que se ejecute con distintos parámetros y conjuntos de datos.
    • Publique una canalización de entrenamiento para reutilizar una sola canalización para el entrenamiento de varios modelos y, al mismo tiempo, cambiar los parámetros y conjuntos de datos.
    • Publique una canalización de inferencia por lotes para hacer predicciones sobre nuevos datos mediante un modelo entrenado previamente.
  1. Implementar una canalización de inferencia en tiempo real en un punto de conexión en tiempo real para realizar predicciones sobre nuevos datos en tiempo real.

Diagrama de flujo de trabajo para entrenamiento, inferencia por lotes e inferencia en tiempo real en el diseñador

Canalización

Una canalización consta de conjuntos de datos y componentes analíticos que se conectan. Las canalizaciones tienen muchos usos: puede crear una canalización que entrene a un modelo único o una que entrene a varios modelos. Puede crear una canalización que realice predicciones en tiempo real o por lotes, o crear una canalización que solo limpie los datos. Las canalizaciones le permiten reutilizar el trabajo y organizar los proyectos.

Borrador de canalización

A medida que edita una canalización en el diseñador, el progreso se guarda como un borrador de canalización. Puede editar un borrador de canalización en cualquier momento si agrega o quita componentes, configura destinos de proceso, crea parámetros, etc.

Una canalización válida tiene estas características:

  • Los conjuntos de datos solo pueden conectarse a componentes.
  • Los componentes solo se pueden conectar a conjuntos de datos o a otros componentes.
  • Todos los puertos de entrada de los componentes deben tener alguna conexión al flujo de datos.
  • Deben establecerse todos los parámetros obligatorios de cada componente.

Cuando esté listo para ejecutar el borrador de la canalización, envíe una ejecución de canalización.

Ejecución de la canalización

Cada vez que se ejecuta una canalización, la configuración de esta y sus resultados se almacenan en el área de trabajo como una ejecución de canalización. Puede regresar a cualquier ejecución de canalización para inspeccionarla con fines de solución de problemas o auditoría. Clone una ejecución de canalización para crear un borrador de canalización y editarlo.

Las ejecuciones de canalización se agrupan en experimentos para organizar el historial de ejecuciones. Puede establecer el experimento de cada ejecución de canalización.

Conjuntos de datos

Un conjuntos de datos de aprendizaje automático permite acceder a los datos y trabajar con ellos fácilmente. En el diseñador se incluyen varios conjuntos de datos de ejemplo para experimentar con ellos. Puede registrar más conjuntos de datos a medida que los necesite.

Componente

Un componente es un algoritmo que se puede realizar en los datos. El diseñador tiene varios componentes que van desde funciones de entrada de datos hasta procesos de entrenamiento, puntuación y validación.

Un componente puede tener un conjunto de parámetros que se puede usar para configurar los algoritmos internos del componente. Al seleccionar un componente en el lienzo, los parámetros de este se muestran en el panel Propiedades, a la derecha del lienzo. Puede modificar los parámetros en ese panel para ajustar su modelo. Puede establecer los recursos de proceso de componentes individuales en el diseñador.

Propiedades de componentes

Para obtener ayuda para desplazarse por la biblioteca de algoritmos de aprendizaje automático disponibles, vea Información general de referencia sobre algoritmos y componentes. Para obtener ayuda en la elección de un algoritmo, consulte Hoja de características de los algoritmos de Machine Learning para el diseñador de Azure Machine Learning.

Recursos de proceso

Use recursos de proceso del área de trabajo para ejecutar la canalización y hospedar los modelos implementados como puntos de conexión en tiempo real o como puntos de conexión de canalización (para la inferencia por lotes). Los destinos de proceso admitidos son los siguientes:

Destino de proceso Cursos Implementación
Proceso de Azure Machine Learning
Azure Kubernetes Service

Los destinos de proceso están conectados a su área de trabajo de Azure Machine Learning. Los destinos de proceso se administran en el área de trabajo de Azure Machine Learning Studio.

Implementación

Para realizar la inferencia en tiempo real, debe implementar una canalización como un punto de conexión en tiempo real. El punto de conexión en tiempo real crea una interfaz entre una aplicación externa y el modelo de puntuación. Una llamada a un punto de conexión en tiempo real devuelve resultados de predicción a la aplicación externa en tiempo real. Para realizar una llamada a un punto de conexión en tiempo real, es necesario pasar la clave de API que se creó al implementar el punto de conexión. El punto de conexión se basa en REST, una arquitectura muy usada para proyectos de programación web.

Los puntos de conexión en tiempo real se deben implementar en un clúster de Azure Kubernetes Service.

Para aprender a implementar el modelo, consulte Tutorial: Implemente un modelo de aprendizaje automático con el diseñador.

Nota

Los puntos de conexión de Azure Machine Learning (versión preliminar) proporcionan una experiencia de implementación mejorada y más sencilla. Los puntos de conexión admiten escenarios de inferencia por lotes y en tiempo real. Los puntos de conexión proporcionan una interfaz unificada para invocar y administrar implementaciones de modelos entre tipos de proceso. Vea ¿Qué son los puntos de conexión de Azure Machine Learning (versión preliminar)?.

Publicar

También puede publicar una canalización en un punto de conexión de canalización. Igual que un punto de conexión en tiempo real, un punto de conexión de canalización permite enviar nuevas ejecuciones de canalización desde aplicaciones externas mediante llamadas REST. Sin embargo, no se pueden enviar ni recibir datos en tiempo real con un punto de conexión de canalización.

Las canalizaciones publicadas son flexibles; se pueden usar para entrenar o volver a entrenar modelos, realizar la inferencia por lotes, procesar nuevos datos y mucho más. Puede publicar varias canalizaciones en un único punto de conexión de canalización y especificar la versión de canalización que se va a ejecutar.

Una canalización publicada se ejecuta en los recursos de proceso que se definen en el borrador de canalización de cada componente.

El diseñador crea el mismo objeto PublishedPipeline como SDK.

Pasos siguientes