¿Qué es el diseñador de Azure Machine Learning (v1)?

El diseñador de Azure Machine Learning es una interfaz de tipo arrastrar y colocar que se usa para entrenar e implementar modelos en Azure Machine Learning. En este artículo, se describen las tareas que puede realizar en el diseñador.

Nota:

El diseñador admite dos tipos de componentes: componentes precompilados clásicos (v1) y componentes personalizados (v2). Estos dos tipos de componentes NO son compatibles.

Los componentes precompilados clásicos proporcionan componentes precompilados principalmente para el procesamiento de datos y las tareas tradicionales de aprendizaje automático, como la regresión y la clasificación. Este tipo de componentes se sigue admitiendo, pero no se agregará ningún componente nuevo.

Los componentes personalizados le permiten ajustar su propio código como componente. Admite el uso compartido de componentes entre áreas de trabajo y la creación fluida entre las interfaces de Studio, CLI v2 y SDK v2.

Para los proyectos nuevos, le recomendamos que utilice el componente personalizado, que es compatible con AzureML V2, y seguirá recibiendo nuevas actualizaciones.

Este artículo se aplica a los componentes precompilados clásicos y no es compatible con la CLI v2 y el SDK v2.

GIF of a building a pipeline in the designer.

El diseñador usa el área de trabajo de Azure Machine Learning para organizar recursos compartidos, por ejemplo:

Entrenamiento e implementación de modelos

Use un lienzo visual para crear un flujo de trabajo de aprendizaje automático completo. Entrene, pruebe e implemente modelos en el diseñador:

  • Arrastre y coloque los recursos de datos y componentes en el lienzo.
  • Conecte los componentes para crear un borrador de canalización.
  • Enviar una ejecución de canalización mediante los recursos de proceso del área de trabajo de Azure Machine Learning.
  • Convertir las canalizaciones de entrenamiento en canalizaciones de inferencia.
  • Publique las canalizaciones en un punto de conexión de canalización de REST para enviar una nueva canalización que se ejecute con distintos parámetros y recursos de datos.
    • Publique una canalización de entrenamiento para reutilizar una sola canalización para el entrenamiento de varios modelos y, al mismo tiempo, cambiar los parámetros y recursos de datos.
    • Publique una canalización de inferencia por lotes para hacer predicciones sobre nuevos datos mediante un modelo entrenado previamente.
  • Implementar una canalización de inferencia en línea en un punto de conexión en tiempo real para realizar predicciones sobre nuevos datos en tiempo real.

Workflow diagram for training, batch inference, and real-time inference in the designer.

Canalización

Una canalización consta de recursos de datos y componentes de análisis que se conectan. Las canalizaciones tienen muchos usos: puede crear una canalización que entrene a un modelo único o una que entrene a varios modelos. Puede crear una canalización que realice predicciones en tiempo real o por lotes, o crear una canalización que solo limpie los datos. Las canalizaciones le permiten reutilizar el trabajo y organizar los proyectos.

Borrador de canalización

A medida que edita una canalización en el diseñador, el progreso se guarda como un borrador de canalización. Puede editar un borrador de canalización en cualquier momento si agrega o quita componentes, configura destinos de proceso, crea parámetros, etc.

Una canalización válida tiene estas características:

  • Los recursos de datos solo pueden conectarse a componentes.
  • Los componentes solo se pueden conectar a recursos de datos o a otros componentes.
  • Todos los puertos de entrada de los componentes deben tener alguna conexión al flujo de datos.
  • Deben establecerse todos los parámetros obligatorios de cada componente.

Cuando esté listo para ejecutar el borrador de la canalización, envíe un trabajo de canalización.

Trabajo de canalización

Cada vez que se ejecuta una canalización, la configuración de esta y sus resultados se almacenan en el área de trabajo como un trabajo de canalización. Puede regresar a cualquier trabajo de canalización para inspeccionarlo con fines de solución de problemas o auditoría. Clone una ejecución de canalización para crear un borrador de canalización y editarlo.

Las ejecuciones de canalización se agrupan en experimentos para organizar el historial de trabajos. Puede establecer el experimento de cada ejecución de canalización.

data

Un recurso de datos de aprendizaje automático permite acceder a los datos y trabajar con ellos fácilmente. En el diseñador se incluyen varios recursos de datos de ejemplo para experimentar con ellos. Puede registrar más recursos de datos a medida que los necesite.

Componente

Un componente es un algoritmo que se puede realizar en los datos. El diseñador tiene varios componentes que van desde funciones de entrada de datos hasta procesos de entrenamiento, puntuación y validación.

Un componente puede tener un conjunto de parámetros que se puede usar para configurar los algoritmos internos del componente. Al seleccionar un componente en el lienzo, los parámetros de este se muestran en el panel Propiedades, a la derecha del lienzo. Puede modificar los parámetros en ese panel para ajustar su modelo. Puede establecer los recursos de proceso de componentes individuales en el diseñador.

Screenshot showing the component properties.

Para obtener ayuda para desplazarse por la biblioteca de algoritmos de aprendizaje automático disponibles, vea Información general de referencia sobre algoritmos y componentes. Para obtener ayuda en la elección de un algoritmo, consulte Hoja de características de los algoritmos de Machine Learning para el diseñador de Azure Machine Learning.

Recursos de proceso

Use recursos de proceso del área de trabajo para ejecutar la canalización y hospedar los modelos implementados como puntos de conexión en línea o como puntos de conexión de canalización (para la inferencia por lotes). Los destinos de proceso admitidos son los siguientes:

Destino de proceso Cursos Implementación
Proceso de Azure Machine Learning
Azure Kubernetes Service

Los destinos de proceso están conectados a su área de trabajo de Azure Machine Learning. Los destinos de proceso se administran en el área de trabajo de Azure Machine Learning Studio.

Implementación

Para realizar la inferencia en tiempo real, debe implementar una canalización como un punto de conexión en línea. El punto de conexión en línea crea una interfaz entre una aplicación externa y el modelo de puntuación. Una llamada a un punto de conexión en tiempo real devuelve resultados de predicción a la aplicación externa en línea. Para realizar una llamada a un punto de conexión en línea, es necesario pasar la clave de API que se creó al implementar el punto de conexión. El punto de conexión se basa en REST, una arquitectura muy usada para proyectos de programación web.

Los puntos de conexión en línea se deben implementar en un clúster de Azure Kubernetes Service.

Para aprender a implementar el modelo, consulte Tutorial: Implemente un modelo de aprendizaje automático con el diseñador.

Publicar

También puede publicar una canalización en un punto de conexión de canalización. Igual que un punto de conexión en línea, un punto de conexión de canalización permite enviar nuevos trabajos de canalización desde aplicaciones externas mediante llamadas REST. Sin embargo, no se pueden enviar ni recibir datos en tiempo real con un punto de conexión de canalización.

Las canalizaciones publicadas son flexibles; se pueden usar para entrenar o volver a entrenar modelos, realizar la inferencia por lotes, procesar nuevos datos y mucho más. Puede publicar varias canalizaciones en un único punto de conexión de canalización y especificar la versión de canalización que se va a ejecutar.

Una canalización publicada se ejecuta en los recursos de proceso que se definen en el borrador de canalización de cada componente.

El diseñador crea el mismo objeto PublishedPipeline como SDK.

Pasos siguientes