Creación, revisión e implementación de modelos de aprendizaje automático automatizado con Azure Machine LearningCreate, review, and deploy automated machine learning models with Azure Machine Learning

En este artículo, aprenderá a crear, explorar e implementar modelos de aprendizaje automático automatizado sin una sola línea de código en Azure Machine Learning Studio.In this article, you learn how to create, explore, and deploy automated machine learning models without a single line of code in Azure Machine Learning studio.

El aprendizaje automático automatizado es un proceso en el que se selecciona automáticamente el mejor algoritmo de aprendizaje automático para sus datos específicos.Automated machine learning is a process in which the best machine learning algorithm to use for your specific data is selected for you. Este proceso le permite generar modelos de aprendizaje automático rápidamente.This process enables you to generate machine learning models quickly. Más información sobre el aprendizaje automático automatizado.Learn more about automated machine learning.

Para obtener un ejemplo completo, pruebe el tutorial para crear un modelo de clasificación con la interfaz de ML automatizado de Azure Machine Learning.For an end to end example, try the tutorial for creating a classification model with Azure Machine Learning's automated ML interface.

Si prefiere una experiencia basada en código de Python, configure sus experimentos de aprendizaje automático automatizado con el SDK de Azure Machine Learning.For a Python code-based experience, configure your automated machine learning experiments with the Azure Machine Learning SDK.

Requisitos previosPrerequisites

IntroducciónGet started

  1. Inicie sesión en Azure Machine Learning en https://ml.azure.com.Sign in to Azure Machine Learning at https://ml.azure.com.

  2. Seleccione su suscripción y área de trabajo.Select your subscription and workspace.

  3. Navegue al panel izquierdo.Navigate to the left pane. Seleccione Automated ML (ML automatizado) en la sección Creación.Select Automated ML under the Author section.

Panel de navegación de Azure Machine Learning StudioAzure Machine Learning studio navigation pane

Si es la primera vez que realiza algún experimento, verá una lista vacía y vínculos a la documentación.If this is your first time doing any experiments, you'll see an empty list and links to documentation.

De lo contrario, verá una lista de los experimentos de aprendizaje automático automatizado recientes, incluidos los creados con el SDK.Otherwise, you'll see a list of your recent automated machine learning experiments, including those created with the SDK.

Creación y ejecución de un experimentoCreate and run experiment

  1. Seleccione + New automated ML run (+ Nueva ejecución de ML automatizada) y rellene el formulario.Select + New automated ML run and populate the form.

  2. Seleccione un conjunto de datos del contenedor de almacenamiento o cree un nuevo conjunto de datos.Select a dataset from your storage container, or create a new dataset. Los conjuntos de datos se pueden crear a partir de archivos locales, direcciones URL web, almacenes de datos o Azure Open Datasets.Datasets can be created from local files, web urls, datastores, or Azure open datasets. Obtenga más información sobre la creación de conjuntos de datos.Learn more about dataset creation.

    Importante

    Requisitos para los datos de entrenamiento:Requirements for training data:

    • Los datos deben estar en formato tabular.Data must be in tabular form.
    • El valor que quiere predecir (columna de destino) debe estar presente en los datos.The value you want to predict (target column) must be present in the data.
    1. Para crear un nuevo conjunto de datos a partir de un archivo del equipo local, seleccione +Crear conjunto de datos y seleccione From local file (Desde archivo local).To create a new dataset from a file on your local computer, select +Create dataset and then select From local file.

    2. En el formulario Información básica, asígnele un nombre único al conjunto de datos e incluya una descripción opcional.In the Basic info form, give your dataset a unique name and provide an optional description.

    3. Seleccione Siguiente para abrir el formulario Datastore and file selection (Almacén de datos y selección de archivos).Select Next to open the Datastore and file selection form. En este formulario, seleccione dónde quiere cargar el conjunto de datos: el contenedor de almacenamiento predeterminado que se crea automáticamente con el área de trabajo, o bien elija un contenedor de almacenamiento que quiera usar para el experimento.On this form you select where to upload your dataset; the default storage container that's automatically created with your workspace, or choose a storage container that you want to use for the experiment.

      1. Si los datos están detrás de una red virtual, debe habilitar la función de omitir la validación para asegurarse de que el área de trabajo pueda tener acceso a los datos.If your data is behind a virtual network, you need to enable the skip the validation function to ensure that the workspace can access your data. Para obtener más información, consulte Uso de Azure Machine Learning en una red virtual de Azure.For more information, see Use Azure Machine Learning studio in an Azure virtual network.
    4. Seleccione Examinar para cargar el archivo de datos del conjunto de datos.Select Browse to upload the data file for your dataset.

    5. Revise el formulario Settings and preview (Configuración y vista previa) para ver que todo está correcto.Review the Settings and preview form for accuracy. El formulario se rellena de forma inteligente según el tipo de archivo.The form is intelligently populated based on the file type.

      CampoField DescripciónDescription
      Formato de archivoFile format Define el diseño y el tipo de datos almacenados en un archivo.Defines the layout and type of data stored in a file.
      DelimitadorDelimiter Uno o más caracteres para especificar el límite entre regiones independientes en texto sin formato u otros flujos de datos.One or more characters for specifying the boundary between separate, independent regions in plain text or other data streams.
      EncodingEncoding Identifica qué tabla de esquema de bit a carácter se va a usar para leer el conjunto de elementos.Identifies what bit to character schema table to use to read your dataset.
      Encabezados de columnaColumn headers Indica cómo se tratarán los encabezados del conjunto de datos, si existen.Indicates how the headers of the dataset, if any, will be treated.
      Omitir filasSkip rows Indica el número de filas, si hay alguna, que se omiten en el conjunto de datos.Indicates how many, if any, rows are skipped in the dataset.

      Seleccione Next (Siguiente).Select Next.

    6. El formulario Esquema se rellena de forma inteligente en función de las selecciones realizadas en el formulario Settings and preview (Configuración y vista previa).The Schema form is intelligently populated based on the selections in the Settings and preview form. Aquí se configura el tipo de datos para cada columna, se revisan los nombres de columna y se seleccionan las columnas que no se van a incluir en el experimento.Here configure the data type for each column, review the column names, and select which columns to Not include for your experiment.

      Seleccione Siguiente.Select Next.

    7. En el formulario Confirmar detalles se muestra un resumen de la información que se ha rellenado anteriormente en los formularios Información básica y Settings and preview (Configuración y vista previa).The Confirm details form is a summary of the information previously populated in the Basic info and Settings and preview forms. También tiene la opción de crear un perfil de datos para el conjunto de datos mediante un proceso habilitado para la generación de perfiles.You also have the option to create a data profile for your dataset using a profiling enabled compute. Más información acerca de la generación de perfiles de datos.Learn more about data profiling.

      Seleccione Next (Siguiente).Select Next.

  3. Seleccione el conjunto de datos recién creado cuando aparezca.Select your newly created dataset once it appears. También puede ver una vista previa del conjunto de datos y las estadísticas de ejemplo.You are also able to view a preview of the dataset and sample statistics.

  4. En el formulario Configurar ejecución, seleccione Crear nuevo y escriba Tutorial-automl-deploy para el nombre del experimento.On the Configure run form, select Create new and enter Tutorial-automl-deploy for the experiment name.

  5. Seleccione una columna de destino; esta es la columna en la que realizará las predicciones.Select a target column; this is the column that you would like to do predictions on.

  6. Seleccione un proceso para la generación de perfiles de los datos y el trabajo de entrenamiento.Select a compute for the data profiling and training job. Hay una lista de los procesos existentes disponible en la lista desplegable.A list of your existing computes is available in the dropdown. Para crear un nuevo proceso, siga las instrucciones del paso 7.To create a new compute, follow the instructions in step 7.

  7. Seleccione Create a new compute (Crear un proceso) para configurar el contexto del proceso de este experimento.Select Create a new compute to configure your compute context for this experiment.

    CampoField DescripciónDescription
    Nombre del procesoCompute name Escriba un nombre único que identifique el contexto del proceso.Enter a unique name that identifies your compute context.
    Prioridad de la máquina virtualVirtual machine priority Las máquinas virtuales de prioridad baja son más económicas, pero no garantizan nodos de proceso.Low priority virtual machines are cheaper but don't guarantee the compute nodes.
    Tipo de máquina virtualVirtual machine type Seleccione la CPU o GPU para el tipo de máquina virtual.Select CPU or GPU for virtual machine type.
    Tamaño de la máquina virtualVirtual machine size Seleccione el tamaño de la máquina virtual para el proceso.Select the virtual machine size for your compute.
    Nodos mín./máx.Min / Max nodes Para generar perfiles de datos, debe especificar uno o más nodos.To profile data, you must specify 1 or more nodes. escriba el número máximo de nodos para el proceso.Enter the maximum number of nodes for your compute. El valor predeterminado es seis nodos para un proceso de AML.The default is 6 nodes for an AML Compute.
    Configuración avanzadaAdvanced settings Esta configuración le permite configurar una cuenta de usuario y una red virtual existente para el experimento.These settings allow you to configure a user account and existing virtual network for your experiment.

    Seleccione Crear.Select Create. La creación de un nuevo proceso puede tardar unos minutos.Creation of a new compute can take a few minutes.

    Nota

    Su nombre de proceso indicará si el proceso que selecciona o crea admite la generación de perfiles .Your compute name will indicate if the compute you select/create is profiling enabled. (Consulte la sección sobre la generación de perfiles de los datos para más detalles ).(See the section data profiling for more details).

    Seleccione Next (Siguiente).Select Next.

  8. En el formulario Task type and settings (Tipo de tarea y configuración), seleccione el tipo de tarea: clasificación, regresión o previsión.On the Task type and settings form, select the task type: classification, regression, or forecasting. Para más información, vea los tipos de tareas admitidos.See supported task types for more information.

    1. Para classification (clasificación), también puede habilitar el aprendizaje profundo.For classification, you can also enable deep learning.

      Si el aprendizaje profundo está habilitado, la validación se limita a train_validation split.If deep learning is enabled, validation is limited to train_validation split. Obtenga más información sobre las opciones de validación.Learn more about validation options.

    2. Para la previsión, puede:For forecasting you can,

      1. Habilitar el aprendizaje profundo.Enable deep learning.

      2. Seleccionar la columna de tiempo: esta columna contiene los datos de tiempo que desea usar.Select time column: This column contains the time data to be used.

      3. Seleccionar el horizonte de previsión: Indique cuántas unidades de tiempo (minutos, horas, días, semanas, meses o años) será capaz predecir el modelo en el futuro.Select forecast horizon: Indicate how many time units (minutes/hours/days/weeks/months/years) will the model be able to predict to the future. Cuanto más se exija al modelo que prediga en el futuro, menos preciso será.The further the model is required to predict into the future, the less accurate it will become. Más información sobre la previsión y el horizonte de previsión.Learn more about forecasting and forecast horizon.

  9. (Opcional) Ver el apartado sobre la adición de configuraciones: opciones de configuración adicionales que puede usar para controlar mejor el trabajo de entrenamiento.(Optional) View addition configuration settings: additional settings you can use to better control the training job. De lo contrario, los valores predeterminados se aplican en función de la selección y los datos del experimento.Otherwise, defaults are applied based on experiment selection and data.

    Configuraciones adicionalesAdditional configurations DescripciónDescription
    Métrica principalPrimary metric Métrica principal usada para puntuar el modelo.Main metric used for scoring your model. Más información sobre las métricas del modelo.Learn more about model metrics.
    Explicación del mejor modeloExplain best model Seleccione esta opción para habilitar o deshabilitar la visualización de explicaciones del mejor modelo recomendado.Select to enable or disable, in order to show explanations for the recommended best model.
    Esta funcionalidad no está disponible actualmente para algunos algoritmos de previsión.This functionality is not currently available for certain forecasting algorithms.
    Blocked algorithms (Algoritmos bloqueados)Blocked algorithm Seleccione los algoritmos que desea excluir del trabajo de entrenamiento.Select algorithms you want to exclude from the training job.

    La opción para permitir los algoritmos solo está disponible para los experimentos de SDK.Allowing algorithms is only available for SDK experiments.
    Vea los modelos admitidos para cada tipo de tarea.See the supported models for each task type.
    Criterios de exclusiónExit criterion Cuando se cumple alguno de estos criterios, se detiene el trabajo de entrenamiento.When any of these criteria are met, the training job is stopped.
    Tiempo de trabajo de entrenamiento (horas) : cantidad de tiempo para permitir que el trabajo de entrenamiento se ejecute.Training job time (hours): How long to allow the training job to run.
    Metric score threshold (Umbral de puntuación de métrica): puntuación mínima de métrica para todas las canalizaciones.Metric score threshold: Minimum metric score for all pipelines. Esto garantiza que si tiene una métrica objetivo definida que desee alcanzar, no dedicará más tiempo en el trabajo de entrenamiento que el necesario.This ensures that if you have a defined target metric you want to reach, you do not spend more time on the training job than necessary.
    ValidaciónValidation Seleccione una de las opciones de validación cruzada en el trabajo de entrenamiento.Select one of the cross validation options to use in the training job.
    Más información sobre la validación cruzada.Learn more about cross validation.

    La previsión solo admite la validación cruzada de k iteraciones.Forecasting only supports k-fold cross validation.
    SimultaneidadConcurrency Número máximo de iteraciones simultáneas: número máximo de canalizaciones (iteraciones) para probar en el trabajo de entrenamiento.Max concurrent iterations: Maximum number of pipelines (iterations) to test in the training job. El trabajo no ejecutará más iteraciones que el número especificado de ellas.The job will not run more than the specified number of iterations. Más información sobre el modo en que el aprendizaje automático automatizado realiza múltiples ejecuciones secundarias en los clústeres.Learn more about how automated ML performs multiple child runs on clusters.
  10. (Opcional) Consulte la configuración de caracterización: Si decide habilitar Caracterización automática en el formulario Ver configuración de caracterización, se aplican las técnicas de caracterización predeterminadas.(Optional) View featurization settings: if you choose to enable Automatic featurization in the Additional configuration settings form, default featurization techniques are applied. En Ver configuración de caracterización puede cambiar estos valores predeterminados y personalizarlos según corresponda.In the View featurization settings you can change these defaults and customize accordingly. Obtenga información sobre cómo personalizar las caracterizaciones.Learn how to customize featurizations.

    Captura de pantalla que muestra el cuadro de diálogo Select task type (Seleccionar tipo de tarea) con la opción View featurization settings (Ver configuración de caracterización) seleccionada.

Personalización de la caracterizaciónCustomize featurization

En el formulario Caracterización, puede habilitar o deshabilitar la caracterización automática y personalizar la configuración de caracterización automática para su experimento.In the Featurization form, you can enable/disable automatic featurization and customize the automatic featurization settings for your experiment. Para abrir este formulario, consulte el paso 10 de la sección Creación y ejecución de un experimento.To open this form, see step 10 in the Create and run experiment section.

En la tabla siguiente se resumen las personalizaciones disponibles actualmente a través de Studio.The following table summarizes the customizations currently available via the studio.

ColumnaColumn PersonalizaciónCustomization
Se incluyeIncluded Especifica las columnas que se van a incluir para el entrenamiento.Specifies which columns to include for training.
Tipo de característicaFeature type Cambia el tipo de valor de la columna seleccionada.Change the value type for the selected column.
Imputar conImpute with Selecciona el valor con los cuales imputar los valores que faltan en los datos.Select what value to impute missing values with in your data.

Ingeniería de características personalizadas de Azure Machine Learning

Ejecución del experimento y visualización de los resultadosRun experiment and view results

Para ejecutar el experimento, seleccione Finalizar.Select Finish to run your experiment. El proceso de preparación del experimento puede tardar hasta 10 minutos.The experiment preparing process can take up to 10 minutes. Los trabajos de entrenamiento pueden tardar de 2 a 3 minutos más para que cada canalización termine de ejecutarse.Training jobs can take an additional 2-3 minutes more for each pipeline to finish running.

Nota

Los algoritmos que el aprendizaje automático automatizado emplea llevan inherente la aleatoriedad, que puede provocar una ligera variación en la puntuación de las métricas finales del modelo recomendado, como la precisión.The algorithms automated ML employs have inherent randomness that can cause slight variation in a recommended model's final metrics score, like accuracy. El aprendizaje automático automatizado también realiza operaciones en datos, como la división de la prueba de entrenamiento, la división de la validación de entrenamiento o la validación cruzada cuando es necesario.Automated ML also performs operations on data such as train-test split, train-validation split or cross-validation when necessary. Por lo tanto, si ejecuta un experimento con las mismas opciones de configuración y métricas principales varias veces, es probable que vea una variación en las puntuaciones de las métricas finales de los experimentos debido a estos factores.So if you run an experiment with the same configuration settings and primary metric multiple times, you'll likely see variation in each experiments final metrics score due to these factors.

Visualización de los detalles del experimentoView experiment details

Se abre la pantalla Detalles de ejecución en la pestaña Detalles. En esta pantalla se muestra un resumen de la ejecución del experimento, incluida una barra de estado en la parte superior, junto al número de ejecución.The Run Detail screen opens to the Details tab. This screen shows you a summary of the experiment run including a status bar at the top next to the run number.

La pestaña Modelos contiene una lista de los modelos creados ordenados por la puntuación de la métrica.The Models tab contains a list of the models created ordered by the metric score. De forma predeterminada, el modelo que puntúa más alto en función de las métricas seleccionadas aparece en la parte superior de la lista.By default, the model that scores the highest based on the chosen metric is at the top of the list. A medida que el trabajo de entrenamiento prueba más modelos, se agregan a la lista.As the training job tries out more models, they are added to the list. Utilice esto para obtener una comparación rápida de las métricas para los modelos generados hasta ahora.Use this to get a quick comparison of the metrics for the models produced so far.

Detalles de la ejecución

Ver detalles de ejecución del entrenamientoView training run details

Explore en profundidad los modelos completados para ver los detalles de la ejecución de entrenamiento, como un resumen del modelo en la pestaña Modelo o gráficos de métricas de rendimiento en la pestaña Métricas. Más información sobre los gráficos.Drill down on any of the completed models to see training run details, like a model summary on the Model tab or performance metric charts on the Metrics tab. Learn more about charts.

Detalles de la iteraciónIteration details

Implementación del modeloDeploy your model

Una vez que tenga a mano el mejor modelo, es el momento de implementarlo como un servicio web para predecir los datos nuevos.Once you have the best model at hand, it is time to deploy it as a web service to predict on new data.

ML automatizado le ayuda a implementar el modelo sin escribir código:Automated ML helps you with deploying the model without writing code:

  1. Tiene unas par de opciones de implementación.You have a couple options for deployment.

    • Opción 1: implementar el mejor modelo, según los criterios de métricas que haya definido.Option 1: Deploy the best model, according to the metric criteria you defined.

      1. Una vez finalizado el experimento, vaya a la página de ejecución primaria seleccionando Ejecución 1 en la parte superior de la pantalla.After the experiment is complete, navigate to the parent run page by selecting Run 1 at the top of the screen.
      2. Seleccione el modelo que aparece en la sección Mejor resumen del modelo.Select the model listed in the Best model summary section.
      3. Seleccione Implementar en la parte superior izquierda de la ventana.Select Deploy on the top left of the window.
    • Opción 2: implementar una iteración del modelo específica de este experimento.Option 2: To deploy a specific model iteration from this experiment.

      1. Seleccione el modelo que quiera en la pestaña Modelos.Select the desired model from the Models tab
      2. Seleccione Implementar en la parte superior izquierda de la ventana.Select Deploy on the top left of the window.
  2. Rellene el panel Implementar modelo.Populate the Deploy model pane.

    CampoField ValueValue
    NombreName Escriba un nombre único para la implementación.Enter a unique name for your deployment.
    DescripciónDescription Escriba una descripción para saber mejor para qué sirve esta implementación.Enter a description to better identify what this deployment is for.
    Compute type (Tipo de proceso)Compute type Seleccione el tipo de punto de conexión que desea implementar: Azure Kubernetes Service (AKS) o Azure Container Instance (ACI) .Select the type of endpoint you want to deploy: Azure Kubernetes Service (AKS) or Azure Container Instance (ACI).
    Nombre del procesoCompute name Solo se aplica a AKS: Seleccione el nombre del clúster de AKS en que desea realizar la implementación.Applies to AKS only: Select the name of the AKS cluster you wish to deploy to.
    Enable authentication (Habilitar autenticación)Enable authentication Seleccione esta opción para permitir la autenticación basada en token o basada en clave.Select to allow for token-based or key-based authentication.
    Use custom deployment assets (Usar recursos de implementación personalizados)Use custom deployment assets Habilite esta característica si desea cargar su propio archivo de entorno y script de puntuación.Enable this feature if you want to upload your own scoring script and environment file. Más información sobre los scripts de puntuación.Learn more about scoring scripts.

    Importante

    Los nombres de archivo deben tener menos de 32 caracteres y deben comenzar y terminar con caracteres alfanuméricos.File names must be under 32 characters and must begin and end with alphanumerics. Puede incluir guiones, caracteres de subrayado, puntos y caracteres alfanuméricos.May include dashes, underscores, dots, and alphanumerics between. No se permiten espacios.Spaces are not allowed.

    El menú Avanzado ofrece características de implementación predeterminadas como la recopilación de datos y la configuración del uso de recursos.The Advanced menu offers default deployment features such as data collection and resource utilization settings. Si desea reemplazar estos valores predeterminados, hágalo en este menú.If you wish to override these defaults do so in this menu.

  3. Seleccione Implementar.Select Deploy. La implementación puede tardar unos 20 minutos en completarse.Deployment can take about 20 minutes to complete. Una vez iniciada la implementación, aparece la pestaña Resumen del modelo.Once deployment begins, the Model summary tab appears. Consulte el progreso de la implementación en la sección Estado de implementación.See the deployment progress under the Deploy status section.

Ya tiene un servicio web operativo para generar predicciones.Now you have an operational web service to generate predictions! Puede probar las predicciones consultando el servicio de soporte técnico de Azure Machine Learning de Power BI.You can test the predictions by querying the service from Power BI's built in Azure Machine Learning support.

Pasos siguientesNext steps