Tutorial: Predicción del precio de un automóvil con el diseñadorTutorial: Predict automobile price with the designer

En este tutorial de dos partes aprenderá a usar el diseñador de Azure Machine Learning para entrenar e implementar un modelo de Machine Learning que predice el precio de cualquier automóvil.In this two-part tutorial, you learn how to use the Azure Machine Learning designer to train and deploy a machine learning model that predicts the price of any car. El diseñador es una herramienta de arrastrar y colocar que le permite crear modelos de Machine Learning sin una sola línea de código.The designer is a drag-and-drop tool that lets you create machine learning models without a single line of code.

En la primera parte del tutorial, aprenderá a:In part one of the tutorial, you'll learn how to:

  • Crear una canalización.Create a new pipeline.
  • Importar datos.Import data.
  • Preparar los datos.Prepare data.
  • Entrenar un modelo de Machine Learning.Train a machine learning model.
  • Evaluar un modelo de Machine Learning.Evaluate a machine learning model.

En la segunda parte del tutorial implementará el modelo como punto de conexión de inferencia en tiempo real para predecir el precio de cualquier automóvil en función de las especificaciones técnicas que envíe.In part two of the tutorial, you'll deploy your model as a real-time inferencing endpoint to predict the price of any car based on technical specifications you send it.

Nota

Está disponible una versión completa de este tutorial como una canalización de ejemplo.A completed version of this tutorial is available as a sample pipeline.

Para encontrarla, vaya al diseñador del área de trabajo.To find it, go to the designer in your workspace. En la sección Nueva canalización, seleccione Sample 1 - Regression: Automobile Price Prediction (Basic) (Ejemplo 1 - Regresión: predicción del precio de automóviles [básica])In the New pipeline section, select Sample 1 - Regression: Automobile Price Prediction(Basic).

Importante

Si no ve los elementos gráficos que se mencionan en este documento, como los botones en Studio o en el diseñador, es posible que no tenga el nivel de permisos adecuado para el área de trabajo.If you do not see graphical elements mentioned in this document, such as buttons in studio or designer, you may not have the right level of permissions to the workspace. Póngase en contacto con el administrador de suscripciones de Azure para verificar que se le ha concedido el nivel de acceso correcto.Please contact your Azure subscription administrator to verify that you have been granted the correct level of access. Para obtener más información, consulte Administración de usuarios y roles.For more information, see Manage users and roles.

Creación de una canalizaciónCreate a new pipeline

Las canalizaciones de Azure Machine Learning organizan varios pasos de aprendizaje automático y procesamiento de datos en un único recurso.Azure Machine Learning pipelines organize multiple machine learning and data processing steps into a single resource. Las canalizaciones permiten organizar, administrar y reutilizar flujos de trabajo de aprendizaje automático complejos entre proyectos y usuarios.Pipelines let you organize, manage, and reuse complex machine learning workflows across projects and users.

Para crear una canalización de Azure Machine Learning, necesita un área de trabajo de Azure Machine Learning.To create an Azure Machine Learning pipeline, you need an Azure Machine Learning workspace. En esta sección aprenderá a crear estos dos recursos.In this section, you learn how to create both these resources.

Crear un área de trabajoCreate a new workspace

Para usar el diseñador, necesita un área de trabajo de Azure Machine Learning.You need an Azure Machine Learning workspace to use the designer. El área de trabajo es el recurso de nivel superior de Azure Machine Learning y proporciona un lugar centralizado para trabajar con todos los artefactos que crea con Azure Machine Learning.The workspace is the top-level resource for Azure Machine Learning, it provides a centralized place to work with all the artifacts you create in Azure Machine Learning. Para más información sobre cómo crear un área de trabajo, consulte Creación y administración de áreas de trabajo de Azure Machine Learning.For instruction on creating a workspace, see Create and manage Azure Machine Learning workspaces.

Nota

Si el área de trabajo utiliza una red virtual, hay pasos de configuración adicionales que debe realizar para usar el diseñador.If your workspace uses a Virtual network, there are additional configuration steps you must use to use the designer. Para más información, consulte el artículo sobre el uso de Azure Machine Learning Studio en una red virtual de Azure.For more information, see Use Azure Machine Learning studio in an Azure virtual network

Creación de la canalizaciónCreate the pipeline

  1. Inicie sesión en ml.azure.com y seleccione el área de trabajo con la que quiere trabajar.Sign in to ml.azure.com, and select the workspace you want to work with.

  2. Seleccione Diseñador.Select Designer.

    Captura de pantalla del área de trabajo visual que muestra cómo acceder al diseñador

  3. Seleccione Easy-to-use prebuilt modules (Módulos precompilados fáciles de usar).Select Easy-to-use prebuilt modules.

  4. En la parte superior del lienzo, seleccione el nombre predeterminado de la canalización, Pipeline-Created-on (Canalización creada el).At the top of the canvas, select the default pipeline name Pipeline-Created-on. Cambie el nombre a Automobile price prediction (Predicción del precio de automóviles).Rename it to Automobile price prediction. No es necesario que el nombre sea único.The name doesn't need to be unique.

Configuración del destino de proceso predeterminadoSet the default compute target

Una canalización se ejecuta en un destino de proceso que es un recurso de proceso asociado al área de trabajo.A pipeline runs on a compute target, which is a compute resource that's attached to your workspace. Después de crear un destino de proceso, puede volver a usarlo para futuras ejecuciones.After you create a compute target, you can reuse it for future runs.

Puede establecer un destino de proceso predeterminado para toda la canalización. Este indicará a cada módulo que debe usar el mismo destino de proceso de forma predeterminada.You can set a Default compute target for the entire pipeline, which will tell every module to use the same compute target by default. Sin embargo, puede especificar destinos de proceso por módulo.However, you can specify compute targets on a per-module basis.

  1. Junto al nombre de la canalización, seleccione el icono de engranaje Captura de pantalla del icono de engranaje en la parte superior del lienzo para abrir el panel de configuración.Next to the pipeline name, select the Gear icon Screenshot of the gear icon at the top of the canvas to open the Settings pane.

  2. En el panel de configuración situado a la derecha del lienzo, elija Selección de destino de proceso.In the Settings pane to the right of the canvas, select Select compute target.

    Si ya tiene un destino de proceso disponible, puede seleccionarlo para ejecutar esta canalización.If you already have an available compute target, you can select it to run this pipeline.

    Nota

    El diseñador solo puede ejecutar experimentos de entrenamiento en Proceso de Azure Machine Learning, pero no se mostrarán otros destinos de proceso.The designer can only run training experiments on Azure Machine Learning Compute but other compute targets won't be shown.

  3. Escriba un nombre para el recurso de proceso.Enter a name for the compute resource.

  4. Seleccione Guardar.Select Save.

    Nota

    La creación de un recurso de proceso tarda aproximadamente cinco minutos.It takes approximately five minutes to create a compute resource. Una vez creado el recurso, puede volver a usarlo y eliminar este tiempo de espera en futuras ejecuciones.After the resource is created, you can reuse it and skip this wait time for future runs.

    El recurso de proceso se escala automáticamente a cero nodos cuando está inactivo para ahorrar costes.The compute resource autoscales to zero nodes when it's idle to save cost. Cuando se vuelve a usar después de un retraso, es posible que experimente aproximadamente cinco minutos de tiempo de espera mientras se escala la copia de seguridad.When you use it again after a delay, you might experience approximately five minutes of wait time while it scales back up.

Importar datosImport data

Se incluyen varios conjuntos de datos de ejemplo en el diseñador para que experimente con ellos.There are several sample datasets included in the designer for you to experiment with. En este tutorial, use Automobile price data (Raw) .For this tutorial, use Automobile price data (Raw).

  1. A la izquierda del lienzo de la canalización, hay una paleta de conjuntos de datos y módulos.To the left of the pipeline canvas is a palette of datasets and modules. Seleccione Conjuntos de datos de ejemplo para ver los conjuntos de datos de ejemplo disponibles.Select Sample datasets to view the available sample datasets.

  2. Seleccione el conjunto de datos Automobile price data (Raw) y arrástrelo al lienzo.Select the dataset Automobile price data (Raw), and drag it onto the canvas.

    Arrastrar datos al lienzo

Visualización de los datosVisualize the data

Puede visualizar los datos para comprender el conjunto de datos que va a usar.You can visualize the data to understand the dataset that you'll use.

  1. Haga clic con el botón derecho en Automobile price data (Raw) (Datos de precio del automóvil [sin procesar]) y seleccione Visualizar > Salida del conjunto de datos.Right-click the Automobile price data (Raw) and select Visualize > Dataset output.

  2. Seleccione las diferentes columnas de la ventana de datos para ver información sobre cada una.Select the different columns in the data window to view information about each one.

    Cada fila representa un automóvil y las variables asociadas a cada uno aparecen como columnas.Each row represents an automobile, and the variables associated with each automobile appear as columns. Hay 205 filas y 26 columnas en este conjunto de datos.There are 205 rows and 26 columns in this dataset.

Preparación de los datosPrepare data

Los conjuntos de datos suelen necesitar algún procesamiento previo antes del análisis.Datasets typically require some preprocessing before analysis. Puede que, al inspeccionar el conjunto de datos, haya observado que faltan algunos valores.You might have noticed some missing values when you inspected the dataset. Estos valores que faltan se deben limpiar, para que el modelo pueda analizar los datos de manera adecuada.These missing values must be cleaned so that the model can analyze the data correctly.

Quitar una columnaRemove a column

Al entrenar un modelo, hay que hacer algo con los datos que faltan.When you train a model, you have to do something about the data that's missing. En este conjunto de datos, faltan muchos valores en la columna normalized-losses, por lo que excluiremos toda esa columna del modelo.In this dataset, the normalized-losses column is missing many values, so you will exclude that column from the model altogether.

  1. En la paleta de módulos que se encuentra a la izquierda del lienzo, expanda la sección Transformación de datos y busque el módulo Select Columns in Dataset (Seleccionar columnas del conjunto de datos).In the module palette to the left of the canvas, expand the Data Transformation section and find the Select Columns in Dataset module.

  2. Haga clic y arrastre el módulo Select Columns in Dataset (Seleccionar columnas del conjunto de datos) al lienzo.Drag the Select Columns in Dataset module onto the canvas. Coloque el módulo bajo el módulo del conjunto de datos.Drop the module below the dataset module.

  3. Conecte el conjunto de datos Automobile price data (Raw) al módulo Select Columns in Dataset (Seleccionar columnas del conjunto de datos).Connect the Automobile price data (Raw) dataset to the Select Columns in Dataset module. Arrastre desde el puerto de salida del conjunto de datos, que es el círculo pequeño situado en la parte inferior del conjunto de datos en el lienzo, hasta el puerto de entrada de Select Columns in Dataset (Seleccionar columnas del conjunto de datos), que es el círculo pequeño de la parte superior del módulo.Drag from the dataset's output port, which is the small circle at the bottom of the dataset on the canvas, to the input port of Select Columns in Dataset, which is the small circle at the top of the module.

    Sugerencia

    Puede crear un flujo de datos mediante la canalización si conecta el puerto de salida de un módulo al puerto de entrada de otro.You create a flow of data through your pipeline when you connect the output port of one module to an input port of another.

    Conectar módulos

  4. Seleccione el módulo Select Columns in Dataset.Select the Select Columns in Dataset module.

  5. En el panel de detalles del módulo, situado a la derecha del lienzo, seleccione Editar columna.In the module details pane to the right of the canvas, select Edit column.

  6. Expanda la lista desplegable Nombres de columna situada junto a Incluir y seleccione Todas las columnas.Expand the Column names drop down next to Include, and select All columns.

  7. Seleccione el signo + para agregar una nueva regla.Select the + to add a new rule.

  8. En los menús desplegables, seleccione Excluir y Nombres de columna.From the drop-down menus, select Exclude and Column names.

  9. Escriba normalized-losses en el cuadro de texto.Enter normalized-losses in the text box.

  10. En la esquina inferior derecha, seleccione Save (Guardar) para cerrar el selector de columnas.In the lower right, select Save to close the column selector.

    Excluir una columna

  11. Seleccione el módulo Select Columns in Dataset.Select the Select Columns in Dataset module.

  12. En el panel de detalles del módulo situado a la derecha del lienzo, seleccione el cuadro de texto Comentario y escriba Exclude normalized losses (Excluir normalized-losses).In the module details pane to the right of the canvas, select the Comment text box and enter Exclude normalized losses.

    Los comentarios aparecerán en el gráfico para ayudarle a organizar la canalización.Comments will appear on the graph to help you organize your pipeline.

Limpiar datos que faltanClean missing data

Después de quitar la columna normalized-losses, aún faltan valores en el conjunto de datos.Your dataset still has missing values after you remove the normalized-losses column. Puede quitar el resto de los datos que faltan mediante el módulo Clean Missing Data (Limpiar datos que faltan).You can remove the remaining missing data by using the Clean Missing Data module.

Sugerencia

Un requisito previo para usar la mayoría de los módulos del diseñador es limpiar los valores que faltan.Cleaning the missing values from input data is a prerequisite for using most of the modules in the designer.

  1. En la paleta de módulos que se encuentra a la izquierda del lienzo, expanda la sección Transformación de datos y busque el módulo Clean Missing Data (Limpiar datos que faltan).In the module palette to the left of the canvas, expand the section Data Transformation, and find the Clean Missing Data module.

  2. Arrastre el módulo Clean Missing Data (Limpiar datos que faltan) al lienzo de la canalización.Drag the Clean Missing Data module to the pipeline canvas. Conéctelo al módulo Select Columns in Dataset (Seleccionar columnas del conjunto de datos).Connect it to the Select Columns in Dataset module.

  3. Seleccione el módulo Clean Missing Data (Limpiar datos que faltan).Select the Clean Missing Data module.

  4. En el panel de detalles del módulo, situado a la derecha del lienzo, seleccione Editar columna.In the module details pane to the right of the canvas, select Edit Column.

  5. En la ventana Columns to be cleaned (Columnas que se limpian) que aparece, expanda el menú desplegable situado junto a Include (Incluir).In the Columns to be cleaned window that appears, expand the drop-down menu next to Include. Seleccione All columns (Todas las columnas).Select, All columns

  6. Seleccione Guardar.Select Save

  7. En el panel de detalles del módulo situado a la derecha del lienzo, seleccione Remove entire row (Quitar toda la fila) en Cleaning mode (Modo de limpieza).In the module details pane to the right of the canvas, select Remove entire row under Cleaning mode.

  8. En el panel de detalles del módulo situado a la derecha del lienzo, seleccione el cuadro Comentario y escriba Remove missing value rows (Quitar filas de valores que faltan).In the module details pane to the right of the canvas, select the Comment box, and enter Remove missing value rows.

    La canalización debe parecerse a esta:Your pipeline should now look something like this:

    Selección de columna

Entrenar un modelo de Machine LearningTrain a machine learning model

Ahora que los módulos están listos para procesar los datos, puede configurar los módulos de entrenamiento.Now that you have the modules in place to process the data, you can set up the training modules.

Como lo que se desea es predecir un precio, que es un número, se puede usar un algoritmo de regresión.Because you want to predict price, which is a number, you can use a regression algorithm. En este ejemplo, va a usar un modelo de regresión lineal.For this example, you use a linear regression model.

División de los datosSplit the data

La división de los datos es una tarea común en el aprendizaje automático.Splitting data is a common task in machine learning. Dividirá los datos en dos conjuntos independientes.You will split your data into two separate datasets. Uno de ellos entrenará el modelo, mientras que el otro probará su funcionamiento.One dataset will train the model and the other will test how well the model performed.

  1. En la paleta de módulos, expanda la sección Transformación de datos y busque el módulo Split Data (Dividir datos).In the module palette, expand the section Data Transformation and find the Split Data module.

  2. Arrastre el módulo Split Data (Dividir datos) al lienzo de la canalización.Drag the Split Data module to the pipeline canvas.

  3. Conecte al puerto izquierdo del módulo Clean Missing Data(Limpiar datos que faltan) al módulo Split Data (Dividir datos).Connect the left port of the Clean Missing Data module to the Split Data module.

    Importante

    Asegúrese de que el puerto de salida izquierdo de Clean Missing Data (Limpiar datos que faltan) se conecta a Split Data (Dividir datos).Be sure that the left output ports of Clean Missing Data connects to Split Data. El puerto izquierdo contiene los datos limpios.The left port contains the the cleaned data. El puerto izquierdo contiene los datos descartados.The right port contains the discarted data.

  4. Seleccione el módulo Split Data (Dividir datos).Select the Split Data module.

  5. En el panel de detalles del módulo que se encuentra a la derecha del lienzo, establezca la opción Fraction of rows in the first output dataset (Fracción de filas del primer conjunto de datos de salida) en 0,7.In the module details pane to the right of the canvas, set the Fraction of rows in the first output dataset to 0.7.

    De este modo divide los datos: el 70 % para entrenar el modelo y el 30 % para probarlo.This option splits 70 percent of the data to train the model and 30 percent for testing it. Al conjunto de datos del 70 % se podrá acceder a través del puerto de salida de la izquierda.The 70 percent dataset will be accessible through the left output port. Los restantes datos estarán disponibles a través del puerto de salida derecho.The remaining data will be available through the right output port.

  6. En el panel de detalles del módulo situado a la derecha del lienzo, seleccione el cuadro Comentario y escriba Split the dataset into training set (0.7) and test set (0.3) (Dividir el conjunto de datos en conjunto de entrenamiento [0,7] y conjunto de pruebas [0,3]).In the module details pane to the right of the canvas, select the Comment box, and enter Split the dataset into training set (0.7) and test set (0.3).

Entrenamiento del modeloTrain the model

Para entrenar el modelo, proporciónele un conjunto de datos que incluya el precio.Train the model by giving it a dataset that includes the price. El algoritmo construye un modelo que explica la relación entre las características y el precio presentado por los datos de entrenamiento.The algorithm constructs a model that explains the relationship between the features and the price as presented by the training data.

  1. En la paleta de módulos expanda Machine Learning Algorithms (Algoritmos de aprendizaje automático).In the module palette, expand Machine Learning Algorithms.

    Esta opción muestra varias categorías de módulos que se pueden usar para inicializar algoritmos de aprendizaje.This option displays several categories of modules that you can use to initialize learning algorithms.

  2. Seleccione Regression > Linear Regression (Regresión > Regresión lineal) y arrástrelo al lienzo de la canalización.Select Regression > Linear Regression, and drag it to the pipeline canvas.

  3. En la paleta de módulos, expanda la sección Entrenamiento de módulos y arrastre el módulo Train Model (Entrenar modelo) al lienzo.In the module palette, expand the section Module training, and drag the Train Model module to the canvas.

  4. Conecte la salida del módulo Linear Regression (Regresión lineal) a la entrada izquierda del módulo Train Model (Entrenar modelo).Connect the output of the Linear Regression module to the left input of the Train Model module.

  5. Conecte la salida de datos de entrenamiento (puerto izquierdo) del módulo Dividir datos a la entrada derecha del módulo Entrenar modelo.Connect the training data output (left port) of the Split Data module to the right input of the Train Model module.

    Importante

    Asegúrese de que el puerto de salida izquierdo de Split Data (Dividir datos) se conecta a Train Model (Entrenar modelo).Be sure that the left output ports of Split Data connects to Train Model. El puerto izquierdo contiene el conjunto de entrenamiento.The left port contains the the training set. El puerto derecho contiene el conjunto de prueba.The right port contains the test set.

    Captura de pantalla que muestra la configuración correcta del módulo Train Model (Entrenar modelo). El módulo Linear Regression (Regresión lineal) se conecta al puerto izquierdo del módulo Train Model (Entrenar modelo) y el módulo Split Data (Dividir datos) se conecta al puerto derecho de Train Model (Entrenar modelo).

  6. Seleccione el módulo Train Model (Entrenar modelo).Select the Train Model module.

  7. En el panel de detalles del módulo, situado a la derecha del lienzo, elija el selector Editar columna.In the module details pane to the right of the canvas, select Edit column selector.

  8. En el cuadro de diálogo Label column (Columna de etiqueta), expanda el menú desplegable y seleccione Column names (Nombres de columna).In the Label column dialog box, expand the drop-down menu and select Column names.

  9. En el cuadro de texto, escriba precio para especificar el valor que el modelo va a predecir.In the text box, enter price to specify the value that your model is going to predict.

    Importante

    Asegúrese de escribir exactamente el nombre de la columna.Make sure you enter the column name exactly. No use mayúsculas para el precio.Do not capitalize price.

    La canalización debe ser parecida a esta:Your pipeline should look like this:

    Captura de pantalla que muestra la configuración correcta de la canalización después de agregar el módulo Train Model (Entrenar modelo).

Adición del módulo Score Model (Puntuar modelo)Add the Score Model module

Después de entrenar el modelo con el 70 % de los datos, puede usarlo para puntuar el otro 30 % y ver si el modelo funciona correctamente.After you train your model by using 70 percent of the data, you can use it to score the other 30 percent to see how well your model functions.

  1. Escriba score model en el cuadro de búsqueda para encontrar el módulo Score Model (Puntuar modelo).Enter score model in the search box to find the Score Model module. Arrastre el módulo al lienzo de la canalización.Drag the module to the pipeline canvas.

  2. Conecte la salida del módulo Train Model (Entrenar modelo) al puerto de entrada izquierdo de Score Model (Entrenar modelo).Connect the output of the Train Model module to the left input port of Score Model. Conecte la salida de los datos de prueba (puerto derecho) del módulo Split Data al puerto de entrada derecho de Score Model.Connect the test data output (right port) of the Split Data module to the right input port of Score Model.

Agregar el módulo Evaluate Model (Evaluar modelo)Add the Evaluate Model module

Use el módulo Evaluate Model (Evaluar modelo) para evaluar la puntuación que dio el modelo al conjunto de datos de prueba.Use the Evaluate Model module to evaluate how well your model scored the test dataset.

  1. Escriba evaluate en el cuadro de búsqueda para buscar el módulo Evaluate Model (Evaluar modelo).Enter evaluate in the search box to find the Evaluate Model module. Arrastre el módulo al lienzo de la canalización.Drag the module to the pipeline canvas.

  2. Conecte la salida del módulo Score Model (Puntuar modelo) a la entrada izquierda de Evaluate Model (Evaluar modelo).Connect the output of the Score Model module to the left input of Evaluate Model.

    La canalización final debe parecerse a esta:The final pipeline should look something like this:

    Captura de pantalla que muestra la configuración correcta de la canalización.

Enviar la canalizaciónSubmit the pipeline

Ahora que ya ha configurado la canalización, puede enviar una ejecución de canalización para entrenar el modelo de Machine Learning.Now that your pipeline is all setup, you can submit a pipeline run to train your machine learning model. Puede enviar una ejecución de canalización válida en cualquier momento, que se puede usar para revisar los cambios de la canalización durante el desarrollo.You can submit a valid pipeline run at any point, which can be used to review changes to your pipeline during development.

  1. En la parte superior del lienzo, seleccione Enviar.At the top of the canvas, select Submit.

  2. En el cuadro de diálogo Set up pipeline run (Configurar ejecución de canalización), seleccione Create new (Crear nuevo).In the Set up pipeline run dialog box, select Create new.

    Nota

    Los experimentos agrupan ejecuciones de canalización.Experiments group similar pipeline runs together. Si ejecuta una canalización varias veces, puede seleccionar el mismo experimento para ejecuciones sucesivas.If you run a pipeline multiple times, you can select the same experiment for successive runs.

    1. En Nombre de nuevo experimento, escriba Tutorial-CarPrices.For New experiment Name, enter Tutorial-CarPrices.

    2. Seleccione Submit (Enviar).Select Submit.

    Puede ver el estado y los detalles de la ejecución en la parte superior derecha del lienzo.You can view run status and details at the top right of the canvas.

    Si esta es la primera ejecución, la canalización puede tardar hasta 20 minutos en finalizar la ejecución.If this is the first run, it may take up to 20 minutes for your pipeline to finish running. La configuración del proceso predeterminada tiene un tamaño de nodo mínimo de 0, lo que significa que el diseñador debe asignar recursos después de estar inactivo.The default compute settings have a minimum node size of 0, which means that the designer must allocate resources after being idle. Las ejecuciones de canalización repetidas tardarán menos en terminar, dado que los recursos del proceso ya están asignados.Repeated pipeline runs will take less time since the compute resources are already allocated. Además, el diseñador usa resultados almacenados en la caché en cada módulo para mejorar aún más la eficiencia.Additionally, the designer uses cached results for each module to further improve efficiency.

Visualización de etiquetas con puntuaciónView scored labels

Una vez finalizada la ejecución, puede ver los resultados de la ejecución de la canalización.After the run completes, you can view the results of the pipeline run. En primer lugar, examine las predicciones generadas por el modelo de regresión.First, look at the predictions generated by the regression model.

  1. Haga clic con el botón derecho en el módulo Score Model (Puntuar modelo) y seleccione Visualizar > Scored dataset (Conjunto de datos puntuado) para ver la salida.Right-click the Score Model module, and select Visualize > Scored dataset to view its output.

    Aquí puede ver los precios previstos y los precios reales de los datos de prueba.Here you can see the predicted prices and the actual prices from the testing data.

    Captura de pantalla de la visualización de salida en la que aparece la columna Scored Label (Etiqueta puntuada) resaltada

Evaluación de modelosEvaluate models

Use Evaluate Model (Evaluar modelo) para ver el rendimiento del modelo entrenado en el conjunto de datos de prueba.Use the Evaluate Model to see how well the trained model performed on the test dataset.

  1. Haga clic con el botón derecho en el módulo Evaluate Model (Evaluar modelo) y seleccione Visualizar > Resultados de la evaluación para ver el resultado.Right-click the Evaluate Model module and select Visualize > Evaluation results to view its output.

Se muestran las siguientes estadísticas de su modelo:The following statistics are shown for your model:

  • Desviación media (MAE) : la media de errores absolutos.Mean Absolute Error (MAE): The average of absolute errors. Un error es la diferencia entre el valor previsto y el valor real.An error is the difference between the predicted value and the actual value.
  • Error cuadrático medio (RMSE) : la raíz cuadrada de la media de errores al cuadrado de las predicciones realizadas sobre el conjunto de datos de prueba.Root Mean Squared Error (RMSE): The square root of the average of squared errors of predictions made on the test dataset.
  • Error absoluto relativo: la media de errores absolutos en relación con la diferencia absoluta entre los valores reales y la media de todos los valores reales.Relative Absolute Error: The average of absolute errors relative to the absolute difference between actual values and the average of all actual values.
  • Error al cuadrado relativo: la media de errores al cuadrado en relación con la diferencia al cuadrado entre los valores reales y la media de todos los valores reales.Relative Squared Error: The average of squared errors relative to the squared difference between the actual values and the average of all actual values.
  • Coeficiente de determinación: conocido también como valor R cuadrado, es una métrica estadística que indica en qué medida se ajusta un modelo a los datos.Coefficient of Determination: Also known as the R squared value, this statistical metric indicates how well a model fits the data.

Para cada una de las estadísticas de errores, cuanto menor sea el valor, mejor.For each of the error statistics, smaller is better. Un valor inferior indica que las predicciones están más próximas a los valores reales.A smaller value indicates that the predictions are closer to the actual values. En el coeficiente de determinación, cuanto más próximo es su valor a uno (1,0), mejores son las predicciones.For the coefficient of determination, the closer its value is to one (1.0), the better the predictions.

Limpieza de recursosClean up resources

Omita esta sección si desea continuar con la parte 2 del tutorial sobre la implementación de modelos.Skip this section if you want to continue on with part 2 of the tutorial, deploying models.

Importante

Los recursos que creó pueden usarse como requisitos previos de otros tutoriales y artículos de procedimientos de Azure Machine Learning.You can use the resources that you created as prerequisites for other Azure Machine Learning tutorials and how-to articles.

Eliminar todo el contenidoDelete everything

Si no va a usar nada de lo que ha creado, elimine el grupo de recursos completo para que no le genere gastos.If you don't plan to use anything that you created, delete the entire resource group so you don't incur any charges.

  1. En Azure Portal, seleccione Grupos de recursos en la parte izquierda de la ventana.In the Azure portal, select Resource groups on the left side of the window.

    Eliminación de un grupo de recursos en Azure Portal

  2. En la lista, seleccione el grupo de recursos que creó.In the list, select the resource group that you created.

  3. Seleccione Eliminar grupo de recursos.Select Delete resource group.

Al eliminar el grupo de recursos también se eliminan todos los recursos que creó en el diseñador.Deleting the resource group also deletes all resources that you created in the designer.

Eliminación de recursos individualesDelete individual assets

En diseñador donde creó el experimento, elimine recursos individuales; para ello, selecciónelos y, luego, haga clic en el botón Eliminar.In the designer where you created your experiment, delete individual assets by selecting them and then selecting the Delete button.

El destino de proceso que ha creado aquí se escala automáticamente a cero nodos cuando no se usa.The compute target that you created here automatically autoscales to zero nodes when it's not being used. Esta acción se lleva a cabo para minimizar los cargos.This action is taken to minimize charges. Si quiere eliminar el destino de proceso, siga estos pasos: If you want to delete the compute target, take these steps:

Eliminación de recursos

Puede anular el registro de los conjuntos de datos del área de trabajo seleccionando cada conjunto de datos y Anular el registro.You can unregister datasets from your workspace by selecting each dataset and selecting Unregister.

Anulación del registro de conjunto de datos

Para eliminar un conjunto de datos, vaya a la cuenta de almacenamiento mediante Azure Portal o el Explorador de Azure Storage y elimine manualmente esos recursos.To delete a dataset, go to the storage account by using the Azure portal or Azure Storage Explorer and manually delete those assets.

Pasos siguientesNext steps

En la segunda parte, aprenderá a implementar el modelo como un punto de conexión en tiempo real.In part two, you'll learn how to deploy your model as a real-time endpoint.