Migración del registro del SDK v1 a SDK v2

Artículo
01/16/2024

Azure Machine Learning solo usa el seguimiento de MLflow para el registro de métricas y el almacenamiento de artefactos para los experimentos, tanto si los ha creado a través del SDK de Python de Azure Machine Learning, la CLI de Azure Machine Learning o Azure Machine Learning studio. Se recomienda usar MLflow para realizar el seguimiento de experimentos.

Si va a migrar del SDK v1 al SDK v2, use la información de esta sección para comprender los valore equivalentes de MLflow de las API de registro del SDK v1.

¿Por qué MLflow?

MLflow, con más de 13 millones de descargas mensuales, se ha convertido en la plataforma estándar para MLOps de un extremo a otro, lo que permite a los equipos de todos los tamaños realizar un seguimiento, compartir, empaquetar e implementar cualquier modelo para la inferencia por lotes o en tiempo real. Azure Machine Learning se integra con MLflow, lo que permite que tu código de capacitación logre una verdadera portabilidad y una integración perfecta con otras plataformas, ya que no contiene instrucciones específicas de Azure Machine Learning.

Preparación para la migración a MLflow

Para usar el seguimiento de MLflow, debes instalar el paquete SDK de Mlflow mlflow y el complemento Azure Machine Learning para MLflow azureml-mlflow. Todos los entornos de Azure Machine Learning ya tienen estos paquetes disponibles, pero tendrás que incluirlos si crea su propio entorno.

pip install mlflow azureml-mlflow

Conexión con su área de trabajo

Azure Machine Learning permite a los usuarios realizar el seguimiento en trabajos de entrenamiento que se ejecutan en el área de trabajo o ejecutarse de forma remota (seguimiento de experimentos que se ejecutan fuera de Azure Machine Learning). Si realizas el seguimiento remoto, deberás indicar el área de trabajo a la que desea conectar MLflow.

Proceso de Azure Machine Learning
Proceso remoto

Ya está conectado al área de trabajo cuando se ejecuta en el proceso de Azure Machine Learning.

Configurar URI de seguimiento

Obtenga el URI de seguimiento del área de trabajo:
SE APLICA A:Extensión de ML de la CLI de Azure v2 (actual)
1. Inicie sesión y configure el área de trabajo:
```
az account set --subscription <subscription>
az configure --defaults workspace=<workspace> group=<resource-group> location=<location> 
```
2. Puede obtener el URI de seguimiento mediante el comando az ml workspace:
```
az ml workspace show --query mlflow_tracking_uri
```
SE APLICA A: SDK de Python azure-ai-ml v2 (actual)

Puede obtener el URI de seguimiento MLflow en Azure ML con el SDK de Azure Machine Learning v2 para Python. Asegúrese de que tiene instalada la biblioteca azure-ai-ml en el proceso que usa. En el ejemplo siguiente, se obtiene el URI de seguimiento de MLFLow único asociado al área de trabajo.
1. Inicie sesión en el área de trabajo mediante MLClient. La manera más fácil de hacerlo es mediante el archivo de configuración del área de trabajo:
```
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

ml_client = MLClient.from_config(credential=DefaultAzureCredential())
```
  Sugerencia
  
  Puede descargar el archivo de configuración del área de trabajo mediante los pasos siguientes:
  
  Vaya a Estudio de Azure Machine Learning.
  
  Haga clic en la esquina superior derecha de la página -> Descargar archivo de configuración.
  
  Guarde el archivo config.json en el mismo directorio en el que está trabajando.
2. Como alternativa, puede usar el identificador de suscripción, el nombre del grupo de recursos y el nombre del área de trabajo para obtenerlo:
```
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

#Enter details of your AzureML workspace
subscription_id = '<SUBSCRIPTION_ID>'
resource_group = '<RESOURCE_GROUP>'
workspace_name = '<WORKSPACE_NAME>'

ml_client = MLClient(credential=DefaultAzureCredential(),
                        subscription_id=subscription_id, 
                        resource_group_name=resource_group,
                        workspace_name=workspace_name)
```
  Importante
  
  DefaultAzureCredential intentará extraer las credenciales del contexto disponible. Si quiere especificar las credenciales de otra forma (por ejemplo, con el explorador web de forma interactiva), puede usar InteractiveBrowserCredential o cualquier otro método disponible en el paquete azure.identity.
3. Obtención del URI de seguimiento de Azure Machine Learning:
```
mlflow_tracking_uri = ml_client.workspaces.get(ml_client.workspace_name).mlflow_tracking_uri
```
Use el portal de Azure Machine Learning para obtener el URI de seguimiento:
1. Abra el portal de Azure Machine Learning Studio e inicie sesión con sus credenciales.
2. En la esquina superior derecha, haga clic en el nombre del área de trabajo para mostrar la hoja Directorio + Suscripción + Área de trabajo.
3. Haga clic en Ver todas las propiedades en Azure Portal.
4. En la sección Información esencial encontrará la propiedad MLflow tracking URI.
El URI de seguimiento de Azure Machine Learning se puede construir con el id. de suscripción, la región donde está implementado el recurso, el nombre del grupo de recursos y el nombre del área de trabajo. El siguiente ejemplo de código muestra cómo hacerlo:

Advertencia

Si trabaja en un área de trabajo habilitada para vínculo privado, el punto de conexión de MLflow también usará un vínculo privado para comunicarse con Azure Machine Learning. Como consecuencia, el URI de seguimiento tendrá el aspecto diferente que se sugiere aquí. En esos casos, debe obtener el URI de seguimiento mediante el SDK de Azure ML o la CLI v2.
```
region = "<LOCATION>"
subscription_id = '<SUBSCRIPTION_ID>'
resource_group = '<RESOURCE_GROUP>'
workspace_name = '<AML_WORKSPACE_NAME>'

mlflow_tracking_uri = f"azureml://{region}.api.azureml.ms/mlflow/v1.0/subscriptions/{subscription_id}/resourceGroups/{resource_group}/providers/Microsoft.MachineLearningServices/workspaces/{workspace_name}"
```
Configuración del URI de seguimiento:
- Uso de SDK de MKLflow
- Uso de variables de entorno
A continuación, el método set_tracking_uri() apunta el URI de seguimiento de MLflow a ese URI.
```
import mlflow

mlflow.set_tracking_uri(mlflow_tracking_uri)
```
Puede establecer las variables de entorno de MLflow MLFLOW_TRACKING_URI en el proceso para que cualquier interacción con MLflow en ese proceso apunte de forma predeterminada a Azure Machine Learning.
```
MLFLOW_TRACKING_URI=$(az ml workspace show --query mlflow_tracking_uri | sed 's/"//g') 
```
Sugerencia

Al trabajar en entornos compartidos, como un clúster de Azure Databricks, un clúster de Azure Synapse Analytics o similar, resulta útil establecer la variable MLFLOW_TRACKING_URI de entorno en el nivel de clúster para configurar automáticamente el URI de seguimiento de MLflow para que apunte a Azure Machine Learning para todas las sesiones que se ejecutan en el clúster en lugar de hacerlo por sesión.

Configurar la autenticación

Una vez configurado el seguimiento, también deberás configurar cómo se debe realizar la autenticación en el área de trabajo asociada. De forma predeterminada, el complemento de Azure Machine Learning para MLflow realiza la autenticación interactiva abriendo el explorador predeterminado para solicitar las credenciales. Consulte Configuración de MLflow para Azure Machine Learning: Configuración de la autenticación para conocer más formas de configurar la autenticación para MLflow en áreas de trabajo de Azure Machine Learning.

En el caso de los trabajos interactivos en los que hay un usuario conectado a la sesión, puede confiar en la autenticación interactiva y, por tanto, no es necesario realizar ninguna otra acción.

Advertencia

La autenticación interactiva del explorador bloqueará la ejecución del código al solicitar las credenciales. No es una opción adecuada para la autenticación en entornos desatendidos, como trabajos de entrenamiento. Se recomienda configurar otro modo de autenticación.

En aquellos escenarios en los que se requiere la ejecución desatendida, tendrá que configurar una entidad de servicio para comunicarse con Azure Machine Learning.

MLflow SDK
Uso de variables de entorno

import os

os.environ["AZURE_TENANT_ID"] = "<AZURE_TENANT_ID>"
os.environ["AZURE_CLIENT_ID"] = "<AZURE_CLIENT_ID>"
os.environ["AZURE_CLIENT_SECRET"] = "<AZURE_CLIENT_SECRET>"

export AZURE_TENANT_ID="<AZURE_TENANT_ID>"
export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>"
export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"

Sugerencia

Al trabajar en entornos compartidos, es aconsejable configurar estas variables de entorno en el proceso. Como procedimiento recomendado, puede administrarlos como secretos en una instancia de Azure Key Vault siempre que sea posible. Por ejemplo, en Azure Databricks puede usar secretos en variables de entorno como se indica a continuación en la configuración del clúster: AZURE_CLIENT_SECRET={{secrets/<scope-name>/<secret-name>}}. Consulte Referencia a un secreto en una variable de entorno para obtener información sobre cómo hacerlo en Azure Databricks o consulte documentación similar en la plataforma.

Experimentos y ejecuciones

SDK v1

from azureml.core import Experiment

# create an Azure Machine Learning experiment and start a run
experiment = Experiment(ws, "create-experiment-sdk-v1")
azureml_run = experiment.start_logging()

SDK v2 con MLflow

# Set the MLflow experiment and start a run
mlflow.set_experiment("logging-with-mlflow")
mlflow_run = mlflow.start_run()

Comparación de API de registro

Registro de una métrica de tipo entero o float

SDK v1

azureml_run.log("sample_int_metric", 1)

SDK v2 con MLflow

mlflow.log_metric("sample_int_metric", 1)

Registro de un valor booleano

SDK v1

azureml_run.log("sample_boolean_metric", True)

SDK v2 con MLflow

mlflow.log_metric("sample_boolean_metric", 1)

Registro de una métrica de cadena

SDK v1

azureml_run.log("sample_string_metric", "a_metric")

SDK v2 con MLflow

mlflow.log_text("sample_string_text", "string.txt")

La cadena se registra como un artefacto, no como una métrica. En Estudio de Azure Machine Learning, el valor se muestra en la pestaña Salidas y registros.

Registro de una imagen en un archivo PNG o JPEG

SDK v1

azureml_run.log_image("sample_image", path="Azure.png")

SDK v2 con MLflow

mlflow.log_artifact("Azure.png")

La imagen se registra como un artefacto y aparece en la pestaña Imágenes de Estudio de Azure Machine Learning.

Registro de un elemento matplotlib.pyplot

SDK v1

import matplotlib.pyplot as plt

plt.plot([1, 2, 3])
azureml_run.log_image("sample_pyplot", plot=plt)

SDK v2 con MLflow

import matplotlib.pyplot as plt

plt.plot([1, 2, 3])
fig, ax = plt.subplots()
ax.plot([0, 1], [2, 3])
mlflow.log_figure(fig, "sample_pyplot.png")

La imagen se registra como un artefacto y aparece en la pestaña Imágenes de Estudio de Azure Machine Learning.

Registro de una lista de métricas

SDK v1

list_to_log = [1, 2, 3, 2, 1, 2, 3, 2, 1]
azureml_run.log_list('sample_list', list_to_log)

SDK v2 con MLflow

list_to_log = [1, 2, 3, 2, 1, 2, 3, 2, 1]
from mlflow.entities import Metric
from mlflow.tracking import MlflowClient
import time

metrics = [Metric(key="sample_list", value=val, timestamp=int(time.time() * 1000), step=0) for val in list_to_log]
MlflowClient().log_batch(mlflow_run.info.run_id, metrics=metrics)

Las métricas aparecen en la pestaña Métricas de Estudio de Azure Machine Learning.
No se admiten los valores de texto.

Registro de una fila de métricas

SDK v1

azureml_run.log_row("sample_table", col1=5, col2=10)

SDK v2 con MLflow

metrics = {"sample_table.col1": 5, "sample_table.col2": 10}
mlflow.log_metrics(metrics)

Las métricas no se representan como una tabla en Estudio de Azure Machine Learning.
No se admiten los valores de texto.
Se registra como un artefacto, no como una métrica.

Registro de una tabla

SDK v1

table = {
"col1" : [1, 2, 3],
"col2" : [4, 5, 6]
}
azureml_run.log_table("table", table)

SDK v2 con MLflow

# Add a metric for each column prefixed by metric name. Similar to log_row
row1 = {"table.col1": 5, "table.col2": 10}
# To be done for each row in the table
mlflow.log_metrics(row1)

# Using mlflow.log_artifact
import json

with open("table.json", 'w') as f:
json.dump(table, f)
mlflow.log_artifact("table.json")

Registra las métricas de cada columna.
Las métricas no se representan como una tabla en Estudio de Azure Machine Learning.
No se admiten los valores de texto.
Se registra como un artefacto, no como una métrica.

Registro de una tabla de precisión

SDK v1

ACCURACY_TABLE = '{"schema_type": "accuracy_table", "schema_version": "v1", "data": {"probability_tables": ' +\
        '[[[114311, 385689, 0, 0], [0, 0, 385689, 114311]], [[67998, 432002, 0, 0], [0, 0, ' + \
        '432002, 67998]]], "percentile_tables": [[[114311, 385689, 0, 0], [1, 0, 385689, ' + \
        '114310]], [[67998, 432002, 0, 0], [1, 0, 432002, 67997]]], "class_labels": ["0", "1"], ' + \
        '"probability_thresholds": [0.52], "percentile_thresholds": [0.09]}}'

azureml_run.log_accuracy_table('v1_accuracy_table', ACCURACY_TABLE)

SDK v2 con MLflow

ACCURACY_TABLE = '{"schema_type": "accuracy_table", "schema_version": "v1", "data": {"probability_tables": ' +\
        '[[[114311, 385689, 0, 0], [0, 0, 385689, 114311]], [[67998, 432002, 0, 0], [0, 0, ' + \
        '432002, 67998]]], "percentile_tables": [[[114311, 385689, 0, 0], [1, 0, 385689, ' + \
        '114310]], [[67998, 432002, 0, 0], [1, 0, 432002, 67997]]], "class_labels": ["0", "1"], ' + \
        '"probability_thresholds": [0.52], "percentile_thresholds": [0.09]}}'

mlflow.log_dict(ACCURACY_TABLE, 'mlflow_accuracy_table.json')

Las métricas no se representan como una tabla de precisión en Estudio de Azure Machine Learning.
Se registra como un artefacto, no como una métrica.
El método mlflow.log_dict es experimental.

Registro de una matriz de confusión

SDK v1

CONF_MATRIX = '{"schema_type": "confusion_matrix", "schema_version": "v1", "data": {"class_labels": ' + \
    '["0", "1", "2", "3"], "matrix": [[3, 0, 1, 0], [0, 1, 0, 1], [0, 0, 1, 0], [0, 0, 0, 1]]}}'

azureml_run.log_confusion_matrix('v1_confusion_matrix', json.loads(CONF_MATRIX))

SDK v2 con MLflow

CONF_MATRIX = '{"schema_type": "confusion_matrix", "schema_version": "v1", "data": {"class_labels": ' + \
    '["0", "1", "2", "3"], "matrix": [[3, 0, 1, 0], [0, 1, 0, 1], [0, 0, 1, 0], [0, 0, 0, 1]]}}'

mlflow.log_dict(CONF_MATRIX, 'mlflow_confusion_matrix.json')

Las métricas no se representan como una matriz de confusión en Estudio de Azure Machine Learning.
Se registra como un artefacto, no como una métrica.
El método mlflow.log_dict es experimental.

Registro de predicciones

SDK v1

PREDICTIONS = '{"schema_type": "predictions", "schema_version": "v1", "data": {"bin_averages": [0.25,' + \
    ' 0.75], "bin_errors": [0.013, 0.042], "bin_counts": [56, 34], "bin_edges": [0.0, 0.5, 1.0]}}'

azureml_run.log_predictions('test_predictions', json.loads(PREDICTIONS))

SDK v2 con MLflow

PREDICTIONS = '{"schema_type": "predictions", "schema_version": "v1", "data": {"bin_averages": [0.25,' + \
    ' 0.75], "bin_errors": [0.013, 0.042], "bin_counts": [56, 34], "bin_edges": [0.0, 0.5, 1.0]}}'

mlflow.log_dict(PREDICTIONS, 'mlflow_predictions.json')

Las métricas no se representan como una matriz de confusión en Estudio de Azure Machine Learning.
Se registra como un artefacto, no como una métrica.
El método mlflow.log_dict es experimental.

Registro de valores residuales

SDK v1

RESIDUALS = '{"schema_type": "residuals", "schema_version": "v1", "data": {"bin_edges": [100, 200, 300], ' + \
'"bin_counts": [0.88, 20, 30, 50.99]}}'

azureml_run.log_residuals('test_residuals', json.loads(RESIDUALS))

SDK v2 con MLflow

RESIDUALS = '{"schema_type": "residuals", "schema_version": "v1", "data": {"bin_edges": [100, 200, 300], ' + \
'"bin_counts": [0.88, 20, 30, 50.99]}}'

mlflow.log_dict(RESIDUALS, 'mlflow_residuals.json')

Las métricas no se representan como una matriz de confusión en Estudio de Azure Machine Learning.
Se registra como un artefacto, no como una métrica.
El método mlflow.log_dict es experimental.

Visualización de la información y los datos de ejecución

Puede acceder a la información de ejecución mediante las propiedades data y info del objeto de ejecución de MLflow (mlflow.entities.Run).

Sugerencia

La información de seguimiento de experimentos y ejecuciones en Azure Machine Learning se puede consultar mediante MLflow, que proporciona una API de búsqueda integral para consultar y buscar experimentos y ejecuciones fácilmente, y comparar resultados rápidamente. Para obtener más información sobre todas las funcionalidades de MLflow en esta dimensión, consulte Query & compare experiments and runs with MLflow (Consulta y comparación de experimentos y ejecuciones con MLflow).

En el ejemplo siguiente se muestra cómo recuperar una ejecución finalizada:

from mlflow.tracking import MlflowClient

# Use MlFlow to retrieve the run that was just completed
client = MlflowClient()
finished_mlflow_run = MlflowClient().get_run("<RUN_ID>")

En el ejemplo siguiente se muestra cómo ver los elementos metrics, tags y params:

metrics = finished_mlflow_run.data.metrics
tags = finished_mlflow_run.data.tags
params = finished_mlflow_run.data.params

Nota:

metrics solo tendrá el valor que se haya registrado más recientemente en una métrica determinada. Por ejemplo, si inicia sesión según el orden de los valores 1, 2, 3 y, por último, 4 en una métrica denominada sample_metric, solo 4 estará presente en el diccionario metrics. Para obtener todas las métricas registradas en una métrica con nombre específica, use MlFlowClient.get_metric_history:

with mlflow.start_run() as multiple_metrics_run:
    mlflow.log_metric("sample_metric", 1)
    mlflow.log_metric("sample_metric", 2)
    mlflow.log_metric("sample_metric", 3)
    mlflow.log_metric("sample_metric", 4)

print(client.get_run(multiple_metrics_run.info.run_id).data.metrics)
print(client.get_metric_history(multiple_metrics_run.info.run_id, "sample_metric"))

Para obtener más información, consulte la referencia MlFlowClient.

El campo info proporciona información general sobre la ejecución, como la hora de inicio, el id. de ejecución, el id.de experimento, etc.:

run_start_time = finished_mlflow_run.info.start_time
run_experiment_id = finished_mlflow_run.info.experiment_id
run_id = finished_mlflow_run.info.run_id

Visualización de artefactos de ejecución

Para ver los artefactos de una ejecución, puede usar MlFlowClient.list_artifacts:

client.list_artifacts(finished_mlflow_run.info.run_id)

Para descargar un artefacto, usa MlFlowClient.download_artifacts:

mlflow.artifacts.download_artifacts(run_id=finished_mlflow_run.info.run_id, artifact_path="Azure.png")

Migración del registro del SDK v1 a SDK v2

¿Por qué MLflow?

Preparación para la migración a MLflow

Conexión con su área de trabajo

Experimentos y ejecuciones

Comparación de API de registro

Registro de una métrica de tipo entero o float

Registro de un valor booleano

Registro de una métrica de cadena

Registro de una imagen en un archivo PNG o JPEG

Registro de un elemento matplotlib.pyplot

Registro de una lista de métricas

Registro de una fila de métricas

Registro de una tabla

Registro de una tabla de precisión

Registro de una matriz de confusión

Registro de predicciones

Registro de valores residuales

Visualización de la información y los datos de ejecución

Visualización de artefactos de ejecución

Pasos siguientes

Recursos adicionales