Eseguire la migrazione della registrazione dall'SDK v1 all'SDK v2

Articolo
01/16/2024

Azure Machine Learning usa MLflow Tracking per la registrazione delle metriche e l'archiviazione degli artefatti per gli esperimenti, indipendentemente dal fatto che gli esperimenti siano stati creati tramite Azure Machine Learning Python SDK, l'interfaccia della riga di comando di Azure Machine Learning o studio di Azure Machine Learning. È consigliabile usare MLflow per tenere traccia degli esperimenti.

Se si esegue la migrazione da SDK v1 a SDK v2, usare le informazioni in questa sezione per comprendere gli equivalenti MLflow delle API di registrazione SDK v1.

Perché MLflow?

MLflow, con oltre 13 milioni di download mensili, è diventata la piattaforma standard per MLOps end-to-end, consentendo ai team di tutte le dimensioni di tenere traccia, condividere, creare pacchetti e distribuire qualsiasi modello per l'inferenza batch o in tempo reale. Azure Machine Learning si integra con MLflow, che consente al codice di training di ottenere una vera portabilità e una perfetta integrazione con altre piattaforme, perché non contiene istruzioni specifiche di Azure Machine Learning.

Preparare la migrazione a MLflow

Per usare il rilevamento MLflow, è necessario installare il pacchetto mlflow Mlflow SDK e il plug-in di Azure Machine Learning per MLflow azureml-mlflow. Tutti gli ambienti di Azure Machine Learning dispongono di questi pacchetti già disponibili, ma è necessario includerli se si crea un ambiente personalizzato.

pip install mlflow azureml-mlflow

Connettersi all'area di lavoro

Azure Machine Learning consente agli utenti di eseguire il rilevamento nei processi di training in esecuzione nell'area di lavoro o in esecuzione in remoto (rilevamento degli esperimenti in esecuzione all'esterno di Azure Machine Learning). Se si esegue il rilevamento remoto, è necessario indicare l'area di lavoro a cui si vuole connettere MLflow.

Calcolo di Azure Machine Learning
Calcolo remoto

L'utente è già connesso all'area di lavoro durante l'esecuzione nell'ambiente di calcolo di Azure Machine Learning.

Configurare l'URI di rilevamento

Ottenere l'URI di rilevamento per l'area di lavoro:
SI APPLICA A:Estensione ML dell'interfaccia della riga di comando di Azure v2 (corrente)
1. Accedere e configurare l'area di lavoro:
```
az account set --subscription <subscription>
az configure --defaults workspace=<workspace> group=<resource-group> location=<location> 
```
2. È possibile ottenere l'URI di rilevamento usando il az ml workspace comando :
```
az ml workspace show --query mlflow_tracking_uri
```
SI APPLICA A: Python SDK azure-ai-ml v2 (corrente)

È possibile ottenere l'URI di rilevamento MLflow di Azure ML usando Azure Machine Learning SDK v2 per Python. Assicurarsi di aver installato la libreria azure-ai-ml nell'ambiente di calcolo in uso. L'esempio seguente ottiene l'URI di rilevamento MLFLow univoco associato all'area di lavoro.
1. Accedere all'area di lavoro usando .MLClient Il modo più semplice per eseguire questa operazione consiste nell'usare il file di configurazione dell'area di lavoro:
```
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

ml_client = MLClient.from_config(credential=DefaultAzureCredential())
```
  Suggerimento
  
  È possibile scaricare il file di configurazione dell'area di lavoro tramite:
  
  Passare ad Azure ML Studio
  
  Fare clic sull'angolo superiore destro della pagina -> Scaricare il file di configurazione.
  
  Salvare il file config.json nella stessa directory in cui si sta lavorando.
2. In alternativa, è possibile usare l'ID sottoscrizione, il nome del gruppo di risorse e il nome dell'area di lavoro per ottenerlo:
```
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

#Enter details of your AzureML workspace
subscription_id = '<SUBSCRIPTION_ID>'
resource_group = '<RESOURCE_GROUP>'
workspace_name = '<WORKSPACE_NAME>'

ml_client = MLClient(credential=DefaultAzureCredential(),
                        subscription_id=subscription_id, 
                        resource_group_name=resource_group,
                        workspace_name=workspace_name)
```
  Importante
  
  DefaultAzureCredential tenterà di eseguire il pull delle credenziali dal contesto disponibile. Se si desidera specificare le credenziali in modo diverso, ad esempio usando il Web browser in modo interattivo, è possibile usare InteractiveBrowserCredential o qualsiasi altro metodo disponibile nel azure.identity pacchetto.
3. Ottenere l'URI di rilevamento di Azure Machine Learning:
```
mlflow_tracking_uri = ml_client.workspaces.get(ml_client.workspace_name).mlflow_tracking_uri
```
Usare il portale di Azure Machine Learning per ottenere l'URI di rilevamento:
1. Aprire il portale di studio di Azure Machine Learning e accedere usando le credenziali.
2. Nell'angolo in alto a destra fare clic sul nome dell'area di lavoro per visualizzare il pannello Directory + Sottoscrizione e area di lavoro .
3. Fare clic su Visualizza tutte le proprietà nel portale di Azure.
4. Nella sezione Informazioni di base è disponibile la proprietà MLflow tracking URI.
L'URI di rilevamento di Azure Machine Learning può essere costruito usando l'ID sottoscrizione, l'area in cui viene distribuita la risorsa, il nome del gruppo di risorse e il nome dell'area di lavoro. L'esempio di codice seguente illustra come:

Avviso

Se si usa un'area di lavoro abilitata per il collegamento privato, l'endpoint MLflow userà anche un collegamento privato per comunicare con Azure Machine Learning. Di conseguenza, l'URI di rilevamento sarà diverso come proposto qui. È necessario ottenere l'URI di rilevamento usando Azure ML SDK o l'interfaccia della riga di comando v2 in questi casi.
```
region = "<LOCATION>"
subscription_id = '<SUBSCRIPTION_ID>'
resource_group = '<RESOURCE_GROUP>'
workspace_name = '<AML_WORKSPACE_NAME>'

mlflow_tracking_uri = f"azureml://{region}.api.azureml.ms/mlflow/v1.0/subscriptions/{subscription_id}/resourceGroups/{resource_group}/providers/Microsoft.MachineLearningServices/workspaces/{workspace_name}"
```
Configurazione dell'URI di rilevamento:
- Uso di MLflow SDK
- Uso delle variabili di ambiente
Il metodo set_tracking_uri() punta quindi l'URI di rilevamento MLflow a tale URI.
```
import mlflow

mlflow.set_tracking_uri(mlflow_tracking_uri)
```
È possibile impostare le variabili di ambiente MLflow MLFLOW_TRACKING_URI nel calcolo per eseguire qualsiasi interazione con MLflow in tale calcolo in modo che punti per impostazione predefinita ad Azure Machine Learning.
```
MLFLOW_TRACKING_URI=$(az ml workspace show --query mlflow_tracking_uri | sed 's/"//g') 
```
Suggerimento

Quando si usano ambienti condivisi, ad esempio un cluster di Azure Databricks, un cluster di Azure Synapse Analytics o un cluster simile, è utile impostare la variabile MLFLOW_TRACKING_URI di ambiente a livello di cluster per configurare automaticamente l'URI di rilevamento MLflow in modo che punti ad Azure Machine Learning per tutte le sessioni in esecuzione nel cluster invece di eseguire questa operazione a livello di sessione.

Configurare l'autenticazione

Dopo aver configurato il rilevamento, è anche necessario configurare la modalità di esecuzione dell'autenticazione nell'area di lavoro associata. Per impostazione predefinita, il plug-in di Azure Machine Learning per MLflow esegue l'autenticazione interattiva aprendo il browser predefinito per richiedere le credenziali. Vedere Configurare MLflow per Azure Machine Learning: Configurare l'autenticazione per altri modi per configurare l'autenticazione per MLflow nelle aree di lavoro di Azure Machine Learning.

Per i processi interattivi in cui è presente un utente connesso alla sessione, è possibile basarsi sull'autenticazione interattiva e quindi non è necessaria alcuna azione.

Avviso

L'autenticazione interattiva del browser blocca l'esecuzione del codice quando vengono richieste le credenziali. Non è un'opzione adatta per l'autenticazione in ambienti automatici come i processi di training. È consigliabile configurare altre modalità di autenticazione.

Per questi scenari in cui è necessaria l'esecuzione automatica, è necessario configurare un'entità servizio per comunicare con Azure Machine Learning.

MLflow SDK
Uso delle variabili di ambiente

import os

os.environ["AZURE_TENANT_ID"] = "<AZURE_TENANT_ID>"
os.environ["AZURE_CLIENT_ID"] = "<AZURE_CLIENT_ID>"
os.environ["AZURE_CLIENT_SECRET"] = "<AZURE_CLIENT_SECRET>"

export AZURE_TENANT_ID="<AZURE_TENANT_ID>"
export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>"
export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"

Suggerimento

Quando si lavora su ambienti condivisi, è consigliabile configurare queste variabili di ambiente nel calcolo. Come procedura consigliata, gestirli come segreti in un'istanza di Azure Key Vault quando possibile. Ad esempio, in Azure Databricks è possibile usare i segreti nelle variabili di ambiente come indicato di seguito nella configurazione del cluster: AZURE_CLIENT_SECRET={{secrets/<scope-name>/<secret-name>}}. Vedere Fare riferimento a un segreto in una variabile di ambiente per informazioni su come eseguire questa operazione in Azure Databricks o fare riferimento a una documentazione simile nella piattaforma.

Esperimenti ed esecuzioni

SDK v1

from azureml.core import Experiment

# create an Azure Machine Learning experiment and start a run
experiment = Experiment(ws, "create-experiment-sdk-v1")
azureml_run = experiment.start_logging()

SDK v2 con MLflow

# Set the MLflow experiment and start a run
mlflow.set_experiment("logging-with-mlflow")
mlflow_run = mlflow.start_run()

Confronto tra LE API di registrazione

Registrare un numero intero o una metrica float

SDK v1

azureml_run.log("sample_int_metric", 1)

SDK v2 con MLflow

mlflow.log_metric("sample_int_metric", 1)

Registrare una metrica booleana

SDK v1

azureml_run.log("sample_boolean_metric", True)

SDK v2 con MLflow

mlflow.log_metric("sample_boolean_metric", 1)

Registrare una metrica stringa

SDK v1

azureml_run.log("sample_string_metric", "a_metric")

SDK v2 con MLflow

mlflow.log_text("sample_string_text", "string.txt")

La stringa viene registrata come artefatto, non come metrica. In studio di Azure Machine Learning il valore viene visualizzato nella scheda Output e log.

Registrare un'immagine in un file PNG o JPEG

SDK v1

azureml_run.log_image("sample_image", path="Azure.png")

SDK v2 con MLflow

mlflow.log_artifact("Azure.png")

L'immagine viene registrata come artefatto e viene visualizzata nella scheda Immagini in Azure Machine Learning Studio.

Registrare un file matplotlib.pyplot

SDK v1

import matplotlib.pyplot as plt

plt.plot([1, 2, 3])
azureml_run.log_image("sample_pyplot", plot=plt)

SDK v2 con MLflow

import matplotlib.pyplot as plt

plt.plot([1, 2, 3])
fig, ax = plt.subplots()
ax.plot([0, 1], [2, 3])
mlflow.log_figure(fig, "sample_pyplot.png")

L'immagine viene registrata come artefatto e viene visualizzata nella scheda Immagini in Azure Machine Learning Studio.

Registrare un elenco di metriche

SDK v1

list_to_log = [1, 2, 3, 2, 1, 2, 3, 2, 1]
azureml_run.log_list('sample_list', list_to_log)

SDK v2 con MLflow

list_to_log = [1, 2, 3, 2, 1, 2, 3, 2, 1]
from mlflow.entities import Metric
from mlflow.tracking import MlflowClient
import time

metrics = [Metric(key="sample_list", value=val, timestamp=int(time.time() * 1000), step=0) for val in list_to_log]
MlflowClient().log_batch(mlflow_run.info.run_id, metrics=metrics)

Le metriche vengono visualizzate nella scheda metriche in studio di Azure Machine Learning.
I valori di testo non sono supportati.

Registrare una riga di metriche

SDK v1

azureml_run.log_row("sample_table", col1=5, col2=10)

SDK v2 con MLflow

metrics = {"sample_table.col1": 5, "sample_table.col2": 10}
mlflow.log_metrics(metrics)

Il rendering delle metriche non viene eseguito come tabella in studio di Azure Machine Learning.
I valori di testo non sono supportati.
Registrato come artefatto, non come metrica.

Registrare una tabella

SDK v1

table = {
"col1" : [1, 2, 3],
"col2" : [4, 5, 6]
}
azureml_run.log_table("table", table)

SDK v2 con MLflow

# Add a metric for each column prefixed by metric name. Similar to log_row
row1 = {"table.col1": 5, "table.col2": 10}
# To be done for each row in the table
mlflow.log_metrics(row1)

# Using mlflow.log_artifact
import json

with open("table.json", 'w') as f:
json.dump(table, f)
mlflow.log_artifact("table.json")

Registra le metriche per ogni colonna.
Il rendering delle metriche non viene eseguito come tabella in studio di Azure Machine Learning.
I valori di testo non sono supportati.
Registrato come artefatto, non come metrica.

Registrare una tabella di accuratezza

SDK v1

ACCURACY_TABLE = '{"schema_type": "accuracy_table", "schema_version": "v1", "data": {"probability_tables": ' +\
        '[[[114311, 385689, 0, 0], [0, 0, 385689, 114311]], [[67998, 432002, 0, 0], [0, 0, ' + \
        '432002, 67998]]], "percentile_tables": [[[114311, 385689, 0, 0], [1, 0, 385689, ' + \
        '114310]], [[67998, 432002, 0, 0], [1, 0, 432002, 67997]]], "class_labels": ["0", "1"], ' + \
        '"probability_thresholds": [0.52], "percentile_thresholds": [0.09]}}'

azureml_run.log_accuracy_table('v1_accuracy_table', ACCURACY_TABLE)

SDK v2 con MLflow

ACCURACY_TABLE = '{"schema_type": "accuracy_table", "schema_version": "v1", "data": {"probability_tables": ' +\
        '[[[114311, 385689, 0, 0], [0, 0, 385689, 114311]], [[67998, 432002, 0, 0], [0, 0, ' + \
        '432002, 67998]]], "percentile_tables": [[[114311, 385689, 0, 0], [1, 0, 385689, ' + \
        '114310]], [[67998, 432002, 0, 0], [1, 0, 432002, 67997]]], "class_labels": ["0", "1"], ' + \
        '"probability_thresholds": [0.52], "percentile_thresholds": [0.09]}}'

mlflow.log_dict(ACCURACY_TABLE, 'mlflow_accuracy_table.json')

Le metriche non vengono eseguite come tabella di accuratezza in studio di Azure Machine Learning.
Registrato come artefatto, non come metrica.
Il mlflow.log_dict metodo è sperimentale.

Registrare una matrice di confusione

SDK v1

CONF_MATRIX = '{"schema_type": "confusion_matrix", "schema_version": "v1", "data": {"class_labels": ' + \
    '["0", "1", "2", "3"], "matrix": [[3, 0, 1, 0], [0, 1, 0, 1], [0, 0, 1, 0], [0, 0, 0, 1]]}}'

azureml_run.log_confusion_matrix('v1_confusion_matrix', json.loads(CONF_MATRIX))

SDK v2 con MLflow

CONF_MATRIX = '{"schema_type": "confusion_matrix", "schema_version": "v1", "data": {"class_labels": ' + \
    '["0", "1", "2", "3"], "matrix": [[3, 0, 1, 0], [0, 1, 0, 1], [0, 0, 1, 0], [0, 0, 0, 1]]}}'

mlflow.log_dict(CONF_MATRIX, 'mlflow_confusion_matrix.json')

Le metriche non vengono eseguite come matrice di confusione in studio di Azure Machine Learning.
Registrato come artefatto, non come metrica.
Il mlflow.log_dict metodo è sperimentale.

Stime dei log

SDK v1

PREDICTIONS = '{"schema_type": "predictions", "schema_version": "v1", "data": {"bin_averages": [0.25,' + \
    ' 0.75], "bin_errors": [0.013, 0.042], "bin_counts": [56, 34], "bin_edges": [0.0, 0.5, 1.0]}}'

azureml_run.log_predictions('test_predictions', json.loads(PREDICTIONS))

SDK v2 con MLflow

PREDICTIONS = '{"schema_type": "predictions", "schema_version": "v1", "data": {"bin_averages": [0.25,' + \
    ' 0.75], "bin_errors": [0.013, 0.042], "bin_counts": [56, 34], "bin_edges": [0.0, 0.5, 1.0]}}'

mlflow.log_dict(PREDICTIONS, 'mlflow_predictions.json')

Le metriche non vengono eseguite come matrice di confusione in studio di Azure Machine Learning.
Registrato come artefatto, non come metrica.
Il mlflow.log_dict metodo è sperimentale.

Residui del log

SDK v1

RESIDUALS = '{"schema_type": "residuals", "schema_version": "v1", "data": {"bin_edges": [100, 200, 300], ' + \
'"bin_counts": [0.88, 20, 30, 50.99]}}'

azureml_run.log_residuals('test_residuals', json.loads(RESIDUALS))

SDK v2 con MLflow

RESIDUALS = '{"schema_type": "residuals", "schema_version": "v1", "data": {"bin_edges": [100, 200, 300], ' + \
'"bin_counts": [0.88, 20, 30, 50.99]}}'

mlflow.log_dict(RESIDUALS, 'mlflow_residuals.json')

Le metriche non vengono eseguite come matrice di confusione in studio di Azure Machine Learning.
Registrato come artefatto, non come metrica.
Il mlflow.log_dict metodo è sperimentale.

Visualizzare informazioni e dati di esecuzione

È possibile accedere alle informazioni di esecuzione usando le proprietà data e info l'oggetto MLflow run (mlflow.entities.Run).

Suggerimento

È possibile eseguire query su esperimenti ed esecuzioni di informazioni di rilevamento in Azure Machine Learning usando MLflow, che fornisce un'API di ricerca completa per eseguire query e cercare esperimenti ed esecuzioni facilmente e confrontare rapidamente i risultati. Per altre informazioni su tutte le funzionalità di MLflow in questa dimensione, vedere Eseguire query e confrontare esperimenti ed esecuzioni con MLflow

Nell'esempio seguente viene illustrato come recuperare un'esecuzione completata:

from mlflow.tracking import MlflowClient

# Use MlFlow to retrieve the run that was just completed
client = MlflowClient()
finished_mlflow_run = MlflowClient().get_run("<RUN_ID>")

Nell'esempio seguente viene illustrato come visualizzare , metricstagse params:

metrics = finished_mlflow_run.data.metrics
tags = finished_mlflow_run.data.tags
params = finished_mlflow_run.data.params

Nota

L'oggetto metrics avrà solo il valore registrato più di recente per una determinata metrica. Ad esempio, se si accede in ordine a un valore di 1, 2, 3, e infine 4 a una metrica denominata sample_metric, sarà presente solo 4 nel metrics dizionario. Per ottenere tutte le metriche registrate per una metrica denominata specifica, usare MlFlowClient.get_metric_history:

with mlflow.start_run() as multiple_metrics_run:
    mlflow.log_metric("sample_metric", 1)
    mlflow.log_metric("sample_metric", 2)
    mlflow.log_metric("sample_metric", 3)
    mlflow.log_metric("sample_metric", 4)

print(client.get_run(multiple_metrics_run.info.run_id).data.metrics)
print(client.get_metric_history(multiple_metrics_run.info.run_id, "sample_metric"))

Per altre informazioni, vedere le informazioni di riferimento su MlFlowClient .

Il info campo fornisce informazioni generali sull'esecuzione, ad esempio ora di inizio, ID esecuzione, ID esperimento e così via:

run_start_time = finished_mlflow_run.info.start_time
run_experiment_id = finished_mlflow_run.info.experiment_id
run_id = finished_mlflow_run.info.run_id

Visualizzare gli artefatti di esecuzione

Per visualizzare gli artefatti di un'esecuzione, usare MlFlowClient.list_artifacts:

client.list_artifacts(finished_mlflow_run.info.run_id)

Per scaricare un artefatto, usare mlflow.artifacts.download_artifacts:

mlflow.artifacts.download_artifacts(run_id=finished_mlflow_run.info.run_id, artifact_path="Azure.png")

Share via

Eseguire la migrazione della registrazione dall'SDK v1 all'SDK v2

Perché MLflow?

Preparare la migrazione a MLflow

Connettersi all'area di lavoro

Esperimenti ed esecuzioni

Confronto tra LE API di registrazione

Registrare un numero intero o una metrica float

Registrare una metrica booleana

Registrare una metrica stringa

Registrare un'immagine in un file PNG o JPEG

Registrare un file matplotlib.pyplot

Registrare un elenco di metriche

Registrare una riga di metriche

Registrare una tabella

Registrare una tabella di accuratezza

Registrare una matrice di confusione

Stime dei log

Residui del log

Visualizzare informazioni e dati di esecuzione

Visualizzare gli artefatti di esecuzione

Passaggi successivi

Risorse aggiuntive