Migrar o log do SDK v1 para o SDK v2

Artigo
01/16/2024

O Azure Machine Learning utiliza o MLflow Tracking para registo de métricas e armazenamento de artefactos para as suas experiências, quer tenha criado as experiências através do SDK Python do Azure Machine Learning, da CLI do Azure Machine Learning ou do estúdio Azure Machine Learning. Recomendamos o uso do MLflow para rastrear experimentos.

Se você estiver migrando do SDK v1 para o SDK v2, use as informações desta seção para entender os equivalentes MLflow das APIs de log do SDK v1.

Porquê o MLflow?

O MLflow, com mais de 13 milhões de downloads mensais, tornou-se a plataforma padrão para MLOps de ponta a ponta, permitindo que equipes de todos os tamanhos rastreiem, compartilhem, empacotem e implantem qualquer modelo para inferência em lote ou em tempo real. O Azure Machine Learning integra-se com o MLflow, o que permite que o seu código de formação obtenha uma verdadeira portabilidade e uma integração perfeita com outras plataformas, uma vez que não contém quaisquer instruções específicas do Azure Machine Learning.

Prepare-se para migrar para o MLflow

Para usar o rastreamento MLflow, você precisa instalar o pacote mlflow SDK do Mlflow e o plug-in do Azure Machine Learning para MLflow azureml-mlflow. Todos os ambientes do Azure Machine Learning já têm esses pacotes disponíveis para você, mas você precisa incluí-los ao criar seu próprio ambiente.

pip install mlflow azureml-mlflow

Ligar à sua área de trabalho

O Azure Machine Learning permite que os usuários realizem o acompanhamento em trabalhos de treinamento em execução em seu espaço de trabalho ou remotamente (rastreando experimentos executados fora do Azure Machine Learning). Se estiver executando o rastreamento remoto, você precisará indicar o espaço de trabalho ao qual deseja conectar o MLflow.

Computação do Azure Machine Learning
Computação remota

Você já está conectado ao seu espaço de trabalho ao executar na computação do Azure Machine Learning.

Configurar URI de rastreamento

Obtenha o URI de acompanhamento para seu espaço de trabalho:
APLICA-SE A:Extensão ml da CLI do Azure v2 (atual)
1. Faça login e configure seu espaço de trabalho:
```
az account set --subscription <subscription>
az configure --defaults workspace=<workspace> group=<resource-group> location=<location> 
```
2. Você pode obter o URI de rastreamento usando o az ml workspace comando:
```
az ml workspace show --query mlflow_tracking_uri
```
APLICA-SE A: Python SDK azure-ai-ml v2 (atual)

Você pode obter o URI de rastreamento do Azure ML MLflow usando o SDK do Azure Machine Learning v2 para Python. Certifique-se de ter a biblioteca azure-ai-ml instalada na computação que está usando. O exemplo a seguir obtém o URI de rastreamento MLFLow exclusivo associado ao seu espaço de trabalho.
1. Faça login no seu espaço de trabalho usando o MLClient. A maneira mais fácil de fazer isso é usando o arquivo de configuração do espaço de trabalho:
```
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

ml_client = MLClient.from_config(credential=DefaultAzureCredential())
```
  Gorjeta
  
  Você pode baixar o arquivo de configuração do espaço de trabalho da seguinte forma:
  
  Navegue até o estúdio do Azure ML
  
  Clique no canto superior direito da página -> Download config file.
  
  Salve o arquivo config.json no mesmo diretório em que você está trabalhando.
2. Como alternativa, você pode usar a ID da assinatura, o nome do grupo de recursos e o nome do espaço de trabalho para obtê-lo:
```
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

#Enter details of your AzureML workspace
subscription_id = '<SUBSCRIPTION_ID>'
resource_group = '<RESOURCE_GROUP>'
workspace_name = '<WORKSPACE_NAME>'

ml_client = MLClient(credential=DefaultAzureCredential(),
                        subscription_id=subscription_id, 
                        resource_group_name=resource_group,
                        workspace_name=workspace_name)
```
  Importante
  
  DefaultAzureCredential tentará extrair as credenciais do contexto disponível. Se você quiser especificar credenciais de uma maneira diferente, por exemplo, usando o navegador da Web de forma interativa, você pode usar InteractiveBrowserCredential ou qualquer outro método disponível no azure.identity pacote.
3. Obtenha o URI de Acompanhamento do Azure Machine Learning:
```
mlflow_tracking_uri = ml_client.workspaces.get(ml_client.workspace_name).mlflow_tracking_uri
```
Use o portal do Azure Machine Learning para obter o URI de rastreamento:
1. Abra o portal do estúdio do Azure Machine Learning e faça logon usando suas credenciais.
2. No canto superior direito, clique no nome do seu espaço de trabalho para mostrar a folha Diretório + Assinatura + Espaço de trabalho .
3. Clique em Exibir todas as propriedades no Portal do Azure.
4. Na seção Essentials, você encontrará a propriedade MLflow tracking URI.
O URI de Acompanhamento do Azure Machine Learning pode ser criado usando a ID da assinatura, a região onde o recurso é implantado, o nome do grupo de recursos e o nome do espaço de trabalho. O exemplo de código a seguir mostra como:

Aviso

Se você estiver trabalhando em um espaço de trabalho habilitado para link privado, o ponto de extremidade MLflow também usará um link privado para se comunicar com o Aprendizado de Máquina do Azure. Como consequência, o URI de rastreamento terá uma aparência diferente, conforme proposto aqui. Você precisa obter o URI de rastreamento usando o SDK do Azure ML ou a CLI v2 nesses casos.
```
region = "<LOCATION>"
subscription_id = '<SUBSCRIPTION_ID>'
resource_group = '<RESOURCE_GROUP>'
workspace_name = '<AML_WORKSPACE_NAME>'

mlflow_tracking_uri = f"azureml://{region}.api.azureml.ms/mlflow/v1.0/subscriptions/{subscription_id}/resourceGroups/{resource_group}/providers/Microsoft.MachineLearningServices/workspaces/{workspace_name}"
```
Configurando o URI de rastreamento:
- Usando o SDK do MLflow
- Usando variáveis de ambiente
Em seguida, o método set_tracking_uri() aponta o URI de rastreamento MLflow para esse URI.
```
import mlflow

mlflow.set_tracking_uri(mlflow_tracking_uri)
```
Você pode definir as variáveis de ambiente MLflow MLFLOW_TRACKING_URI em sua computação para fazer qualquer interação com MLflow nessa computação para apontar por padrão para o Aprendizado de Máquina do Azure.
```
MLFLOW_TRACKING_URI=$(az ml workspace show --query mlflow_tracking_uri | sed 's/"//g') 
```
Gorjeta

Ao trabalhar em ambientes compartilhados, como um cluster do Azure Databricks, cluster do Azure Synapse Analytics ou similar, é útil definir a variável MLFLOW_TRACKING_URI de ambiente no nível do cluster para configurar automaticamente o URI de acompanhamento do MLflow para apontar para o Azure Machine Learning para todas as sessões em execução no cluster, em vez de fazê-lo por sessão.

Configurar a autenticação

Depois que o rastreamento estiver configurado, você também precisará configurar como a autenticação precisa acontecer com o espaço de trabalho associado. Por padrão, o plug-in do Azure Machine Learning para MLflow executa a autenticação interativa abrindo o navegador padrão para solicitar credenciais. Consulte Configurar MLflow para Azure Machine Learning: Configurar autenticação para obter mais maneiras de configurar a autenticação para MLflow em espaços de trabalho do Azure Machine Learning.

Para trabalhos interativos em que há um usuário conectado à sessão, você pode confiar na Autenticação Interativa e, portanto, nenhuma ação adicional é necessária.

Aviso

A autenticação interativa do navegador bloqueará a execução de código ao solicitar credenciais. Não é uma opção adequada para autenticação em ambientes autônomos, como trabalhos de treinamento. Recomendamos configurar outro modo de autenticação.

Para os cenários em que a execução autônoma é necessária, você terá que configurar uma entidade de serviço para se comunicar com o Azure Machine Learning.

MLflow SDK
Usando variáveis de ambiente

import os

os.environ["AZURE_TENANT_ID"] = "<AZURE_TENANT_ID>"
os.environ["AZURE_CLIENT_ID"] = "<AZURE_CLIENT_ID>"
os.environ["AZURE_CLIENT_SECRET"] = "<AZURE_CLIENT_SECRET>"

export AZURE_TENANT_ID="<AZURE_TENANT_ID>"
export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>"
export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"

Gorjeta

Ao trabalhar em ambientes compartilhados, é aconselhável configurar essas variáveis de ambiente na computação. Como prática recomendada, gerencie-os como segredos em uma instância do Azure Key Vault sempre que possível. Por exemplo, no Azure Databricks, você pode usar segredos em variáveis de ambiente da seguinte forma na configuração do cluster: AZURE_CLIENT_SECRET={{secrets/<scope-name>/<secret-name>}}. Consulte Referenciar um segredo em uma variável de ambiente para saber como fazer isso no Azure Databricks ou consulte documentação semelhante em sua plataforma.

Experiências e execuções

SDK v1

from azureml.core import Experiment

# create an Azure Machine Learning experiment and start a run
experiment = Experiment(ws, "create-experiment-sdk-v1")
azureml_run = experiment.start_logging()

SDK v2 com MLflow

# Set the MLflow experiment and start a run
mlflow.set_experiment("logging-with-mlflow")
mlflow_run = mlflow.start_run()

Comparação da API de registro em log

Registrar uma métrica inteira ou flutuante

SDK v1

azureml_run.log("sample_int_metric", 1)

SDK v2 com MLflow

mlflow.log_metric("sample_int_metric", 1)

Registrar uma métrica booleana

SDK v1

azureml_run.log("sample_boolean_metric", True)

SDK v2 com MLflow

mlflow.log_metric("sample_boolean_metric", 1)

Registrar uma métrica de cadeia de caracteres

SDK v1

azureml_run.log("sample_string_metric", "a_metric")

SDK v2 com MLflow

mlflow.log_text("sample_string_text", "string.txt")

A cadeia de caracteres é registrada como um artefato, não como uma métrica. No estúdio do Azure Machine Learning, o valor é exibido na guia Saídas + logs .

Registrar uma imagem em um arquivo PNG ou JPEG

SDK v1

azureml_run.log_image("sample_image", path="Azure.png")

SDK v2 com MLflow

mlflow.log_artifact("Azure.png")

A imagem é registrada como um artefato e aparece na guia Imagens no Estúdio de Aprendizado de Máquina do Azure.

Registrar um matplotlib.pyplot

SDK v1

import matplotlib.pyplot as plt

plt.plot([1, 2, 3])
azureml_run.log_image("sample_pyplot", plot=plt)

SDK v2 com MLflow

import matplotlib.pyplot as plt

plt.plot([1, 2, 3])
fig, ax = plt.subplots()
ax.plot([0, 1], [2, 3])
mlflow.log_figure(fig, "sample_pyplot.png")

A imagem é registrada como um artefato e aparece na guia Imagens no Estúdio de Aprendizado de Máquina do Azure.

Registrar uma lista de métricas

SDK v1

list_to_log = [1, 2, 3, 2, 1, 2, 3, 2, 1]
azureml_run.log_list('sample_list', list_to_log)

SDK v2 com MLflow

list_to_log = [1, 2, 3, 2, 1, 2, 3, 2, 1]
from mlflow.entities import Metric
from mlflow.tracking import MlflowClient
import time

metrics = [Metric(key="sample_list", value=val, timestamp=int(time.time() * 1000), step=0) for val in list_to_log]
MlflowClient().log_batch(mlflow_run.info.run_id, metrics=metrics)

As métricas aparecem na guia métricas no estúdio do Azure Machine Learning.
Não há suporte para valores de texto.

Registrar uma linha de métricas

SDK v1

azureml_run.log_row("sample_table", col1=5, col2=10)

SDK v2 com MLflow

metrics = {"sample_table.col1": 5, "sample_table.col2": 10}
mlflow.log_metrics(metrics)

As métricas não são renderizadas como uma tabela no estúdio do Azure Machine Learning.
Não há suporte para valores de texto.
Registrado como um artefato, não como uma métrica.

Registar uma tabela

SDK v1

table = {
"col1" : [1, 2, 3],
"col2" : [4, 5, 6]
}
azureml_run.log_table("table", table)

SDK v2 com MLflow

# Add a metric for each column prefixed by metric name. Similar to log_row
row1 = {"table.col1": 5, "table.col2": 10}
# To be done for each row in the table
mlflow.log_metrics(row1)

# Using mlflow.log_artifact
import json

with open("table.json", 'w') as f:
json.dump(table, f)
mlflow.log_artifact("table.json")

Registra métricas para cada coluna.
As métricas não são renderizadas como uma tabela no estúdio do Azure Machine Learning.
Não há suporte para valores de texto.
Registrado como um artefato, não como uma métrica.

Registrar uma tabela de precisão

SDK v1

ACCURACY_TABLE = '{"schema_type": "accuracy_table", "schema_version": "v1", "data": {"probability_tables": ' +\
        '[[[114311, 385689, 0, 0], [0, 0, 385689, 114311]], [[67998, 432002, 0, 0], [0, 0, ' + \
        '432002, 67998]]], "percentile_tables": [[[114311, 385689, 0, 0], [1, 0, 385689, ' + \
        '114310]], [[67998, 432002, 0, 0], [1, 0, 432002, 67997]]], "class_labels": ["0", "1"], ' + \
        '"probability_thresholds": [0.52], "percentile_thresholds": [0.09]}}'

azureml_run.log_accuracy_table('v1_accuracy_table', ACCURACY_TABLE)

SDK v2 com MLflow

ACCURACY_TABLE = '{"schema_type": "accuracy_table", "schema_version": "v1", "data": {"probability_tables": ' +\
        '[[[114311, 385689, 0, 0], [0, 0, 385689, 114311]], [[67998, 432002, 0, 0], [0, 0, ' + \
        '432002, 67998]]], "percentile_tables": [[[114311, 385689, 0, 0], [1, 0, 385689, ' + \
        '114310]], [[67998, 432002, 0, 0], [1, 0, 432002, 67997]]], "class_labels": ["0", "1"], ' + \
        '"probability_thresholds": [0.52], "percentile_thresholds": [0.09]}}'

mlflow.log_dict(ACCURACY_TABLE, 'mlflow_accuracy_table.json')

As métricas não são renderizadas como uma tabela de precisão no estúdio do Azure Machine Learning.
Registrado como um artefato, não como uma métrica.
O mlflow.log_dict método é experimental.

Registar uma matriz de confusão

SDK v1

CONF_MATRIX = '{"schema_type": "confusion_matrix", "schema_version": "v1", "data": {"class_labels": ' + \
    '["0", "1", "2", "3"], "matrix": [[3, 0, 1, 0], [0, 1, 0, 1], [0, 0, 1, 0], [0, 0, 0, 1]]}}'

azureml_run.log_confusion_matrix('v1_confusion_matrix', json.loads(CONF_MATRIX))

SDK v2 com MLflow

CONF_MATRIX = '{"schema_type": "confusion_matrix", "schema_version": "v1", "data": {"class_labels": ' + \
    '["0", "1", "2", "3"], "matrix": [[3, 0, 1, 0], [0, 1, 0, 1], [0, 0, 1, 0], [0, 0, 0, 1]]}}'

mlflow.log_dict(CONF_MATRIX, 'mlflow_confusion_matrix.json')

As métricas não são renderizadas como uma matriz de confusão no estúdio de Aprendizado de Máquina do Azure.
Registrado como um artefato, não como uma métrica.
O mlflow.log_dict método é experimental.

Previsões de log

SDK v1

PREDICTIONS = '{"schema_type": "predictions", "schema_version": "v1", "data": {"bin_averages": [0.25,' + \
    ' 0.75], "bin_errors": [0.013, 0.042], "bin_counts": [56, 34], "bin_edges": [0.0, 0.5, 1.0]}}'

azureml_run.log_predictions('test_predictions', json.loads(PREDICTIONS))

SDK v2 com MLflow

PREDICTIONS = '{"schema_type": "predictions", "schema_version": "v1", "data": {"bin_averages": [0.25,' + \
    ' 0.75], "bin_errors": [0.013, 0.042], "bin_counts": [56, 34], "bin_edges": [0.0, 0.5, 1.0]}}'

mlflow.log_dict(PREDICTIONS, 'mlflow_predictions.json')

As métricas não são renderizadas como uma matriz de confusão no estúdio de Aprendizado de Máquina do Azure.
Registrado como um artefato, não como uma métrica.
O mlflow.log_dict método é experimental.

Log de resíduos

SDK v1

RESIDUALS = '{"schema_type": "residuals", "schema_version": "v1", "data": {"bin_edges": [100, 200, 300], ' + \
'"bin_counts": [0.88, 20, 30, 50.99]}}'

azureml_run.log_residuals('test_residuals', json.loads(RESIDUALS))

SDK v2 com MLflow

RESIDUALS = '{"schema_type": "residuals", "schema_version": "v1", "data": {"bin_edges": [100, 200, 300], ' + \
'"bin_counts": [0.88, 20, 30, 50.99]}}'

mlflow.log_dict(RESIDUALS, 'mlflow_residuals.json')

As métricas não são renderizadas como uma matriz de confusão no estúdio de Aprendizado de Máquina do Azure.
Registrado como um artefato, não como uma métrica.
O mlflow.log_dict método é experimental.

Exibir informações e dados de execução

Você pode acessar informações de execução usando as propriedades data e do objeto MLflow run (mlflow.entities.Run).info

Gorjeta

Experimentos e execuções de informações de rastreamento no Aprendizado de Máquina do Azure podem ser consultados usando o MLflow, que fornece uma API de pesquisa abrangente para consultar e pesquisar experimentos, e é executado facilmente e comparar resultados rapidamente. Para obter mais informações sobre todos os recursos do MLflow nessa dimensão, consulte Query & compare experimentos e execuções com MLflow

O exemplo a seguir mostra como recuperar uma execução concluída:

from mlflow.tracking import MlflowClient

# Use MlFlow to retrieve the run that was just completed
client = MlflowClient()
finished_mlflow_run = MlflowClient().get_run("<RUN_ID>")

O exemplo a seguir mostra como exibir o metrics, tagse params:

metrics = finished_mlflow_run.data.metrics
tags = finished_mlflow_run.data.tags
params = finished_mlflow_run.data.params

Nota

O metrics terá apenas o valor registrado mais recentemente para uma determinada métrica. Por exemplo, se você registrar em ordem um valor de 1, então 2, e finalmente 4 para uma métrica chamada sample_metric, 3somente 4 estará presente no metrics dicionário. Para obter todas as métricas registradas para uma métrica nomeada específica, use MlFlowClient.get_metric_history:

with mlflow.start_run() as multiple_metrics_run:
    mlflow.log_metric("sample_metric", 1)
    mlflow.log_metric("sample_metric", 2)
    mlflow.log_metric("sample_metric", 3)
    mlflow.log_metric("sample_metric", 4)

print(client.get_run(multiple_metrics_run.info.run_id).data.metrics)
print(client.get_metric_history(multiple_metrics_run.info.run_id, "sample_metric"))

Para obter mais informações, consulte a referência MlFlowClient .

O info campo fornece informações gerais sobre a execução, como hora de início, ID de execução, ID do experimento, etc.:

run_start_time = finished_mlflow_run.info.start_time
run_experiment_id = finished_mlflow_run.info.experiment_id
run_id = finished_mlflow_run.info.run_id

Exibir artefatos de execução

Para exibir os artefatos de uma execução, use MlFlowClient.list_artifacts:

client.list_artifacts(finished_mlflow_run.info.run_id)

Para baixar um artefato, use mlflow.artifacts.download_artifacts:

mlflow.artifacts.download_artifacts(run_id=finished_mlflow_run.info.run_id, artifact_path="Azure.png")

Share via

Migrar o log do SDK v1 para o SDK v2

Porquê o MLflow?

Prepare-se para migrar para o MLflow

Ligar à sua área de trabalho

Experiências e execuções

Comparação da API de registro em log

Registrar uma métrica inteira ou flutuante

Registrar uma métrica booleana

Registrar uma métrica de cadeia de caracteres

Registrar uma imagem em um arquivo PNG ou JPEG

Registrar um matplotlib.pyplot

Registrar uma lista de métricas

Registrar uma linha de métricas

Registar uma tabela

Registrar uma tabela de precisão

Registar uma matriz de confusão

Previsões de log

Log de resíduos

Exibir informações e dados de execução

Exibir artefatos de execução

Próximos passos

Recursos adicionais