Naplózás migrálása az SDK v1-ről az SDK v2-be

Cikk
01/16/2024

Az Azure Machine Tanulás az MLflow Trackingt használja a metrikanaplózáshoz és az összetevők tárolásához a kísérletekhez, függetlenül attól, hogy az Azure Machine Tanulás Python SDK-val, az Azure Machine Tanulás CLI-vel vagy az Azure Machine Tanulás Studióval hozta létre a kísérleteket. Javasoljuk, hogy az MLflow használatával kövesse nyomon a kísérleteket.

Ha SDK v1-ről SDK v2-re migrál, az ebben a szakaszban található információk segítségével megismerheti az SDK v1 naplózási API-k MLflow-megfelelőit.

Miért az MLflow?

A több mint 13 millió havi letöltéssel rendelkező MLflow a teljes körű MLOps szabványos platformjává vált, amely lehetővé teszi, hogy minden méretű csapat nyomon kövesse, ossza meg, csomagolja és telepítse a modelleket kötegelt vagy valós idejű következtetéshez. Az Azure Machine Tanulás integrálható az MLflow szolgáltatással, így a betanítási kód valódi hordozhatóságot és zökkenőmentes integrációt tesz lehetővé más platformokkal, mivel nem tartalmaz Azure Machine-Tanulás konkrét utasításokat.

Felkészülés az MLflow-ba való migrálásra

Az MLflow-nyomkövetés használatához telepítenie kell a Mlflow SDK-csomagot mlflow és az Azure Machine Tanulás beépülő modult az MLflow-hozazureml-mlflow. Minden Azure Machine Tanulás-környezet rendelkezik ezekkel a csomagokkal, de a saját környezet létrehozásakor fel kell vennie őket.

pip install mlflow azureml-mlflow

Csatlakozás a munkaterülethez

Az Azure Machine Tanulás lehetővé teszi a felhasználók számára a munkaterületen futó vagy távolról futó betanítási feladatok nyomon követését (az Azure Machine-Tanulás kívül futó kísérletek nyomon követését). Ha távoli nyomkövetést végez, meg kell jelölnie azt a munkaterületet, amelyhez az MLflow-t csatlakoztatni szeretné.

Azure Machine Tanulás számítás
Távoli számítás

Már csatlakozik a munkaterülethez, amikor az Azure Machine Tanulás számításon fut.

Nyomkövetési URI konfigurálása

Kérje le a munkaterület nyomkövetési URI-ját:
- Azure CLI
- Python
- Studio
- Manuálisan
ÉRVÉNYES:Azure CLI ml-bővítmény 2-es verzió (aktuális)
1. Jelentkezzen be és konfigurálja a munkaterületet:
```
az account set --subscription <subscription>
az configure --defaults workspace=<workspace> group=<resource-group> location=<location> 
```
2. A nyomkövetési URI-t a következő paranccsal szerezheti az ml workspace be:
```
az ml workspace show --query mlflow_tracking_uri
```
A KÖVETKEZŐKRE VONATKOZIK: Python SDK azure-ai-ml v2 (aktuális)

Az Azure ML MLflow nyomkövetési URI-t az Azure Machine Tanulás SDK v2 for Python használatával szerezheti be. Győződjön meg arról, hogy telepítve van a kódtár azure-ai-ml a használt számításban. Az alábbi minta lekéri a munkaterülethez társított egyedi MLFLow nyomkövetési URI-t.
1. Jelentkezzen be a munkaterületre a MLClient. Ennek egyszerűbb módja a munkaterület konfigurációs fájljának használata:
```
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

ml_client = MLClient.from_config(credential=DefaultAzureCredential())
```
  Tipp.
  
  A munkaterület konfigurációs fájlját a következővel töltheti le:
  
  Navigálás az Azure ML Studióba
  
  Kattintson a lap jobb felső sarkára –> Konfigurációs fájl letöltése.
  
  Mentse a fájlt config.json ugyanabban a könyvtárban, amelyen dolgozik.
2. Másik lehetőségként használhatja az előfizetés azonosítóját, az erőforráscsoport nevét és a munkaterület nevét is:
```
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

#Enter details of your AzureML workspace
subscription_id = '<SUBSCRIPTION_ID>'
resource_group = '<RESOURCE_GROUP>'
workspace_name = '<WORKSPACE_NAME>'

ml_client = MLClient(credential=DefaultAzureCredential(),
                        subscription_id=subscription_id, 
                        resource_group_name=resource_group,
                        workspace_name=workspace_name)
```
  Fontos
  
  DefaultAzureCredential megpróbálja lekérni a hitelesítő adatokat a rendelkezésre álló környezetből. Ha más módon szeretné megadni a hitelesítő adatokat, például a webböngésző interaktív módon való használatát, használhatja InteractiveBrowserCredential vagy bármilyen más, csomagban azure.identity elérhető módszert.
3. Szerezze be az Azure Machine Tanulás Tracking URI-t:
```
mlflow_tracking_uri = ml_client.workspaces.get(ml_client.workspace_name).mlflow_tracking_uri
```
A nyomkövetési URI lekéréséhez használja az Azure Machine Tanulás portált:
1. Nyissa meg az Azure Machine Tanulás studio portált, és jelentkezzen be a hitelesítő adataival.
2. A jobb felső sarokban kattintson a munkaterület nevére a Címtár + Előfizetés + Munkaterület panel megjelenítéséhez.
3. Kattintson az Összes tulajdonság megtekintése az Azure Portalon elemre.
4. Az Essentials szakaszban megtalálja az MLflow tracking URI tulajdonságot.
Az Azure Machine Tanulás Tracking URI az előfizetés azonosítójával, az erőforrás üzembe helyezésének régiójával, az erőforráscsoport nevével és a munkaterület nevével hozható létre. A következő kódminta bemutatja, hogyan:

Figyelmeztetés

Ha privát kapcsolattal kompatibilis munkaterületen dolgozik, az MLflow-végpont egy privát hivatkozást is használ az Azure Machine Tanulás való kommunikációhoz. Ennek következtében a nyomkövetési URI az itt javasolt módon fog kinézni. Ezekben az esetekben le kell kérnie a nyomkövetési URI-t az Azure ML SDK vagy a CLI v2 használatával.
```
region = "<LOCATION>"
subscription_id = '<SUBSCRIPTION_ID>'
resource_group = '<RESOURCE_GROUP>'
workspace_name = '<AML_WORKSPACE_NAME>'

mlflow_tracking_uri = f"azureml://{region}.api.azureml.ms/mlflow/v1.0/subscriptions/{subscription_id}/resourceGroups/{resource_group}/providers/Microsoft.MachineLearningServices/workspaces/{workspace_name}"
```
A nyomkövetési URI konfigurálása:
- Az MLflow SDK használata
- Környezeti változók használata
Ezután a metódus set_tracking_uri() az MLflow-követési URI-t az adott URI-ra pontokat jelölő URI-ra mutatja.
```
import mlflow

mlflow.set_tracking_uri(mlflow_tracking_uri)
```
Beállíthatja a számításban MLFLOW_TRACKING_URI MLflow környezeti változókat, hogy az adott számítás MLflow-jával való interakció alapértelmezés szerint az Azure Machine Tanulás legyen.
```
MLFLOW_TRACKING_URI=$(az ml workspace show --query mlflow_tracking_uri | sed 's/"//g') 
```
Tipp.

Megosztott környezeteken, például Azure Databricks-fürtön, Azure Synapse Analytics-fürtön vagy hasonlókon végzett munka során hasznos, ha a környezeti változót MLFLOW_TRACKING_URI a fürt szintjén úgy állítja be, hogy automatikusan konfigurálja az MLflow-követési URI-t úgy, hogy a fürtben futó összes munkamenethez az Azure Machine Tanulás mutasson, és ne munkamenetenkénti alapon végezze el.

Hitelesítés konfigurálása

A nyomon követés konfigurálása után azt is konfigurálnia kell, hogy a hitelesítésnek hogyan kell történnie a társított munkaterületen. Alapértelmezés szerint az MLflow Azure Machine Tanulás beépülő modulja interaktív hitelesítést hajt végre az alapértelmezett böngésző megnyitásával, hogy hitelesítő adatokat kérjen. Tekintse meg az MLflow konfigurálását az Azure Machine Tanulás: A hitelesítés konfigurálásához további módszereket biztosít az MLflow hitelesítésének konfigurálására az Azure Machine Tanulás-munkaterületeken.

Az olyan interaktív feladatok esetében, ahol egy felhasználó csatlakozik a munkamenethez, interaktív hitelesítésre támaszkodhat, ezért nincs szükség további műveletekre.

Figyelmeztetés

Az interaktív böngészőhitelesítés letiltja a kódvégrehajtást, amikor hitelesítő adatokat kér. Ez nem alkalmas hitelesítésre felügyelet nélküli környezetekben, például betanítási feladatokban. Javasoljuk, hogy más hitelesítési módot is konfiguráljon.

Azokban az esetekben, amikor felügyelet nélküli végrehajtásra van szükség, konfigurálnia kell egy szolgáltatásnevet az Azure Machine Tanulás való kommunikációhoz.

MLflow SDK
Környezeti változók használata

import os

os.environ["AZURE_TENANT_ID"] = "<AZURE_TENANT_ID>"
os.environ["AZURE_CLIENT_ID"] = "<AZURE_CLIENT_ID>"
os.environ["AZURE_CLIENT_SECRET"] = "<AZURE_CLIENT_SECRET>"

export AZURE_TENANT_ID="<AZURE_TENANT_ID>"
export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>"
export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"

Tipp.

A megosztott környezeteken való munka során célszerű ezeket a környezeti változókat a számításnál konfigurálni. Ajánlott eljárásként titkos kulcsként kezelni őket az Azure Key Vault egy példányában, amikor csak lehetséges. Az Azure Databricksben például a fürtkonfigurációban az alábbiak szerint használhat titkos kulcsokat a környezeti változókban: AZURE_CLIENT_SECRET={{secrets/<scope-name>/<secret-name>}}. Az Azure Databricksben való műveletet egy környezeti változóban található titkos kódra hivatkozva, vagy a platform hasonló dokumentációjában találja.

Kísérletek és futtatások

SDK v1

from azureml.core import Experiment

# create an Azure Machine Learning experiment and start a run
experiment = Experiment(ws, "create-experiment-sdk-v1")
azureml_run = experiment.start_logging()

SDK v2 MLflow-val

# Set the MLflow experiment and start a run
mlflow.set_experiment("logging-with-mlflow")
mlflow_run = mlflow.start_run()

Naplózási API összehasonlítása

Egész szám vagy lebegőpontos metrika naplózása

SDK v1

azureml_run.log("sample_int_metric", 1)

SDK v2 MLflow-val

mlflow.log_metric("sample_int_metric", 1)

Logikai metrika naplózása

SDK v1

azureml_run.log("sample_boolean_metric", True)

SDK v2 MLflow-val

mlflow.log_metric("sample_boolean_metric", 1)

Sztringmetrika naplózása

SDK v1

azureml_run.log("sample_string_metric", "a_metric")

SDK v2 MLflow-val

mlflow.log_text("sample_string_text", "string.txt")

A sztringet a rendszer összetevőként naplózza, nem metrikaként. Az Azure Machine Tanulás Studióban az érték a Kimenetek + naplók lapon jelenik meg.

Kép naplózása PNG- vagy JPEG-fájlba

SDK v1

azureml_run.log_image("sample_image", path="Azure.png")

SDK v2 MLflow-val

mlflow.log_artifact("Azure.png")

A rendszerképet a rendszer összetevőként naplózza, és az Azure Machine Tanulás Studio Képek lapján jelenik meg.

Matplotlib.pyplot naplózása

SDK v1

import matplotlib.pyplot as plt

plt.plot([1, 2, 3])
azureml_run.log_image("sample_pyplot", plot=plt)

SDK v2 MLflow-val

import matplotlib.pyplot as plt

plt.plot([1, 2, 3])
fig, ax = plt.subplots()
ax.plot([0, 1], [2, 3])
mlflow.log_figure(fig, "sample_pyplot.png")

A rendszerképet a rendszer összetevőként naplózza, és az Azure Machine Tanulás Studio Képek lapján jelenik meg.

Metrikák listájának naplózása

SDK v1

list_to_log = [1, 2, 3, 2, 1, 2, 3, 2, 1]
azureml_run.log_list('sample_list', list_to_log)

SDK v2 MLflow-val

list_to_log = [1, 2, 3, 2, 1, 2, 3, 2, 1]
from mlflow.entities import Metric
from mlflow.tracking import MlflowClient
import time

metrics = [Metric(key="sample_list", value=val, timestamp=int(time.time() * 1000), step=0) for val in list_to_log]
MlflowClient().log_batch(mlflow_run.info.run_id, metrics=metrics)

A metrikák az Azure Machine Tanulás Studióban a Metrikák lapon jelennek meg.
A szöveges értékek nem támogatottak.

Metrikák sorának naplózása

SDK v1

azureml_run.log_row("sample_table", col1=5, col2=10)

SDK v2 MLflow-val

metrics = {"sample_table.col1": 5, "sample_table.col2": 10}
mlflow.log_metrics(metrics)

A metrikák nem jelennek meg táblázatként az Azure Machine Tanulás Studióban.
A szöveges értékek nem támogatottak.
A napló nem metrikaként, hanem összetevőként van naplózva.

Táblázat naplózása

SDK v1

table = {
"col1" : [1, 2, 3],
"col2" : [4, 5, 6]
}
azureml_run.log_table("table", table)

SDK v2 MLflow-val

# Add a metric for each column prefixed by metric name. Similar to log_row
row1 = {"table.col1": 5, "table.col2": 10}
# To be done for each row in the table
mlflow.log_metrics(row1)

# Using mlflow.log_artifact
import json

with open("table.json", 'w') as f:
json.dump(table, f)
mlflow.log_artifact("table.json")

Naplózza az egyes oszlopok metrikáit.
A metrikák nem jelennek meg táblázatként az Azure Machine Tanulás Studióban.
A szöveges értékek nem támogatottak.
A napló nem metrikaként, hanem összetevőként van naplózva.

Pontossági táblázat naplózása

SDK v1

ACCURACY_TABLE = '{"schema_type": "accuracy_table", "schema_version": "v1", "data": {"probability_tables": ' +\
        '[[[114311, 385689, 0, 0], [0, 0, 385689, 114311]], [[67998, 432002, 0, 0], [0, 0, ' + \
        '432002, 67998]]], "percentile_tables": [[[114311, 385689, 0, 0], [1, 0, 385689, ' + \
        '114310]], [[67998, 432002, 0, 0], [1, 0, 432002, 67997]]], "class_labels": ["0", "1"], ' + \
        '"probability_thresholds": [0.52], "percentile_thresholds": [0.09]}}'

azureml_run.log_accuracy_table('v1_accuracy_table', ACCURACY_TABLE)

SDK v2 MLflow-val

ACCURACY_TABLE = '{"schema_type": "accuracy_table", "schema_version": "v1", "data": {"probability_tables": ' +\
        '[[[114311, 385689, 0, 0], [0, 0, 385689, 114311]], [[67998, 432002, 0, 0], [0, 0, ' + \
        '432002, 67998]]], "percentile_tables": [[[114311, 385689, 0, 0], [1, 0, 385689, ' + \
        '114310]], [[67998, 432002, 0, 0], [1, 0, 432002, 67997]]], "class_labels": ["0", "1"], ' + \
        '"probability_thresholds": [0.52], "percentile_thresholds": [0.09]}}'

mlflow.log_dict(ACCURACY_TABLE, 'mlflow_accuracy_table.json')

A metrikák nem jelennek meg pontossági táblázatként az Azure Machine Tanulás Studióban.
A napló nem metrikaként, hanem összetevőként van naplózva.
A mlflow.log_dict módszer kísérleti jellegű.

Keveredési mátrix naplózása

SDK v1

CONF_MATRIX = '{"schema_type": "confusion_matrix", "schema_version": "v1", "data": {"class_labels": ' + \
    '["0", "1", "2", "3"], "matrix": [[3, 0, 1, 0], [0, 1, 0, 1], [0, 0, 1, 0], [0, 0, 0, 1]]}}'

azureml_run.log_confusion_matrix('v1_confusion_matrix', json.loads(CONF_MATRIX))

SDK v2 MLflow-val

CONF_MATRIX = '{"schema_type": "confusion_matrix", "schema_version": "v1", "data": {"class_labels": ' + \
    '["0", "1", "2", "3"], "matrix": [[3, 0, 1, 0], [0, 1, 0, 1], [0, 0, 1, 0], [0, 0, 0, 1]]}}'

mlflow.log_dict(CONF_MATRIX, 'mlflow_confusion_matrix.json')

A metrikák nem jelennek meg keveredési mátrixként az Azure Machine Tanulás Studióban.
A napló nem metrikaként, hanem összetevőként van naplózva.
A mlflow.log_dict módszer kísérleti jellegű.

Napló-előrejelzések

SDK v1

PREDICTIONS = '{"schema_type": "predictions", "schema_version": "v1", "data": {"bin_averages": [0.25,' + \
    ' 0.75], "bin_errors": [0.013, 0.042], "bin_counts": [56, 34], "bin_edges": [0.0, 0.5, 1.0]}}'

azureml_run.log_predictions('test_predictions', json.loads(PREDICTIONS))

SDK v2 MLflow-val

PREDICTIONS = '{"schema_type": "predictions", "schema_version": "v1", "data": {"bin_averages": [0.25,' + \
    ' 0.75], "bin_errors": [0.013, 0.042], "bin_counts": [56, 34], "bin_edges": [0.0, 0.5, 1.0]}}'

mlflow.log_dict(PREDICTIONS, 'mlflow_predictions.json')

A metrikák nem jelennek meg keveredési mátrixként az Azure Machine Tanulás Studióban.
A napló nem metrikaként, hanem összetevőként van naplózva.
A mlflow.log_dict módszer kísérleti jellegű.

Naplómaradványok

SDK v1

RESIDUALS = '{"schema_type": "residuals", "schema_version": "v1", "data": {"bin_edges": [100, 200, 300], ' + \
'"bin_counts": [0.88, 20, 30, 50.99]}}'

azureml_run.log_residuals('test_residuals', json.loads(RESIDUALS))

SDK v2 MLflow-val

RESIDUALS = '{"schema_type": "residuals", "schema_version": "v1", "data": {"bin_edges": [100, 200, 300], ' + \
'"bin_counts": [0.88, 20, 30, 50.99]}}'

mlflow.log_dict(RESIDUALS, 'mlflow_residuals.json')

A metrikák nem jelennek meg keveredési mátrixként az Azure Machine Tanulás Studióban.
A napló nem metrikaként, hanem összetevőként van naplózva.
A mlflow.log_dict módszer kísérleti jellegű.

Futtatási adatok és adatok megtekintése

A futtatási információk az MLflow-futtatás (mlflow.entities.Run) objektum tulajdonságaival data és info használatával érhetők el.

Tipp.

Az Azure Machine-Tanulás a kísérletek és a futtatások nyomon követési adatai lekérdezhetők az MLflow használatával, amely átfogó keresési API-t biztosít a kísérletek lekérdezéséhez és kereséséhez, valamint a futtatások egyszerű futtatásához, valamint az eredmények gyors összehasonlításához. Az MLflow ezen dimenzióban található összes funkciójával kapcsolatos további információkért lásd : Lekérdezés > kísérletek és futtatások összehasonlítása az MLflow-tal

Az alábbi példa bemutatja, hogyan kérhető le egy befejezett futtatás:

from mlflow.tracking import MlflowClient

# Use MlFlow to retrieve the run that was just completed
client = MlflowClient()
finished_mlflow_run = MlflowClient().get_run("<RUN_ID>")

Az alábbi példa bemutatja, hogyan tekintheti meg a , tagsésparams:metrics

metrics = finished_mlflow_run.data.metrics
tags = finished_mlflow_run.data.tags
params = finished_mlflow_run.data.params

Megjegyzés:

A metrics rendszer csak egy adott metrika legutóbb naplózott értékével rendelkezik. Ha például egy , majd 23, végül 4 pedig egy elnevezett sample_metricmetrika értékét 1adja meg, akkor csak 4 a metrics szótárban jelenik meg. Ha az összes metrikát naplózni szeretné egy adott nevesített metrika esetében, használja a MlFlowClient.get_metric_history:

with mlflow.start_run() as multiple_metrics_run:
    mlflow.log_metric("sample_metric", 1)
    mlflow.log_metric("sample_metric", 2)
    mlflow.log_metric("sample_metric", 3)
    mlflow.log_metric("sample_metric", 4)

print(client.get_run(multiple_metrics_run.info.run_id).data.metrics)
print(client.get_metric_history(multiple_metrics_run.info.run_id, "sample_metric"))

További információ: MlFlowClient-referencia .

A info mező általános információkat tartalmaz a futtatásról, például a kezdési időpontról, a futtatási azonosítóról, a kísérletazonosítóról stb.:

run_start_time = finished_mlflow_run.info.start_time
run_experiment_id = finished_mlflow_run.info.experiment_id
run_id = finished_mlflow_run.info.run_id

Futtatási összetevők megtekintése

A futtatás összetevőinek megtekintéséhez használja a MlFlowClient.list_artifacts:

client.list_artifacts(finished_mlflow_run.info.run_id)

Összetevő letöltéséhez használja a mlflow.artifacts.download_artifacts:

mlflow.artifacts.download_artifacts(run_id=finished_mlflow_run.info.run_id, artifact_path="Azure.png")

További lépések

Ml-kísérletek és modellek nyomon követése az MLflow használatával.
Naplómetrikák, paraméterek és fájlok az MLflow használatával.
MLflow-modellek naplózása.
Lekérdezés > kísérletek és futtatások összehasonlítása az MLflow-tal.
Modellregisztrációs adatbázisok kezelése az Azure Machine Tanulás MLflow használatával.

Share via

Naplózás migrálása az SDK v1-ről az SDK v2-be

Miért az MLflow?

Felkészülés az MLflow-ba való migrálásra

Csatlakozás a munkaterülethez

Kísérletek és futtatások

Naplózási API összehasonlítása

Egész szám vagy lebegőpontos metrika naplózása

Logikai metrika naplózása

Sztringmetrika naplózása

Kép naplózása PNG- vagy JPEG-fájlba

Matplotlib.pyplot naplózása

Metrikák listájának naplózása

Metrikák sorának naplózása

Táblázat naplózása

Pontossági táblázat naplózása

Keveredési mátrix naplózása

Napló-előrejelzések

Naplómaradványok

Futtatási adatok és adatok megtekintése

Futtatási összetevők megtekintése

További lépések

További források