Migrowanie rejestrowania z zestawu SDK w wersji 1 do zestawu SDK w wersji 2

Artykuł
01/16/2024

Usługa Azure Machine Edukacja używa rozwiązania MLflow Tracking na potrzeby rejestrowania metryk i magazynu artefaktów dla eksperymentów niezależnie od tego, czy eksperymenty zostały utworzone za pośrednictwem zestawu SDK języka Python usługi Azure Machine Edukacja, interfejsu wiersza polecenia usługi Azure Machine Edukacja lub usługi Azure Machine Edukacja Studio. Zalecamy używanie biblioteki MLflow do śledzenia eksperymentów.

Jeśli przeprowadzasz migrację z zestawu SDK w wersji 1 do zestawu SDK w wersji 2, skorzystaj z informacji w tej sekcji, aby poznać odpowiedniki biblioteki MLflow interfejsów API rejestrowania zestawu SDK w wersji 1.

Dlaczego MLflow?

MLflow, z ponad 13 milionami miesięcznych pobrań, stał się standardową platformą kompleksowej metodyki MLOps, umożliwiając zespołom wszystkich rozmiarów śledzenie, udostępnianie, pakowanie i wdrażanie dowolnego modelu na potrzeby wnioskowania wsadowego lub w czasie rzeczywistym. Usługa Azure Machine Edukacja integruje się z rozwiązaniem MLflow, co umożliwia kodowi szkoleniowemu osiągnięcie prawdziwej przenośności i bezproblemowej integracji z innymi platformami, ponieważ nie zawiera żadnych instrukcji usługi Azure Machine Edukacja.

Przygotowanie do migracji do platformy MLflow

Aby użyć śledzenia MLflow, należy zainstalować pakiet mlflow zestawu MLflow SDK i wtyczkę azure Machine Edukacja dla biblioteki MLflowazureml-mlflow. Wszystkie środowiska usługi Azure Machine Edukacja mają te pakiety już dostępne, ale należy je uwzględnić w przypadku tworzenia własnego środowiska.

pip install mlflow azureml-mlflow

Nawiązywanie połączenia z obszarem roboczym

Usługa Azure Machine Edukacja umożliwia użytkownikom śledzenie zadań szkoleniowych uruchomionych w obszarze roboczym lub zdalnie (śledzenie eksperymentów uruchomionych poza usługą Azure Machine Edukacja). W przypadku przeprowadzania śledzenia zdalnego należy wskazać obszar roboczy, z którym chcesz połączyć rozwiązanie MLflow.

Środowisko obliczeniowe usługi Azure Machine Edukacja
Zdalne obliczenia

Masz już połączenie z obszarem roboczym podczas uruchamiania na maszynie azure Edukacja obliczeniowych.

Konfigurowanie identyfikatora URI śledzenia

Pobierz identyfikator URI śledzenia dla obszaru roboczego:
DOTYCZY: Rozszerzenie interfejsu wiersza polecenia platformy Azure w wersji 2 (bieżąca)
1. Zaloguj się i skonfiguruj obszar roboczy:
```
az account set --subscription <subscription>
az configure --defaults workspace=<workspace> group=<resource-group> location=<location> 
```
2. Identyfikator URI śledzenia można uzyskać za pomocą az ml workspace polecenia :
```
az ml workspace show --query mlflow_tracking_uri
```
DOTYCZY: Zestaw PYTHON SDK azure-ai-ml w wersji 2 (bieżąca)

Identyfikator URI śledzenia usługi Azure ML MLflow można uzyskać przy użyciu zestawu SDK usługi Azure Machine Edukacja w wersji 2 dla języka Python. Upewnij się, że biblioteka azure-ai-ml jest zainstalowana w używanym środowisku obliczeniowym. Poniższy przykład pobiera unikatowy identyfikator URI śledzenia MLFLow skojarzony z obszarem roboczym.
1. Zaloguj się do obszaru roboczego przy użyciu polecenia MLClient. Łatwiejszym sposobem na to jest użycie pliku konfiguracji obszaru roboczego:
```
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

ml_client = MLClient.from_config(credential=DefaultAzureCredential())
```
  Napiwek
  
  Plik konfiguracji obszaru roboczego można pobrać, wykonując następujące czynności:
  
  Przejdź do usługi Azure ML Studio
  
  Kliknij prawy górny róg strony —> pobierz plik konfiguracji.
  
  Zapisz plik config.json w tym samym katalogu, nad którym pracujesz.
2. Alternatywnie możesz użyć identyfikatora subskrypcji, nazwy grupy zasobów i nazwy obszaru roboczego, aby go pobrać:
```
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

#Enter details of your AzureML workspace
subscription_id = '<SUBSCRIPTION_ID>'
resource_group = '<RESOURCE_GROUP>'
workspace_name = '<WORKSPACE_NAME>'

ml_client = MLClient(credential=DefaultAzureCredential(),
                        subscription_id=subscription_id, 
                        resource_group_name=resource_group,
                        workspace_name=workspace_name)
```
  Ważne
  
  DefaultAzureCredential Program podejmie próbę ściągnięcia poświadczeń z dostępnego kontekstu. Jeśli chcesz określić poświadczenia w inny sposób, na przykład przy użyciu przeglądarki internetowej w interaktywny sposób, możesz użyć InteractiveBrowserCredential lub innej metody dostępnej w azure.identity pakiecie.
3. Pobierz identyfikator URI śledzenia usługi Azure Machine Edukacja:
```
mlflow_tracking_uri = ml_client.workspaces.get(ml_client.workspace_name).mlflow_tracking_uri
```
Użyj portalu usługi Azure Machine Edukacja, aby uzyskać identyfikator URI śledzenia:
1. Otwórz portal usługi Azure Machine Edukacja Studio i zaloguj się przy użyciu swoich poświadczeń.
2. W prawym górnym rogu kliknij nazwę obszaru roboczego, aby wyświetlić blok Katalog + subskrypcja i obszar roboczy .
3. Kliknij pozycję Wyświetl wszystkie właściwości w witrynie Azure Portal.
4. W sekcji Podstawy znajdziesz identyfikator URI śledzenia MLflow właściwości.
Identyfikator URI śledzenia usługi Azure Machine Edukacja można utworzyć przy użyciu identyfikatora subskrypcji, regionu, w którym jest wdrażany zasób, nazwa grupy zasobów i nazwa obszaru roboczego. Poniższy przykładowy kod pokazuje, jak:

Ostrzeżenie

Jeśli pracujesz w obszarze roboczym z obsługą łącza prywatnego, punkt końcowy platformy MLflow będzie również używać łącza prywatnego do komunikowania się z usługą Azure Machine Edukacja. W związku z tym identyfikator URI śledzenia będzie wyglądać inaczej, jak zaproponowano tutaj. W tych przypadkach musisz uzyskać identyfikator URI śledzenia przy użyciu zestawu AZURE ML SDK lub interfejsu wiersza polecenia w wersji 2.
```
region = "<LOCATION>"
subscription_id = '<SUBSCRIPTION_ID>'
resource_group = '<RESOURCE_GROUP>'
workspace_name = '<AML_WORKSPACE_NAME>'

mlflow_tracking_uri = f"azureml://{region}.api.azureml.ms/mlflow/v1.0/subscriptions/{subscription_id}/resourceGroups/{resource_group}/providers/Microsoft.MachineLearningServices/workspaces/{workspace_name}"
```
Konfigurowanie identyfikatora URI śledzenia:
- Korzystanie z zestawu MLflow SDK
- Używanie zmiennych środowiskowych
Następnie metoda set_tracking_uri() wskazuje identyfikator URI śledzenia MLflow na ten identyfikator URI.
```
import mlflow

mlflow.set_tracking_uri(mlflow_tracking_uri)
```
Zmienne środowiskowe MLflow można ustawić MLFLOW_TRACKING_URI w obliczeniach, aby dowolna interakcja z usługą MLflow w tym środowisku obliczeniowym wskazywała domyślnie usługę Azure Machine Edukacja.
```
MLFLOW_TRACKING_URI=$(az ml workspace show --query mlflow_tracking_uri | sed 's/"//g') 
```
Napiwek

Podczas pracy w środowiskach udostępnionych, takich jak klaster usługi Azure Databricks, klaster usługi Azure Synapse Analytics lub podobny, warto ustawić zmienną środowiskową MLFLOW_TRACKING_URI na poziomie klastra, aby automatycznie skonfigurować identyfikator URI śledzenia MLflow w taki sposób, aby wskazywał usługę Azure Machine Edukacja dla wszystkich sesji uruchomionych w klastrze, a nie na potrzeby poszczególnych sesji.

Konfiguruj uwierzytelnianie

Po skonfigurowaniu śledzenia należy również skonfigurować sposób uwierzytelniania w skojarzonym obszarze roboczym. Domyślnie wtyczka azure Machine Edukacja dla platformy MLflow wykonuje uwierzytelnianie interakcyjne, otwierając domyślną przeglądarkę w celu wyświetlenia monitu o poświadczenia. Zobacz Konfigurowanie platformy MLflow dla usługi Azure Machine Edukacja: Konfigurowanie uwierzytelniania, aby uzyskać więcej sposobów konfigurowania uwierzytelniania dla platformy MLflow w obszarach roboczych usługi Azure Machine Edukacja.

W przypadku zadań interaktywnych, w których istnieje użytkownik połączony z sesją, można polegać na uwierzytelnianiu interakcyjnym i dlatego nie jest wymagana żadna dalsza akcja.

Ostrzeżenie

Uwierzytelnianie interakcyjne przeglądarki zablokuje wykonywanie kodu podczas monitowania o poświadczenia. Nie jest to odpowiednia opcja uwierzytelniania w środowiskach nienadzorowanych, takich jak zadania szkoleniowe. Zalecamy skonfigurowanie innego trybu uwierzytelniania.

W przypadku tych scenariuszy, w których wymagane jest nienadzorowane wykonanie, należy skonfigurować jednostkę usługi do komunikowania się z usługą Azure Machine Edukacja.

MLflow SDK
Używanie zmiennych środowiskowych

import os

os.environ["AZURE_TENANT_ID"] = "<AZURE_TENANT_ID>"
os.environ["AZURE_CLIENT_ID"] = "<AZURE_CLIENT_ID>"
os.environ["AZURE_CLIENT_SECRET"] = "<AZURE_CLIENT_SECRET>"

export AZURE_TENANT_ID="<AZURE_TENANT_ID>"
export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>"
export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"

Napiwek

Podczas pracy w środowiskach udostępnionych zaleca się skonfigurowanie tych zmiennych środowiskowych w środowisku obliczeniowym. Najlepszym rozwiązaniem jest zarządzanie nimi jako wpisami tajnymi w wystąpieniu usługi Azure Key Vault zawsze, gdy jest to możliwe. Na przykład w usłudze Azure Databricks można używać wpisów tajnych w zmiennych środowiskowych w następujący sposób w konfiguracji klastra: AZURE_CLIENT_SECRET={{secrets/<scope-name>/<secret-name>}}. Zobacz Odwołanie do wpisu tajnego w zmiennej środowiskowej , aby dowiedzieć się, jak to zrobić w usłudze Azure Databricks lub zapoznaj się z podobną dokumentacją na platformie.