Zarządzanie wystąpieniem obliczeniowym usługi Azure Machine Edukacja

DOTYCZY: Rozszerzenie interfejsu wiersza polecenia platformy Azure w wersji 2 (current)Zestaw PYTHON SDK azure-ai-ml v2 (bieżąca)

Dowiedz się, jak zarządzać wystąpieniem obliczeniowym w obszarze roboczym usługi Azure Machine Edukacja.

Użyj wystąpienia obliczeniowego jako w pełni skonfigurowanego i zarządzanego środowiska programistycznego w chmurze. Na potrzeby programowania i testowania można również użyć wystąpienia jako celu obliczeniowego trenowania. Wystąpienie obliczeniowe może uruchamiać wiele zadań równolegle i ma kolejkę zadań. Jako środowisko programistyczne wystąpienie obliczeniowe nie może być współużytkowane przez innych użytkowników w obszarze roboczym.

Z tego artykułu dowiesz się, jak uruchomić, zatrzymać, uruchomić ponownie, usunąć wystąpienie obliczeniowe. Aby dowiedzieć się, jak utworzyć wystąpienie obliczeniowe, zobacz Tworzenie wystąpienia obliczeniowego usługi Azure Machine Edukacja.

Uwaga

W tym artykule przedstawiono interfejs wiersza polecenia w wersji 2 w poniższych sekcjach. Jeśli nadal używasz interfejsu wiersza polecenia w wersji 1, zobacz Tworzenie maszyny Edukacja interfejsu wiersza polecenia klastra obliczeniowego w wersji 1.

Wymagania wstępne

Wybierz odpowiednią kartę dla pozostałych wymagań wstępnych w oparciu o preferowaną metodę zarządzania wystąpieniem obliczeniowym.

  • Jeśli nie uruchamiasz kodu w wystąpieniu obliczeniowym, zainstaluj zestaw AZURE Machine Edukacja Python SDK. Ten zestaw SDK jest już zainstalowany w wystąpieniu obliczeniowym.

  • Dołącz do obszaru roboczego w skrypsie języka Python:

    Uruchom ten kod, aby nawiązać połączenie z obszarem roboczym usługi Azure Machine Edukacja.

    Zastąp identyfikator subskrypcji, nazwę grupy zasobów i nazwę obszaru roboczego w poniższym kodzie. Aby znaleźć następujące wartości:

    1. Zaloguj się do usługi Azure Machine Edukacja Studio.
    2. Otwórz obszar roboczy, którego chcesz użyć.
    3. Wybierz nazwę obszaru roboczego w prawym górnym rogu paska narzędzi azure Machine Edukacja Studio.
    4. Skopiuj wartość obszaru roboczego, grupy zasobów i identyfikatora subskrypcji do kodu.
    5. Skopiuj jedną wartość, zamknij obszar i wklej, a następnie wróć do następnego podczas wklejania do notesu w programie Studio.

    DOTYCZY: Zestaw PYTHON SDK azure-ai-ml w wersji 2 (bieżąca)

    # Enter details of your AML workspace
    subscription_id = "<SUBSCRIPTION_ID>"
    resource_group = "<RESOURCE_GROUP>"
    workspace = "<AML_WORKSPACE_NAME>"
    # get a handle to the workspace
    from azure.ai.ml import MLClient
    from azure.identity import DefaultAzureCredential
    
    ml_client = MLClient(
        DefaultAzureCredential(), subscription_id, resource_group, workspace
    )

    ml_client jest procedurą obsługi obszaru roboczego używanego do zarządzania innymi zasobami i zadaniami.

Zarządzanie

Uruchamianie, zatrzymywanie, ponowne uruchamianie i usuwanie wystąpienia obliczeniowego. Wystąpienie obliczeniowe nie zawsze jest automatycznie skalowane w dół, dlatego pamiętaj, aby zatrzymać zasób, aby zapobiec trwającym opłatom. Zatrzymanie wystąpienia obliczeniowego powoduje cofnięcie jego przydziału. Następnie uruchom go ponownie, gdy będzie potrzebny. Zatrzymanie wystąpienia obliczeniowego zatrzymuje naliczanie opłat za godziny obliczeniowe, nadal jednak są naliczane opłaty za dysk, publiczny adres IP i standardowy moduł równoważenia obciążenia.

Możesz włączyć automatyczne zamykanie , aby automatycznie zatrzymać wystąpienie obliczeniowe po upływie określonego czasu.

Możesz również utworzyć harmonogram dla wystąpienia obliczeniowego, aby automatycznie uruchamiać i zatrzymywać się na podstawie godziny i dnia tygodnia.

Napiwek

Wystąpienie obliczeniowe korzysta z dysku systemu operacyjnego o pojemności 120 GB. Jeśli zabraknie miejsca na dysku, użyj terminalu, aby wyczyścić co najmniej 1–2 GB przed zatrzymaniem lub ponownym uruchomieniem wystąpienia obliczeniowego. Nie należy zatrzymywać wystąpienia obliczeniowego, wydając polecenie sudo shutdown z terminalu. Rozmiar dysku tymczasowego w wystąpieniu obliczeniowym zależy od wybranego rozmiaru maszyny wirtualnej i jest zainstalowany na /mnt.

DOTYCZY: Zestaw PYTHON SDK azure-ai-ml w wersji 2 (bieżąca)

W tych przykładach nazwa wystąpienia obliczeniowego jest przechowywana w zmiennej ci_basic_name.

  • Uzyskiwanie stanu

    from azure.ai.ml.entities import ComputeInstance, AmlCompute
    
    # Get compute
    ci_basic_state = ml_client.compute.get(ci_basic_name)
  • Zatrzymaj

    from azure.ai.ml.entities import ComputeInstance, AmlCompute
    
    # Stop compute
    ml_client.compute.begin_stop(ci_basic_name).wait()
  • Rozpocznij

    from azure.ai.ml.entities import ComputeInstance, AmlCompute
    
    # Start compute
    ml_client.compute.begin_start(ci_basic_name).wait()
  • Uruchom ponownie

    from azure.ai.ml.entities import ComputeInstance, AmlCompute
    
    # Restart compute
    ml_client.compute.begin_restart(ci_basic_name).wait()
  • Delete

    from azure.ai.ml.entities import ComputeInstance, AmlCompute
    
    ml_client.compute.begin_delete(ci_basic_name).wait()

Kontrola dostępu oparta na rolach platformy Azure umożliwia kontrolowanie, którzy użytkownicy w obszarze roboczym mogą tworzyć, usuwać, uruchamiać, zatrzymywać, uruchamiać ponownie wystąpienie obliczeniowe. Wszyscy użytkownicy z roli współautora obszaru roboczego i właściciela mogą tworzyć, usuwać, uruchamiać, zatrzymywać i ponownie uruchamiać wystąpienia obliczeniowe w obszarze roboczym. Jednak tylko twórca określonego wystąpienia obliczeniowego lub użytkownik przypisany, jeśli został utworzony w ich imieniu, może uzyskać dostęp do programu Jupyter, JupyterLab i RStudio w tym wystąpieniu obliczeniowym. Wystąpienie obliczeniowe jest przeznaczone dla pojedynczego użytkownika, który ma dostęp główny. Ten użytkownik ma dostęp do aplikacji Jupyter/JupyterLab/RStudio uruchomionej w wystąpieniu. Wystąpienie obliczeniowe ma logowanie jednokrotne użytkownika i wszystkie akcje używają tożsamości tego użytkownika dla kontroli dostępu opartej na rolach platformy Azure i przypisywania zadań eksperymentu. Dostęp za pomocą protokołu SSH jest kontrolowany za pomocą mechanizmu klucza publicznego/prywatnego.

Te akcje można kontrolować za pomocą kontroli dostępu opartej na rolach platformy Azure:

  • Microsoft.Machine Edukacja Services/workspaces/computes/read
  • Microsoft.MachineLearningServices/workspaces/computes/write
  • Microsoft.Machine Edukacja Services/workspaces/computes/delete
  • Microsoft.Machine Edukacja Services/workspaces/computes/start/action
  • Microsoft.Machine Edukacja Services/workspaces/computes/stop/action
  • Microsoft.Machine Edukacja Services/workspaces/computes/restart/action
  • Microsoft.Machine Edukacja Services/workspaces/computes/updateSchedules/action

Aby utworzyć wystąpienie obliczeniowe, musisz mieć uprawnienia do następujących akcji:

  • Microsoft.MachineLearningServices/workspaces/computes/write
  • Microsoft.MachineLearningServices/workspaces/checkComputeNameAvailability/action

Inspekcja i obserwowanie wersji wystąpienia obliczeniowego

Po wdrożeniu wystąpienia obliczeniowego nie zostanie ono automatycznie zaktualizowane. Firma Microsoft wydaje nowe obrazy maszyn wirtualnych co miesiąc. Aby poznać opcje przechowywania najnowszych wersji, zobacz zarządzanie lukami w zabezpieczeniach.

Aby śledzić, czy wersja systemu operacyjnego wystąpienia jest aktualna, możesz wykonać zapytanie dotyczące jego wersji przy użyciu interfejsu wiersza polecenia, zestawu SDK lub interfejsu użytkownika programu Studio.

DOTYCZY: Zestaw PYTHON SDK azure-ai-ml w wersji 2 (bieżąca)

from azure.ai.ml.entities import ComputeInstance, AmlCompute

# Display operating system version
instance = ml_client.compute.get("myci")
print instance.os_image_metadata

Aby uzyskać więcej informacji na temat klas, metod i parametrów używanych w tym przykładzie, zobacz następujące dokumenty referencyjne:

Administratorzy IT mogą używać usługi Azure Policy do monitorowania spisu wystąpień w obszarach roboczych w portalu zgodności usługi Azure Policy. Przypisz wbudowane zasady Audit Azure Machine Learning Compute Instances z nieaktualnym systemem operacyjnym w subskrypcji platformy Azure lub w zakresie grupy zarządzania platformy Azure.

Następne kroki