Mengelola instans komputasi Azure Pembelajaran Mesin

BERLAKU UNTUK:Ekstensi ml Azure CLI v2 (saat ini)Python SDK azure-ai-ml v2 (saat ini)

Pelajari cara mengelola instans komputasi di ruang kerja Azure Pembelajaran Mesin Anda.

Gunakan instans komputasi sebagai lingkungan pengembangan anda yang sepenuhnya dikonfigurasi dan dikelola di cloud. Untuk pengembangan dan pengujian, Anda juga dapat menggunakan instans sebagai target komputasi pelatihan. Instans komputasi dapat menjalankan beberapa pekerjaan secara paralel dan memiliki antrean pekerjaan. Sebagai lingkungan pengembangan, instans komputasi tidak dapat dibagikan dengan pengguna lain di ruang kerja Anda.

Dalam artikel ini, Anda mempelajari cara memulai, menghentikan, memulai ulang, menghapus instans komputasi. Untuk mempelajari cara membuat instans komputasi, lihat Membuat instans komputasi Azure Pembelajaran Mesin.

Catatan

Artikel ini memperlihatkan CLI v2 di bagian di bawah ini. Jika Anda masih menggunakan CLI v1, lihat Membuat Kluster komputasi Azure Pembelajaran Mesin CLI v1.

Prasyarat

Pilih tab yang sesuai untuk prasyarat lainnya berdasarkan metode pilihan Anda untuk mengelola instans komputasi Anda.

  • Jika Anda tidak menjalankan kode pada instans komputasi, instal Azure Pembelajaran Mesin Python SDK. SDK ini sudah diinstal untuk Anda pada instans komputasi.

  • Lampirkan ke ruang kerja di skrip Python Anda:

    Jalankan kode ini untuk menyambungkan ke ruang kerja Azure Pembelajaran Mesin Anda.

    Ganti ID Langganan, nama Grup Sumber Daya, dan Nama ruang kerja Anda dalam kode berikut. Untuk menemukan nilai-nilai ini:

    1. Masuk ke Studio Azure Machine Learning.
    2. Buka ruang kerja yang ingin Anda gunakan.
    3. Pilih nama ruang kerja Anda di toolbar studio Azure Pembelajaran Mesin kanan atas.
    4. Salin nilai untuk ruang kerja, grup sumber daya, dan ID langganan ke dalam kode.
    5. Salin satu nilai, tutup area dan tempel, lalu kembali untuk nilai berikutnya saat Anda menempelkan ke buku catatan di dalam studio.

    BERLAKU UNTUK: Python SDK azure-ai-ml v2 (saat ini)

    # Enter details of your AML workspace
    subscription_id = "<SUBSCRIPTION_ID>"
    resource_group = "<RESOURCE_GROUP>"
    workspace = "<AML_WORKSPACE_NAME>"
    # get a handle to the workspace
    from azure.ai.ml import MLClient
    from azure.identity import DefaultAzureCredential
    
    ml_client = MLClient(
        DefaultAzureCredential(), subscription_id, resource_group, workspace
    )

    ml_client adalah handler ke ruang kerja yang Anda gunakan untuk mengelola sumber daya dan pekerjaan lain.

Kelola

Memulai, menghentikan, memulai ulang, dan menghapus instans komputasi. Instans komputasi tidak selalu menurunkan skala secara otomatis, jadi pastikan untuk menghentikan sumber daya untuk mencegah biaya yang sedang berlangsung. Menghentikan instans komputasi yang membatalkannya. Kemudian mulai lagi ketika Anda membutuhkannya. Saat menghentikan instans komputasi menghentikan penagihan selama jam komputasi, Anda masih akan ditagih untuk disk, IP publik, dan penyeimbang beban standar.

Anda dapat mengaktifkan matikan otomatis untuk menghentikan instans komputasi secara otomatis setelah waktu yang ditentukan.

Anda juga dapat membuat jadwal instans komputasi untuk memulai dan berhenti secara otomatis berdasarkan waktu dan hari dalam seminggu.

Tip

Instans komputasi memiliki disk OS 120GB. Jika Anda kehabisan ruang disk, gunakan terminal untuk menghapus setidaknya 1-2 GB sebelum Anda menghentikan atau memulai ulang instans komputasi. Jangan hentikan instans komputasi dengan mengeluarkan pematian sudo dari terminal. Ukuran disk sementara pada instans komputasi bergantung pada ukuran VM yang dipilih dan dipasang di /mnt.

BERLAKU UNTUK: Python SDK azure-ai-ml v2 (saat ini)

Dalam contoh ini, nama instans komputasi disimpan dalam variabel ci_basic_name.

  • Dapatkan status

    from azure.ai.ml.entities import ComputeInstance, AmlCompute
    
    # Get compute
    ci_basic_state = ml_client.compute.get(ci_basic_name)
  • Stop

    from azure.ai.ml.entities import ComputeInstance, AmlCompute
    
    # Stop compute
    ml_client.compute.begin_stop(ci_basic_name).wait()
  • Mulai

    from azure.ai.ml.entities import ComputeInstance, AmlCompute
    
    # Start compute
    ml_client.compute.begin_start(ci_basic_name).wait()
  • Mulai ulang

    from azure.ai.ml.entities import ComputeInstance, AmlCompute
    
    # Restart compute
    ml_client.compute.begin_restart(ci_basic_name).wait()
  • Hapus

    from azure.ai.ml.entities import ComputeInstance, AmlCompute
    
    ml_client.compute.begin_delete(ci_basic_name).wait()

Azure RBAC memungkinkan Anda mengontrol pengguna mana di ruang kerja yang dapat membuat, menghapus, memulai, menghentikan, memulai ulang instans komputasi. Semua pengguna dalam peran kontributor dan pemilik ruang kerja dapat membuat, menghapus, memulai, menghentikan, dan memulai ulang instans komputasi di seluruh ruang kerja. Namun, hanya pembuat instans komputasi tertentu, atau pengguna yang ditetapkan jika dibuat atas nama mereka, yang diizinkan untuk mengakses Jupyter, JupyterLab, dan RStudio pada instans komputasi tersebut. Instans komputasi didedikasikan untuk satu pengguna yang memiliki akses root. Pengguna tersebut memiliki akses ke Jupyter/JupyterLab/RStudio yang berjalan pada instans. Instans komputasi memiliki masuk pengguna tunggal dan semua tindakan menggunakan identitas pengguna tersebut untuk Azure RBAC dan atribusi pekerjaan eksperimen. Akses SSH dikontrol melalui mekanisme kunci publik/privat.

Tindakan ini dapat dikontrol oleh Azure RBAC:

  • Microsoft.MachineLearningServices/workspaces/computes/read
  • Microsoft.MachineLearningServices/workspaces/computes/write
  • Microsoft.MachineLearningServices/workspaces/computes/write
  • Microsoft.MachineLearningServices/workspaces/computes/start/action
  • Microsoft.MachineLearningServices/workspaces/computes/stop/action
  • Microsoft.MachineLearningServices/workspaces/computes/restart/action
  • Microsoft.Machine Pembelajaran Services/workspaces/computes/updateSchedules/action

Untuk membuat instans komputasi, Anda memerlukan izin untuk tindakan berikut:

  • Microsoft.MachineLearningServices/workspaces/computes/write
  • Microsoft.MachineLearningServices/workspaces/computes/write

Mengaudit dan mengamati versi instans komputasi

Setelah instans komputasi disebarkan, instans tersebut tidak diperbarui secara otomatis. Microsoft merilis gambar VM baru setiap bulan. Untuk memahami opsi untuk menjaga terbaru dengan versi terbaru, lihat manajemen kerentanan.

Untuk melacak apakah versi sistem operasi instans terkini, Anda dapat mengkueri versinya menggunakan CLI, SDK, atau Studio UI.

BERLAKU UNTUK: Python SDK azure-ai-ml v2 (saat ini)

from azure.ai.ml.entities import ComputeInstance, AmlCompute

# Display operating system version
instance = ml_client.compute.get("myci")
print instance.os_image_metadata

Untuk informasi selengkapnya tentang kelas, metode, dan parameter yang digunakan dalam contoh ini, lihat dokumen referensi berikut:

Administrator TI dapat menggunakan Azure Policy untuk memantau inventarsi instans di seluruh ruang kerja di portal kepatuhan Azure Policy. Tetapkan kebijakan bawaan Audit Azure Machine Learning Compute Instances dengan sistem operasi yang kedaluarsa pada langganan Azure atau cakupan grup manajemen Azure.

Langkah berikutnya