Mengidentifikasi sumber daya Azure Pembelajaran Mesin

Selesai

Sumber daya di Azure Pembelajaran Mesin merujuk ke infrastruktur yang Anda butuhkan untuk menjalankan alur kerja pembelajaran mesin. Idealnya, Anda ingin seseorang seperti administrator membuat dan mengelola sumber daya.

Sumber daya di Azure Pembelajaran Mesin meliputi:

  • Ruang kerja
  • Sumber daya komputasi
  • Datastore

Membuat dan mengelola ruang kerja

Ruang kerja adalah sumber daya tingkat atas untuk Azure Pembelajaran Mesin. Ilmuwan data memerlukan akses ke ruang kerja untuk melatih dan melacak model, dan untuk menyebarkan model ke titik akhir.

Namun, Anda ingin berhati-hati dengan siapa yang memiliki akses penuh ke ruang kerja. Di samping referensi ke sumber daya komputasi dan penyimpanan data, Anda dapat menemukan semua log, metrik, output, model, dan rekam jepret kode Anda di ruang kerja.

Membuat dan mengelola sumber daya komputasi

Salah satu sumber daya terpenting yang Anda butuhkan saat melatih atau menyebarkan model adalah komputasi. Ada lima jenis komputasi di ruang kerja Azure Pembelajaran Mesin:

  • Instans komputasi: Mirip dengan komputer virtual di cloud, dikelola oleh ruang kerja. Ideal untuk digunakan sebagai lingkungan pengembangan untuk menjalankan notebook (Jupyter).
  • Kluster komputasi: Kluster sesuai permintaan simpul komputasi CPU atau GPU di cloud, dikelola oleh ruang kerja. Ideal digunakan untuk beban kerja produksi karena secara otomatis menskalakan sesuai kebutuhan Anda.
  • Kluster Kubernetes: Memungkinkan Anda membuat atau melampirkan kluster Azure Kubernetes Service (AKS). Ideal untuk menyebarkan model pembelajaran mesin terlatih dalam skenario produksi.
  • Komputasi terlampir: Memungkinkan Anda melampirkan sumber daya komputasi Azure lainnya ke ruang kerja, seperti kumpulan Azure Databricks atau Synapse Spark.
  • Komputasi tanpa server: Komputasi sesuai permintaan yang dikelola sepenuhnya yang dapat Anda gunakan untuk pekerjaan pelatihan.

Catatan

Saat Azure Pembelajaran Mesin membuat dan mengelola komputasi tanpa server untuk Anda, Azure Pembelajaran Mesin tidak tercantum di halaman komputasi di studio. Pelajari selengkapnya tentang cara menggunakan komputasi tanpa server untuk pelatihan model

Meskipun komputasi adalah sumber daya terpenting saat bekerja dengan beban kerja pembelajaran mesin, komputasi juga bisa menjadi yang paling mahal biayanya. Oleh karena itu, praktik terbaik adalah hanya mengizinkan administrator untuk membuat dan mengelola sumber daya komputasi. Ilmuwan data tidak boleh diizinkan untuk mengedit komputasi, tetapi hanya menggunakan komputasi yang tersedia untuk menjalankan beban kerja mereka.

Membuat dan mengelola datastore

Ruang kerja tidak menyimpan data apa pun itu sendiri. Sebagai gantinya, semua data disimpan di penyimpanan data, yang merupakan referensi ke layanan data Azure. Informasi koneksi ke layanan data yang diwakili datastore, disimpan di Azure Key Vault.

Saat ruang kerja dibuat, akun Azure Storage dibuat dan secara otomatis tersambung ke ruang kerja. Akibatnya, Anda memiliki empat penyimpanan data yang sudah ditambahkan ke ruang kerja Anda:

  • workspaceartifactstore: Koneksi ke azureml kontainer akun Azure Storage yang dibuat dengan ruang kerja. Digunakan untuk menyimpan log komputasi dan eksperimen saat menjalankan pekerjaan.
  • workspaceworkingdirectory: Koneksi ke berbagi file akun Azure Storage yang dibuat dengan ruang kerja yang digunakan oleh bagian Notebooks di studio. Setiap kali Anda mengunggah file atau folder untuk diakses dari instans komputasi, file tersebut akan diunggah ke berbagi file ini.
  • workspaceblobstore: Koneksi ke Blob Storage akun Azure Storage yang dibuat dengan ruang kerja. Khususnya azureml-blobstore-... kontainer. Atur sebagai datastore default, yang berarti bahwa setiap kali Anda membuat aset data dan mengunggah data, data disimpan dalam kontainer ini.
  • workspacefilestore: Koneksi ke berbagi file akun Azure Storage yang dibuat dengan ruang kerja. Khususnya azureml-filestore-... berbagi file.

Selain itu, Anda dapat membuat penyimpanan data untuk menyambungkan ke layanan data Azure lainnya. Paling umum, datastore Anda akan terhubung ke Akun Azure Storage atau Azure Data Lake Storage (Gen2) karena layanan data tersebut paling sering digunakan dalam proyek ilmu data.