Pilih target komputasi yang sesuai

Selesai

Di Azure Pembelajaran Mesin, target komputasi adalah komputer fisik atau virtual tempat pekerjaan dijalankan.

Memahami jenis komputasi yang tersedia

Azure Pembelajaran Mesin mendukung beberapa jenis komputasi untuk eksperimen, pelatihan, dan penyebaran. Dengan memiliki beberapa jenis komputasi, Anda dapat memilih jenis target komputasi yang paling tepat untuk kebutuhan Anda.

Diagram of different hyperparameter values resulting in different models by performing hyperparameter tuning.

  • Instans komputasi: Berperilaku mirip dengan komputer virtual dan terutama digunakan untuk menjalankan notebook. Ini ideal untuk eksperimen.
  • Kluster komputasi: Kluster multi-simpul komputer virtual yang secara otomatis meningkatkan atau menurunkan skala untuk memenuhi permintaan. Cara hemat biaya untuk menjalankan skrip yang perlu memproses data dalam volume besar. Kluster juga memungkinkan Anda menggunakan pemrosesan paralel untuk mendistribusikan beban kerja dan mengurangi waktu yang diperlukan untuk menjalankan skrip.
  • Kluster Kubernetes: Kluster berdasarkan teknologi Kubernetes, memberi Anda lebih banyak kontrol atas bagaimana komputasi dikonfigurasi dan dikelola. Anda dapat melampirkan kluster Azure Kubernetes (AKS) yang dikelola sendiri untuk komputasi cloud, atau kluster Arc Kubernetes untuk beban kerja lokal.
  • Komputasi terlampir: Memungkinkan Anda melampirkan komputasi yang ada seperti komputer virtual Azure atau kluster Azure Databricks ke ruang kerja Anda.
  • Komputasi tanpa server: Komputasi sesuai permintaan yang dikelola sepenuhnya yang dapat Anda gunakan untuk pekerjaan pelatihan.

Catatan

Azure Pembelajaran Mesin menawarkan opsi untuk membuat dan mengelola komputasi Anda sendiri atau menggunakan komputasi yang dikelola sepenuhnya oleh Azure Pembelajaran Mesin.

Kapan menggunakan jenis komputasi mana?

Secara umum, ada beberapa praktik terbaik yang dapat Anda ikuti saat bekerja dengan target komputasi. Untuk memahami cara memilih jenis komputasi yang sesuai, beberapa contoh disediakan. Ingatlah bahwa jenis komputasi mana yang Anda gunakan selalu tergantung pada situasi spesifik Anda.

Pilih target komputasi untuk eksperimen

Bayangkan Anda seorang ilmuwan data dan Anda diminta untuk mengembangkan model pembelajaran mesin baru. Anda mungkin memiliki subset kecil data pelatihan yang dapat Anda eksperimen.

Selama eksperimen dan pengembangan, Anda lebih suka bekerja di notebook Jupyter. Pengalaman notebook paling diuntungkan dari komputasi yang terus berjalan.

Banyak ilmuwan data yang terbiasa menjalankan notebook di perangkat lokal mereka. Alternatif cloud yang dikelola oleh Azure Pembelajaran Mesin adalah instans komputasi. Atau, Anda juga dapat memilih komputasi tanpa server Spark untuk menjalankan kode Spark di notebook, jika Anda ingin menggunakan daya komputasi terdistribusi Spark.

Pilih target komputasi untuk produksi

Setelah eksperimen, Anda dapat melatih model dengan menjalankan skrip Python untuk mempersiapkan produksi. Skrip akan lebih mudah diotomatisasi dan dijadwalkan ketika Anda ingin melatih kembali model Anda terus menerus dari waktu ke waktu. Anda dapat menjalankan skrip sebagai (alur) pekerjaan.

Saat pindah ke produksi, Anda ingin target komputasi siap menangani data dalam volume besar. Semakin banyak data yang Anda gunakan, semakin baik kemungkinan model pembelajaran mesin.

Saat melatih model dengan skrip, Anda menginginkan target komputasi sesuai permintaan. Kluster komputasi secara otomatis meningkatkan skala ketika skrip perlu dijalankan, dan menurunkan skala ketika skrip selesai dieksekusi. Jika Anda menginginkan alternatif yang tidak perlu Anda buat dan kelola, Anda dapat menggunakan komputasi tanpa server Azure Pembelajaran Mesin.

Pilih target komputasi untuk penyebaran

Jenis komputasi yang Anda butuhkan saat menggunakan model Anda untuk menghasilkan prediksi tergantung pada apakah Anda menginginkan prediksi batch atau real-time.

Untuk prediksi batch, Anda dapat menjalankan pekerjaan alur di Azure Pembelajaran Mesin. Target komputasi seperti kluster komputasi dan komputasi tanpa server Azure Pembelajaran Mesin sangat ideal untuk pekerjaan alur karena sesuai permintaan dan dapat diskalakan.

Saat Anda menginginkan prediksi real time, Anda memerlukan jenis komputasi yang berjalan terus menerus. Oleh karena itu, penyebaran real-time mendapat manfaat dari komputasi yang lebih ringan (dan dengan demikian lebih hemat biaya). Kontainer sangat ideal untuk penyebaran real-time. Saat Anda menyebarkan model ke titik akhir online terkelola, Azure Pembelajaran Mesin membuat dan mengelola kontainer agar Anda dapat menjalankan model Anda. Atau, Anda dapat melampirkan kluster Kubernetes untuk mengelola komputasi yang diperlukan untuk menghasilkan prediksi real-time.