Pembelajaran mendalam

Artikel ini memberikan pengenalan singkat tentang menggunakan PyTorch, Tensorflow, dan pelatihan terdistribusi untuk mengembangkan dan menyempurnakan model pembelajaran mendalam di Azure Databricks. Ini juga mencakup tautan ke halaman dengan contoh buku catatan yang mengilustrasikan cara menggunakan alat tersebut.

PyTorch

PyTorch disertakan dalam Databricks Runtime ML dan menyediakan komputasi tensor yang dipercepat GPU dan fungsionalitas tingkat tinggi untuk membangun jaringan pembelajaran mendalam. Anda dapat melakukan pelatihan simpul tunggal atau pelatihan terdistribusi dengan PyTorch di Databricks. Lihat PyTorch.

TensorFlow

Databricks Runtime ML mencakup TensorFlow dan TensorBoard, sehingga Anda dapat menggunakan pustaka ini tanpa menginstal paket apa pun. TensorFlow mendukung komputasi numerik pembelajaran mendalam dan umum pada CPU, GPU, dan kluster GPU. TensorBoard menyediakan alat visualisasi untuk membantu Anda men-debug dan mengoptimalkan pembelajaran mesin dan alur kerja pembelajaran mendalam. Lihat TensorFlow untuk node tunggal dan contoh pelatihan terdistribusi.

Pelatihan yang didistribusikan

Karena model pembelajaran mendalam adalah data dan pelatihan yang intensif komputasi, pelatihan terdistribusi bisa menjadi penting. Untuk contoh pembelajaran mendalam terdistribusi menggunakan integrasi dengan Horovod, spark-tensorflow-distributor, TorchDistributor, dan DeepSpeed lihat Pelatihan terdistribusi.

Melacak pengembangan model pembelajaran mendalam

Pelacakan tetap menjadi landasan ekosistem MLflow dan sangat penting untuk sifat iteratif pembelajaran mendalam. Databricks menggunakan MLflow untuk melacak eksekusi pelatihan pembelajaran mendalam dan pengembangan model. Lihat Melacak pengembangan model menggunakan MLflow.