Pembelajaran mendalam
Artikel ini memberikan pengenalan singkat tentang menggunakan PyTorch, Tensorflow, dan pelatihan terdistribusi untuk mengembangkan dan menyempurnakan model pembelajaran mendalam di Azure Databricks. Ini juga mencakup tautan ke halaman dengan contoh buku catatan yang mengilustrasikan cara menggunakan alat tersebut.
- Untuk panduan umum tentang mengoptimalkan alur kerja pembelajaran mendalam di Azure Databricks, lihat Praktik terbaik untuk pembelajaran mendalam di Azure Databricks.
- Untuk informasi tentang bekerja dengan model bahasa besar dan AI generatif di Azure Databricks, lihat:
PyTorch
PyTorch disertakan dalam Databricks Runtime ML dan menyediakan komputasi tensor yang dipercepat GPU dan fungsionalitas tingkat tinggi untuk membangun jaringan pembelajaran mendalam. Anda dapat melakukan pelatihan simpul tunggal atau pelatihan terdistribusi dengan PyTorch di Databricks. Lihat PyTorch.
TensorFlow
Databricks Runtime ML mencakup TensorFlow dan TensorBoard, sehingga Anda dapat menggunakan pustaka ini tanpa menginstal paket apa pun. TensorFlow mendukung komputasi numerik pembelajaran mendalam dan umum pada CPU, GPU, dan kluster GPU. TensorBoard menyediakan alat visualisasi untuk membantu Anda men-debug dan mengoptimalkan pembelajaran mesin dan alur kerja pembelajaran mendalam. Lihat TensorFlow untuk node tunggal dan contoh pelatihan terdistribusi.
Pelatihan yang didistribusikan
Karena model pembelajaran mendalam adalah data dan pelatihan yang intensif komputasi, pelatihan terdistribusi bisa menjadi penting. Untuk contoh pembelajaran mendalam terdistribusi menggunakan integrasi dengan Horovod, spark-tensorflow-distributor
, TorchDistributor, dan DeepSpeed lihat Pelatihan terdistribusi.
Melacak pengembangan model pembelajaran mendalam
Pelacakan tetap menjadi landasan ekosistem MLflow dan sangat penting untuk sifat iteratif pembelajaran mendalam. Databricks menggunakan MLflow untuk melacak eksekusi pelatihan pembelajaran mendalam dan pengembangan model. Lihat Melacak pengembangan model menggunakan MLflow.