Deep Learning

Artikel
03/01/2024

Dit artikel bevat een korte inleiding tot het gebruik van PyTorch, Tensorflow en gedistribueerde training voor het ontwikkelen en verfijnen van Deep Learning-modellen in Azure Databricks. Het bevat ook koppelingen naar pagina's met voorbeeldnotitieblokken die illustreren hoe u deze hulpprogramma's gebruikt.

Zie best practices voor deep learning in Azure Databricks voor algemene richtlijnen voor het optimaliseren van Deep Learning-werkstromen in Azure Databricks.
Zie voor meer informatie over het werken met grote taalmodellen en generatieve AI in Azure Databricks:
- Grote taalmodellen (LLMs) in Databricks.
- Generatieve AI- en grote taalmodellen (LLM's) in Azure Databricks.

PyTorch

PyTorch is opgenomen in Databricks Runtime ML en biedt versnelde tensor-berekeningen en functies op hoog niveau voor het bouwen van deep learning-netwerken. U kunt training voor één knooppunt of gedistribueerde training uitvoeren met PyTorch op Databricks. Zie PyTorch.

TensorFlow

Databricks Runtime ML bevat TensorFlow en TensorBoard, zodat u deze bibliotheken kunt gebruiken zonder pakketten te installeren. TensorFlow ondersteunt deep learning en algemene numerieke berekeningen op CPU's, GPU's en clusters met GPU's. TensorBoard biedt visualisatiehulpprogramma's waarmee u machine learning- en Deep Learning-werkstromen kunt opsporen en optimaliseren. Zie TensorFlow voor voorbeelden van één knooppunt en gedistribueerde training.

Gedistribueerde training

Omdat Deep Learning-modellen gegevens- en rekenintensief zijn, kan gedistribueerde training belangrijk zijn. Zie Gedistribueerde training voor voorbeelden van gedistribueerde deep learning met behulp van integraties met Horovod, spark-tensorflow-distributorTorchDistributor en DeepSpeed.

Ontwikkeling van deep learning-modellen bijhouden

Tracking blijft een hoeksteen van het MLflow-ecosysteem en is vooral essentieel voor de iteratieve aard van deep learning. Databricks maakt gebruik van MLflow om deep learning-trainingsuitvoeringen en modelontwikkeling bij te houden. Zie Modelontwikkeling bijhouden met behulp van MLflow.

Deep Learning

PyTorch

TensorFlow

Gedistribueerde training

Ontwikkeling van deep learning-modellen bijhouden

Aanvullende resources