Qu’est-ce qu’Azure Data Science Virtual Machine pour Linux et Windows ?

Data Science Virtual Machine (DSVM) est une image de machine virtuelle personnalisée qui est disponible sur la plateforme cloud Azure et qui peut gérer la science des données. Elle inclut de nombreux outils populaires de science des données qui sont préinstallés et préconfigurés afin d’accélérer la création d’applications intelligentes à des fins d’analyse avancée.

La Data Science Virtual Machine est disponible sur :

  • Windows Server 2019
  • Windows Server 2022
  • Ubuntu 20.04 LTS

De plus, nous offrons Azure DSVM pour PyTorch, une image Ubuntu 20.04 de la Place de marché Azure qui est optimisée pour les grandes charges de travail distribuées de Deep Learning. Cette DSVM préinstallée est validée avec la dernière version de PyTorch pour réduire les coûts d’installation et accélérer le délai de rentabilisation. Elle est fournie avec différentes fonctionnalités d’optimisation :

  • ONNX Runtime
  • DeepSpeed
  • MSCCL​
  • ORTMoE​
  • Fairscale
  • Nvidia Apex​
  • Une pile à jour avec les dernières versions compatibles d’Ubuntu, Python, PyTorch et CUDA

Comparaison avec Azure Machine Learning

La DSVM est une image de machine virtuelle personnalisée pour la Science des données, mais Azure Machine Learning est une plateforme de bout en bout qui couvre :

  • Capacité de calcul managée
    • Compute Instances (Instances de calcul)
    • Clusters de calcul pour les tâches ML distribuées
    • Clusters d’inférence pour la notation en temps réel
  • Magasins de données (par exemple Blob, ADLS Gen2, SQL DB)
  • Suivi des expériences
  • La gestion des modèles
  • Notebooks
  • Environnements (gérer les dépendances Conda et R)
  • L’étiquetage
  • Pipelines (automatiser les workflows de science des données de bout en bout)

Comparaison avec les instances de calcul Azure Machine Learning

Les instances de calcul Azure Machine Learning sont des images de machine virtuelle entièrement configurées et managées, tandis que la DSVM est une machine virtuelle non managée.

Principales différences entre une DSVM et une instance de calcul Azure Machine Learning :

Fonctionnalité Science des données
Machine virtuelle
Azure Machine Learning
Instance de calcul
Entièrement managée Non Oui
Prise en charge de la langue Python, R, Julia, SQL, C#,
Java, Node.js, F#
Python et R
Système d'exploitation Ubuntu
Windows
Ubuntu
Option GPU préconfigurée Oui Oui
Option de scale-up Oui Oui
Accès SSH Oui Oui
Accès RDP Oui Non
Intégré
Notebooks hébergés
Non
(nécessite une configuration supplémentaire)
Oui
Authentification unique intégrée Aucune
(nécessite une configuration supplémentaire)
Oui
Collaboration intégrée Non Oui
Outils préinstallés Jupyter(lab), VS Code,
Visual Studio, PyCharm, Juno,
Power BI Desktop, SSMS,
Microsoft Office 365, Apache Drill
Jupyter(lab)

Exemples de cas d’usage client de DSVM

Expérimentation et évaluation à court terme

La DSVM peut évaluer ou apprendre de nouveaux outils de science des données. Essayez certains de nos exemples et procédures pas à pas publiés.

Deep Learning avec les GPU

Dans la DSVM, vos modèles de formation peuvent utiliser des algorithmes de Deep Learning sur du matériel basé sur des unités de traitement graphique (GPU). Si vous tirez parti des fonctionnalités de mise à l’échelle des machines virtuelles de la plateforme Azure, la DSVM vous aide à exploiter le matériel basé sur GPU dans le cloud en fonction de vos besoins. Vous pouvez basculer sur une machine virtuelle basée sur GPU quand vous effectuez l’apprentissage de grands modèles ou quand vous avez besoin d’une grande rapidité de calcul tout en conservant le même disque de système d’exploitation. Vous pouvez choisir l’une des références SKU de machines virtuelles avec GPU de la série N avec DSVM. Les comptes gratuits Azure ne prennent pas en charge les références SKU de machines virtuelles où le GPU est activé.

Une DSVM édition Windows est préinstallée avec les pilotes GPU, les infrastructures et les versions GPU des infrastructures de Deep Learning. Sur les éditions Linux, le deep learning sur les GPU est activé sur les DSVM Ubuntu.

Vous pouvez également déployer l’édition Ubuntu ou Windows de la DSVM sur une machine virtuelle Azure qui n’est pas basée sur des GPU. Dans ce cas, toutes les infrastructures de Deep Learning repassent en mode UC.

Découvrez-en plus sur les frameworks de deep learning et d’intelligence artificielle disponibles.

Formation et éducation de la science des données

Les formateurs et instructeurs en entreprise qui enseignent la science des données fournissent généralement une image de machine virtuelle. Avec l’image, les étudiants disposent d’une installation cohérente et les exemples fonctionnent comme prévu.

La DSVM crée un environnement à la demande avec une configuration cohérente qui atténue les problèmes de support et d’incompatibilité. Ceci est d’autant plus bénéfique dans les cas où ces environnements doivent être créés fréquemment, en particulier lors de formations plus courtes.

Que comprend la DSVM ?

Pour plus d’informations, consultez cette liste complète des outils sur les DSVM Windows et Linux.

Étapes suivantes

Pour plus d’informations, visitez ces ressources :