Qu’est-ce qu’Azure Data Science Virtual Machine pour Linux et Windows ?

La Data Science Virtual Machine (DSVM) est une image de machine virtuelle personnalisée sur la plateforme cloud Azure spécialement conçue pour la science des données. Elle inclut de nombreux outils populaires de science des données qui sont préinstallés et préconfigurés afin d’accélérer la création d’applications intelligentes à des fins d’analyse avancée.

La Data Science Virtual Machine est disponible sur :

  • Windows Server 2019
  • Windows Server 2022
  • Ubuntu 20.04 LTS

De plus, nous sommes heureux de fournir Azure DSVM pour PyTorch, qui est une image Ubuntu 20.04, de la place de marché Azure, optimisée pour les grandes charges de travail distribuées de Deep Learning. Elle est préinstallée et validée avec la dernière version de PyTorch pour réduire les coûts d’installation et accélérer le temps de valorisation. Elle est fournie avec diverses fonctionnalités d’optimisation (ONNX Runtime, DeepSpeed, MSCCL, ORTMoE, Fairscale, Nvidia Apex) et une pile à jour avec les dernières versions compatibles d’Ubuntu, de Python, de PyTorch et de CUDA.

Comparaison avec Azure Machine Learning

DSVM est une image de machine virtuelle personnalisée pour Data Science, mais Azure Machine Learning est une plateforme de bout en bout qui comprend :

  • Capacité de calcul managée
    • Compute Instances (Instances de calcul)
    • Clusters de calcul pour les tâches ML distribuées
    • Clusters d’inférence pour la notation en temps réel
  • Magasins de données (par exemple Blob, ADLS Gen2, SQL DB)
  • Suivi des expériences
  • La gestion des modèles
  • Notebooks
  • Environnements (gérer les dépendances Conda et R)
  • L’étiquetage
  • Pipelines (automatiser les workflows de science des données de bout en bout)

Comparaison avec les instances de calcul Azure Machine Learning

Les instances de calcul Azure Machine Learning sont des images de machine virtuelle entièrement configurées et managées, tandis que DSVM est une machine virtuelle non managée.

Principales différences entre ces éléments :

Fonctionnalité Science des données
Machine virtuelle
Azure Machine Learning
Instance de calcul
Entièrement managée Non Oui
Prise en charge de la langue Python, R, Julia, SQL, C#,
Java, Node.js, F#
Python et R
Système d'exploitation Ubuntu
Windows
Ubuntu
Option GPU préconfigurée Oui Oui
Option de scale-up Oui Oui
Accès SSH Oui Oui
Accès RDP Oui Non
Intégré
Notebooks hébergés
Non
(nécessite une configuration supplémentaire)
Oui
Authentification unique intégrée Aucune
(nécessite une configuration supplémentaire)
Oui
Collaboration intégrée Non Oui
Outils préinstallés Jupyter(lab), VS Code,
Visual Studio, PyCharm, Juno,
Power BI Desktop, SSMS,
Microsoft Office 365, Apache Drill
Jupyter(lab)

Exemples de cas d’utilisation

Voici quelques cas d’usage courants pour les clients DSVM.

Expérimentation et évaluation à court terme

Vous pouvez utiliser une DSVM pour évaluer et apprendre de nouveaux outils de science des données, notamment en consultant nos exemples et procédures pas à pas.

Deep Learning avec les GPU

Dans la DSVM, vos modèles d’entraînement peuvent utiliser des algorithmes de deep learning sur du matériel basé sur des unités de traitement graphique (GPU). En tirant parti des fonctionnalités de mise à l’échelle des machines virtuelles de la plateforme Azure, la DSVM vous aide à utiliser le matériel basé sur GPU dans le cloud en fonction de vos besoins. Vous pouvez basculer vers une machine virtuelle basée sur GPU quand vous entraînez de grands modèles ou que vous avez besoin d’une grande rapidité de calcul, mais souhaitez garder le même disque de système d’exploitation. Vous pouvez choisir une des références SKU de machines virtuelles de série N activées pour les GPU avec DSVM. Notez que les références SKU de machines virtuelles activées pour les GPU ne sont pas prises en charge pour les comptes Azure gratuits.

Les pilotes GPU, les frameworks et les versions GPU des frameworks de Deep Learning sont préinstallés sur les éditions Windows de la DSVM. Sur les éditions Linux, le deep learning sur les GPU est activé sur les DSVM Ubuntu.

Vous pouvez également déployer l’édition Ubuntu ou Windows de la DSVM sur une machine virtuelle Azure qui n’est pas basée sur des GPU. Dans ce cas, toutes les infrastructures de Deep Learning repassent en mode UC.

Découvrez-en plus sur les frameworks de deep learning et d’intelligence artificielle disponibles.

Formation et éducation de la science des données

Les formateurs et instructeurs en entreprise qui enseignent la science des données fournissent généralement une image de machine virtuelle. Avec l’image, les étudiants disposent d’une installation cohérente et d’exemples qui fonctionnent de façon prévisible.

La DSVM crée un environnement à la demande avec une configuration cohérente qui simplifie le support et les soucis de compatibilité. Ceci est d’autant plus bénéfique dans les cas où ces environnements doivent être créés fréquemment, en particulier lors de formations plus courtes.

Ce qui est inclut dans la DSVM

Pour voir la liste complète des outils des DSVM Windows et Linux, cliquez ici.

Étapes suivantes

Pour en savoir plus, consultez les articles suivants :