Wat is de Azure Data Science Virtual Machine voor Linux en Windows?

Data Science Virtual Machine (DSVM) is een aangepaste VM-installatiekopie op het Azure-cloudplatform, dat speciaal is gebouwd voor datatechnologie. Het bevat veel populaire data science-hulpprogramma's die vooraf zijn geïnstalleerd en vooraf zijn geconfigureerd om intelligente toepassingen te bouwen voor geavanceerde analyses.

De DSVM is beschikbaar op:

  • Windows Server 2019
  • Windows Server 2022
  • Ubuntu 20.04 LTS

Daarnaast willen we Azure DSVM voor PyTorch aanbieden. Dit is een Ubuntu 20.04-installatiekopie van Azure Marketplace die is geoptimaliseerd voor grote, gedistribueerde deep learning-workloads. Het wordt vooraf geïnstalleerd en gevalideerd met de nieuwste PyTorch-versie om de installatiekosten te verlagen en de waarde te versnellen. Het wordt geleverd met verschillende optimalisatiefuncties (ONNX Runtime, DeepSpeed, MSCCL, ORTMoE, Fairscale, Nvidia Apex) en een up-to-date stack met de nieuwste compatibele versies van Ubuntu, Python, PyTorch, CUDA.

Vergelijking met Azure Machine Learning

De DSVM is een aangepaste VM-installatiekopieën voor Datawetenschap, maar Azure Machine Learning is een end-to-end platform dat het volgende omvat:

  • Volledig beheerde compute
    • Rekeninstanties
    • Rekenclusters voor gedistribueerde ML-taken
    • Deductieclusters voor realtime scoren
  • Gegevensarchieven (bijvoorbeeld blob, ADLS Gen2, SQL DB)
  • Experimenten volgen
  • Modelbeheer
  • Notebooks
  • Omgevingen (Conda- en R-afhankelijkheden beheren)
  • Labels
  • Pijplijnen (end-to-end datatechnologiewerkstromen automatiseren)

Vergelijking met Azure Machine Learning Compute-exemplaren

Azure Machine Learning Compute-instanties zijn een volledig geconfigureerde en beheerde VM-installatiekopie, terwijl de DSVM een niet-beheerde VM is.

Belangrijke verschillen tussen deze:

Functie Gegevenswetenschap
VM
Azure Machine Learning
Rekenproces
Volledig beheerd Nr. Ja
Taalondersteuning Python, R, Julia, SQL, C#,
Java, Node.js, F#
Python en R
Besturingssysteem Ubuntu
Windows
Ubuntu
Vooraf geconfigureerde GPU-optie Ja Ja
Optie voor omhoog schalen Ja Ja
SSH-toegang Ja Ja
RDP-toegang Ja Nr.
Ingebouwd
Gehoste notebooks
Nee
(hiervoor is aanvullende configuratie vereist)
Ja
Ingebouwde SSO No
(hiervoor is aanvullende configuratie vereist)
Ja
Ingebouwde samenwerking Nr. Ja
Vooraf geïnstalleerde hulpprogramma's Jupyter(lab), VS Code,
Visual Studio, PyCharm, Juno,
Power BI Desktop, SSMS,
Microsoft Office 365, Apache Drill
Jupyter(lab)

Gebruiksvoorbeelden

Hier volgen enkele veelvoorkomende use cases voor DSVM-klanten.

Kortetermijnexperimenten en evaluatie

U kunt de DSVM gebruiken om nieuwe -hulpprogramma's voor datatechnologie te evalueren of te leren, met name door enkele van onze gepubliceerde -voorbeelden en -instructies te door lopen.

Deep Learning met GPU's

In de DSVM kunnen uw trainingsmodellen deep learning-algoritmen op hardware gebruiken die is gebaseerd op GPU's (grafische verwerkingseenheden). Door gebruik te maken van de VM-schaalmogelijkheden van het Azure-platform, helpt de DSVM u om op GPU gebaseerde hardware in de cloud te gebruiken op basis van uw behoeften. Wanneer u grote modellen traint of snelle berekeningen nodig hebt, kunt u met behoud van dezelfde besturingssysteemschijf overschakelen naar een GPU-VM. U kunt kiezen uit een van de VM-SKU's met GPU-functionaliteit uit de N-serie met DSVM. Opmerking SKU's voor virtuele machines met GPU worden niet ondersteund in gratis Azure-accounts.

De Windows-edities van de DSVM zijn vooraf geïnstalleerd met GPU-stuurprogramma's, frameworks en GPU-versies van deep learning-frameworks. In de Linux-edities is deep learning voor GPU's ingeschakeld op de Ubuntu-DSVM's.

U kunt ook de Ubuntu- of Windows-edities van de DSVM implementeren op een virtuele machine van Azure die niet is gebaseerd op GPU's. In dit geval vallen alle deep learning-frameworks terug op de CPU-modus.

Meer informatie over beschikbare deep learning en AI-frameworks.

Training en opleiding in data science

Instructeurs en docenten die lessen in data science geven, verstrekken gewoonlijk een installatiekopie van de VM. De installatiekopie zorgt ervoor dat studenten een consistente installatie hebben en dat de voorbeelden werken zoals verwacht.

De DSVM maakt een omgeving op aanvraag met een consistente configuratie, waardoor zich minder problemen met ondersteuning en incompatibiliteit voordoen. In gevallen waarin deze omgevingen regelmatig moeten worden gebouwd, met name voor kortere trainingen, hebben hier aanzienlijk baat bij.

Wat is inbegrepen in de DSVM?

Bekijk hier een volledige lijst met hulpprogramma's voor zowel de Windows- als de Linux-DSVM.

Volgende stappen

Meer informatie vindt u in deze artikelen: