Was ist Azure Data Science Virtual Machine für Linux und Windows?

Data Science Virtual Machine (DSVM) ist ein benutzerdefiniertes VM-Image, das auf der Azure-Cloudplattform verfügbar ist und Data Science verarbeiten kann. Es hat viele beliebte Data Science-Tools vorinstalliert und vorkonfiguriert, damit Sie sofort intelligente Anwendungen für die erweiterte Analyse erstellen können.

Die DSVM-Instanz ist für folgende Betriebssysteme verfügbar:

  • Windows Server 2019
  • Windows Server 2022
  • Ubuntu 20.04 LTS

Außerdem bieten wir Azure DSVM for PyTorch an, ein Ubuntu 20.04-Image aus dem Azure Marketplace, das für große, verteilte Deep Learning-Workloads optimiert ist. Die vorinstallierte DSVM ist überprüft und verfügt über die aktuelle PyTorch-Version, um Setupkosten zu senken und die Amortisation zu beschleunigen. Sie wird mit verschiedenen Optimierungsfunktionen ausgeliefert:

  • ONNX-Runtime
  • DeepSpeed
  • MSCCL​
  • ORTMoE​
  • Fairscale​
  • Nvidia Apex​
  • Ein aktueller Stapel mit den neuesten kompatiblen Versionen von Ubuntu, Python, PyTorch und CUDA

Vergleich mit Azure Machine Learning

Die DSVM ist ein benutzerdefiniertes VM-Image für Data Science, Azure Machine Learning hingegen ist eine End-to-End-Plattform, die Folgendes abdeckt:

  • Vollständig verwaltete Computeressourcen
    • Compute-Instanzen
    • Computecluster für verteilte ML-Aufgaben
    • Rückschlusscluster für die Echtzeitbewertung
  • Datenspeicher (z. B. Blob, ADLS Gen2, SQL DB)
  • Experimentnachverfolgung
  • Modellverwaltung
  • Notebooks
  • Umgebungen (Verwalten von Conda- und R-Abhängigkeiten)
  • Bezeichnungen
  • Pipelines (Automatisieren von Data Science-End-to-End-Workflows)

Vergleich mit Azure Machine Learning Compute-Instanzen

Bei Azure Machine Learning Compute-Instanzen handelt es sich um ein vollständig konfiguriertes und verwaltetes VM-Image, DSVM hingegen eine nicht verwaltete VM.

Wichtige Unterschiede zwischen einer DSVM- und einer Azure Machine Learning-Computeinstanz:

Funktion Data Science
VM
Azure Machine Learning
Compute-Instanz
Vollständig verwaltet Nein Ja
Sprachunterstützung Python, R, Julia, SQL, C#,
Java, Node.js, F#
Python und R
Betriebssystem Ubuntu
Windows
Ubuntu
Vorkonfigurierte GPU-Option Ja Ja
Option zum Hochskalieren Ja Ja
SSH-Zugriff Ja Ja
RDP-Zugriff Ja Nein
Integriert
Gehostete Notebooks
Nein
(zusätzliche Konfigurationsschritte erforderlich)
Ja
Integriertes einmaliges Anmelden Ohne
(zusätzliche Konfigurationsschritte erforderlich)
Ja
Integrierte Zusammenarbeit Nein Ja
Vorinstallierte Tools Jupyter(lab), VS Code,
Visual Studio, PyCharm, Juno,
Power BI Desktop, SSMS,
Microsoft Office 365, Apache Drill
Jupyter (Lab)

Beispiele für DSVM-Kundenanwendungsfälle

Kurzfristige Experimente und Auswertungen

DSVM kann neue Data Science-Tools auswerten oder erlernen. Testen Sie einige unserer veröffentlichten Beispiele und exemplarischen Vorgehensweisen.

Deep Learning mit GPUs

In DSVM können Ihre Trainingsmodelle Deep Learning-Algorithmen auf Hardware verwenden, die auf Grafikprozessoren (Graphics Processing Units, GPUs) basiert. Wenn Sie die VM-Skalierungsfunktionen der Azure-Plattform nutzen, unterstützt DSVM Sie bei der bedarfsgerechten Nutzung von GPU-basierter Hardware in der Cloud. Sie können zu einer GPU-basierten VM wechseln, wenn Sie große Modelle trainieren oder schnelle Berechnungen benötigen, und dabei den gleichen Betriebssystem-Datenträger beibehalten. Für DSVM können Sie beliebige GPU-fähige VM-SKUs der N-Serie auswählen. Kostenlose Azure-Konten unterstützen keine GPU-fähigen VM-SKUs.

Die Windows-Editionen von DSVM enthalten vorinstallierte GPU-Treiber und -Frameworks sowie GPU-Versionen der Deep Learning-Frameworks. Unter Linux-Editionen ist GPU-basiertes Deep Learning in der DSVM-Instanz mit Ubuntu aktiviert.

Sie können die Ubuntu- oder Windows-Editionen von DSVM auch auf einem virtuellen Azure-Computer bereitstellen, der nicht auf GPUs basiert. In diesem Fall werden alle Deep Learning-Frameworks auf den CPU-Modus zurückgesetzt.

Informieren Sie sich ausführlicher über die verfügbaren Deep Learning- und KI-Frameworks.

Data Science-Schulung und -Ausbildung

Ausbilder in Unternehmen und Dozenten, die Data Science-Kurse leiten, stellen in der Regel ein Image eines virtuellen Computers bereit. Durch das Image wird gewährleistet, dass für die Kursteilnehmer eine konsistente Umgebung eingerichtet wird und die Beispiele erwartungsgemäß funktionieren.

DSVM erstellt eine bedarfsgerechte Umgebung mit einem konsistenten Setup, das den Support erleichtert und Inkompatibilitätsprobleme vermeidet. Wenn diese Umgebungen häufig bereitgestellt werden müssen, insbesondere für kürzere Schulungen, bringt dies erhebliche Vorteile.

Was beinhaltet die DSVM?

Weitere Informationen finden Sie in dieser vollständigen Liste der Tools für Windows- und Linux-DSVMs.

Nächste Schritte

Weitere Informationen finden Sie in den folgenden Ressourcen: