Co je Azure Data Science Virtual Machine pro Linux a Windows?

Data Science Virtual Machine (DSVM) je přizpůsobená image virtuálního počítače na cloudové platformě Azure sestavená speciálně pro účely datových věd. Má mnoho oblíbených nástrojů pro datové vědy předinstalované a předem nakonfigurované, aby se daly začít vytvářet inteligentní aplikace pro pokročilé analýzy.

DsVM je k dispozici na:

  • Windows Server 2019
  • Ubuntu 18.04 LTS
  • Ubuntu 20.04 LTS

Porovnání s Azure Machine Learning

DSVM je přizpůsobená image virtuálního počítače pro datové vědy, ale Azure Machine Learning (AzureML) je kompletní platforma, která zahrnuje:

  • Plně spravované výpočetní prostředky
    • Výpočetní instance
    • Výpočetní clustery pro distribuované úlohy ML
    • Odvozování clusterů pro vyhodnocování v reálném čase
  • Úložiště dat (například Objekt blob, ADLS Gen2, SQL DB)
  • Sledování experimentů
  • Správa modelů
  • Notebooks
  • Prostředí (správa závislostí conda a R)
  • Označování
  • Pipelines (automatizace kompletních pracovních postupů datových věd)

Porovnání s výpočetními instancemi AzureML

Azure Machine Learning výpočetní instance jsou plně nakonfigurovaná a spravovaná image virtuálního počítače, zatímco DSVM je nespravovaný virtuální počítač.

Klíčové rozdíly mezi těmito dvěma nabídkami produktů jsou podrobně popsány níže:

Funkce Datové vědy
Virtuální počítač
AzureML
Výpočetní instance
Plně spravovaná No Yes
Podpora jazyků Python, R, Julia, SQL, C#,
Java, Node.js, F #
Python a R
Operační systém Ubuntu
Windows
Ubuntu
Předkonfigurovaná možnost GPU Yes Yes
Možnost vertikálního navýšení kapacity Yes Yes
Přístup SSH Yes Yes
Přístup RDP Yes No
Integrované
Hostované poznámkové bloky
No
(vyžaduje další konfiguraci)
Yes
Integrované jednotné přihlašování No
(vyžaduje další konfiguraci)
Yes
Integrovaná spolupráce No Yes
Předinstalované nástroje Jupyter(lab), RStudio Server, VSCode,
Visual Studio, PyCharm, Juno,
Power BI Desktop, SSMS,
Microsoft Office 365, Apache Drill
Jupyter(lab)
RStudio Server

Ukázkové případy použití

Níže si ukážeme některé běžné případy použití pro zákazníky DSVM.

Krátkodobé experimenty a vyhodnocování

Virtuální počítač pro datové vědy můžete použít k vyhodnocení nebo seznámení s novými nástroji pro datové vědy, zejména procházením některých publikovaných ukázek a návodů.

Hluboké učení s grafickými procesory

Ve virtuálním počítači DSVM můžou trénovací modely používat algoritmy hlubokého učení na hardwaru založeném na grafických procesorech (GPU). Díky využití možností škálování virtuálních počítačů platformy Azure vám dsVM pomůže používat hardware založený na GPU v cloudu podle vašich potřeb. Pokud trénujete velké modely nebo potřebujete vysokorychlostní výpočty, můžete přepnout na virtuální počítač založený na GPU a stále zůstat na stejném disku s operačním systémem. U virtuálních počítačů s podporou dsVM můžete zvolit libovolnou z grafických procesorů řady N. Poznámka: Skladové položky virtuálních počítačů s podporou GPU nejsou podporované v bezplatných účtech Azure.

Windows edice DSVM jsou předinstalované s ovladači GPU, architekturami a verzemi GPU architektur hlubokého učení. V edicích s Linuxem je hluboké učení na GPU povolené na virtuálních počítačích DSVM s Ubuntu.

Můžete také nasadit edice Ubuntu nebo Windows dsVM do virtuálního počítače Azure, který není založený na gpu. V tomto případě se všechny architektury hlubokého učení vrátí do režimu procesoru.

Přečtěte si další informace o dostupných architekturách hlubokého učení a umělé inteligence.

Školení a vzdělávání v oblasti datové vědy

Firemní školitelé a učitelé, kteří vyučují kurzy datových věd, obvykle dodají image virtuálního počítače. Obrázek zajišťuje, aby studenti měli konzistentní nastavení a aby ukázky fungovaly předvídatelně.

DSVM vytváří prostředí na vyžádání s konzistentním nastavením, které usnadňuje problémy s podporou a nekompatibilitou. Užitečný je zejména v případech, kdy je potřeba taková prostředí vytvářet často, například pro kratší školení.

Co je součástí dsVM?

Úplný seznam nástrojů najdete na Windows i linuxových DSVM.

Další kroky

Další informace najdete v těchto článcích: