適用於 Linux 和 Windows 的 Azure 資料科學虛擬機器是什麼?

資料科學虛擬機器 (DSVM) 是 Azure 雲端平臺上可用的自定義 VM 映射,而且可以處理數據科學。 這已預先安裝和預先設定許多常用的資料科學工具,可開始建置智慧型手機應用程式以進行進階分析。

下列項目有提供 DSVM:

  • Windows Server 2019
  • Windows Server 2022
  • Ubuntu 20.04 LTS

此外,我們提供適用於 PyTorch 的 Azure DSVM - Azure Marketplace 中針對大型分散式深度學習工作負載優化的 Ubuntu 20.04 映像。 這個預安裝的 DSVM 會使用最新的 PyTorch 版本進行驗證,以降低設定成本,並加速實現價值的時間。 它隨附各種優化功能:

  • ONNX 運行時間
  • DeepSpeed
  • MSCCL
  • ORTMoE
  • Fairscale
  • Nvidia Apex
  • 具有最新相容 Ubuntu、Python、PyTorch 和 CUDA 版本的最新堆疊

與 Azure Machine Learning 比較

DSVM 是適用於 資料科學 的自定義 VM 映射,但 Azure 機器學習 是涵蓋下列專案的端對端平臺:

  • 完全受控的計算
    • 計算執行個體
    • 分散式 ML 工作的計算叢集
    • 用於即時評分的推斷叢集
  • 資料存放區 (例如 Blob、ADLS Gen2、SQL DB)
  • 實驗追蹤
  • 模型管理
  • Notebooks
  • 環境 (管理 Conda 和 R 相依性)
  • 加上標籤
  • 管線 (自動執行端對端資料科學工作流程)

與 Azure Machine Learning 計算執行個體的比較

Azure 機器學習 計算實例是完整設定和管理的 VM 映射,而 DSVM 是非受控 VM。

DSVM 與 Azure 機器學習 計算實例之間的主要差異:

功能 資料科學
VM
Azure Machine Learning
計算執行個體
完全受控 No Yes
語言支援 Python、R、Julia、SQL、C#、
Java、Node.js、F#
Python 和 R
作業系統 Ubuntu \(英文\)
Windows
Ubuntu
已預先設定的 GPU 選項 Yes Yes
擴大選項 Yes Yes
SSH 存取 Yes Yes
RDP 存取 No
內建
裝載的 Notebook
No
(需要進行其他設定)
Yes
內建 SSO
(需要進行其他設定)
Yes
內建共同作業 No Yes
預先安裝的工具 Jupyter (lab)、VS Code、
Visual Studio、PyCharm、Juno、
Power BI Desktop、SSMS、
Microsoft Office 365、Apache Drill
Jupyter(lab)

範例 DSVM 客戶使用案例

短期實驗和評估

DSVM 可以評估或學習新的數據科學 工具。 請嘗試一些已發佈 的範例和逐步解說

使用 GPU 進行深度學習

在 DSVM 中,您的定型模型可以在圖形處理單元(GPU)型硬體上使用深度學習演算法。 如果您利用 Azure 平臺的 VM 調整功能,DSVM 會根據您的需求,協助您在雲端中調整 GPU 型硬體。 當您定型大型模型,或在保留相同的 OS 磁碟時需要高速計算時,您可以切換至 GPU 型 VM。 您可以使用 DSVM 選擇任何已啟用 GPU 的 N 系列虛擬機 SKU。 Azure 免費帳戶不支援已啟用 GPU 的虛擬機器 SKU。

Windows 版本 DSVM 已預安裝 GPU 驅動程式、架構和 GPU 版本的深度學習架構。 在 Linux 版本上,GPU 的深度學習會在 Ubuntu DSVM 上啟用。

您也可以將 Ubuntu 或 Windows DSVM 版本部署到不是以 GPU 為基礎的 Azure 虛擬機。 在此情況下,所有深度學習架構都會回復為 CPU 模式。

深入了解可用的深度學習和 AI 架構

資料科學訓練和教育

教導資料科學課程的企業講師和授課者通常會提供虛擬機器映像。 影像可確保學生都有一致的設定,而且範例可預測地運作。

DSVM 會建立具有一致設定的隨選環境,以簡化支援和不相容的挑戰。 在需要頻繁建置這些環境的情況下,特別是對於較短的訓練課程,可以大大受益。

DSVM 包含哪些內容?

如需詳細資訊,請參閱 Windows 和 Linux DSVM 上的完整工具清單。

下一步

如需詳細資訊,請流覽下列資源: