Azure 資料科學虛擬機器上包含哪些工具 \(部分機器翻譯\)
資料科學虛擬機器 是探索數據和在雲端中執行機器學習的簡單方式。 資料科學虛擬機器 已預先設定完整的操作系統、安全性修補程式、驅動程式和熱門數據科學與開發軟體。 您可以選擇硬體環境,範圍從成本較低的CPU中心機器到具有多個 GPU、NVMe 記憶體和大量記憶體的強大機器。 針對具有 GPU 的機器,會安裝所有驅動程式、所有機器學習架構都符合 GPU 相容性的版本,而且支援 GPU 的所有應用程式軟體都會啟用加速。
資料科學虛擬機器 隨附預安裝最實用的數據科學工具。
建置深度學習和機器學習解決方案
工具 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 使用量注意事項 |
---|---|---|---|---|
CUDA、cuDNN、NVIDIA Driver | ✅ | ✅ | ✅ |
DSVM 上的 CUDA、cuDNN、NVIDIA 驅動程式 |
Horovod | ❌ | ❌ | ✅ | DSVM 上的 Horovod |
NVidia 系統管理介面 (nvidia-smi) | ✅ | ✅ | ✅ | DSVM 上的 nvidia-smi |
PyTorch | ✅ | ✅ | ✅ | DSVM 上的 PyTorch |
TensorFlow | ✅ | ✅ |
✅ | DSVM 上的 TensorFlow |
與 Azure 機器學習 整合 (Python) | ✅ (Python SDK,範例) |
✅ (Python SDK,範例) |
✅ (Python SDK,CLI, 範例) |
Azure 機器學習 SDK |
XGBoost | ✅ (CUDA 支援) |
✅ (CUDA 支援) |
✅ (CUDA 支援) |
DSVM 上的 XGBoost |
Vowpal Wabbit | ✅ | ✅ | ✅ |
DSVM 上的 Vowpal Wabbit |
Weka | ❌ | ❌ | ❌ | |
LightGBM | ❌ | ❌ | ✅ (GPU、MPI 支援) |
|
H2o | ❌ | ❌ | ✅ | |
CatBoost | ❌ | ❌ | ✅ | |
Intel MKL | ❌ | ❌ | ✅ | |
OpenCV | ❌ | ❌ | ✅ | |
Dlib | ❌ | ❌ | ✅ | |
Docker | ✅ (僅限 Windows 容器) |
✅ (僅限 Windows 容器) |
✅ | |
Nccl | ❌ | ❌ | ✅ | |
Rattle | ❌ | ❌ | ❌ | |
PostgreSQL | ❌ | ❌ | ✅ | |
ONNX Runtime | ❌ | ❌ | ✅ |
儲存、擷取及操作數據
工具 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 使用量注意事項 |
---|---|---|---|---|
關聯式資料庫 | SQL Server 2019 Developer Edition |
SQL Server 2019 Developer Edition |
SQL Server 2019 Developer Edition |
DSVM 上的 SQL Server |
資料庫工具 | SQL Server Management Studio SQL Server Integration Services bcp、sqlcmd |
SQL Server Management Studio SQL Server Integration Services bcp、sqlcmd |
SQuirreL SQL (查詢工具), bcp、sqlcmd ODBC/JDBC 驅動程式 |
|
Azure 儲存體總管 | ✅ |
✅ |
||
Azure CLI | ✅ |
✅ |
✅ |
|
AzCopy | ✅ |
✅ |
❌ | DSVM 上的 AzCopy |
Blob FUSE 驅動程式 | ❌ | ❌ | ❌ |
DSVM 上的 blobfuse |
Azure Cosmos DB 資料遷移工具 | ✅ | ✅ | ❌ | DSVM 上的 Azure Cosmos DB |
Unix/Linux 命令行工具 | ❌ | ❌ | ✅ | |
Apache Spark 3.1 (獨立版) | ✅ | ✅ | ✅ |
Python、R、Julia 和 Node.js 中的程式
工具 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 使用量注意事項 |
---|---|---|---|---|
預安裝熱門套件的CRAN-R | ✅ | ✅ | ✅ | |
預安裝熱門套件的 Anaconda Python | ✅ | ✅ (迷你康達) |
✅ (迷你康達) |
|
裘莉婭(朱利亞朗) | ✅ | ✅ | ✅ | |
JupyterHub (多使用者筆記本伺服器) | ❌ | ❌ | ✅ | |
JupyterLab (多使用者筆記本伺服器) | ✅ | ✅ | ✅ | |
Node.js | ✅ | ✅ | ✅ | |
具有下列核心的 Jupyter Notebook Server : | ✅ |
✅ |
✅ | Jupyter Notebook 範例 |
R | R Jupyter 範例 | |||
Python | Python Jupyter 範例 | |||
Julia | Julia Jupyter 範例 | |||
PySpark | pySpark Jupyter 範例 |
Ubuntu 20.04 DSVM、Windows Server 2019 DSVM 和 Windows Server 2022 DSVM 具有下列 Jupyter 核心:-
- Python3.8-default
- Python3.8-Tensorflow-Pytorch
- Python3.8-AzureML
- R
- Python 3.7 - Spark (本機)
- Julia 1.6.0
- R Spark – HDInsight
- Scala Spark – HDInsight
- Python 3 Spark – HDInsight
Ubuntu 20.04 DSVM、Windows Server 2019 DSVM 和 Windows Server 2022 DSVM 具有下列 conda 環境:-
- Python3.8-default
- Python3.8-Tensorflow-Pytorch
- Python3.8-AzureML
使用您慣用的編輯器或 IDE
工具 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 使用量注意事項 |
---|---|---|---|---|
Notepad++ | ✅ |
✅ |
❌ |
|
納米 | ✅ |
✅ |
❌ |
|
Visual Studio 2019 Community Edition | ✅ |
✅ | ❌ | DSVM 上的 Visual Studio |
Visual Studio Code | ✅ |
✅ |
✅ |
DSVM 上的 Visual Studio Code |
PyCharm Community Edition | ✅ |
✅ |
✅ |
DSVM 上的 PyCharm |
IntelliJ IDEA | ❌ | ❌ | ✅ | |
Vim | ❌ | ❌ | ✅ |
|
Emacs | ❌ | ❌ | ✅ |
|
Git 和 Git Bash | ✅ |
✅ |
✅ |
|
OpenJDK 11 | ✅ |
✅ |
✅ |
|
.NET Framework | ✅ |
✅ |
❌ | |
Azure SDK | ✅ |
✅ | ✅ |
組織及呈現結果
工具 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 使用量注意事項 |
---|---|---|---|---|
Microsoft 365 (Word、Excel、PowerPoint) | ✅ | ✅ | ❌ | |
Microsoft Teams | ✅ | ✅ | ❌ | |
Power BI Desktop | ✅ | ✅ |
❌ | |
Microsoft Edge 瀏覽器 | ✅ | ✅ | ✅ |