¿Qué herramientas se incluyen en Azure Data Science Virtual Machine?
Data Science Virtual Machine es una forma fácil de explorar los datos y realizar aprendizaje automático en la nube. Las instancias de Data Science Virtual Machine están preconfiguradas con el sistema operativo completo, los parches de seguridad, los controladores y el software de desarrollo y ciencia de datos más populares. Puede elegir el entorno de hardware, que abarca desde instancias de menor costo centradas en la CPU hasta máquinas muy eficaces con varias GPU, almacenamiento de NVMe y grandes cantidades de memoria. En el caso de las instancias con varias GPU, se instalan todos los controladores, todos los marcos de aprendizaje automático tienen la versión correspondiente a la compatibilidad de GPU y la aceleración está habilitada en todo el software de aplicación que admita las GPU.
Data Science Virtual Machine incluye las herramientas de ciencia de datos más útiles preinstaladas.
Creación de aprendizaje profundo y soluciones de aprendizaje automático
Herramienta | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | Notas de uso |
---|---|---|---|---|
CUDA, cuDNN, NVIDIA Driver | ✅ | ✅ | ✅ |
CUDA, cuDNN y controlador NVIDIA en DSVM |
Horovod | ❌ | ❌ | ✅ | Horovod en DSVM |
NVidia System Management Interface (nvidia-smi) | ✅ | ✅ | ✅ | nvidia-smi en DSVM |
PyTorch | ✅ | ✅ | ✅ | PyTorch en DSVM |
TensorFlow | ✅ | ✅ |
✅ | TensorFlow en DSVM |
Integración con Azure Machine Learning (Python) | ✅ (Python SDK, ejemplos) |
✅ (Python SDK, ejemplos) |
✅ (SDK de Python, CLI y ejemplos) |
SDK de Azure Machine Learning |
XGBoost | ✅ (Compatibilidad con CUDA) |
✅ (Compatibilidad con CUDA) |
✅ (Compatibilidad con CUDA) |
XGBoost en DSVM |
Vowpal Wabbit | ✅ | ✅ | ✅ |
Vowpal Wabbit en DSVM |
Weka | ❌ | ❌ | ❌ | |
LightGBM | ❌ | ❌ | ✅ (Compatibilidad con GPU, MPI) |
|
H2O | ❌ | ❌ | ✅ | |
CatBoost | ❌ | ❌ | ✅ | |
Intel MKL | ❌ | ❌ | ✅ | |
OpenCV | ❌ | ❌ | ✅ | |
Dlib | ❌ | ❌ | ✅ | |
Docker | ✅ (Solo contenedores de Windows) |
✅ (Solo contenedores de Windows) |
✅ | |
Nccl | ❌ | ❌ | ✅ | |
Rattle | ❌ | ❌ | ❌ | |
PostgreSQL | ❌ | ❌ | ✅ | |
ONNX Runtime | ❌ | ❌ | ✅ |
Almacenamiento, recuperación y manipulación de datos
Herramienta | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | Notas de uso |
---|---|---|---|---|
Bases de datos relacionales | SQL Server 2019 Developer Edition |
SQL Server 2019 Developer Edition |
SQL Server 2019 Developer Edition |
SQL Server en DSVM |
Herramientas de base de datos | SQL Server Management Studio SQL Server Integration Services bcp, sqlcmd |
SQL Server Management Studio SQL Server Integration Services bcp, sqlcmd |
SQuirreL SQL (herramienta de consulta), bcp, sqlcmd Controladores ODBC/JDBC |
|
Explorador de Azure Storage | ✅ |
✅ |
||
CLI de Azure | ✅ |
✅ |
✅ |
|
AzCopy | ✅ |
✅ |
❌ | AzCopy en DSVM |
Controlador FUSE de blob | ❌ | ❌ | ❌ |
blobfuse en DSVM |
Herramienta de migración de datos de Azure Cosmos DB | ✅ | ✅ | ❌ | Azure Cosmos DB en DSVM |
Herramientas de línea de comandos de Unix o Linux | ❌ | ❌ | ✅ | |
Apache Spark 3.1 (independiente) | ✅ | ✅ | ✅ |
Programa en Python, R, Julia y Node.js
Herramienta | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | Notas de uso |
---|---|---|---|---|
CRAN-R con paquetes populares preinstalados | ✅ | ✅ | ✅ | |
Anaconda Python con paquetes populares preinstalados | ✅ | ✅ (Miniconda) |
✅ (Miniconda) |
|
Julia (Julialang) | ✅ | ✅ | ✅ | |
JupyterHub (servidor de cuadernos multiusuario) | ❌ | ❌ | ✅ | |
JupyterLab (servidor de cuadernos multiusuario) | ✅ | ✅ | ✅ | |
Node.js | ✅ | ✅ | ✅ | |
Servidor de Jupyter Notebook con los siguientes kernels: | ✅ |
✅ |
✅ | Ejemplos de Jupyter Notebook |
R | Ejemplos de Jupyter R | |||
Python | Ejemplos de Python Jupyter | |||
Julia | Ejemplos de Julia Jupyter | |||
PySpark | Ejemplos de pySpark Jupyter |
DSVM de Ubuntu 20.04, DSVM de Windows Server 2019 y DSVM de Windows Server 2022 tienen los siguientes kernels de Jupyter:
- Python3.8-default
- Python3.8-Tensorflow-Pytorch
- Python3.8-AzureML
- R
- Python 3.7: Spark (local)
- Julia 1.6.0
- R Spark: HDInsight
- Scala Spark: HDInsight
- Python 3 Spark: HDInsight
DSVM de Ubuntu 20.04, DSVM de Windows Server 2019 y DSVM de Windows Server 2022 tienen los siguientes entornos de conda:
- Python3.8-default
- Python3.8-Tensorflow-Pytorch
- Python3.8-AzureML
Uso del editor o IDE preferidos
Herramienta | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | Notas de uso |
---|---|---|---|---|
Notepad++ | ✅ |
✅ |
❌ |
|
Nano | ✅ |
✅ |
❌ |
|
Visual Studio 2019 Community Edition | ✅ |
✅ | ❌ | Visual Studio en DSVM |
Visual Studio Code | ✅ |
✅ |
✅ |
Visual Studio Code en DSVM |
PyCharm Community Edition | ✅ |
✅ |
✅ |
PyCharm en DSVM |
IntelliJ IDEA | ❌ | ❌ | ✅ | |
Vim | ❌ | ❌ | ✅ |
|
Emacs | ❌ | ❌ | ✅ |
|
Git y Git Bash | ✅ |
✅ |
✅ |
|
OpenJDK 11 | ✅ |
✅ |
✅ |
|
.NET Framework | ✅ |
✅ |
❌ | |
SDK de Azure | ✅ |
✅ | ✅ |
Organización y presentación de resultados
Herramienta | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | Notas de uso |
---|---|---|---|---|
Microsoft 365 (Word, Excel, PowerPoint) | ✅ | ✅ | ❌ | |
Microsoft Teams | ✅ | ✅ | ❌ | |
Power BI Desktop | ✅ | ✅ |
❌ | |
Explorador Microsoft Edge | ✅ | ✅ | ✅ |