¿Qué herramientas se incluyen en Azure Data Science Virtual Machine?

Data Science Virtual Machine es una forma fácil de explorar los datos y realizar aprendizaje automático en la nube. Las instancias de Data Science Virtual Machine están preconfiguradas con el sistema operativo completo, los parches de seguridad, los controladores y el software de desarrollo y ciencia de datos más populares. Puede elegir el entorno de hardware, que abarca desde instancias de menor costo centradas en la CPU hasta máquinas muy eficaces con varias GPU, almacenamiento de NVMe y grandes cantidades de memoria. En el caso de las instancias con varias GPU, se instalan todos los controladores, todos los marcos de aprendizaje automático tienen la versión correspondiente a la compatibilidad de GPU y la aceleración está habilitada en todo el software de aplicación que admita las GPU.

Data Science Virtual Machine incluye las herramientas de ciencia de datos más útiles preinstaladas.

Creación de aprendizaje profundo y soluciones de aprendizaje automático

Herramienta Windows Server 2019 DSVM Windows Server 2022 DSVM Ubuntu 20.04 DSVM Notas de uso
CUDA, cuDNN, NVIDIA Driver
CUDA, cuDNN y controlador NVIDIA en DSVM
Horovod Horovod en DSVM
NVidia System Management Interface (nvidia-smi) nvidia-smi en DSVM
PyTorch PyTorch en DSVM
TensorFlow
TensorFlow en DSVM
Integración con Azure Machine Learning (Python)
(Python SDK, ejemplos)

(Python SDK, ejemplos)

(SDK de Python, CLI y ejemplos)
SDK de Azure Machine Learning
XGBoost
(Compatibilidad con CUDA)

(Compatibilidad con CUDA)

(Compatibilidad con CUDA)
XGBoost en DSVM
Vowpal Wabbit
Vowpal Wabbit en DSVM
Weka
LightGBM
(Compatibilidad con GPU, MPI)
H2O
CatBoost
Intel MKL
OpenCV
Dlib
Docker
(Solo contenedores de Windows)

(Solo contenedores de Windows)
Nccl
Rattle
PostgreSQL
ONNX Runtime

Almacenamiento, recuperación y manipulación de datos

Herramienta Windows Server 2019 DSVM Windows Server 2022 DSVM Ubuntu 20.04 DSVM Notas de uso
Bases de datos relacionales SQL Server 2019
Developer Edition
SQL Server 2019
Developer Edition
SQL Server 2019
Developer Edition
SQL Server en DSVM
Herramientas de base de datos SQL Server Management Studio
SQL Server Integration Services
bcp, sqlcmd
SQL Server Management Studio
SQL Server Integration Services
bcp, sqlcmd
SQuirreL SQL (herramienta de consulta),
bcp, sqlcmd
Controladores ODBC/JDBC
Explorador de Azure Storage

CLI de Azure


AzCopy

AzCopy en DSVM
Controlador FUSE de blob
blobfuse en DSVM
Herramienta de migración de datos de Azure Cosmos DB Azure Cosmos DB en DSVM
Herramientas de línea de comandos de Unix o Linux
Apache Spark 3.1 (independiente)

Programa en Python, R, Julia y Node.js

Herramienta Windows Server 2019 DSVM Windows Server 2022 DSVM Ubuntu 20.04 DSVM Notas de uso
CRAN-R con paquetes populares preinstalados
Anaconda Python con paquetes populares preinstalados
(Miniconda)

(Miniconda)
Julia (Julialang)
JupyterHub (servidor de cuadernos multiusuario)
JupyterLab (servidor de cuadernos multiusuario)
Node.js
Servidor de Jupyter Notebook con los siguientes kernels:

Ejemplos de Jupyter Notebook
     R Ejemplos de Jupyter R
     Python Ejemplos de Python Jupyter
     Julia Ejemplos de Julia Jupyter
     PySpark Ejemplos de pySpark Jupyter

DSVM de Ubuntu 20.04, DSVM de Windows Server 2019 y DSVM de Windows Server 2022 tienen los siguientes kernels de Jupyter:

  • Python3.8-default
  • Python3.8-Tensorflow-Pytorch
  • Python3.8-AzureML
  • R
  • Python 3.7: Spark (local)
  • Julia 1.6.0
  • R Spark: HDInsight
  • Scala Spark: HDInsight
  • Python 3 Spark: HDInsight

DSVM de Ubuntu 20.04, DSVM de Windows Server 2019 y DSVM de Windows Server 2022 tienen los siguientes entornos de conda:

  • Python3.8-default
  • Python3.8-Tensorflow-Pytorch
  • Python3.8-AzureML

Uso del editor o IDE preferidos

Herramienta Windows Server 2019 DSVM Windows Server 2022 DSVM Ubuntu 20.04 DSVM Notas de uso
Notepad++


Nano


Visual Studio 2019 Community Edition
Visual Studio en DSVM
Visual Studio Code


Visual Studio Code en DSVM
PyCharm Community Edition


PyCharm en DSVM
IntelliJ IDEA
Vim
Emacs
Git y Git Bash


OpenJDK 11


.NET Framework

SDK de Azure

Organización y presentación de resultados

Herramienta Windows Server 2019 DSVM Windows Server 2022 DSVM Ubuntu 20.04 DSVM Notas de uso
Microsoft 365 (Word, Excel, PowerPoint)
Microsoft Teams
Power BI Desktop
Explorador Microsoft Edge