¿Qué herramientas se incluyen en Azure Data Science Virtual Machine?

Data Science Virtual Machine es una forma fácil de explorar los datos y realizar aprendizaje automático en la nube. Las instancias de Data Science Virtual Machine están preconfiguradas con el sistema operativo completo, los parches de seguridad, los controladores y el software de desarrollo y ciencia de datos más populares. Puede elegir el entorno de hardware, que abarca desde instancias de menor costo centradas en la CPU hasta máquinas muy eficaces con varias GPU, almacenamiento de NVMe y grandes cantidades de memoria. En el caso de las instancias con varias GPU, se instalan todos los controladores, todos los marcos de aprendizaje automático tienen la versión correspondiente a la compatibilidad de GPU y la aceleración está habilitada en todo el software de aplicación que admita las GPU.

Data Science Virtual Machine incluye las herramientas de ciencia de datos más útiles preinstaladas.

Creación de aprendizaje profundo y soluciones de aprendizaje automático

Herramienta Windows Server 2019 DSVM Ubuntu 18.04 DSVM Notas de uso
CUDA, cuDNN, NVIDIA Driver

CUDA, cuDNN y controlador NVIDIA en DSVM
Horovod
Horovod en DSVM
NVidia System Management Interface (nvidia-smi) nvidia-smi en DSVM
PyTorch PyTorch en DSVM
TensorFlow

TensorFlow en DSVM
Integración con Azure Machine Learning (Python)
(Python SDK, ejemplos)

(SDK de Python, CLI y ejemplos)
SDK de Azure ML
XGBoost
(Compatibilidad con CUDA)

(Compatibilidad con CUDA)
XGBoost en DSVM
Vowpal Wabbit
Vowpal Wabbit en DSVM
Weka
LightGBM
(Compatibilidad con GPU, MPI)
H2O
CatBoost
Intel MKL
OpenCV
Dlib
Docker
(Solo contenedores de Windows)
Nccl
Rattle
ONNX Runtime

Almacenamiento, recuperación y manipulación de datos

Herramienta Windows Server 2019 DSVM Ubuntu 18.04 DSVM Notas de uso
Bases de datos relacionales SQL Server 2019
Developer Edition
SQL Server 2019
Developer Edition
SQL Server en DSVM
Herramientas de base de datos SQL Server Management Studio
SQL Server Integration Services
bcp, sqlcmd
SQuirreL SQL (herramienta de consulta),
bcp, sqlcmd
Controladores ODBC/JDBC
Explorador de Azure Storage

CLI de Azure

AzCopy
AzCopy en DSVM
Controlador FUSE de blob
blobfuse en DSVM
Herramienta de migración de datos de Azure Cosmos DB Cosmos DB en DSVM
Herramientas de línea de comandos de Unix o Linux
Apache Spark 3.1 (independiente)

Programa en Python, R, Julia y Node.js

Herramienta Windows Server 2019 DSVM Ubuntu 18.04 DSVM Notas de uso
CRAN-R con paquetes populares preinstalados
Anaconda Python con paquetes populares preinstalados
(Miniconda)

(Miniconda)
Julia (Julialang)
JupyterHub (servidor de cuadernos multiusuario)
JupyterLab (servidor de cuadernos multiusuario)
Node.js
Servidor de Jupyter Notebook con los siguientes kernels:
Ejemplos de Jupyter Notebook
     R Ejemplos de Jupyter R
     Python Ejemplos de Python Jupyter
     Julia Ejemplos de Julia Jupyter
     PySpark Ejemplos de pySpark Jupyter

DSVM de Ubuntu 18.04 y DSVM de Windows Server 2019 tienen los siguientes kernels de Jupyter:

  • Python 3.8: predeterminado
  • Python 3.8: PyTorch
  • Python 3.8: TensorFlow
  • Python 3.6: AzureML, TensorFlow
  • Python 3.6: AzureML, PyTorch
  • Python 3.6: AzureML, AutoML
  • R
  • Python 3.7: Spark (local)
  • Julia 1.2.0
  • R Spark: HDInsight
  • Scala Spark: HDInsight
  • Python 3 Spark: HDInsight

DSVM de Ubuntu 18.04 y DSVM de Windows Server 2019 tienen los siguientes entornos de Conda:

  • py38_default 
  • py38_tensorflow 
  • py38_pytorch 
  • azureml_py36_tensorflow 
  • azureml_py36_pytorch 
  • azureml_py36_automl 

Uso del editor o IDE preferidos

Herramienta Windows Server 2019 DSVM Ubuntu 18.04 DSVM Notas de uso
Notepad++

Nano

Visual Studio 2019 Community Edition Visual Studio en DSVM
Visual Studio Code

Visual Studio Code en DSVM
RStudio Desktop

RStudio Desktop en DSVM
RStudio Server
(deshabilitado de forma predeterminada)
PyCharm Community Edition

PyCharm en DSVM
IntelliJ IDEA
Vim
Emacs
Git y Git Bash

OpenJDK 11

.NET Framework
SDK de Azure

Organización y presentación de resultados

Herramienta Windows Server 2019 DSVM Ubuntu 18.04 DSVM Notas de uso
Microsoft 365 (Word, Excel, PowerPoint)
Microsoft Teams
Power BI Desktop
Explorador Microsoft Edge