¿Qué es Azure Data Science Virtual Machine de Azure para Linux y Windows?

Data Science Virtual Machine (DSVM) es una imagen de máquina virtual personalizada disponible en la plataforma en la nube de Azure y puede controlar la ciencia de datos. Tiene muchas herramientas de ciencias de datos populares preinstaladas y preconfiguradas para impulsar la creación de aplicaciones inteligentes para análisis avanzado.

El DSVM está disponible en:

  • Windows Server 2019
  • Windows Server 2022
  • Ubuntu 20.04 LTS

Además, ofrecemos Azure DSVM para PyTorch: una imagen de Ubuntu 20.04 de Azure Marketplace optimizada para cargas de trabajo de aprendizaje profundo distribuidas de gran tamaño. Esta instancia de DSVM preinstalada viene validada con la versión más reciente de PyTorch, para reducir los costos de instalación y acelerar el tiempo de valor. Viene empaquetado con varias características de optimización:

  • ONNX Runtime
  • DeepSpeed​
  • MSCCL
  • ORTMoE​
  • Fairscale
  • Nvidia Apex​
  • Una pila actualizada con las versiones más recientes compatibles de Ubuntu, Python, PyTorch y CUDA

Comparación con Azure Machine Learning

DSVM es una imagen de máquina virtual personalizada para la ciencia de datos, pero Azure Machine Learning es una plataforma de un extremo a otro que abarca:

  • Proceso totalmente administrado
    • Compute Instances (Instancias de proceso)
    • Clústeres de proceso para tareas distribuidas de aprendizaje automático
    • Clústeres de inferencia para puntuaciones en tiempo real
  • Almacenes de datos (por ejemplo, Blob, ADLS Gen2, base de datos SQL)
  • Seguimiento de experimentos
  • Administración de modelos
  • Cuaderno
  • Entornos (administración de las dependencias de Conda y R)
  • Etiquetado
  • Canalizaciones (automatización de flujos de trabajo de ciencia de datos de un extremo a otro)

Comparación con instancias de proceso de Azure Machine Learning

Las Instancias de Proceso de Azure Machine Learning son una imagen de máquina virtual totalmente configurada y administrada, mientras que DSVM es una máquina virtual no administrada.

Diferencias clave entre una instancia de proceso de DSVM y una instancia de proceso de Azure Machine Learning:

Característica Ciencia de datos
máquina virtual
Azure Machine Learning
Instancia de proceso
Totalmente administrada No
Compatibilidad con idiomas Python, R, Julia, SQL, C#,
Java, Node.js, F#
Python y R
Sistema operativo Ubuntu
Windows
Ubuntu
Opción de GPU preconfigurada
Opción de escalado vertical
Acceso SSH
Acceso RDP No
Integrada
Notebooks hospedados
No
(requiere configuración adicional)
SSO integrado No
(requiere configuración adicional)
Colaboración integrada No
Herramientas preinstaladas Jupyter(lab), VS Code,
Visual Studio, PyCharm, Juno,
Power BI Desktop, SSMS,
Microsoft Office 365, Apache Drill
Jupyter(lab)

Casos de uso de clientes de DSVM de ejemplo

Evaluación y experimentación a corto plazo

DSVM puede evaluar o aprender nuevas herramientas de ciencia de datos. Pruebe algunos de nuestros ejemplos de publicados y tutoriales.

Aprendizaje profundo con GPU

En DSVM, los modelos de entrenamiento pueden usar algoritmos de aprendizaje profundo en hardware basado en unidades de procesamiento de gráficos (GPU). Si aprovecha las funcionalidades de escalado de máquinas virtuales de la plataforma Azure, DSVM le ayuda a reducir el hardware basado en GPU en la nube, según sus necesidades. Puede cambiar a una máquina virtual basada en GPU al entrenar modelos grandes o cuando necesite cálculos de alta velocidad mientras mantiene el mismo disco del sistema operativo. Puede elegir cualquiera de las SKU de máquina virtual habilitadas para GPU de la serie N con DSVM. Las cuentas gratuitas de Azure no admiten las SKU de máquinas virtuales habilitadas para GPU.

Una edición de DSVM para Windows viene preinstalada con controladores, marcos de GPU y versiones de GPU de marcos de aprendizaje profundo. En las ediciones de Linux, el aprendizaje profundo en las GPU está habilitado en las DSVM con Ubuntu.

También puede implementar las ediciones DSVM de Ubuntu o Windows en una máquina virtual de Azure que no se basa en GPU. En este caso, todos los marcos de aprendizaje profundo vuelven al modo de CPU.

Más información sobre los marcos de aprendizaje profundo y de inteligencia artificial.

Educación y formación de ciencia de datos

Los instructores y educadores que imparten clases de ciencia de datos proporcionan normalmente una imagen de máquina virtual. La imagen garantiza que los alumnos tengan una configuración coherente y que las muestras funcionen de forma predecible.

DSVM crea un entorno a petición con una configuración coherente para facilitar los desafíos de compatibilidad e incompatibilidad. En los casos en donde estos entornos tienen que crearse con frecuencia, especialmente para las clases de aprendizaje más cortas, estos entornos se benefician sustancialmente.

¿Qué incluye DSVM?

Para obtener más información, vea esta lista completa de herramientas en DSVMs de Windows y Linux.

Pasos siguientes

Para obtener más información, visite estos recursos: