Herramientas de aprendizaje automático y ciencia de datos en Azure Data Science Virtual Machines

Artículo
04/22/2024

Las máquinas virtuales de Ciencia de datos de Azure (DSVM) disponen de un amplio conjunto de herramientas y bibliotecas para el aprendizaje automático. Estos recursos están disponibles en lenguajes populares, como Python, R y Julia.

DSVM admite estas bibliotecas y herramientas de aprendizaje automático:

SDK de Azure Machine Learning para Python

Para obtener una referencia completa, visite SDK de Azure Machine Learning para Python.

Category	Value
¿Qué es?	Puede usar el servicio en la nube de Azure Machine Learning para desarrollar e implementar modelos de aprendizaje automático. Puede usar el SDK de Python para realizar un seguimiento de los modelos a medida que compila, entrena, escala y administra los modelos. Implemente modelos como contenedores y ejecútelos en la nube, de forma local o en Azure IoT Edge.
Ediciones compatibles	Windows (entorno de conda: AzureML), Linux (entorno de conda: py36)
Usos típicos	Plataforma de aprendizaje automático general
¿Cómo se configura o instala?	Se instala con la compatibilidad de GPU
¿Cómo se usa o ejecuta?	Como un SDK de Python y en la CLI de Azure. Activar al entorno conda `AzureML` en la edición Windows o activar la edición `py36` a en la edición Linux.
Vínculos a ejemplos	Busque cuadernos de Jupyter Notebook de ejemplo en el directorio `AzureML`, en cuadernos.

H2O

Category	Value
¿Qué es?	Una plataforma de inteligencia artificial de código abierto que admite el aprendizaje automático escalable distribuido, rápido, en memoria.
Versiones compatibles	Linux
Usos típicos	Aprendizaje automático escalable y distribuido de uso general
¿Cómo se configura o instala?	H2O se instala en `/dsvm/tools/h2o`.
¿Cómo se usa o ejecuta?	Conéctese a la máquina virtual con X2Go. Inicie un nuevo terminal y ejecute `java -jar /dsvm/tools/h2o/current/h2o.jar`. Luego, inicie un explorador web y conéctese a `http://localhost:54321`.
Vínculos a ejemplos	Busque ejemplos en la máquina virtual en Jupyter, en el directorio `h2o`.

Hay otras bibliotecas de aprendizaje automático en DSVM; por ejemplo, el popular paquete scikit-learn que forma parte de la distribución de Python de Anaconda para DSVM. Para obtener una lista de los paquetes disponibles en Python, R y Julia, ejecute los administradores de paquetes respectivos.

LightGBM

Category	Value
¿Qué es?	Un marco de potenciación del gradiente (GBDT, GBRT, GBM o MART) rápido, distribuido y de alto rendimiento, basado en algoritmos de árbol de decisión. Tareas de aprendizaje automático: clasificación, clasificación, etc., úsela.
Versiones compatibles	Windows, Linux
Usos típicos	Marco de potenciación del gradiente de uso general
¿Cómo se configura o instala?	LightGBM se instala como un paquete de Python en Windows. En Linux, el ejecutable de la línea de comandos se encuentra en `/opt/LightGBM/lightgbm`. El paquete de R está instalado y se instalan los paquetes de Python.
Vínculos a ejemplos	Guía de LightGBM

Rattle

Category	Value
¿Qué es?	Interfaz gráfica de usuario para la minería de datos que usa R.
Ediciones compatibles	Windows, Linux
Usos típicos	Herramienta general de minería de datos de la IU para R
¿Cómo se usa o ejecuta?	Como herramienta de interfaz de usuario. En Windows, inicie un símbolo del sistema, ejecute R y, dentro de R, ejecute `rattle()`. En Linux, conéctese a X2Go, inicie un terminal, ejecute R y, dentro de R, ejecute `rattle()`.
Vínculos a ejemplos	Rattle

Vowpal Wabbit

Category	Value
¿Qué es?	Una biblioteca de sistema de aprendizaje rápida, de código abierto y situada fuera de núcleo
Ediciones compatibles	Windows, Linux
Usos típicos	Biblioteca de aprendizaje automático general
¿Cómo se configura o instala?	Windows: instalador msi Linux: apt-get
¿Cómo se usa o ejecuta?	Como una herramienta de línea de comandos de ruta de acceso (`C:\Program Files\VowpalWabbit\vw.exe` en Windows y `/usr/bin/vw` en Linux)
Vínculos a ejemplos	Ejemplos de VowPal Wabbit

Weka

Category	Value
¿Qué es?	Una colección de algoritmos de aprendizaje automático para las tareas de minería de datos. Puede aplicar los algoritmos directamente o llamarlos desde su propio código Java. Weka contiene herramientas para el preprocesamiento, la clasificación, la regresión, la agrupación en clústeres, las reglas de asociación y la visualización de datos.
Ediciones compatibles	Windows, Linux
Usos típicos	Herramienta de aprendizaje automático general
¿Cómo se usa o ejecuta?	En Windows, busque Weka en el menú Inicio. En Linux, inicie sesión con X2Go y, a continuación, vaya a Applications (Aplicaciones)>Development (Desarrollo)>Weka.
Vínculos a ejemplos	Ejemplos de Weka

XGBoost

Category	Value
¿Qué es?	Una biblioteca de potenciación del gradiente (GBDT, GBRT o GBM) rápida, portátil y distribuida para Python, R, Java, Scala, C++, etc. Se ejecuta en una única máquina, y en Apache Hadoop y Spark.
Ediciones compatibles	Windows, Linux
Usos típicos	Biblioteca de aprendizaje automático general
¿Cómo se configura o instala?	Se instala con la compatibilidad de GPU
¿Cómo se usa o ejecuta?	Como biblioteca de Python (2.7 y 3.6+), paquete de R y en la herramienta de línea de comandos de ruta de acceso (`C:\dsvm\tools\xgboost\bin\xgboost.exe` para Windows y `/dsvm/tools/xgboost/xgboost` para Linux)
Vínculos a ejemplos	Se incluyen ejemplos en la máquina virtual, en `/dsvm/tools/xgboost/demo` en Linux y `C:\dsvm\tools\xgboost\demo` en Windows.