Herramientas de aprendizaje automático y ciencia de datos en Azure Data Science Virtual Machines

Las máquinas virtuales de Ciencia de datos de Azure (DSVM) disponen de un amplio conjunto de herramientas y bibliotecas para el aprendizaje automático. Estos recursos están disponibles en lenguajes populares, como Python, R y Julia.

DSVM admite estas bibliotecas y herramientas de aprendizaje automático:

SDK de Azure Machine Learning para Python

Para obtener una referencia completa, visite SDK de Azure Machine Learning para Python.

Category Value
¿Qué es? Puede usar el servicio en la nube de Azure Machine Learning para desarrollar e implementar modelos de aprendizaje automático. Puede usar el SDK de Python para realizar un seguimiento de los modelos a medida que compila, entrena, escala y administra los modelos. Implemente modelos como contenedores y ejecútelos en la nube, de forma local o en Azure IoT Edge.
Ediciones compatibles Windows (entorno de conda: AzureML), Linux (entorno de conda: py36)
Usos típicos Plataforma de aprendizaje automático general
¿Cómo se configura o instala? Se instala con la compatibilidad de GPU
¿Cómo se usa o ejecuta? Como un SDK de Python y en la CLI de Azure. Activar al entorno conda AzureML en la edición Windows o activar la edición py36 a en la edición Linux.
Vínculos a ejemplos Busque cuadernos de Jupyter Notebook de ejemplo en el directorio AzureML, en cuadernos.

H2O

Category Value
¿Qué es? Una plataforma de inteligencia artificial de código abierto que admite el aprendizaje automático escalable distribuido, rápido, en memoria.
Versiones compatibles Linux
Usos típicos Aprendizaje automático escalable y distribuido de uso general
¿Cómo se configura o instala? H2O se instala en /dsvm/tools/h2o.
¿Cómo se usa o ejecuta? Conéctese a la máquina virtual con X2Go. Inicie un nuevo terminal y ejecute java -jar /dsvm/tools/h2o/current/h2o.jar. Luego, inicie un explorador web y conéctese a http://localhost:54321.
Vínculos a ejemplos Busque ejemplos en la máquina virtual en Jupyter, en el directorio h2o.

Hay otras bibliotecas de aprendizaje automático en DSVM; por ejemplo, el popular paquete scikit-learn que forma parte de la distribución de Python de Anaconda para DSVM. Para obtener una lista de los paquetes disponibles en Python, R y Julia, ejecute los administradores de paquetes respectivos.

LightGBM

Category Value
¿Qué es? Un marco de potenciación del gradiente (GBDT, GBRT, GBM o MART) rápido, distribuido y de alto rendimiento, basado en algoritmos de árbol de decisión. Tareas de aprendizaje automático: clasificación, clasificación, etc., úsela.
Versiones compatibles Windows, Linux
Usos típicos Marco de potenciación del gradiente de uso general
¿Cómo se configura o instala? LightGBM se instala como un paquete de Python en Windows. En Linux, el ejecutable de la línea de comandos se encuentra en /opt/LightGBM/lightgbm. El paquete de R está instalado y se instalan los paquetes de Python.
Vínculos a ejemplos Guía de LightGBM

Rattle

Category Value
¿Qué es? Interfaz gráfica de usuario para la minería de datos que usa R.
Ediciones compatibles Windows, Linux
Usos típicos Herramienta general de minería de datos de la IU para R
¿Cómo se usa o ejecuta? Como herramienta de interfaz de usuario. En Windows, inicie un símbolo del sistema, ejecute R y, dentro de R, ejecute rattle(). En Linux, conéctese a X2Go, inicie un terminal, ejecute R y, dentro de R, ejecute rattle().
Vínculos a ejemplos Rattle

Vowpal Wabbit

Category Value
¿Qué es? Una biblioteca de sistema de aprendizaje rápida, de código abierto y situada fuera de núcleo
Ediciones compatibles Windows, Linux
Usos típicos Biblioteca de aprendizaje automático general
¿Cómo se configura o instala? Windows: instalador msi
Linux: apt-get
¿Cómo se usa o ejecuta? Como una herramienta de línea de comandos de ruta de acceso (C:\Program Files\VowpalWabbit\vw.exe en Windows y /usr/bin/vw en Linux)
Vínculos a ejemplos Ejemplos de VowPal Wabbit

Weka

Category Value
¿Qué es? Una colección de algoritmos de aprendizaje automático para las tareas de minería de datos. Puede aplicar los algoritmos directamente o llamarlos desde su propio código Java. Weka contiene herramientas para el preprocesamiento, la clasificación, la regresión, la agrupación en clústeres, las reglas de asociación y la visualización de datos.
Ediciones compatibles Windows, Linux
Usos típicos Herramienta de aprendizaje automático general
¿Cómo se usa o ejecuta? En Windows, busque Weka en el menú Inicio. En Linux, inicie sesión con X2Go y, a continuación, vaya a Applications (Aplicaciones)>Development (Desarrollo)>Weka.
Vínculos a ejemplos Ejemplos de Weka

XGBoost

Category Value
¿Qué es? Una biblioteca de potenciación del gradiente (GBDT, GBRT o GBM) rápida, portátil y distribuida para Python, R, Java, Scala, C++, etc. Se ejecuta en una única máquina, y en Apache Hadoop y Spark.
Ediciones compatibles Windows, Linux
Usos típicos Biblioteca de aprendizaje automático general
¿Cómo se configura o instala? Se instala con la compatibilidad de GPU
¿Cómo se usa o ejecuta? Como biblioteca de Python (2.7 y 3.6+), paquete de R y en la herramienta de línea de comandos de ruta de acceso (C:\dsvm\tools\xgboost\bin\xgboost.exe para Windows y /dsvm/tools/xgboost/xgboost para Linux)
Vínculos a ejemplos Se incluyen ejemplos en la máquina virtual, en /dsvm/tools/xgboost/demo en Linux y C:\dsvm\tools\xgboost\demo en Windows.