microsoftml (paquete de Python en SQL Server Machine Learning Services)

Se aplica a: SQL Server 2017 (14.x) y versiones posteriores

microsoftml es un paquete de Python de Microsoft que proporciona algoritmos de aprendizaje automático de alto rendimiento. Incluye funciones para el entrenamiento y las transformaciones, la puntuación, el análisis de texto y de imágenes, y la extracción de características para derivar valores a partir de datos existentes. El paquete se incluye en SQL Server Machine Learning Services y admite un alto rendimiento en macrodatos, mediante el procesamiento de varios núcleos y un flujo de datos rápido.

Detalles del paquete Information
Versión actual: 9,4
Fecha de compilación: Distribución Anaconda 4.2 de Python 3.7.1
Distribución de paquetes: SQL Server Machine Learning Services versión 2017 o 2019.

Cómo usar microsoftml

El módulo microsoftml se instala como parte de SQL Server Machine Learning Services cuando se agrega Python a la instalación. El usuario obtiene la colección completa de paquetes de su propiedad más una distribución de Python con sus módulos e intérpretes. Puede usar cualquier IDE de Python para escribir funciones de llamada de script de Python en microsoftml, pero el script debe ejecutarse en un equipo que tenga SQL Server Machine Learning Services con Python.

Microsoftml y revoscalepy están estrechamente ligados; así, los orígenes de datos usados en microsoftml se definen como objetos de revoscalepy. Las limitaciones de contexto de proceso de revoscalepy se trasladan a microsoftml; es decir, todas las funciones están disponibles para las operaciones locales, pero cambiar a un contexto de proceso remoto requiere RxSpark o RxInSQLServer.

Versiones y plataformas

El módulo microsoftml solo está disponible cuando se instala uno de los siguientes productos o descargas de Microsoft:

Nota:

En SQL Server 2017, las versiones completas del producto son solo para Windows. Para microsoftml en SQL Server 2019, se admiten tanto Windows como Linux.

Dependencias de paquetes

Los algoritmos de microsoftml dependen de revoscalepy para:

  • Objetos de origen de datos: los datos consumidos por las funciones de microsoftml se crean mediante las funciones de revoscalepy.
  • Informática remota (desplazamiento de la ejecución de funciones a una instancia remota de SQL Server): el paquete revoscalepy proporciona funciones para crear y activar un contexto de proceso remoto para SQL Server.

En la mayoría de los casos, los paquetes se cargarán juntos siempre que se use microsoftml.

Funciones por categoría

En esta sección se enumeran las funciones por categoría, para darle una idea del uso de cada una de ellas. También puede usar la tabla de contenido para ver las funciones en orden alfabético.

1- Funciones de aprendizaje

Función Descripción
microsoftml.rx_ensemble Entrena un conjunto de modelos.
microsoftml.rx_fast_forest Bosque aleatorio.
microsoftml.rx_fast_linear Modelo lineal. con el ascenso estocástico dual de coordenadas.
microsoftml.rx_fast_trees Árboles impulsados.
microsoftml.rx_logistic_regression Regresión logística.
microsoftml.rx_neural_network Red neuronal.
microsoftml.rx_oneclass_svm Detección de anomalías.

2-Funciones de transformación

Control de variables de categorías

Función Descripción
microsoftml.categorical Convierte una columna de texto en categorías.
microsoftml.categorical_hash Aplica y convierte una columna de texto en categorías.

Manipulación de esquemas

Función Descripción
microsoftml.concat Concatena varias columnas en un único vector.
microsoftml.drop_columns Quita columnas de un conjunto de datos.
microsoftml.select_columns Conserva las columnas de un conjunto de datos.

Selección de variables

Función Descripción
microsoftml.count_select Selecciona características basadas en recuentos.
microsoftml.mutualinformation_select Selecciona características basadas en la información mutua.

Análisis de texto

Función Descripción
microsoftml.featurize_text Convierte las columnas de texto en características numéricas.
microsoftml.get_sentiment Análisis de sentimiento.

Análisis de imagen

Función Descripción
microsoftml.load_image Carga una imagen.
microsoftml.resize_image Ajusta el tamaño de una imagen.
microsoftml.extract_pixels Extrae píxeles de una imagen.
microsoftml.featurize_image Convierte una imagen en características.

Funciones de características

Función Descripción
microsoftml.rx_featurize Transformación de datos para orígenes de datos

Funciones de puntuación

Función Descripción
microsoftml.rx_predict Puntuaciones mediante un modelo de aprendizaje automático de Microsoft

Cómo llamar a microsoftml

Las funciones de microsoftml se pueden llamar en código Python encapsulado en procedimientos almacenados. La mayoría de los desarrolladores compilan soluciones de microsoftml localmente y, después, migran el código Python final a los procedimientos almacenados como un ejercicio de implementación.

El paquete microsoftml para Python está instalado de forma predeterminada, pero a diferencia de revoscalepy, no se carga de forma predeterminada cuando se inicia una sesión de Python con los ejecutables de Python instalados con SQL Server.

Como primer paso, importe el paquete de microsoftml e importe revoscalepy si necesita usar contextos de cálculo remotos o conectividad u objetos de origen de datos relacionados. Después, haga referencia a las funciones individuales que necesite.

from microsoftml.modules.logistic_regression.rx_logistic_regression import rx_logistic_regression
from revoscalepy.functions.RxSummary import rx_summary
from revoscalepy.etl.RxImport import rx_import_datasource

Consulte también