Instalación de SQL Server Machine Learning Services (Python y R) en Linux

Se aplica a: síSQL Server 2019 (15.x): Linux

En este artículo se le guiará por la instalación de SQL Server Machine Learning Services en Linux. Se pueden ejecutar scripts de Python y R en la base de datos mediante Machine Learning Services.

Puede instalar Machine Learning Services en Red Hat Enterprise Linux (RHEL), SUSE Linux Enterprise Server (SLES) y Ubuntu. Para obtener más información, vea la sección Plataformas admitidas de las instrucciones de instalación de SQL Server en Linux.

Nota

Machine Learning Services se instala de forma predeterminada en los clústeres de macrodatos de SQL Server. Para más información, vea Uso de Machine Learning Services (Python y R) en Clústeres de macrodatos

Lista de comprobación previa a la instalación

  • Instale SQL Server en Linux y compruebe la instalación.

  • Compruebe en los repositorios de SQL Server para Linux si están las extensiones de Python y R. Si ya ha configurado repositorios de origen para la instalación del motor de base de datos, puede ejecutar los comandos de instalación de paquetes mssql-mlservices usando el mismo registro de repositorio.

  • (Solo R) Microsoft R Open (MRO) proporciona la distribución de R base para la característica R de SQL Server y es un requisito previo para usar RevoScaleR, MicrosoftML y otros paquetes de R instalados con Machine Learning Services.

    • La versión necesaria es MRO 3.5.2.
    • Elija entre los dos métodos siguientes para instalar MRO:
      • Descargue el tarball de MRO desde MRAN, desempaquételo y ejecute el script install.sh. Si quiere usar este método, puede seguir las instrucciones de instalación en MRAN.
      • Registre el repositorio packages.microsoft.com como se describe a continuación para instalar la distribución de MRO: microsoft-r-open-mro y microsoft-r-open-mkl.
    • Vea las secciones de instalación siguientes para saber cómo instalar MRO.
  • Debe tener una herramienta para ejecutar comandos de T-SQL.

    • Puede usar Azure Data Studio, una herramienta de base de datos gratuita que se ejecuta en Linux, Windows y macOS.

Lista de paquetes

En un dispositivo conectado a Internet, los paquetes se descargan e instalan de forma independiente del motor de base de datos mediante el instalador de paquetes de cada sistema operativo. En la siguiente tabla se describen todos los paquetes disponibles, pero para R y Python hay que especificar paquetes que proporcionen la instalación completa de características o la instalación mínima de características.

Paquetes de instalación disponibles:

Nombre del paquete Válido para Descripción
mssql-server-extensibility All Marco de extensibilidad que se usa para ejecutar Python y R.
microsoft-openmpi Python, R Interfaz de paso de mensajes usada por las bibliotecas Rev* para la paralelización en Linux.
mssql-mlservices-python Python Distribución de código abierto de Anaconda y Python.
mssql-mlservices-mlm-py Python Instalación completa. Proporciona revoscalepy, microsoftml, modelos entrenados previamente para las características de imágenes y análisis de opiniones de texto.
mssql-mlservices-packages-py Python Instalación mínima. Proporciona revoscalepy y microsoftml.
Excluye los modelos previamente entrenados.
microsoft-r-open* R Distribución de código abierto de R, formada por tres paquetes.
mssql-mlservices-mlm-r R Instalación completa. Proporciona: RevoScaleR, MicrosoftML, sqlRUtils, olapR, modelos entrenados previamente para las características de imágenes y análisis de opiniones de texto.
mssql-mlservices-packages-r R Instalación mínima. Proporciona RevoScaleR, sqlRUtils, MicrosoftML, olapr.
Excluye los modelos previamente entrenados.

Instalación en RHEL

Siga los pasos siguientes para instalar SQL Server Machine Learning Services en Red Hat Enterprise Linux (RHEL).

Instalación de MRO en RHEL

Los siguientes comandos registran el repositorio que proporciona MRO. Tras el registro, los comandos para instalar otros paquetes de R (como mssql-mlservices-mml-r) incluirán automáticamente MRO como una dependencia de paquete.

# Import the Microsoft repository key

sudo rpm --import https://packages.microsoft.com/keys/microsoft.asc

# Set the location of the package repo at the "prod" directory
# The following command is for version 8.x
# To get the version for 6.x or 7.x, replace 8 with 6 or 7, respectively.
rpm -Uvh https://packages.microsoft.com/config/rhel/8/packages-microsoft-prod.rpm

# Update packages on your system (optional)
yum update

Opciones de instalación para Python y R:

  • Instale la compatibilidad de lenguaje según los requisitos (uno o varios lenguajes).
  • En la instalación completa se proporcionan todas las características disponibles, incluidos modelos de Machine Learning entrenados previamente.
  • La instalación mínima excluye los modelos pero todavía mantiene toda la funcionalidad.

Sugerencia

Si es posible, ejecute yum clean all para actualizar los paquetes en el sistema antes de la instalación.

Instalación completa

Incluye:

  • Python de código abierto
  • R de código abierto
  • Marco de extensibilidad
  • Microsoft-openmpi
  • Extensiones (Python, R)
  • Bibliotecas de aprendizaje automático
  • Modelos entrenados previamente para Python y R
# Install as root or sudo
# Add everything (all R, Python)
# Be sure to include -9.4.7* in mlsservices package names
sudo yum install mssql-mlservices-mlm-py-9.4.7*
sudo yum install mssql-mlservices-mlm-r-9.4.7*

Instalación mínima

Incluye:

  • Python de código abierto
  • R de código abierto
  • Marco de extensibilidad
  • Microsoft-openmpi
  • Bibliotecas Revo* básicas
  • Bibliotecas de aprendizaje automático
# Install as root or sudo
# Minimum install of R, Python extensions
# Be sure to include -9.4.6* in mlsservices package names
sudo yum install mssql-mlservices-packages-py-9.4.7*
sudo yum install mssql-mlservices-packages-r-9.4.7*

Instalación en Ubuntu

Siga los pasos siguientes para instalar SQL Server Machine Learning Services en Ubuntu.

Instalación de MRO en Ubuntu

Los siguientes comandos registran el repositorio que proporciona MRO. Tras el registro, los comandos para instalar otros paquetes de R (como mssql-mlservices-mml-r) incluirán automáticamente MRO como una dependencia de paquete.

# Install as root
sudo su

# Optionally, if your system does not have the https apt transport option
apt-get install apt-transport-https

# Set the location of the package repo the "prod" directory containing the distribution.
# This example specifies 20.04. Replace with 16.04 or 14.04 if you want those versions.
wget https://packages.microsoft.com/config/ubuntu/20.04/packages-microsoft-prod.deb

# Register the repo
dpkg -i packages-microsoft-prod.deb

# Update packages on your system (required), including MRO installation
sudo apt-get update

Opciones de instalación para Python y R:

  • Instale la compatibilidad de lenguaje según los requisitos (uno o varios lenguajes).
  • En la instalación completa se proporcionan todas las características disponibles, incluidos los modelos de aprendizaje automático entrenados previamente.
  • La instalación mínima excluye los modelos pero todavía mantiene toda la funcionalidad.

Sugerencia

Si es posible, ejecute apt-get update para actualizar los paquetes en el sistema antes de la instalación.

Instalación completa

Incluye:

  • Python de código abierto
  • R de código abierto
  • Marco de extensibilidad
  • Microsoft-openmpi
  • Extensiones de Python
  • Extensiones de R
  • Bibliotecas de aprendizaje automático
  • Modelos entrenados previamente para Python y R
# Install as root or sudo
# Add everything (all R, Python)
# There is no asterisk in this full install
sudo apt-get install mssql-mlservices-mlm-py 
sudo apt-get install mssql-mlservices-mlm-r 

Instalación mínima

Incluye:

  • Python de código abierto
  • R de código abierto
  • Marco de extensibilidad
  • Microsoft-openmpi
  • Bibliotecas Revo* básicas
  • Bibliotecas de aprendizaje automático
# Install as root or sudo
# Minimum install of R, Python
# No asterisk
sudo apt-get install mssql-mlservices-packages-py
sudo apt-get install mssql-mlservices-packages-r

Instalación en SLES

Siga los pasos siguientes para instalar SQL Server Machine Learning Services en SUSE Linux Enterprise Server (SLES).

Instalación de MRO en SLES

Los siguientes comandos registran el repositorio que proporciona MRO. Tras el registro, los comandos para instalar otros paquetes de R (como mssql-mlservices-mml-r) incluirán automáticamente MRO como una dependencia de paquete.

# Install as root
sudo su

# Set the location of the package repo at the "prod" directory containing the distribution
# This example is for SLES12
zypper ar -f https://packages.microsoft.com/sles/12/prod packages-microsoft-com

# Update packages on your system (optional)
zypper update

Opciones de instalación para Python y R:

  • Instale la compatibilidad de lenguaje según los requisitos (uno o varios lenguajes).
  • En la instalación completa se proporcionan todas las características disponibles, incluidos los modelos de aprendizaje automático entrenados previamente.
  • La instalación mínima excluye los modelos pero todavía mantiene toda la funcionalidad.

Instalación completa

Incluye:

  • Python de código abierto
  • R de código abierto
  • Marco de extensibilidad
  • Microsoft-openmpi
  • Extensiones para Python y R
  • Bibliotecas de aprendizaje automático
  • Modelos entrenados previamente para Python y R
# Install as root or sudo
# Add everything (all R, Python)
sudo zypper install mssql-mlservices-mlm-py
sudo zypper install mssql-mlservices-mlm-r

Instalación mínima

Incluye:

  • Python de código abierto
  • R de código abierto
  • Marco de extensibilidad
  • Microsoft-openmpi
  • Bibliotecas Revo* básicas
  • Bibliotecas de aprendizaje automático
# Install as root or sudo
# Minimum install of R, Python extensions
sudo zypper install mssql-mlservices-packages-py
sudo zypper install mssql-mlservices-packages-r

Configuración posterior a la instalación (obligatoria)

La configuración adicional se realiza principalmente a través de la herramienta mssql-conf.

  1. Cuando finalice la instalación del paquete, ejecute mssql-conf setup y siga las indicaciones para establecer la contraseña de administrador del sistema y elegir la edición. Realice este paso solo si aún no ha configurado SQL Server en Linux.

    sudo /opt/mssql/bin/mssql-conf setup
    
  2. Acepte los contratos de licencia de las extensiones de R y Python de código abierto. Use el comando siguiente:

    # Run as SUDO or root
    # Use set + EULA 
    sudo /opt/mssql/bin/mssql-conf set EULA accepteulaml Y
    

    El programa de instalación detecta los paquetes mssql-mlservices y solicita la aceptación del CLUF (si no se ha aceptado antes) cuando se ejecuta mssql-conf setup. Para más información sobre los parámetros EULA, vea Configuración de SQL Server con la herramienta mssql-conf.

  3. Habilite el acceso de red saliente. El acceso de red saliente está deshabilitado de forma predeterminada. Para habilitar las solicitudes salientes, establezca la propiedad booleana "outboundnetworkaccess" con la herramienta mssql-conf. Para más información, vea Configuración de SQL Server en Linux con mssql-conf.

    # Run as SUDO or root
    # Enable outbound requests over the network
    sudo /opt/mssql/bin/mssql-conf set extensibility outboundnetworkaccess 1
    
  4. Solo de cara a la integración de características de R, establezca la variable de entorno MKL_CBWR para garantizar una salida coherente de los cálculos de la biblioteca Math Kernel Library (MKL) de Intel.

    • Edite o cree un archivo llamado .bash_profile en el directorio principal de usuario, mediante la adición de la línea export MKL_CBWR="AUTO" al archivo.

    • Ejecute este archivo escribiendo source .bash_profile en un símbolo del sistema de Bash.

  5. Reinicie el servicio SQL Server Launchpad y la instancia del motor de base de datos para leer los valores actualizados del archivo INI. Cuando se modifica una configuración relacionada con la extensibilidad, se muestra un mensaje de notificación.

    systemctl restart mssql-launchpadd
    
    systemctl restart mssql-server.service
    
  6. Habilite la ejecución de scripts externos con Azure Data Studio u otra herramienta como SQL Server Management Studio (solo Windows) que ejecute Transact-SQL.

    EXEC sp_configure 'external scripts enabled', 1 
    RECONFIGURE WITH OVERRIDE 
    
  7. Vuelva a reiniciar el servicio Launchpad.

Comprobar la instalación

Las bibliotecas de R (MicrosoftML, RevoScaleR y otras) se encuentran en /opt/mssql/mlservices/libraries/RServer.

Las bibliotecas de Python (microsoftml y revoscalepy) se encuentran en /opt/mssql/mlservices/libraries/PythonServer.

Para validar la instalación:

  • Ejecute un script de T-SQL que ejecute un procedimiento almacenado del sistema que invoque Python o R mediante una herramienta de consulta.

  • Ejecute el siguiente comando SQL para probar la ejecución de R en SQL Server. ¿Errores? Pruebe el reinicio del servicio, sudo systemctl restart mssql-server.service.

    EXEC sp_execute_external_script   
    @language =N'R', 
    @script=N' 
    OutputDataSet <- InputDataSet', 
    @input_data_1 =N'SELECT 1 AS hello' 
    WITH RESULT SETS (([hello] int not null)); 
    GO 
    
  • Ejecute el siguiente comando SQL para probar la ejecución de Python en SQL Server.

    EXEC sp_execute_external_script  
    @language =N'Python', 
    @script=N' 
    OutputDataSet = InputDataSet; 
    ', 
    @input_data_1 =N'SELECT 1 AS hello' 
    WITH RESULT SETS (([hello] int not null)); 
    GO 
    

Instalación desatendida

Mediante la instalación desatendida del motor de base de datos, agregue los paquetes de mssql-mlservices y los contratos de licencia.

Use uno de los parámetros de CLUF específicos de mlservices para las distribuciones de R y Python de código abierto:

sudo /opt/mssql/bin/mssql-conf setup accept-eula-ml

El CLUF completo se documenta en Configuración de SQL Server en Linux con la herramienta mssql-conf.

Instalación sin conexión

Siga las instrucciones de instalación sin conexión para ver los pasos para instalar los paquetes. Busque el sitio de descarga y luego descargue paquetes específicos mediante la lista de paquetes siguiente.

Sugerencia

Varias de las herramientas de administración de paquetes proporcionan comandos que pueden ayudar a determinar las dependencias de los paquetes. En yum, use sudo yum deplist [package]. En Ubuntu, use sudo apt-get install --reinstall --download-only [package name] seguido de dpkg -I [package name].deb.

Sitio de descarga

Descargue los paquetes desde https://packages.microsoft.com/. Todos los paquetes mlservices de Python y R se colocan con el paquete del motor de base de datos. La versión base de los paquetes mlservices es 9.4.6. Recuerde que los paquetes microsoft-r-open están en un repositorio diferente.

Rutas de acceso de RHEL/8

Paquete Ubicación de descarga
Paquetes mssql/mlservices https://packages.microsoft.com/rhel/8/mssql-server-2019/
Paquetes microsoft-r-open https://packages.microsoft.com/rhel/8/prod/

Rutas de acceso de Ubuntu/20.04

Paquete Ubicación de descarga
Paquetes mssql/mlservices https://packages.microsoft.com/ubuntu/20.04/mssql-server-2019/pool/main/m/
Paquetes microsoft-r-open https://packages.microsoft.com/ubuntu/20.04/prod/pool/main/m/

Rutas de acceso de SLES/12

Paquete Ubicación de descarga
Paquetes mssql/mlservices https://packages.microsoft.com/sles/12/mssql-server-2019/
Paquetes microsoft-r-open https://packages.microsoft.com/sles/12/prod/

Seleccione las extensiones que quiera usar y descargue los paquetes necesarios para un lenguaje específico. Los nombres de archivo incluyen información de la plataforma en el sufijo.

Lista de paquetes

En función de las extensiones que quiera usar, descargue los paquetes necesarios relativos a un lenguaje específico. Los nombres de archivo exactos incluyen información de la plataforma en el sufijo, pero los nombres de archivo siguientes deben ser lo suficientemente cercanos para que pueda determinar qué archivos va a obtener.

# Core packages 
mssql-server-15.0.1000
mssql-server-extensibility-15.0.1000

# R
microsoft-openmpi-3.0.0
microsoft-r-open-mkl-3.5.2
microsoft-r-open-mro-3.5.2
mssql-mlservices-packages-r-9.4.7.64
mssql-mlservices-mlm-r-9.4.7.64


# Python
microsoft-openmpi-3.0.0
mssql-mlservices-python-9.4.7.64
mssql-mlservices-packages-py-9.4.7.64
mssql-mlservices-mlm-py-9.4.7.64

Pasos siguientes

Los desarrolladores de Python pueden aprender a usar Python con SQL Server con estos tutoriales:

Los desarrolladores de R pueden empezar con algunos ejemplos sencillos y conocer los aspectos básicos del funcionamiento de R con SQL Server. Para conocer el siguiente paso, vea los vínculos siguientes: