Presentación del grupo maestro en Clústeres de macrodatos de SQL Server

Se aplica a: síSQL Server 2019 (15.x)

En este artículo, se describe el rol de la instancia maestra de SQL Server en un clúster de macrodatos de SQL Server. El grupo maestro contiene la instancia maestra de SQL Server. La instancia maestra es una instancia de SQL Server que se ejecuta en un clúster de macrodatos de SQL Server. La instancia maestra administra la conectividad, las consultas de escalabilidad horizontal, los metadatos y las bases de datos de usuario, así como los servicios de aprendizaje automático.

La instancia maestra de SQL Server proporciona las siguientes funciones:

Conectividad

La instancia maestra de SQL Server proporciona un punto de conexión TDS accesible externamente para el clúster. Puede conectar aplicaciones o herramientas de SQL Server (como Azure Data Studio o SQL Server Management Studio) a este punto de conexión, igual que conectaría cualquier otra instancia de SQL Server.

Administración de consultas de escalado horizontal

La instancia maestra de SQL Server contiene el motor de consultas de escalado horizontal que se usa para distribuir consultas en distintas instancias de SQL Server en nodos del grupo de proceso. El motor de consultas de escalado horizontal también proporciona acceso mediante Transact-SQL a todas las tablas de Hive en el clúster, sin necesidad de usar una configuración adicional.

Metadatos y bases de datos de usuario

Además de las bases de datos del sistema de SQL Server estándar, la instancia maestra de SQL también contiene lo siguiente:

  • Base de datos de metadatos que contiene metadatos de tablas HDFS.
  • Mapa de particiones del plano de datos.
  • Detalles de las tablas externas que proporcionan acceso al plano de datos del clúster.
  • Orígenes de datos externos de PolyBase y tablas externas definidas en bases de datos de usuario.

También puede agregar sus propias bases de datos de usuario a la instancia maestra de SQL Server.

Machine Learning Services

La característica de los servicios de aprendizaje automático de SQL Server es un complemento al motor de base de datos. La característica de los servicios de aprendizaje automático se usa para ejecutar código Java, R y Python en SQL Server. Esta característica se basa en el marco de extensibilidad de SQL Server, que aísla los procesos externos de los procesos del motor principal, pero que se integra por completo con los datos relacionales como procedimientos almacenados, como un script de T-SQL que contiene instrucciones de R o Python, o bien como código de Java, R o Python que contiene T-SQL.

Como parte del clúster de macrodatos de SQL Server, la característica Machine Learning Services estará disponible de forma predeterminada en la instancia maestra de SQL Server. Cuando se habilita la ejecución del script externo en la instancia maestra de SQL Server, es posible ejecutar scripts de Java, R y Python mediante sp_execute_external_script.

Ventajas de Machine Learning Services en un clúster de macrodatos

Clústeres de macrodatos de SQL Server permite encontrar fácilmente macrodatos para unirlos a los datos dimensionales que suelen almacenarse en la base de datos empresarial. Este valor de los macrodatos se incrementa en gran medida cuando no solo pertenece a una organización, sino que también se incluye en informes, paneles y aplicaciones. Al mismo tiempo, los científicos de datos pueden seguir usando las herramientas del ecosistema de Spark/HDFS, y acceder fácilmente y en tiempo real a los datos en la instancia maestra de SQL Server y en orígenes de datos externos accesibles mediante la instancia maestra de SQL Server.

Con Clústeres de macrodatos de SQL Server, puede hacer más cosas con sus lagos de datos empresariales. Los desarrolladores y analistas de SQL Server pueden:

  • Crear aplicaciones que usen datos de lagos de datos empresariales.
  • Razonar sobre todos los datos con consultas Transact-SQL.
  • Usar el ecosistema existente de herramientas de aplicaciones de SQL Server para acceder a datos empresariales y analizarlos.
  • Reducir la necesidad del movimiento de datos mediante la virtualización de datos y data marts.
  • Seguir usando Spark para escenarios de macrodatos.
  • Crea aplicaciones empresariales inteligentes que usen Spark o SQL Server para entrenar modelos con lagos de datos.
  • Hacer operativos modelos en bases de datos de producción para obtener el mejor rendimiento.
  • Transmitir por streaming datos directamente en data marts empresariales para obtener análisis en tiempo real.
  • Explorar datos visualmente mediante análisis interactivos y herramientas de BI.

Pasos siguientes

Para obtener más información sobre Clústeres de macrodatos de SQL Server, vea los recursos siguientes: