Consultas de minería de datos

Se aplica a: SQL Server 2019 y versiones anteriores de Analysis Services Azure Analysis Services Fabric/Power BI Premium

Importante

La minería de datos estaba en desuso en SQL Server 2017 Analysis Services y ahora se ha interrumpido en SQL Server 2022 Analysis Services. La documentación no se actualiza para las características en desuso e interrumpidas. Para más información, consulte Compatibilidad con versiones anteriores de Analysis Services.

Las consultas de minería de datos son útiles para muchos propósitos. Puede:

  • Aplicar el modelo a nuevos datos, para realizar una o varias predicciones. Proporcionar valores de entrada como parámetros o en un lote.

  • Obtener un resumen estadístico de los datos utilizados para entrenar.

  • Extraer patrones y reglas, o generar un perfil del caso típico que representa un patrón del modelo.

  • Extraer fórmulas de regresión y otros cálculos que expliquen los patrones.

  • Obtener los casos que se ajusten a un patrón determinado.

  • Recuperar detalles sobre casos individuales usados en el modelo, incluidos los datos no usados en el análisis.

  • Volver a entrenar un modelo agregando nuevos datos, o realizar predicciones cruzadas.

Esta sección proporciona información general sobre lo que debe saber para empezar a trabajar con consultas de minería de datos. Describe los tipos de consultas que puede crear con los objetos de minería de datos, presenta las herramientas y lenguajes de consulta y proporciona vínculos a ejemplos de consultas que puede crear con modelos que fueron compilados utilizando los algoritmos proporcionados en la minería de datos de SQL Server.

Descripción de las consultas de minería de datos

Herramientas e interfaces de consulta

Consultas para diferentes tipos de modelo

Requisitos

Descripción de las consultas de minería de datos

SQL Server Analysis Services minería de datos admite los siguientes tipos de consultas:

Antes de crear consultas, recomendamos que se familiarice con las diferencias que existen entre los modelos creados con cada uno de los algoritmos de minería de datos proporcionados por SQL Server.

Herramientas e interfaces de consulta

Puede compilar consultas de minería de datos de forma interactiva mediante una de las herramientas de consulta proporcionadas por SQL Server. El Generador gráfico de consultas de predicción se proporciona tanto en SQL Server Data Tools como en SQL Server Management Studio. Si no ha utilizado el Generador de consultas de predicción antes, recomendamos seguir los pasos de Basic Data Mining Tutorial para familiarizarse con la interfaz. Para una introducción rápida a los pasos, vea Crear una consulta de predicción con el Generador de consultas de predicción.

El Generador de consultas de predicción es útil para iniciar consultas que personalizará después. Puede agregar orígenes de datos con facilidad y asignarlos a columnas y, a continuación, pasar a la vista DMX y personalizar la consulta agregando una cláusula WHERE u otras funciones.

Una vez familiarizado con los modelos de minería de datos y con el modo de compilar consultas, también puede escribir consultas directamente utilizando Extensiones de minería de datos (DMX). DMX es un lenguaje de consultas que es similar a Transact-SQL y que puede utilizar en muchos clientes diferentes. DMX es la herramienta adecuada para crear predicciones personalizadas y consultas complejas. Para obtener una introducción a DMX, consulte Creación y consulta de modelos de minería de datos con DMX: Tutoriales (Analysis Services - Minería de datos).

Los editores DMX se proporcionan tanto en SQL Server Data Tools como en SQL Server Management Studio. También puede utilizar el Generador de consultas de predicción para iniciar sus consultas y, a continuación, cambiar la vista al editor de texto y copiar la instrucción DMX en otro cliente. Para más información, vea Herramientas de consulta de minería de datos.

Puede redactar instrucciones DMX mediante programación y enviarlas desde el cliente al servidor SQL Server Analysis Services mediante AMO o XMLA. Sin embargo, DMX es el lenguaje que debe utilizar para crear consultas en un modelo de minería de datos.

También puede consultar los metadatos, estadísticas y parte del contenido del modelo usando Vistas de administración dinámica (DMV) basadas en los conjuntos de filas de esquema de minería de datos. Con estas DMV resulta fácil recuperar información sobre el modelo mediante instrucciones SELECT; sin embargo, no se pueden crear predicciones. Para obtener más información sobre las DMV compatibles con SQL Server Analysis Services, vea Usar vistas de administración dinámica (DMV) para supervisar Analysis Services.

Finalmente, puede crear consultas de minería de datos para utilizarlas en paquetes de Integration Services mediante la Data Mining Query Tasko la Data Mining Query Transformation. La tarea de flujo de control admite varios tipos de consultas DMX, mientras que la transformación de flujo de datos solo admite consultas que trabajan con datos del flujo de datos, lo cual significa que las consultas utilizan la sintaxis de PREDICTION JOIN.

Consultas para los diferentes tipos de modelos

El algoritmo utilizado al crear el modelo influye notablemente en el tipo de información que se puede recibir de una consulta de minería de datos. La razón de las diferencias es que cada algoritmo procesa los datos de forma diferente y almacena diferentes tipos de modelos. Por ejemplo, algunos algoritmos crean clústeres y otros crean árboles. Por consiguiente, podría tener que utilizar predicción y funciones de consulta especializadas, según el tipo de modelo con el que esté trabajando.

La siguiente lista proporciona un resumen de las funciones que puede utilizar en las consultas:

  • Funciones de predicción generales: la función Predict es polimórfica, lo que significa que funciona con todos los tipos de modelo. Esta función detectará automáticamente el tipo de modelo con el que está trabajando y solicitará parámetros adicionales. Para obtener más información, consulte Predicción (DMX).

    Advertencia

    No todos los modelos se utilizan para realizar predicciones. Por ejemplo, puede crear un modelo de agrupación en clústeres que no tenga un atributo de predicción. Sin embargo, aun cuando un modelo no tenga un atributo de predicción, puede crear consultas de predicción que devuelvan otro tipo de información útil sobre el modelo.

  • Funciones de predicción personalizadas: cada tipo modelo proporciona un conjunto de funciones de predicción diseñado para trabajar con los modelos creados por ese algoritmo.

    Por ejemplo, la función Lag se proporciona para los modelos de serie temporal, para que pueda ver los datos históricos utilizados para el modelo. Para los modelos de agrupación en clústeres, las funciones como ClusterDistance tienen más sentido.

    Para obtener más información sobre las funciones que se admiten para cada tipo de modelo, vea los siguientes vínculos:

    También puede llamar a funciones VBA o crear sus propias funciones. Para obtener más información, vea Funciones (DMX).

  • Estadísticas generales: hay varias funciones que se pueden utilizar con casi cualquier tipo de modelo, que devuelven un conjunto estándar de estadísticas descriptivas, como la desviación estándar.

    Por ejemplo, la función PredictHistogram devuelve una tabla que enumera todos los estados de la columna especificada.

    Para obtener más información, vea Funciones de predicción general (DMX).

  • Estadísticas personalizadas: se proporcionan funciones de apoyo adicionales para cada tipo de modelo, para generar estadísticas que sean pertinentes a la tarea analítica concreta.

    Por ejemplo, cuando trabaje con un modelo de agrupación en clústeres, puede utilizar la función PredictCaseLikelihoodpara devolver la puntuación de probabilidad asociada a un determinado caso y clúster. Sin embargo, si creara un modelo de regresión lineal, le interesaría más recuperar el coeficiente y la intersección, lo que puede hacer mediante una consulta de contenido.

  • Funciones de modelo de contenido: el contenido de todos los modelos se representa en un formato normalizado que permite recuperar información con una consulta simple. Puede crear consultas en el modelo de contenido mediante DMX. También puede obtener algún tipo de contenido del modelo de minería de datos utilizando los conjuntos de filas de esquema de minería de datos.

    En el contenido del modelo, el significado de cada fila o nodo de la tabla que se devuelve varía según el tipo de algoritmo que se utilizó para compilar el modelo, así como el tipo de datos de la columna. Para obtener más información, vea Consultas de contenido (minería de datos) .

Requisitos

Para poder crear una consulta en un modelo, el modelo de minería de datos se debe haber procesado. El procesamiento de objetos SQL Server Analysis Services requiere permisos especiales. Para obtener más información sobre el procesamiento de modelos de minería de datos, vea Requisitos y consideraciones de procesamiento (minería de datos).

Ejecutar consultas en un modelo de minería de datos requiere diferentes niveles de permisos, según el tipo de consulta que se ejecuta. Por ejemplo, la obtención de detalles de casos o datos de estructuras normalmente requiere permisos adicionales que se pueden establecer en el objeto de estructura de minería de datos u objeto de modelo de minería de datos.

Sin embargo, si la consulta utiliza datos externos e incluye instrucciones como OPENROWSET u OPENQUERY, la base de datos que está consultando debe habilitar estas instrucciones, y usted debe tener permiso en los objetos de base de datos subyacentes.

Para obtener más información sobre los contextos de seguridad necesarios para ejecutar consultas de minería de datos, vea Información general de seguridad (minería de datos)

En esta sección

Los temas de esta sección presentan cada tipo de consulta de minería de datos con más detalle y proporcionan vínculos a ejemplos detallados de cómo crear consultas en modelos de mingin de datos.

Consultas de predicción (minería de datos)

Consultas de contenido (minería de datos)

Consultas de obtención de detalles (minería de datos)

Consultas de definición de datos (minería de datos)

Herramientas de consulta de minería de datos

Use estos vínculos para aprender a crear y a trabajar con consultas de minería de datos.

Tareas Vínculos
Ver tutoriales y visitas guiadas sobre las consultas de minería de datos Lección 6: Crear y trabajar con predicciones (Tutorial básico de minería de datos)

Tutorial DMX de predicción de series temporales
Uso de herramientas de consulta de minería de datos en SQL Server Management Studio y SQL Server Data Tools Crear una consulta DMX en SQL Server Management Studio

Crear una consulta de predicción con el Generador de consultas de predicción

Aplicar funciones de predicción a un modelo

Modificar manualmente una consulta de predicción
Trabajar con los datos externos usados en consultas de predicción Elegir y asignar datos de entrada para una consulta de predicción

Elegir y asignar datos de entrada para una consulta de predicción
Trabajar con los resultados de las consultas Ver y guardar los resultados de una consulta de predicción
Usar las plantillas de consultas DMX y XMLA proporcionadas en Management Studio Crear una consulta de predicción singleton desde una plantilla

Crear una consulta de minería de datos utilizando XMLA

Uso de las plantillas de Analysis Services en SQL Server Management Studio
Obtener más información acerca de las consultas de contenido y ver ejemplos Crear una consulta de contenido en un modelo de minería de datos

Consultar los parámetros usados para crear un modelo de minería de datos

Consultas de contenido (minería de datos)
Establecer opciones de consulta y solucionar problemas relacionados con los permisos y otros problemas de las consultas Cambiar el valor del tiempo de espera para las consultas de minería de datos
Usar los componentes de minería de datos en Integration Services Tarea Consulta de minería de datos

Transformación Consulta de minería de datos

Consulte también

Algoritmos de minería de datos (Analysis Services: Minería de datos)
Contenido del modelo de minería de datos (Analysis Services - Minería de datos)