Usar Integration Services con minería de datos

La minería de datos suele describirse como el proceso de extraer información válida y que se pueda procesar de bases de datos de gran tamaño. En otras palabras, la minería de datos ayuda a descubrir los patrones y tendencias que existen en los datos. Microsoft SQL ServerAnalysis Services dispone de características y herramientas de minería de datos muy eficaces para extraer y analizar dichos patrones. Integration Services tiene también diversos componentes que le ayudarán a administrar estos modelos de minería de datos y hacer consultas en ellos.

Para obtener más información acerca de las características de la minería de datos de SQL ServerAnalysis Services, vea Información general (Analysis Services - Minería de datos) y Proyectos de minería de datos (Analysis Services - Minería de datos).

[!NOTA]

Algunos de los componentes de Integration Services que se describen en este tema sólo están disponibles en SQL Server Enterprise y Developer.

Administradores de conexión

Un administrador de conexión es una representación lógica de una conexión a un origen de datos. El administrador de conexión de Analysis Services se puede usar para conectarse a una base de datos de Analysis Services en la que se almacenan estructuras y modelos de minería de datos. Todas las tareas y los componentes de flujo de datos que se describen en este tema requieren un administrador de conexión de Analysis Services.

Administrador de conexión de Analysis Services

Un administrador de conexión de Analysis Services permite que un paquete se conecte con un servidor que se ejecuta en una base de datos de Analysis Services o con un proyecto de Analysis Services que proporciona acceso a estructuras y modelos de minería de datos. Sólo puede conectarse a un proyecto de Analysis Services mientras desarrolla paquetes en Business Intelligence Development Studio. Durante el tiempo de ejecución, los paquetes se conectan al servidor y la base de datos en la que se implementó Analysis Services.

Para obtener más información, vea Administrador de conexión de Analysis Services.

Tareas

Las tareas son elementos de flujo de control que definen las unidades de trabajo que se realizan en un paquete. Se pueden usar las tareas siguientes para crear o modificar una estructura o un modelo de minería de datos, así como para procesar o realizar consultas en un modelo.

Tarea Ejecutar DDL de Analysis Services

La tarea Ejecutar DDL de Analysis Services ejecuta instrucciones del lenguaje de definición de datos (DDL) que pueden crear, quitar o modificar estructuras y modelos de minería. Las instrucciones de DDL se representan como instrucciones del Lenguaje de scripts de Analysis Services (ASSL) y se generan como comandos de XML for Analysis (XMLA).

Para obtener más información acerca de esta tarea, vea Tarea Ejecutar DDL de Analysis Services. Para obtener más información sobre la creación y modificación de objetos de Analysis Services mediante XMLA, vea Crear y modificar objetos (XMLA).

Tarea Procesamiento de Analysis Services

La tarea Procesamiento de Analysis Services automatiza el procesamiento de objetos de Analysis Services, como por ejemplo, modelos de minería.

Para obtener más información acerca de esta tarea, vea Tarea Procesamiento de Analysis Services. Para obtener más información acerca de cómo procesar objetos de Analysis Services, vea Procesar objetos de Analysis Services

Tarea Consulta de minería de datos

La tarea Consulta de minería de datos ejecuta consultas de predicción basadas en modelos de minería de datos integrados en Analysis Services. La consulta de predicción crea una predicción de nuevos datos utilizando modelos de minería y guarda el resultado en una o varias tablas.

Para obtener más información acerca de esta tarea, vea Tarea Consulta de minería de datos. Para obtener más información acerca de la realización de consultas en un modelo de minería de datos mediante DMX, vea Crear consultas de predicción DMX.

Transformaciones de flujo de datos

Las transformaciones son los componentes del flujo de datos de un paquete que agregan, mezclan, distribuyen y modifican datos.

Transformación Consulta de minería de datos

La transformación Consulta de minería de datos realiza consultas de predicción en modelos de minería de datos. Esta transformación contiene un generador de consultas para crear consultas de Extensiones de minería de datos (DMX). El generador de consultas permite crear instrucciones personalizadas, mediante el lenguaje DMX, para evaluar los datos de entrada de la transformación en un modelo de minería existente. A diferencia de la tarea Consulta de minería de datos, que guarda su resultado directamente en una o varias tablas, la transformación Consulta de minería de datos pone su resultado a disposición de los componentes de nivel inferior del flujo de datos del paquete.

Para obtener más información sobre esta transformación, vea Transformación Consulta de minería de datos. Para obtener más información acerca de la realización de consultas en un modelo de minería de datos mediante DMX, vea Crear consultas de predicción DMX.

Destinos de flujo de datos

Los destinos son los componentes de flujo de datos que cargan el resultado de un flujo de datos en diferentes tipos de orígenes de datos o crean un conjunto de datos almacenados en memoria.

Destino de entrenamiento del modelo de minería de datos

El destino de Entrenamiento del modelo de minería de datos entrena los modelos de minería de datos pasando los datos que recibe el destino por los algoritmos de modelos de minería de datos. Durante el proceso de entrenamiento, los algoritmos calculan los patrones y las relaciones existentes entre los elementos de los datos. Una vez que se ha entrenado un nuevo modelo de minería, el modelo se puede utilizar para ejecutar consultas de predicción.

Para obtener más información, vea Destino de entrenamiento del modelo de minería de datos.

Otros componentes de Integration Services para la minería de datos

Integration Services dispone de muchos otros componentes que pueden resultar útiles en una solución de minería de datos.

  • Para entrenar o comprobar los modelos de minería de datos con un subconjunto de los datos, se puede utilizar:

    • **Transformación Muestreo de fila.   **Copia únicamente un subconjunto de filas, en función de un recuento especificado. Para obtener más información, vea Transformación Muestreo de fila.

    • **Transformación Muestreo de porcentaje.   **Copia únicamente un subconjunto de filas, en función de un porcentaje especificado. Para obtener más información, vea Transformación Muestreo de porcentaje.

  • Para limpiar los datos mediante la eliminación de duplicados y la normalización de valores, se puede utilizar:

  • Para realizar minería de datos de texto, se puede utilizar:

    • **Transformación Extracción de términos.   **Crea una tabla con los términos encontrados en el conjunto de datos original, tras eliminar las palabras estándar y las palabras irrelevantes definidas por el usuario. Para obtener más información, vea Transformación Extracción de términos.

    • **Transformación Búsqueda de términos.   **Compara los términos de entrada con los de una tabla de referencia. Para obtener más información, vea Transformación Búsqueda de términos.

Icono de Integration Services (pequeño) Manténgase al día con Integration Services

Para obtener las más recientes descargas, artículos, ejemplos y vídeos de Microsoft, así como soluciones seleccionadas de la comunidad, visite la página de Integration Services en MSDN o TechNet:

Para recibir notificaciones automáticas de estas actualizaciones, suscríbase a las fuentes RSS disponibles en la página.