Conceptos de minería de datosData Mining Concepts

La minería de datos es el proceso de detectar la información procesable de los conjuntos grandes de datos.Data mining is the process of discovering actionable information from large sets of data. Utiliza el análisis matemático para deducir los patrones y tendencias que existen en los datos.Data mining uses mathematical analysis to derive patterns and trends that exist in data. Normalmente, estos patrones no se pueden detectar mediante la exploración tradicional de los datos porque las relaciones son demasiado complejas o porque hay demasiado datos.Typically, these patterns cannot be discovered by traditional data exploration because the relationships are too complex or because there is too much data.

Estos patrones y tendencias se pueden recopilar y definir como un modelo de minería de datos.These patterns and trends can be collected and defined as a data mining model. Los modelos de minería de datos se pueden aplicar en escenarios como los siguientes:Mining models can be applied to specific scenarios, such as:

  • Pronóstico: cálculo de las ventas y predicción de las cargas del servidor o del tiempo de inactividad del servidor.Forecasting: Estimating sales, predicting server loads or server downtime

  • Riesgo y probabilidad: elección de los mejores clientes para la distribución de correo directo, determinación del punto de equilibrio probable para los escenarios de riesgo, y asignación de probabilidades a diagnósticos y otros resultados.Risk and probability: Choosing the best customers for targeted mailings, determining the probable break-even point for risk scenarios, assigning probabilities to diagnoses or other outcomes

  • Recomendaciones: determinación de los productos que se pueden vender juntos y generación de recomendaciones.Recommendations: Determining which products are likely to be sold together, generating recommendations

  • Búsqueda de secuencias: análisis de los artículos que los clientes han introducido en el carrito de la compra y predicción de posibles eventos.Finding sequences: Analyzing customer selections in a shopping cart, predicting next likely events

  • Agrupación: distribución de clientes o eventos en grupos de elementos relacionados, y análisis y predicción de afinidades.Grouping: Separating customers or events into cluster of related items, analyzing and predicting affinities

    La generación de un modelo de minería de datos forma parte de un proceso mayor que incluye desde la formulación de preguntas acerca de los datos y la creación de un modelo para responderlas, hasta la implementación del modelo en un entorno de trabajo.Building a mining model is part of a larger process that includes everything from asking questions about the data and creating a model to answer those questions, to deploying the model into a working environment. Este proceso se puede definir mediante los seis pasos básicos siguientes:This process can be defined by using the following six basic steps:

  1. Definir el problemaDefining the Problem

  2. Preparar los datosPreparing Data

  3. Explorar los datosExploring Data

  4. Generar modelosBuilding Models

  5. Explorar y validar los modelosExploring and Validating Models

  6. Implementar y actualizar los modelosDeploying and Updating Models

    El siguiente diagrama describe las relaciones existentes entre cada paso del proceso y las tecnologías de MicrosoftMicrosoft SQL ServerSQL Server que se pueden usar para completar cada paso.The following diagram describes the relationships between each step in the process, and the technologies in MicrosoftMicrosoft SQL ServerSQL Server that you can use to complete each step.

    Pasos clave del proceso de minería de datos deKey steps in data mining process

    El proceso que se ilustra en el diagrama es cíclico, lo que significa que la creación de un modelo de minería de datos es un proceso dinámico e iterativo.The process illustrated in the diagram is cyclical, meaning that creating a data mining model is a dynamic and iterative process. Una vez que ha explorado los datos, puede que descubra que resultan insuficientes para crear los modelos de minería de datos adecuados y que, por tanto, debe buscar más datos.After you explore the data, you may find that the data is insufficient to create the appropriate mining models, and that you therefore have to look for more data. O bien, puede generar varios modelos y descubrir entonces que no responden adecuadamente al problema planteado cuando los definió y que, por tanto, debe volver a definir el problema.Alternatively, you may build several models and then realize that the models do not adequately answer the problem you defined, and that you therefore must redefine the problem. Es posible que deba actualizar los modelos una vez implementados debido a que haya más datos disponibles.You may have to update the models after they have been deployed because more data has become available. Puede que haya que repetir cada paso del proceso muchas veces para crear un modelo adecuado.Each step in the process might need to be repeated many times in order to create a good model.

    La minería de datos de Microsoft SQL Server ofrece un entorno integrado para crear y trabajar con modelos de minería de datos.Microsoft SQL Server Data Mining provides an integrated environment for creating and working with data mining models. Este entorno incluye SQL Server Development Studio, que contiene algoritmos de minería de datos y herramientas de consulta que facilitan la generación de una solución completa para una serie de proyectos, y SQL Server Management StudioSQL Server Management Studio, que contiene herramientas que permiten examinar modelos y administrar objetos de minería de datos.This environment includes SQL Server Development Studio, which contains data mining algorithms and query tools that make it easy to build a comprehensive solution for a variety of projects, and SQL Server Management StudioSQL Server Management Studio, which contains tools for browsing models and managing data mining objects. Para obtener más información, vea Crear modelos multidimensionales al usar las herramientas de datos de SQL Server (SSDT).For more information, see Creating Multidimensional Models Using SQL Server Data Tools (SSDT).

    Si quiere ver un ejemplo de cómo las herramientas de SQL ServerSQL Server se pueden aplicar en un escenario empresarial, vea Tutorial básico de minería de datos.For an example of how the SQL ServerSQL Server tools can be applied to a business scenario, see the Basic Data Mining Tutorial.

Definir el problema Defining the Problem

El primer paso del proceso de minería de datos, tal como se resalta en el siguiente diagrama, consiste en definir claramente el problema y considerar formas de usar los datos para proporcionar una respuesta para el mismo.The first step in the data mining process, as highlighted in the following diagram, is to clearly define the problem, and consider ways that data can be utilized to provide an answer to the problem.

Primer paso de minería de datos: definir el problemaData mining first step: defining the problem

Este paso incluye analizar los requisitos empresariales, definir el ámbito del problema, definir las métricas por las que se evaluará el modelo y definir los objetivos concretos del proyecto de minería de datos.This step includes analyzing business requirements, defining the scope of the problem, defining the metrics by which the model will be evaluated, and defining specific objectives for the data mining project. Estas tareas se traducen en preguntas como las siguientes:These tasks translate into questions such as the following:

  • ¿Qué está buscando?What are you looking for? ¿Qué tipos de relaciones intenta buscar?What types of relationships are you trying to find?

  • ¿Refleja el problema que está intentando resolver las directivas o procesos de la empresa?Does the problem you are trying to solve reflect the policies or processes of the business?

  • ¿Desea realizar predicciones a partir del modelo de minería de datos o solamente buscar asociaciones y patrones interesantes?Do you want to make predictions from the data mining model, or just look for interesting patterns and associations?

  • ¿Qué resultado o atributo desea predecir?Which outcome or attribute do you want to try to predict?

  • ¿Qué tipo de datos tiene y qué tipo de información hay en cada columna?What kind of data do you have and what kind of information is in each column? En caso de que haya varias tablas, ¿cómo se relacionan?If there are multiple tables, how are the tables related? ¿Necesita limpiar, agregar o procesar los datos antes de poder usarlos?Do you need to perform any cleansing, aggregation, or processing to make the data usable?

  • ¿Cómo se distribuyen los datos?How is the data distributed? ¿Los datos son estacionales?Is the data seasonal? ¿Los datos representan con precisión los procesos de la empresa?Does the data accurately represent the processes of the business?

    Para responder a estas preguntas, puede que deba dirigir un estudio de disponibilidad de datos para investigar las necesidades de los usuarios de la empresa con respecto a los datos disponibles.To answer these questions, you might have to conduct a data availability study, to investigate the needs of the business users with regard to the available data. Si los datos no abarcan las necesidades de los usuarios, podría tener que volver a definir el proyecto.If the data does not support the needs of the users, you might have to redefine the project.

    También debe considerar las maneras en las que los resultados del modelo se pueden incorporar en los indicadores de rendimiento clave (KPI) que se utilizan para medir el progreso comercial.You also need to consider the ways in which the results of the model can be incorporated in key performance indicators (KPI) that are used to measure business progress.

Preparar los datos Preparing Data

El segundo paso del proceso de minería de datos, como se indica en el siguiente diagrama, consiste en consolidar y limpiar los datos identificados en el paso Definir el problema .The second step in the data mining process, as highlighted in the following diagram, is to consolidate and clean the data that was identified in the Defining the Problem step.

Segundo paso de minería de datos: preparar los datosData mining second step: preparing data

Los datos pueden estar dispersos en la empresa y almacenados en formatos distintos; también pueden contener incoherencias como entradas que faltan o incorrectas.Data can be scattered across a company and stored in different formats, or may contain inconsistencies such as incorrect or missing entries. Por ejemplo, los datos pueden mostrar que un cliente adquirió un producto incluso antes que se ofreciera en el mercado o que el cliente compra regularmente en una tienda situada a 2.000 kilómetros de su casa.For example, the data might show that a customer bought a product before the product was offered on the market, or that the customer shops regularly at a store located 2,000 miles from her home.

La limpieza de datos no solamente implica quitar los datos no válidos o interpolar valores que faltan, sino también buscar las correlaciones ocultas en los datos, identificar los orígenes de datos que son más precisos y determinar qué columnas son las más adecuadas para el análisis.Data cleaning is not just about removing bad data or interpolating missing values, but about finding hidden correlations in the data, identifying sources of data that are the most accurate, and determining which columns are the most appropriate for use in analysis. Por ejemplo, ¿debería utilizar la fecha de envío o la fecha de pedido?For example, should you use the shipping date or the order date? ¿Qué influye más en las ventas: la cantidad, el precio total o un precio con descuento?Is the best sales influencer the quantity, total price, or a discounted price? Los datos incompletos, los datos incorrectos y las entradas que parecen independientes, pero que de hecho están estrechamente correlacionadas, pueden influir en los resultados del modelo de maneras que no espera.Incomplete data, wrong data, and inputs that appear separate but in fact are strongly correlated all can influence the results of the model in ways you do not expect.

Por consiguiente, antes de empezar a generar los modelos de minería de datos, debería identificar estos problemas y determinar cómo los corregirá.Therefore, before you start to build mining models, you should identify these problems and determine how you will fix them. En la minería de datos, por lo general se trabaja con un conjunto de datos de gran tamaño y no se puede examinar la calidad de los datos de cada transacción; por tanto, es posible que necesite usar herramientas de generación de perfiles de datos, y de limpieza y filtrado automático de datos, como las que se proporcionan en Integration ServicesIntegration Services, Microsoft SQL Server 2012 Master Data ServicesMicrosoft SQL Server 2012 Master Data Serviceso SQL Server Data Quality ServicesSQL Server Data Quality Services para explorar los datos y buscar incoherencias.For data mining typically you are working with a very large dataset and cannot examine every transaction for data quality; therefore, you might need to use some form of data profiling and automated data cleansing and filtering tools, such as those supplied in Integration ServicesIntegration Services, Microsoft SQL Server 2012 Master Data ServicesMicrosoft SQL Server 2012 Master Data Services, or SQL Server Data Quality ServicesSQL Server Data Quality Services to explore the data and find the inconsistencies. Para obtener más información, vea estos recursos:For more information, see these resources:

Explorar los datos Exploring Data

El tercer paso del proceso de minería de datos, como se resalta en el siguiente diagrama, consiste en explorar los datos preparados.The third step in the data mining process, as highlighted in the following diagram, is to explore the prepared data.

Tercer paso de minería de datos: explorar datosData mining third step: exploring data

Debe conocer los datos para tomar las decisiones adecuadas al crear los modelos de minería de datos.You must understand the data in order to make appropriate decisions when you create the mining models. Entre las técnicas de exploración se incluyen calcular los valores mínimos y máximos, calcular la media y las desviaciones estándar, y examinar la distribución de los datos.Exploration techniques include calculating the minimum and maximum values, calculating mean and standard deviations, and looking at the distribution of the data. Por ejemplo, al revisar el máximo, el mínimo y los valores de la media se podría determinar que los datos no son representativos de los clientes o procesos de negocio, y que por consiguiente debe obtener más datos equilibrados o revisar las suposiciones que son la base de sus expectativas.For example, you might determine by reviewing the maximum, minimum, and mean values that the data is not representative of your customers or business processes, and that you therefore must obtain more balanced data or review the assumptions that are the basis for your expectations. Las desviaciones estándar y otros valores de distribución pueden proporcionar información útil sobre la estabilidad y exactitud de los resultados.Standard deviations and other distribution values can provide useful information about the stability and accuracy of the results. Una desviación estándar grande puede indicar que agregar más datos podría ayudarle a mejorar el modelo.A large standard deviation can indicate that adding more data might help you improve the model. Los datos que se desvían mucho de una distribución estándar se podrían sesgar o podrían representar una imagen precisa de un problema de la vida real, pero dificultar el ajustar un modelo a los datos.Data that strongly deviates from a standard distribution might be skewed, or might represent an accurate picture of a real-life problem, but make it difficult to fit a model to the data.

Al explorar los datos para conocer el problema empresarial, puede decidir si el conjunto de datos contiene datos defectuosos y, a continuación, puede inventar una estrategia para corregir los problemas u obtener una descripción más profunda de los comportamientos que son típicos de su negocio.By exploring the data in light of your own understanding of the business problem, you can decide if the dataset contains flawed data, and then you can devise a strategy for fixing the problems or gain a deeper understanding of the behaviors that are typical of your business.

Puede usar herramientas como Master Data ServicesMaster Data Services para sondear los orígenes de datos disponibles y determinar su disponibilidad para la minería de datos.You can use tools such as Master Data ServicesMaster Data Services to canvass available sources of data and determine their availability for data mining. Puede usar herramientas como SQL Server Data Quality ServicesSQL Server Data Quality Services, o el generador de perfiles de datos de Integration Services, para analizar la distribución de los datos y solucionar problemas, como la existencia de datos incorrectos o la falta de datos.You can use tools such as SQL Server Data Quality ServicesSQL Server Data Quality Services, or the Data Profiler in Integration Services, to analyze the distribution of your data and repair issues such as wrong or missing data.

Cuando tenga definido los orígenes, combínelos en una vista del origen de datos con el Diseñador de vistas del origen de datos de SQL Server Data ToolsSQL Server Data Tools.After you have defined your sources, you combine them in a Data Source view by using the Data Source View Designer in SQL Server Data ToolsSQL Server Data Tools. Para obtener más información, vea Vistas del origen de datos en modelos multidimensionales.For more information, see Data Source Views in Multidimensional Models. Este diseñador también contiene algunas herramientas que podrá usar para explorar los datos y comprobar que funcionarán a la hora de crear un modelo.This designer also contains some several tools that you can use to explore the data and verify that it will work for creating a model. Para obtener más información, vea Explorar datos en una vista del origen de datos (Analysis Services).For more information, see Explore Data in a Data Source View (Analysis Services).

Tenga en cuenta que cuando se crea un modelo, Analysis ServicesAnalysis Services crea automáticamente resúmenes estadísticos de los datos contenidos en él, que puede consultar para su uso en informes o análisis.Note that when you create a model, Analysis ServicesAnalysis Services automatically creates statistical summaries of the data contained in the model, which you can query to use in reports or further analysis. Para obtener más información, vea Consultas de minería de datos.For more information, see Data Mining Queries.

Generar modelos Building Models

El cuarto paso del proceso de minería de datos, como se resalta en el siguiente diagrama, consiste en generar el modelo o modelos de minería de datos.The fourth step in the data mining process, as highlighted in the following diagram, is to build the mining model or models. Usará los conocimientos adquiridos en el paso Explorar los datos para definir y crear los modelos.You will use the knowledge that you gained in the Exploring Data step to help define and create the models.

Cuarto paso de minería de datos: creación de modelos de minería de datosData mining fourth step: building mining models

Deberá definir qué columnas de datos desea que se usen; para ello, creará una estructura de minería de datos.You define the columns of data that you want to use by creating a mining structure. La estructura de minería de datos se vincula al origen de datos, pero en realidad no contiene ningún dato hasta que se procesa.The mining structure is linked to the source of data, but does not actually contain any data until you process it. Al procesar la estructura de minería de datos, Analysis ServicesAnalysis Services genera agregados y otra información estadística que se puede usar para el análisis.When you process the mining structure, Analysis ServicesAnalysis Services generates aggregates and other statistical information that can be used for analysis. Cualquier modelo de minería de datos que esté basado en la estructura puede utilizar esta información.This information can be used by any mining model that is based on the structure. Para obtener más información sobre cómo se relacionan las estructuras de minería de datos con los modelos de minería de datos, vea Arquitectura lógica (Analysis Services - Minería de datos).For more information about how mining structures are related to mining models, see Logical Architecture (Analysis Services - Data Mining).

Antes de procesar la estructura y el modelo, un modelo de minería de datos simplemente es un contenedor que especifica las columnas que se usan para la entrada, el atributo que está prediciendo y parámetros que indican al algoritmo cómo procesar los datos.Before the structure and model is processed, a data mining model too is just a container that specifies the columns used for input, the attribute that you are predicting, and parameters that tell the algorithm how to process the data. El procesamiento de un modelo a menudo se denomina entrenamiento.Processing a model is often called training. El entrenamiento hace referencia al proceso de aplicar un algoritmo matemático concreto a los datos de la estructura para extraer patrones.Training refers to the process of applying a specific mathematical algorithm to the data in the structure in order to extract patterns. Los patrones que encuentre en el proceso de entrenamiento dependerán de la selección de los datos de entrenamiento, el algoritmo que elija y cómo se haya configurado el algoritmo.The patterns that you find in the training process depend on the selection of training data, the algorithm you chose, and how you have configured the algorithm. SQL Server 2017SQL Server 2017 contiene muchos algoritmos diferentes. Cada uno está preparado para un tipo diferente de tarea y crea un tipo distinto de modelo. contains many different algorithms, each suited to a different type of task, and each creating a different type of model. Para obtener una lista de los algoritmos proporcionados en SQL Server 2017SQL Server 2017, vea Algoritmos de minería de datos (Analysis Services: Minería de datos).For a list of the algorithms provided in SQL Server 2017SQL Server 2017, see Data Mining Algorithms (Analysis Services - Data Mining).

También puede utilizar los parámetros para ajustar cada algoritmo y puede aplicar filtros a los datos de entrenamiento para utilizar un subconjunto de los datos, creando resultados diferentes.You can also use parameters to adjust each algorithm, and you can apply filters to the training data to use just a subset of the data, creating different results. Después de pasar los datos a través del modelo, el objeto de modelo de minería de datos contiene los resúmenes y modelos que se pueden consultar o utilizar para la predicción.After you pass data through the model, the mining model object contains summaries and patterns that can be queried or used for prediction.

Puede definir un modelo nuevo mediante el Asistente para minería de datos de SQL Server Data ToolsSQL Server Data Tools o con el lenguaje DMX (Extensiones de minería de datos).You can define a new model by using the Data Mining Wizard in SQL Server Data ToolsSQL Server Data Tools, or by using the Data Mining Extensions (DMX) language. Para obtener más información sobre cómo usar el Asistente para minería de datos, vea Asistente para minería de datos (Analysis Services - Minería de datos).For more information about how to use the Data Mining Wizard, see Data Mining Wizard (Analysis Services - Data Mining). Para obtener más información sobre cómo usar DMX, vea Referencia de Extensiones de minería de datos (DMX).For more information about how to use DMX, see Data Mining Extensions (DMX) Reference.

Es importante recordar que siempre que los datos cambian, debe actualizar la estructura y el modelo de minería de datos.It is important to remember that whenever the data changes, you must update both the mining structure and the mining model. Al actualizar una estructura de minería de datos volviéndola a procesar, Analysis ServicesAnalysis Services recupera los datos del origen, incluido cualquier dato nuevo si el origen se actualiza dinámicamente, y vuelve a rellenar la estructura de minería de datos.When you update a mining structure by reprocessing it, Analysis ServicesAnalysis Services retrieves data from the source, including any new data if the source is dynamically updated, and repopulates the mining structure. Si tiene modelos que están basados en la estructura, puede elegir actualizar estos, lo que significa que se vuelven a entrenar con los nuevos datos, o puede dejar los modelos tal cual.If you have models that are based on the structure, you can choose to update the models that are based on the structure, which means they are retrained on the new data, or you can leave the models as is. Para más información, vea Requisitos y consideraciones de procesamiento (minería de datos).For more information, see Processing Requirements and Considerations (Data Mining).

Explorar y validar los modelos Exploring and Validating Models

El quinto paso del proceso de minería de datos, como se resalta en el siguiente diagrama, consiste en explorar los modelos de minería de datos que ha generado y comprobar su eficacia.The fifth step in the data mining process, as highlighted in the following diagram, is to explore the mining models that you have built and test their effectiveness.

Quinto paso de minería de datos: validar los modelos de minería de datosData mining fifth step: validating mining models

Antes de implementar un modelo en un entorno de producción, es aconsejable probar si funciona correctamente.Before you deploy a model into a production environment, you will want to test how well the model performs. Además, al generar un modelo, normalmente se crean varios con configuraciones diferentes y se prueban todos para ver cuál ofrece los resultados mejores para su problema y sus datos.Also, when you build a model, you typically create multiple models with different configurations and test all models to see which yields the best results for your problem and your data.

Analysis ServicesAnalysis Services proporciona herramientas que ayudan a separar los datos en conjuntos de datos de entrenamiento y pruebas, para que pueda evaluar con precisión el rendimiento de todos los modelos en los mismos datos. provides tools that help you separate your data into training and testing datasets so that you can accurately assess the performance of all models on the same data. El conjunto de datos de entrenamiento se utiliza para generar el modelo y el conjunto de datos de prueba para comprobar la precisión del modelo mediante la creación de consultas de predicción.You use the training dataset to build the model, and the testing dataset to test the accuracy of the model by creating prediction queries. Estas particiones pueden hacer automáticamente mientras se genera el modelo de minería de datos.This partitioning can be done automatically while building the mining model. Para obtener más información, vea Prueba y validación (minería de datos).For more information, see Testing and Validation (Data Mining).

Puede explorar las tendencias y patrones que los algoritmos detectan mediante los visores del diseñador de minería de datos de SQL Server Data ToolsSQL Server Data Tools.You can explore the trends and patterns that the algorithms discover by using the viewers in Data Mining Designer in SQL Server Data ToolsSQL Server Data Tools. Para obtener más información, vea Visores de modelos de minería de datos.For more information, see Data Mining Model Viewers. También puede comprobar si los modelos crean predicciones correctamente mediante herramientas del diseñador como el gráfico de mejora respecto al modelo predictivo y la matriz de clasificación.You can also test how well the models create predictions by using tools in the designer such as the lift chart and classification matrix. Para comprobar si el modelo es específico de sus datos o se puede usar para realizar inferencias en la población general, puede usar la técnica estadística denominada validación cruzada para crear automáticamente subconjuntos de los datos y probar el modelo con cada uno.To verify whether the model is specific to your data, or may be used to make inferences on the general population, you can use the statistical technique called cross-validation to automatically create subsets of the data and test the model against each subset. Para obtener más información, vea Prueba y validación (minería de datos).For more information, see Testing and Validation (Data Mining).

Si ninguno de los modelos que ha creado en el paso Generar modelos funciona correctamente, puede que deba volver a un paso anterior del proceso y volver a definir el problema o volver a investigar los datos del conjunto de datos original.If none of the models that you created in the Building Models step perform well, you might have to return to a previous step in the process and redefine the problem or reinvestigate the data in the original dataset.

Implementar y actualizar los modelos Deploying and Updating Models

El último paso del proceso de minería de datos, como se resalta en el siguiente diagrama, consiste en implementar los modelos que funcionan mejor en un entorno de producción.The last step in the data mining process, as highlighted in the following diagram, is to deploy the models that performed the best to a production environment.

Sexto paso de minería de datos: implementación de modelos de minería de datosData mining sixth step: deploying mining models

Una vez que los modelos de minería de datos se encuentran en el entorno de producción, puede llevar acabo diferentes tareas, dependiendo de sus necesidades.After the mining models exist in a production environment, you can perform many tasks, depending on your needs. Las siguientes son algunas de las tareas que puede realizar:The following are some of the tasks you can perform:

  • Use los modelos para crear predicciones que luego podrá usar para tomar decisiones comerciales.Use the models to create predictions, which you can then use to make business decisions. SQL ServerSQL Server pone a su disposición el lenguaje DMX, que podrá usar para crear consultas de predicción, y el Generador de consultas de predicción, que le ayudará a generar las consultas. provides the DMX language that you can use to create prediction queries, and Prediction Query Builder to help you build the queries. Para más información, vea Referencia de Extensiones de minería de datos (DMX).For more information, see Data Mining Extensions (DMX) Reference.

  • Crear consultas de contenido para recuperar estadísticas, reglas o fórmulas del modelo.Create content queries to retrieve statistics, rules, or formulas from the model. Para obtener más información, vea Consultas de minería de datos.For more information, see Data Mining Queries.

  • Incrustar la funcionalidad de minería de datos directamente en una aplicación.Embed data mining functionality directly into an application. Puede incluir Objetos de administración de análisis (AMO), que contiene un conjunto de objetos que la aplicación pueda utilizar para crear, cambiar, procesar y eliminar estructuras y modelos de minería de datos.You can include Analysis Management Objects (AMO), which contains a set of objects that your application can use to create, alter, process, and delete mining structures and mining models. También puede enviar mensajes XML for Analysis (XMLA) directamente a una instancia de Analysis ServicesAnalysis Services.Alternatively, you can send XML for Analysis (XMLA) messages directly to an instance of Analysis ServicesAnalysis Services. Para obtener más información, vea Desarrollo (Analysis Services - Minería de datos).For more information, see Development (Analysis Services - Data Mining).

  • Utilizar Integration ServicesIntegration Services para crear un paquete en el que se utilice un modelo de minería de datos para dividir de forma inteligente los datos entrantes en varias tablas.Use Integration ServicesIntegration Services to create a package in which a mining model is used to intelligently separate incoming data into multiple tables. Por ejemplo, si una base de datos se actualiza continuamente con clientes potenciales, puede utilizar un modelo de minería de datos junto con Integration ServicesIntegration Services para dividir los datos entrantes en clientes que probablemente compren un producto y clientes que probablemente no compren un producto.For example, if a database is continually updated with potential customers, you could use a mining model together with Integration ServicesIntegration Services to split the incoming data into customers who are likely to purchase a product and customers who are likely to not purchase a product. Para más información, consulte Usos típicos de Integration Services.For more information, see Typical Uses of Integration Services.

  • Crear un informe que permita a los usuarios realizar consultas directamente en un modelo de minería de datos existente.Create a report that lets users directly query against an existing mining model. Para obtener más información, vea Reporting Services en SQL Server Data Tools (SSDT).For more information, see Reporting Services in SQL Server Data Tools (SSDT).

  • Actualizar los modelos después de la revisión y análisis.Update the models after review and analysis. Cualquier actualización requiere que vuelve a procesar los modelos.Any update requires that you reprocess the models. Para más información, consulte Processing Data Mining Objects.For more information, see Processing Data Mining Objects.

  • Actualizar dinámicamente los modelos, cuando entren más datos en la organización, y realizar modificaciones constantes para mejorar la efectividad de la solución debería ser parte de la estrategia de implementación.Update the models dynamically, as more data comes into the organization, and making constant changes to improve the effectiveness of the solution should be part of the deployment strategy. Para obtener más información, vea Administración de las soluciones y los objetos de minería de datos.For more information, see Management of Data Mining Solutions and Objects

Vea tambiénSee Also

Soluciones de minería de datos Data Mining Solutions
Herramientas de minería de datosData Mining Tools