Projets d'exploration de donnéesData Mining Projects

S’APPLIQUE À :ouiSQL Server Analysis ServicesnonAzure Analysis ServicesAPPLIES TO:yesSQL Server Analysis ServicesnoAzure Analysis ServicesUn projet d’exploration de données fait partie d’un Analysis ServicesAnalysis Services solution. A data mining project is part of an Analysis ServicesAnalysis Services solution. Pendant le processus de conception, les objets que vous créez dans ce projet sont disponibles à des fins de test et d'interrogation dans le cadre d'une base de données d'espace de travail.During the design process, the objects that you create in this project are available for testing and querying as part of a workspace database. Lorsque vous souhaitez que les utilisateurs puissent interroger ou parcourir les objets dans le projet, vous devez déployer le projet sur une instance d' Analysis ServicesAnalysis Services s'exécutant en mode multidimensionnel.When you want users to be able to query or browse the objects in the project, you must deploy the project to an instance of Analysis ServicesAnalysis Services running in multidimensional mode.

Cette rubrique fournit les informations de base nécessaires à la compréhension et à la création des projets d'exploration de données.This topic provides you with the basic information needed to understand and create data mining projects.

Création de projets d'exploration de donnéesCreating Data Mining Projects

Objets dans les projets d'exploration de donnéesObjects in Data Mining Projects

Création de projets d'exploration de donnéesCreating Data Mining Projects

Dans Outils de données SQL Server (SSDT)SQL Server Data Tools (SSDT), vous créez des projets d'exploration de données à l'aide du modèle, Projet OLAP et expl. de données.In Outils de données SQL Server (SSDT)SQL Server Data Tools (SSDT), you build data mining projects using the template, OLAP and Data Mining Project. Vous pouvez également créer des projets d'exploration de données par programmation en utilisant AMO.You can also create data mining projects programmatically, by using AMO. Les différents objets d'exploration de données peuvent faire l'objet d'un script à l'aide du langage ASSL (Analysis Services Scripting Language).Individual data mining objects can be scripted using the Analysis Services Scripting language (ASSL). Pour plus d’informations, consultez Accès aux données de modèles multidimensionnels (Analysis Services - Données multidimensionnelles ).For more information, see Multidimensional Model Data Access (Analysis Services - Multidimensional Data).

Si vous créez un projet d'exploration de données dans une solution existante, par défaut les objets d'exploration de données seront déployés vers une base de données Analysis ServicesAnalysis Services avec le même nom que le fichier solution.If you create a data mining project within an existing solution, by default the data mining objects will be deployed to an Analysis ServicesAnalysis Services database with the same name as the solution file. Vous pouvez modifier ce nom et le serveur cible à l'aide de la boîte de dialogue Propriétés du projet .You can change this name and the target server by using the Project Properties dialog box. Pour plus d’informations, consultez Configurer les propriétés d’un projet Analysis Services (SSDT).For more information, see Configure Analysis Services Project Properties (SSDT).

Avertissement

Pour correctement générer et déployer votre projet, vous devez avoir accès à une instance d' Analysis ServicesAnalysis Services s'exécutant en mode d'exploration de données OLAP/Data.To successfully build and deploy your project, you must have access to an instance of Analysis ServicesAnalysis Services that is running in OLAP/Data Mining mode. Vous ne pouvez pas développer ou déployer des solutions d’exploration de données sur une instance d’ Analysis ServicesAnalysis Services qui prend en charge les modèles tabulaires. Vous ne pouvez pas non plus utiliser directement les données d’un classeur Power PivotPower Pivot ou d’un modèle tabulaire qui utilise la banque de données en mémoire.You cannot develop or deploy data mining solutions on an instance of Analysis ServicesAnalysis Services that supports tabular models, nor can you use data directly from a Power PivotPower Pivot workbook or from a tabular model that uses the in-memory data store. Pour déterminer si l’instance de Analysis ServicesAnalysis Services que vous avez peut prendre en charge l’exploration de données, consultez Déterminer le mode serveur d’une instance Analysis Services.To determine whether the instance of Analysis ServicesAnalysis Services that you have can support data mining, see Determine the Server Mode of an Analysis Services Instance.

Dans chaque projet d'exploration de données que vous créez, suivez ces étapes :Within each data mining project that you create, you will follow these steps:

  1. Choisissez une source de données, telle qu'un cube, une base de données, ou des fichiers Excel ou texte, qui contient les données brutes que vous utiliserez pour générer des modèles.Choose a data source, such as a cube, database, or even Excel or text files, which contains the raw data you will use for building models.

  2. Définissez un sous-ensemble des données dans la source de données à utiliser pour l'analyse, puis enregistrez-le comme vue de source de données.Define a subset of the data in the data source to use for analysis, and save it as a data source view.

  3. Définissez une structure d'exploration de données pour prendre en charge la modélisation.Define a mining structure to support modeling.

  4. Ajoutez des modèles d'exploration de données à la structure d'exploration de données, en choisissant un algorithme et en spécifiant la façon dont l'algorithme traite les données.Add mining models to the mining structure, by choosing an algorithm and specifying how the algorithm will handle the data.

  5. Effectuez l'apprentissage des modèles en les remplissant avec les données sélectionnées ou un sous-ensemble filtré des données.Train models by populating them with the selected data, or a filtered subset of the data.

  6. Explorez, testez et régénérez les modèles.Explore, test, and rebuild models.

    Lorsque le projet terminé, vous pouvez le déployer pour que les utilisateurs puissent le parcourir ou l'interroger, ou autoriser l'accès par programmation aux modèles d'exploration de données dans une application, afin de prendre en charge des prédictions et l'analyse.When the project is complete, you can deploy it for users to browse or query, or provide programmatic access to the mining models in an application, to support predictions and analysis.

Objets dans les projets d'exploration de donnéesObjects in Data Mining Projects

Tous les projets d'exploration de données contiennent les quatre types d'objets suivants.All data mining projects contain the following four types of objects. Vous pouvez avoir plusieurs objets de tous les types.You can have multiple objects of all types.

  • Sources de donnéesData sources

  • Vues de source de donnéesData source views

  • Structures d'exploration de donnéesMining structures

  • Modèles d'exploration de donnéesMining models

    Par exemple, un projet d'exploration de données unique peut contenir une référence à plusieurs sources de données et chacune de ces sources de données prend en charge plusieurs vues de source de données.For example, a single data mining project can contain a reference to multiple data sources, with each data source supporting multiple data source views. Ensuite, chaque vue de source de données peut prendre en charge plusieurs structures d'exploration de données, chacune avec de nombreux modèles d'exploration de données associés.In turn, each data source view can support multiple mining structures, each with many related mining models.

    En outre, votre projet peut inclure des algorithmes de plug-in, des assemblys personnalisés ou des procédures stockées personnalisées ; toutefois, ces objets ne sont pas décrits ici.Additionally, your project might include plug-in algorithms, custom assemblies, or custom stored procedures; however, these objects are not described here. Pour plus d’informations, consultez Guide du développeur (Analysis Services).For more information, see Analysis Services Developer Documentation.

Data SourcesData Sources

La source de données définit la chaîne de connexion et les informations d'authentification que le serveur Analysis ServicesAnalysis Services utilisera pour se connecter à la source de données.The data source defines the connection string and authentication information that the Analysis ServicesAnalysis Services server will use to connect to the data source. La source de données peut contenir plusieurs tables ou vues ; elle peut être aussi simple qu'un classeur Excel ou fichier texte unique, ou aussi complexe qu'une base de données de traitement analytique en ligne (OLAP) ou qu'une vaste base de données relationnelle.The data source can contain multiple tables or views; it can be as simple as a single Excel workbook or text file, or as complex as an Online Analytical Processing (OLAP) database or large relational database.

Un projet d'exploration de données unique peut référencer plusieurs sources de données.A single data mining project can reference multiple data sources. Bien qu'un modèle d'exploration de données puisse utiliser une seule source de données à la fois, le projet peut avoir plusieurs dessin de modèles sur différentes sources de données.Even though a mining model can use only one data source at a time, the project could have multiple models drawing on different data sources.

Analysis ServicesAnalysis Services prend en charge des données de nombreux fournisseurs externes et l'exploration de données SQL Server peut utiliser des données relationnelles et des données du cube comme source de données. supports data from many external providers, and SQL Server Data Mining can use both relational and cube data as a data source. Toutefois, si vous développez les deux types de projet (modèles basés sur des sources relationnelles et modèles basés sur des cubes OLAP) vous pouvez développer et gérer ces derniers dans des projets distincts.However, if you develop both types of projects—models based on relational sources and models based on OLAP cubes—you might wish to develop and manage these in separate projects.

  • En général, les modèles basés sur un cube OLAP doivent être développés dans la solution de conception OLAP.Typically models that are based on an OLAP cube should be developed within the OLAP design solution. En effet, les modèles basés sur un cube doivent traiter le cube pour mettre à jour les données.One reason is that models based on a cube must process the cube to update data. En règle générale, vous devez utiliser des données de cube uniquement lorsqu'il s'agit du moyen principal de stockage et d'accès aux données, ou lorsque vous avez besoin des agrégations, des dimensions et des attributs créés par le projet multidimensionnel.Generally, you should use cube data only when that is the principal means of data storage and access, or when you require the aggregations, dimensions, and attributes created by the multidimensional project.

  • Si votre projet utilise des données relationnelles uniquement, vous devez créer des modèles relationnels dans un projet distinct, afin de ne pas retraiter d'autres objets inutilement.If your project uses relational data only, you should create the relational models within a separate project, so that you do not unnecessarily reprocess other objects. Dans de nombreux cas, la base de données de la zone de transit ou l'entrepôt de données utilisé pour prendre en charge la création de cube contient déjà les vues nécessaires pour exécuter l'exploration de données, et vous pouvez utiliser ces vues pour l'exploration de données à la place des agrégations et des dimensions du cube.In many cases, the staging database or the data warehouse used to support cube creation already contains the views that are needed to perform data mining, and you can use those views for data mining rather than use the aggregations and dimensions in the cube.

  • Vous ne pouvez pas utiliser directement les données en mémoire ou Power PivotPower Pivot pour générer des modèles d’exploration de données.You cannot use in-memory or Power PivotPower Pivot data directly to build data mining models.

    La source de données identifie uniquement le serveur ou le fournisseur et le type de données général.The data source only identifies the server or provider and the general type of data. Si vous devez modifier la mise en forme des données et les agrégations, utilisez l'objet de vue de source de données.If you need to change data formatting and aggregations, use the data source view object.

    Pour contrôler la façon dont les données de la source de données sont traitées, vous pouvez ajouter des colonnes dérivées ou un calcul, modifier des agrégats ou renommer des colonnes de données dans la vue de source de données.To control the way that data from the data source is handled, you can add derived columns or calculation, modify aggregates, or rename columns in the data in the data source view. (Vous pouvez également utiliser des données en aval, en modifiant les colonnes de la structure d'exploration de données, ou en utilisant des indicateurs et des filtres de modélisation au niveau de la colonne du modèle d'exploration de données.)(You can also work with data downstream, by modifying mining structure columns, or by using modeling flags and filters at the level of the mining model column.)

    Si le nettoyage de données est requis ou que les données de l'entrepôt de données doivent être modifiées pour créer des variables supplémentaires, modifier des types de données ou créer une autre agrégation, vous devrez peut-être créer des types de projet supplémentaires pour l'exploration de données.If data cleansing is required, or the data in the data warehouse must be modified to create additional variables, change data types, or create alternate aggregation, you might need to create additional project types in support of data mining. Pour plus d’informations sur ces projets connexes, consultez Projets connexes pour des solutions d’exploration de données.For more information about these related projects, see Related Projects for Data Mining Solutions.

Data Source ViewsData Source Views

Après avoir défini cette connexion vers une source de données, vous pouvez créer une vue qui identifie les données spécifiques se rapportant à votre modèle.After you have defined this connection to a data source, you create a view that identifies the specific data that is relevant to your model.

La vue de source de données permet également de personnaliser la manière dont les données de la source sont fournies au modèle d'exploration de données.The data source view also enables you to customize the way that the data in the data source is supplied to the mining model. Vous pouvez modifier la structure des données pour la rendre plus pertinente par rapport à votre projet ou ne choisir que certains types de données.You can modify the structure of the data to make it more relevant to your project, or choose only certain kinds of data.

Par exemple, à l'aide de l'éditeur de vue de source de données, vous pouvez :For example, by using the Data Source View editor, you can:

  • Créez des colonnes dérivées, telles que des parties de date, des sous-chaînes, etc.Create derived columns, such as dateparts, substrings, etc.

  • Valeurs d'agrégation utilisant des instructions Transact-SQLTransact-SQL telles que GROUP BYAggregate values using Transact-SQLTransact-SQL statements such as GROUP BY

  • Limitez les données temporairement ou échantillonnez les donnéesRestrict data temporarily, or sample data

    Pour plus d’informations sur la façon dont vous pouvez modifier des données dans une vue de source de données, consultez Vues de sources de données dans les modèles multidimensionnels.For more information about how you can modify data within a data source view, see Data Source Views in Multidimensional Models.

Avertissement

Si vous souhaitez filtrer les données, vous pouvez effectuer cette opération dans la vue de source de données, mais vous pouvez également créer des filtres sur les données au niveau du modèle d'exploration de données.If you want to filter the data, you can do so in the data source view, but you can also create filters on the data at the level of the mining model. La définition de filtre étant stockée avec le modèle d'exploration de données, l'utilisation de filtres de modèle simplifie la détermination des données utilisées pour l'apprentissage du modèle.Because the filter definition is stored with the mining model, using model filters makes it easier to determine the data that was used for training the model. De plus, vous pouvez créer plusieurs modèles associés, avec différents critères de filtre.Moreover, you can create multiple related models, with different filter criteria. Pour plus d’informations, consultez Filtres pour les modèles d’exploration de données (Analysis Services - Exploration de données).For more information, see Filters for Mining Models (Analysis Services - Data Mining).

Notez que la vue de source de données créée peut contenir des informations supplémentaires qui ne sont pas directement utilisées pour l'analyse.Note that the data source view that you create can contain additional data that is not directly used for analysis. Par exemple, vous pouvez ajouter à votre vue de source de données des données utilisées pour le test, les prédictions ou l'extraction.For example, you might add to your data source view data that is used for testing, predictions, or for drillthrough. Pour plus d’informations sur ces utilisations, consultez Test et validation (Exploration des données) et Extraction.For more information about these uses, see Testing and Validation (Data Mining) and Drillthrough.

Mining StructuresMining Structures

Une fois que vous avez créé votre source de données et votre vue de source de données, vous devez sélectionner les colonnes de données les plus pertinentes pour votre problème professionnel, en définissant des structures d'exploration de données dans le projet.Once you have created your data source and data source view, you must select the columns of data that are most relevant to your business problem, by defining mining structures within the project. Une structure d'exploration de données indique au projet les colonnes de données de la vue de source de données qui doivent être utilisées réellement dans la modélisation, l'apprentissage, et le test.A mining structure tells the project which columns of data from the data source view should actually be used in modeling, training, and testing.

Pour ajouter une nouvelle structure d'exploration de données, démarrez l'Assistant Exploration de données.To add a new mining structure, you start the Data Mining Wizard. L'Assistant définit automatiquement une structure d’exploration de données, vous guide tout au long de la procédure de sélection des données et, de manière facultative, vous permet d'ajouter un modèle d’exploration de données initial à la structure.The wizard automatically defines a mining structure, walks you through the process of choosing the data, and optionally lets you add an initial mining model to the structure. Dans la structure d'exploration de données, choisissez les tables et les colonnes de la vue de source de données ou d'un cube OLAP et définissez des relations entre les tables, si vos données contiennent des tables imbriquées.Within the mining structure, you choose tables and columns from the data source view or from an OLAP cube, and define relationships among tables, if your data includes nested tables.

Votre choix de données aura un aspect très différent dans l'Assistant Exploration de données, selon que vous utilisez des sources de données relationnelles ou de traitement analytique en ligne (OLAP).Your choice of data will look very different in the Data Mining Wizard, depending on whether you use relational or online analytical processing (OLAP) data sources.

  • Lorsque vous choisissez les données d'une source de données relationnelle, la configuration d'une structure d'exploration de données est simple : choisissez des colonnes de données dans la vue de source de données et définissez des personnalisations supplémentaires telles que des alias, ou définissez la façon dont les valeurs de la colonne doivent être groupées ou placées dans un conteneur.When you choose data from a relational data source, setting up a mining structure is easy: you choose columns from the data in the data source view, and set additional customizations such as aliases, or define how values in the column should be grouped or binned. Pour plus d’informations, consultez Créer une structure d’exploration de données relationnelle.For more information, see Create a Relational Mining Structure.

  • Lorsque vous utilisez des données d'un cube OLAP, la structure d'exploration de données doit être dans la même base de données que la solution OLAP.When you use data from an OLAP cube, the mining structure must be in the same database as the OLAP solution. Pour créer une structure d'exploration de données, sélectionnez les attributs des dimensions et les mesures associées dans votre solution OLAP.To create a mining structure, you select attributes from the dimensions and related measures in your OLAP solution. Les valeurs numériques sont généralement détectées dans les mesures et les variables catégorielles dans les dimensions.Numeric values are typically found in measures, and categorical variables in dimensions. Pour plus d’informations, consultez Créer une structure d’exploration de données OLAP.For more information, see Create an OLAP Mining Structure.

  • Vous pouvez également définir des structures d'exploration de données en utilisant DMX.You can also define mining structures by using DMX. Pour plus d’informations, consultez Instructions de définition de données DMX (Data Mining Extensions).For more information, see Data Mining Extensions (DMX) Data Definition Statements.

    Après avoir créé la structure d'exploration de données initiale, vous pouvez copier, modifier et affecter un alias aux colonnes de la structure.After you have created the initial mining structure, you can copy, modify, and alias the structure columns.

    Chaque structure d'exploration de données peut contenir plusieurs modèles d'exploration de données.Each mining structure can contain multiple mining models. Par conséquent, une fois que vous avez terminé, vous pouvez rouvrir la structure d'exploration de données, puis utilisez Data Mining Designer pour ajouter des modèles d'exploration de données à la structure.Therefore, after you are done, you can open the mining structure again, and use Data Mining Designer to add more mining models to the structure.

    Vous avez également la possibilité de séparer vos données en jeu de données d'apprentissage, utilisé pour générer des modèles, et en jeu de données d'exclusion à des fins de test ou de validation de vos modèles d'exploration de données.You also have the option to separate your data into a training data set, used for building models, and a holdout data set to use in testing or validating your mining models.

Avertissement

Certains types de modèle, tels que les modèles de série chronologique, ne prennent pas en charge la création de jeux de données d'exclusion car ils nécessitent une série continue de données pour l'apprentissage.Some model types, such as time series models, do not support the creation of holdout data sets because they require a continuous series of data for training. Pour plus d'informations, voir Training and Testing Data Sets.For more information, see Training and Testing Data Sets.

Mining ModelsMining Models

Le modèle d’exploration de données définit l’algorithme ou la méthode d’analyse que vous utiliserez sur les données.The mining model defines the algorithm, or the method of analysis that you will use on the data. Vous pouvez ajouter un ou plusieurs modèles d'exploration de données dans chaque structure.To each mining structure, you add one or more mining models.

Selon vos besoins, vous pouvez combiner plusieurs modèles dans un projet unique ou créer des projets distincts pour chaque type de modèle ou de tâche analytique.Depending on your needs, you can combine many models in a single project, or create separate projects for each type of model or analytical task.

Après avoir créé une structure et un modèle, vous traitez chaque modèle en exécutant les données de la vue de source de données au moyen de l'algorithme, qui génère un modèle mathématique des données.After you have created a structure and model, you process each model by running the data from the data source view through the algorithm, which generates a mathematical model of the data. Ce processus porte le nom d’ apprentissage du modèle.This process is also known as training the model. Pour plus d’informations, consultez Exigences et considérations concernant le traitement (exploration de données).For more information, see Processing Requirements and Considerations (Data Mining).

Une fois le modèle traité, vous pouvez explorer visuellement le modèle d’exploration de données et créer des requêtes de prédiction s'y rapportant.After the model has been processed, you can then visually explore the mining model and create prediction queries against it. Si les données du processus d'apprentissage ont été mises en cache, vous pouvez utiliser des requêtes d’ extraction qui renvoient des informations détaillées sur les cas utilisés dans le modèle.If the data from the training process has been cached, you can use drillthrough queries to return detailed information about the cases used in the model.

Lorsque vous souhaitez utiliser un modèle pour la production (par exemple, pour effectuer des prédictions ou pour l'exploration par des utilisateurs généraux) vous pouvez déployer le modèle sur un autre serveur.When you want to use a model for production (for example, for use in making predictions, or for exploration by general users) you can deploy the model to a different server. Si vous devez retraiter le modèle à l'avenir, vous devez également exporter la définition de la structure d'exploration de données sous-jacente (et, nécessairement, la définition de la source de données et de la vue de source de données) en même temps.If you need to reprocess the model in future, you must also export the definition of the underlying mining structure (and, necessarily, the definition of the data source and data source view) at the same time.

Lorsque vous déployez un modèle, vous devez également garantir que les options de traitement appropriées sont définies sur la structure et le modèle, et que les utilisateurs potentiels disposent des autorisations nécessaires pour exécuter des requêtes, afficher des modèles, ou extraire dans les données de la structure ou du modèle.When you deploy a model, you must also ensure that the correct processing options are set on the structure and model, and that potential users have the permissions they need to perform queries, view models, or drillthrough to structure o model data. Pour plus d’informations, consultez Vue d’ensemble de la sécurité (exploration de données).For more information, see Security Overview (Data Mining).

Utilisation du projet d'exploration de données terminéUsing the Completed Data Mining Project

Cette section résume les façons dont vous pouvez utiliser le projet terminé d'exploration de données.This section summarizes the ways that you can use the completed data mining project. Vous pouvez créer des graphiques d'analyse de précision, explorer et valider les données et rendre les modèles d'exploration de données disponibles aux utilisateurs.You can create accuracy charts, explore and validate the data, and make the data mining patterns available to users.

Avertissement

Les graphiques, les requêtes et les visualisations que vous utilisez avec des modèles d'exploration de données ne sont pas enregistrés dans le cadre du projet d'exploration de données et ne peuvent pas être déployés.The charts, queries, and visualizations that you use with data mining models are not saved as part of the data mining project, and cannot be deployed. Si vous devez rendre ces objets persistants, vous devez enregistrer le contenu qui est présenté ou créer un script à partir de ce contenu comme indiqué pour chaque objet.If you need to persist these objects, you must either save the content that is presented or script it as described for each object.

View and Explore ModelsView and Explore Models

Après avoir créé un modèle, vous pouvez utiliser des outils visuels et des requêtes pour explorer les schémas du modèle et pour en savoir plus sur les schémas et les statistiques sous-jacents.After you have created a model, you can use visual tools and queries to explore the patterns in the model and learn more about the underlying patterns and statistics. Dans l’onglet Visionneuse de modèle d'exploration de données du Concepteur d'exploration de données, Analysis ServicesAnalysis Services fournit des visionneuses pour chaque type de modèle d’exploration de données que vous pouvez utiliser pour explorer les modèles.On the Mining Model Viewer tab in Data Mining Designer, Analysis ServicesAnalysis Services provides viewers for each mining model type, which you can use to explore the mining models.

Ces visualisations sont temporaires et sont fermées sans enregistrement lorsque vous fermez la session avec Analysis ServicesAnalysis Services.These visualizations are temporary, and are closed without saving when you exit the session with Analysis ServicesAnalysis Services. Par conséquent, si vous devez exporter les visualisations vers une autre application pour les présenter ou les analyser plus en détails, utilisez la commande Copier à disposition dans chaque onglet ou volet de l'interface de la visionneuse.Therefore, if you need to export these visualizations to another application for presentation or further analysis, use the Copy commands provided in each tab or pane of the viewer interface.

Les Compléments d'exploration de données pour Excel fournissent également un modèle Visio que vous pouvez utiliser pour représenter vos modèles dans un diagramme Visio et pour annoter et modifier le diagramme à l'aide des outils Visio.The Data Mining Add-ins for Excel also provides a Visio template that you can use to represent your models in a Visio diagram and annotate and modify the diagram using Visio tools. Pour plus d’informations, consultez Compléments d’exploration de données Microsoft SQL Server 2008 SP2 pour Microsoft Office 2007.For more information, see Microsoft SQL Server 2008 SP2 Data Mining Add-ins for Microsoft Office 2007.

Test and Validate ModelsTest and Validate Models

Une fois un modèle créé, vous pouvez étudier les résultats et déterminer quels sont les modèles les plus efficaces.After you have created a model, you can investigate the results and make decisions about which models perform the best.

Analysis ServicesAnalysis Services fournit plusieurs graphiques que vous pouvez utiliser pour fournir des outils que vous pouvez utiliser pour comparer directement les modèles d’exploration de données et choisir le modèle le plus précis ou le plus utile. provides several charts that you can use to provides tools that you can use to directly compare mining models and choose the most accurate or useful mining model. Ces outils incluent un graphique de courbes d'élévation, un graphique des bénéfices et une matrice de classification.These tools include a lift chart, profit chart, and a classification matrix. Vous pouvez générer ces graphiques en utilisant l’onglet Graphique d'analyse de précision de l'exploration de données du Concepteur d'exploration de données.You can generate these charts by using the Mining Accuracy Chart tab of Data Mining Designer.

Vous pouvez également utiliser le rapport de validation croisée pour effectuer un sous-échantillonnage itératif de vos données afin de déterminer si le modèle est influencé par un jeu de données particulier.You can also use the cross-validation report to perform iterative subsampling of your data to determine whether the model is biased to a particular set of data. Les statistiques de ce rapport peuvent être utilisées pour comparer des modèles objectivement et évaluer la qualité de vos données d'apprentissage.The statistics that the report provides can be used to objectively compare models and assess the quality of your training data.

Notez que ces rapports et graphiques ne sont pas stockés avec le projet ou dans la base de données ssASnoversion, par conséquent si vous devez conserver ou dupliquer les résultats, vous devez les enregistrer ou créer un script à partir des objets en utilisant DMX ou AMO.Note that these reports and charts are not stored with the project or in the ssASnoversion database, so if you need to preserve or duplicate the results, you should either save the results, or script the objects by using DMX or AMO. Vous pouvez également utiliser des procédures stockées pour la validation croisée.You can also use stored procedures for cross-validation.

Pour plus d’informations, consultez Test et validation (Exploration des données).For more information, see Testing and Validation (Data Mining).

Create PredictionsCreate Predictions

Analysis ServicesAnalysis Services fournit un langage de requête appelé DMX (data mining extensions) qui est à la base de la création des prédictions et qui est facilement scriptable. provides a query language called Data Mining Extensions (DMX) that is the basis for creating predictions and is easily scriptable. Pour vous permettre de générer des requêtes de prédiction DMX, SQL ServerSQL Server fournit un générateur de requêtes, disponible dans SQL Server Management StudioSQL Server Management Studio.To help you build DMX prediction queries, SQL ServerSQL Server provides a query builder, available in SQL Server Management StudioSQL Server Management Studio. Il existe également de nombreux modèles DMX pour l'éditeur de requête dans SQL Server Management StudioSQL Server Management Studio. Si vous n'êtes pas familiarisé avec les requêtes de prédiction, nous vous recommandons d'utiliser le générateur de requêtes fourni dans le Concepteur d'exploration de données et dans SQL Server Management StudioSQL Server Management Studio.There are also many DMX templates for the query editor in SQL Server Management StudioSQL Server Management Studio.If you are new to prediction queries, we recommend that you use the query builder that is provided in both Data Mining Designer and SQL Server Management StudioSQL Server Management Studio. Pour plus d'informations, voir Data Mining Tools.For more information, see Data Mining Tools.

Les prédictions que vous créez dans Outils de données SQL Server (SSDT)SQL Server Data Tools (SSDT) ou SQL Server Management StudioSQL Server Management Studio ne sont pas conservées, par conséquent si vos requêtes sont complexes ou si vous devez reproduire les résultats, nous vous recommandons d'enregistrer vos requêtes de prédiction dans des fichiers de requête DMX, les inclure dans des scripts ou les incorporer dans le cadre d'un package Integration Services.The predictions that you create in either Outils de données SQL Server (SSDT)SQL Server Data Tools (SSDT) or SQL Server Management StudioSQL Server Management Studio are not persisted, so if your queries are complex, or you need to reproduce the results, we recommend that you save your prediction queries to DMX query files, script them, or embed the queries as part of an Integration Services package.

Accès par programmation aux objets d'exploration de donnéesProgrammatic Access to Data Mining Objects

Analysis ServicesAnalysis Services fournit plusieurs outils que vous pouvez utiliser pour utiliser par programmation des projets d'exploration de données et les objets qu'ils contiennent. provides several tools that you can use to programmatically work with data mining projects and the objects in them. Le langage DMX fournit des déclarations que vous pouvez utiliser pour créer des sources de données et des vues de source de données, et pour créer, effectuer l'apprentissage et utiliser des structures et des modèles d'exploration de données.The DMX language provides statements that you can use to create data sources and data source views, and to create, train, and use data mining structure and models. Pour plus d’informations, consultez Guide de référence du langage DMX (Data Mining Extensions).For more information, see Data Mining Extensions (DMX) Reference.

Vous pouvez également effectuer ces tâches en utilisant ASSL (Analysis Services Scripting Language), ou en utilisant des objets AMO (Analysis Management Objects).You can also perform these tasks by using the Analysis Services Scripting Language (ASSL), or by using Analysis Management Objects (AMO). Pour plus d’informations, consultez Développement avec XMLA dans Analysis Services.For more information, see Developing with XMLA in Analysis Services.

Les rubriques suivantes décrivent l'utilisation de l'Assistant Exploration de données pour créer un projet d'exploration de données et ses objets associés.The following topics describe use of the Data Mining Wizard to create a data mining project and associated objects.

TâchesTasks RubriquesTopics
Décrit la façon d'utiliser des colonnes de structure d'exploration de donnéesDescribes how to work with mining structure columns Créer une structure d’exploration de données relationnelleCreate a Relational Mining Structure
Fournit des informations sur l'ajout de nouveaux modèles d'exploration de données et le traitement d'une structure et de modèlesProvides more information about how to add new mining models, and process a structure and models Ajouter des modèles d’exploration de données à une structure (Analysis Services - Exploration de données)Add Mining Models to a Structure (Analysis Services - Data Mining)
Fournit des liens vers des ressources qui vous permettent de personnaliser les algorithmes qui génèrent des modèles d'exploration de donnéesProvides links to resources that help you customize the algorithms that build mining models Personnaliser les modèles et les structures d’exploration de donnéesCustomize Mining Models and Structure
Fournit des liens vers des informations sur chacune des visionneuses de modèles d'exploration de donnéesProvides links to information about each of the mining model viewers Visionneuses de modèle d’exploration de donnéesData Mining Model Viewers
En savoir plus sur la création d'un graphique de courbes d'élévation, d'un graphique des bénéfices ou d'une matrice de classification, ou sur le test d'une structure d'exploration de donnéesLearn how to create a lift chart, profit chart, or classification matrix, or test a mining structure Test et validation (Exploration des données)Testing and Validation (Data Mining)
En savoir plus sur les options de traitement et les autorisationsLearn about processing options and permissions Traitement des objets d'exploration de donnéesProcessing Data Mining Objects
Fournit des informations supplémentaires sur Analysis ServicesProvides more information about Analysis Services Bases de données de modèle multidimensionnel (SSAS)Multidimensional Model Databases (SSAS)

Voir aussiSee Also

Data Mining Designer Data Mining Designer
Création de modèles multidimensionnels à l’aide des Outils de données SQL Server (SSDT) Creating Multidimensional Models Using SQL Server Data Tools (SSDT)
Base de données d’espace de travail (SSAS Tabulaire)Workspace Database (SSAS Tabular)