Modèles d'exploration de données (Analysis Services - Exploration de données)Mining Models (Analysis Services - Data Mining)

S’APPLIQUE À :ouiSQL Server Analysis ServicesnonAzure Analysis ServicesAPPLIES TO:yesSQL Server Analysis ServicesnoAzure Analysis ServicesA modèle d’exploration de est créé en appliquant un algorithme aux données, mais il est plus que d’un algorithme ou d’un conteneur de métadonnées : il s’agit d’un jeu de données, les statistiques et les modèles qui peuvent être appliqués aux nouvelles données pour générer des prédictions et faire des inférences sur les relations. A mining model is created by applying an algorithm to data, but it is more than an algorithm or a metadata container: it is a set of data, statistics, and patterns that can be applied to new data to generate predictions and make inferences about relationships.

Cette section explique ce qu'est un modèle d'exploration de données et son utilisation : l'architecture de base des modèles et des structures, les propriétés des modèles d'exploration de données, ainsi que les méthodes pour créer et utiliser des modèles d'exploration de données.This section explains what a data mining model is and what it can be used for: the basic architecture of models and structures, the properties of mining models, and ways to create and work with mining models.

Architecture du modèle d'exploration de donnéesMining Model Architecture

Définition des modèles d'exploration de donnéesDefining Data Mining Models

Propriétés du modèle d'exploration de donnéesMining Model Properties

Colonnes d'un modèle d'exploration de donnéesMining Model Columns

Traitement des modèles d'exploration de donnéesProcessing Mining Models

Affichage et interrogation de modèles d'exploration de donnéesViewing and Querying Mining Models

Architecture du modèle d'exploration de donnéesMining Model Architecture

Un modèle d'exploration de données récupère les données d'une structure d'exploration de données, puis les analyse à l'aide d'un algorithme d'exploration de données.A data mining model gets data from a mining structure and then analyzes that data by using a data mining algorithm. Le modèle et la structure d'exploration de données sont des objets distincts.The mining structure and mining model are separate objects. La structure d'exploration de données stocke les informations qui définissent la source de données.The mining structure stores information that defines the data source. Un modèle d'exploration de données stocke les informations découlant du traitement statistique des données, telles que les motifs trouvés suite à l'analyse.A mining model stores information derived from statistical processing of the data, such as the patterns found as a result of analysis.

Un modèle d'exploration de données est vide jusqu'à ce que les données fournies par la structure d'exploration de données aient été traitées et analysées.A mining model is empty until the data provided by the mining structure has been processed and analyzed. Après traitement, un modèle d'exploration de données contiendra des métadonnées, des résultats et des liaisons se rapportant à la structure d'exploration de données.After a mining model has been processed, it contains metadata, results, and bindings back to the mining structure.

modèle contient des métadonnées, les modèles et les liaisonsmodel contains metadata, patterns, and bindings

Les métadonnées indiquent le nom du modèle et le serveur où il est stocké, ainsi qu'une définition du modèle, y compris les colonnes de la structure d'exploration de données utilisées pour créer le modèle, les définitions des filtres éventuels appliqués lors du traitement du modèle et l'algorithme utilisé pour analyser les données.The metadata specifies the name of the model and the server where it is stored, as well as a definition of the model, including the columns from the mining structure that were used in building the model, the definitions of any filters that were applied when processing the model, and the algorithm that was used to analyze the data. Tous ces choix, les colonnes de données et leurs types de données, les filtres et l'algorithme, ont une influence importante sur les résultats de l'analyse.All these choices—the data columns and their data types, filters, and algorithm—have a powerful influence on the results of analysis.

Par exemple, vous pouvez utiliser les mêmes données pour créer plusieurs modèles, en utilisant éventuellement un algorithme de clustering, un algorithme d'arbre de décision et un algorithme Naïve Bayes.For example, you can use the same data to create multiple models, using perhaps a clustering algorithm, decision tree algorithm, and Naïve Bayes algorithm. Chaque type de modèle crée un ensemble différent de modèles, de jeux d'éléments, de règles ou de formules, que vous pouvez utiliser pour faire des prédictions.Each model type creates different set of patterns, itemsets, rules, or formulas, which you can use for making predictions. Généralement, chaque algorithme analyse les données d’une manière différente afin que le contenu du modèle résultant soit également organisé en différentes structures.Generally each algorithm analyses the data in a different way, so the content of the resulting model is also organized in different structures. Dans un type de modèle, les données et les modèles peuvent être regroupés en clusters; dans un autre type de modèle, les données peuvent être organisées en arborescences et en branches, ainsi que selon les règles qui les divisent et les définissent.In one type of model, the data and patterns might be grouped in clusters; in another type of model, data might be organized into trees, branches, and the rules that divide and define them.

Le modèle est également affecté par les données sur lesquelles vous effectuez l'apprentissage : même les modèles qualifiés sur la même structure d'exploration de données peuvent donner des résultats différents si vous filtrez les données différemment ou utilisez différentes valeurs de départ durant l'analyse.The model is also affected by the data that you train it on: even models trained on the same mining structure can yield different results if you filter the data differently or use different seeds during analysis. Toutefois, les données réelles ne sont pas stockées dans le modèle ; seules les statistiques sommaires sont stockées, les données réelles résidant dans la structure d'exploration de données.However, the actual data is not stored in the model—only summary statistics are stored, with the actual data residing in the mining structure. Si vous avez créé des filtres sur les données lors de l'apprentissage du modèle, les définitions de filtre sont également enregistrées avec l'objet de modèle.If you have created filters on the data when you trained the model, the filter definitions are saved with the model object as well.

Le modèle contient un jeu de liaisons, qui renvoient aux données mises en cache dans la structure d'exploration de données.The model does contain a set of bindings, which point back to the data cached in the mining structure. Si les données ont été mises en cache dans la structure et n'ont pas été effacées après leur traitement, ces liaisons permettent d'extraire des résultats les cas les prenant en charge.If the data has been cached in the structure and has not been cleared after processing, these bindings enable you to drill through from the results to the cases that support the results. Toutefois, les données réelles sont stockées dans le cache de la structure, et non dans le modèle.However, the actual data is stored in the structure cache, not in the model.

Architecture du modèle d'exploration de donnéesMining Model Architecture

Définition des modèles d'exploration de donnéesDefining Data Mining Models

Pour créer un modèle d'exploration de données, suivez ces étapes générales :You create a data mining model by following these general steps:

  • Créez la structure d'exploration de données sous-jacente et incluez des colonnes de données qui peuvent être nécessaires.Create the underlying mining structure and include the columns of data that might be needed.

  • Sélectionnez l'algorithme le mieux adapté à la tâche analytique.Select the algorithm that is best suited to the analytical task.

  • Choisissez les colonnes de la structure à utiliser dans le modèle, puis spécifiez comment elles doivent être utiliser : quelle colonne contient les résultats que vous souhaitez prédire, quelles colonnes servent d'entrée uniquement, etc.Choose the columns from the structure to use in the model, and specify how they should be used—which column contains the outcome you want to predict, which columns are for input only, and so forth.

  • Facultativement, définition des paramètres pour régler avec précision le traitement par l'algorithme.Optionally, set parameters to fine-tune the processing by the algorithm.

  • Remplissez le modèle avec des données en traitant la structure et le modèle.Populate the model with data by processing the structure and model.

    Analysis ServicesAnalysis Services fournit les outils suivants pour gérer les modèles d’exploration de données : provides the following tools to help you manage your mining models:

  • L'Assistant Exploration de données permet de créer une structure et un modèle d'exploration de données connexe.The Data Mining Wizard helps you create a structure and related mining model. Il s'agit de la méthode la plus simple à utiliser.This is the easiest method to use. L'Assistant crée automatiquement la structure d'exploration de données requise et permet de configurer les paramètres importants.The wizard automatically creates the required mining structure and helps you with the configuration of the important settings.

  • Une instruction DMX CREATE MODEL peut être utilisée pour définir un modèle.A DMX CREATE MODEL statement can be used to define a model. La structure requise est créée automatiquement dans le cadre du processus ; par conséquent, vous ne pouvez pas réutiliser une structure existante avec cette méthode.The required structure is automatically created as part of the process; therefore, you cannot reuse an existing structure with this method. Utilisez cette méthode si vous savez déjà exactement quel modèle vous souhaitez créer ou si vous souhaitez écrire des scripts pour des modèles.Use this method if you already know exactly which model you want to create, or if you want to script models.

  • Une instruction A DMX ALTER STRUCTURE ADD MODEL peut être utilisée pour ajouter un nouveau modèle d'exploration de données à une structure existante.A DMX ALTER STRUCTURE ADD MODEL statement can be used to add a new mining model to an existing structure. Utilisez cette méthode si vous souhaitez essayer différents modèles basés sur le même jeu de données.Use this method if you want to experiment with different models that are based on the same data set.

    Vous pouvez également créer par programmation des modèles d'exploration de données, avec AMO ou XML/A, ou en utilisant d'autres clients, tels que le Client d'exploration de données pour Excel.You can also create mining models programmatically, by using AMO or XML/A, or by using other clients such as the Data Mining Client for Excel. Pour plus d'informations, consultez les rubriques suivantes :For more information, see the following topics:

    Architecture du modèle d'exploration de donnéesMining Model Architecture

Propriétés du modèle d'exploration de donnéesMining Model Properties

Chaque modèle d'exploration de données a des propriétés qui définissent le modèle et ses métadonnées.Each mining model has properties that define the model and its metadata. Celles-ci incluent le nom, la description, la date du dernier traitement du modèle, les autorisations liées au modèle, ainsi que tous les filtres appliqués aux données utilisées pour l'apprentissage.These include the name, description, the date the model was last processed, permissions on the model, and any filters on the data that is used for training.

Chaque modèle d'exploration de données possède également des propriétés découlant de la structure d'exploration de données qui décrivent les colonnes de données utilisées par le modèle.Each mining model also has properties that are derived from the mining structure, and that describe the columns of data used by the model. Si une colonne utilisée par le modèle est une table imbriquée, il est également possible qu'un filtre séparé lui soit appliqué.If any column used by the model is a nested table, the column can also have a separate filter applied.

De plus, chaque modèle d’exploration de données contient deux propriétés spéciales : Algorithm et Usage.In addition, each mining model contains two special properties: Algorithm and Usage.

  • Propriété Algorithme : spécifie l’algorithme utilisé pour créer le modèle.Algorithm property Specifies the algorithm that is used to create the model. Les algorithmes disponibles dépendent du fournisseur utilisé.The algorithms that are available depend on the provider that you are using. Pour une liste des algorithmes inclus avec SQL ServerSQL Server Analysis ServicesAnalysis Services, consultez Algorithmes d’exploration de données (Analysis Services – Exploration de données).For a list of the algorithms that are included with SQL ServerSQL Server Analysis ServicesAnalysis Services, see Data Mining Algorithms (Analysis Services - Data Mining). La propriété Algorithme s’applique au modèle d’exploration de données et ne peut être définie qu’une seule fois pour chaque modèle.The Algorithm property applies to the mining model and can be set only one time for each model. Vous pouvez modifier l'algorithme ultérieurement mais certaines colonnes du modèle d'exploration de données peuvent devenir non valides si elles ne sont pas prises en charge par l'algorithme choisi.You can change the algorithm later but some columns in the mining model might become invalid if they are not supported by the algorithm that you choose. Vous devez toujours retraiter le modèle suivant la modification de cette propriété.You must always reprocess the model following a change to this property.

  • Propriété Utilisation : définit la façon dont chaque colonne est utilisée par le modèle.Usage property Defines how each column is used by the model. Vous pouvez définir l’utilisation de la colonne comme Entrée, Prédire, Prédire uniquementou Clé.You can define the column usage as Input, Predict, Predict Only, or Key. La propriété Utilisation s’applique à des colonnes individuelles du modèle d’exploration de données et doit être définie individuellement pour chaque colonne incluse dans un modèle.The Usage property applies to individual mining model columns and must be set individually for every column that is included in a model. Si la structure contient une colonne que vous n’utilisez pas dans le modèle, l’utilisation est définie sur Ignorer.If the structure contains a column that you do not use in the model, the usage is set to Ignore. Les exemples de données que vous pouvez inclure dans la structure d'exploration de données mais pas utiliser dans l'analyse, peuvent être des noms de client ou des adresses de messagerie.Examples of data that you might include in the mining structure but not use in analysis might be customer names or e-mail addresses. De cette façon, vous pouvez les interroger ultérieurement sans avoir à les inclure dans la phase d'analyse.This way you can query them later without having to include them during the analysis phase.

    Après avoir créé un modèle d'exploration de données, vous pouvez modifier la valeur de ses propriétés.You can change the value of mining model properties after you create a mining model. Toutefois, toute modification, même sur le nom du modèle d'exploration de données, requiert un traitement supplémentaire du modèle.However, any change, even to the name of the mining model, requires that you reprocess the model. Lorsque le modèle a été traité de nouveau, vous pouvez voir des résultats différents.After you reprocess the model, you might see different results.

    Architecture du modèle d'exploration de donnéesMining Model Architecture

Colonnes d'un modèle d'exploration de donnéesMining Model Columns

Le modèle d'exploration de données contient des colonnes de données qui sont obtenues à partir des colonnes définies dans la structure d'exploration de données.The mining model contains columns of data that are obtained from the columns defined in the mining structure. Vous pouvez choisir les colonnes provenant de la structure d'exploration de données à utiliser dans le modèle et créer des copies des colonnes de la structure d'exploration de données, puis les renommer ou modifier leur utilisation.You can choose which columns from the mining structure to use in the model, and you can create copies of the mining structure columns and then rename them or change their usage. Dans le cadre du processus de création de modèles, vous devez également définir l'utilisation de la colonne par le modèle.As part of the model building process, you must also define the usage of the column by the model. Cela inclut des informations indiquant notamment si la colonne est une clé, si elle est utilisée pour la prédiction ou si elle peut être ignorée par l'algorithme.That includes such information as whether the column is a key, whether it is used for prediction, or whether it can be ignored by the algorithm.

Lorsque vous générez un modèle, plutôt que d'ajouter automatiquement chaque colonne de données disponibles, il est recommandé de vérifier les données de la structure avec soin et de n'inclure dans le modèle que les colonnes qui se justifient pour l'analyse.While you are building a model, rather than automatically adding every column of data that is available, it is recommended that you review the data in the structure carefully and include in the model only those columns that make sense for analysis. Par exemple, vous devez éviter d'inclure plusieurs colonnes qui répètent les mêmes données et éviter d'utiliser des colonnes contenant principalement des valeurs uniques.For example, you should avoid including multiple columns that repeat the same data, and you should avoid using columns that have mostly unique values. Si vous pensez qu'une colonne ne doit pas être utilisée, il n'est pas nécessaire de la supprimer de la structure ou du modèle d'exploration de données ; à la place, vous pouvez placer sur cette colonne un indicateur qui spécifie qu'elle doit être ignorée lors de la génération du modèle.If you think a column should not be used, you do not need to delete it from the mining structure or mining model; instead, you can just set a flag on the column that specifies that it should be ignored when building the model. Cela signifie que la colonne restera dans la structure d'exploration de données, mais ne sera pas utilisée dans le modèle d'exploration de données.This means that the column will remain in the mining structure, but will not be used in the mining model. Si vous avez activé l'extraction du modèle vers la structure d'exploration de données, vous pouvez récupérer les informations de la colonne ultérieurement.If you have enabled drillthrough from the model to the mining structure, you can retrieve the information from the column later.

Selon l'algorithme choisi, il est possible que certaines colonnes de la structure d'exploration de données soient incompatibles avec certains types de modèle ou qu'elles aboutissent à des résultats incorrects.Depending on which algorithm you choose, some columns in the mining structure might be incompatible with certain model types, or might give you poor results. Par exemple, si vos données contiennent des données numériques continues, telles qu'une colonne de revenus, et que votre modèle requiert des valeurs discrètes, vous pouvez convertir les données en plages discrètes ou les supprimer du modèle.For example, if your data contains continuous numeric data, such as an Income column, and your model requires discrete values, you might need to convert the data to discrete ranges or remove it from the model. Dans certains cas, l'algorithme convertit automatiquement ou lie les données à votre place, mais les résultats peuvent ne pas toujours être conformes à vos souhaits ou attentes.In some cases the algorithm will automatically convert or bin the data for you, but the results might not always be what you want or expect. Pensez à effectuer des copies supplémentaires de la colonne et essayez différents modèles.Consider making additional copies of the column and trying out different models. Vous pouvez également définir des indicateurs sur les différentes colonnes pour indiquer où est requis un traitement spécial.You can also set flags on the individual columns to indicate where special processing is required. Par exemple, si vos données contiennent des valeurs Null, vous pouvez utiliser un indicateur de modélisation pour contrôler la gestion.For example, if your data contains nulls, you can use a modeling flag to control handling. Si vous souhaitez qu'une colonne particulière soit considérée comme régresseur dans un modèle, vous pouvez le faire à l'aide d'un indicateur de modélisation.If you want a particular column to be considered as a regressor in a model you can do that with a modeling flag.

Après avoir créé le modèle, vous pouvez apporter des modifications, telles que l'ajout ou la suppression de colonnes, et la modification du nom du modèle.After you have created the model, you can make changes such as adding or removing columns, or changing the name of the model. Toutefois, toute modification, même appliquée uniquement aux métadonnées du modèle, requiert un retraitement du modèle.However, any change, even only to the model metadata, requires that you reprocess the model.

Architecture du modèle d'exploration de donnéesMining Model Architecture

Traitement des modèles d'exploration de donnéesProcessing Mining Models

Un modèle d'exploration de données est un objet vide tant qu'il n'est pas traité.A data mining model is an empty object until it is processed. Lorsque vous traitez un modèle, les données mises en cache par la structure passent dans un filtre (s'il a été défini dans le modèle), puis elles sont analysées par l'algorithme.When you process a model, the data that is cached by the structure is passed through a filter, if one has been defined in the model, and is analyzed by the algorithm. L'algorithme calcule un ensemble de statistiques de résumé qui décrivent les données, identifie les règles et les schémas figurant dans les données, puis les utilise pour remplir le modèle.The algorithm computes a set of summary statistics that describes the data, identifies the rules and patterns within the data, and then uses these rules and patterns to populate the model.

Après avoir été traité, le modèle d'exploration de données contient quantité d'informations sur les données et les schémas détectés par l'analyse, y compris des statistiques, des règles et des formules de régression.After it has been processed, the mining model contains a wealth of information about the data and the patterns found through analysis, including statistics, rules, and regression formulas. Vous pouvez utiliser les visionneuses personnalisées pour parcourir ces informations, ou vous pouvez créer des requêtes d'exploration de données pour récupérer ces informations et les utiliser pour l'analyse et la présentation.You can use the custom viewers to browse this information, or you can create data mining queries to retrieve this information and use it for analysis and presentation.

Architecture du modèle d'exploration de donnéesMining Model Architecture

Affichage et interrogation de modèles d'exploration de donnéesViewing and Querying Mining Models

Une fois vous avez traité un modèle, vous pouvez l’explorer en utilisant les visionneuses personnalisées fournies dans Outils de données SQL Server (SSDT)SQL Server Data Tools (SSDT) et dans SQL Server Management StudioSQL Server Management Studio.After you have processed a model, you can explore it by using the custom viewers that are provided in Outils de données SQL Server (SSDT)SQL Server Data Tools (SSDT) and SQL Server Management StudioSQL Server Management Studio. ForFor

Vous pouvez également créer des requêtes sur le modèle d'exploration de données pour élaborer des prédictions, ou récupérer les métadonnées du modèle ou les motifs créés par celui-ci.You can also create queries against the mining model either to make predictions, or to retrieve model metadata or the patterns created by the model. Vous pouvez créer des requêtes avec les extensions DMX (Data Mining Extensions).You create queries by using Data Mining Extensions (DMX).

RubriquesTopics LiensLinks
Apprendre à créer des structures d'exploration de données qui peuvent prendre en charge plusieurs modèles d'exploration de données.Learn how to build mining structures that can support multiple mining models. En savoir plus sur l'utilisation de colonnes dans les modèles.Learn about the usage of columns in models. Colonnes de structure d’exploration de donnéesMining Structure Columns

Colonnes d'un modèle d'exploration de donnéesMining Model Columns

Types de contenu (exploration de données)Content Types (Data Mining)
Découvrir les différents algorithmes et la manière dont le choix de l'algorithme affecte le contenu du modèle.Learn about different algorithms, and how the choice of algorithm affects the model content. Contenu du modèle d’exploration (Analysis Services – Exploration de données)Mining Model Content (Analysis Services - Data Mining)

Algorithmes d’exploration de données (Analysis Services – Exploration de données)Data Mining Algorithms (Analysis Services - Data Mining)
Découvrir comment vous pouvez définir des propriétés sur le modèle qui affectent sa composition et son comportement.Learn now you can set properties on the model that affects its composition and behavior. Propriétés du modèle d'exploration de donnéesMining Model Properties

Indicateurs de modélisation (exploration de données)Modeling Flags (Data Mining)
En savoir plus sur les interfaces programmables pour l'exploration de données.Learn about the programmable interfaces for data mining. Développement avec AMO (Analysis Management Objects)Developing with Analysis Management Objects (AMO)

Informations de référence sur le langage DMX (Data Mining Extensions)Data Mining Extensions (DMX) Reference
Apprendre à utiliser les visionneuses personnalisées d'exploration de données dans Analysis ServicesAnalysis Services.Learn how to use the custom data mining viewers in Analysis ServicesAnalysis Services. Visionneuses de modèle d’exploration de donnéesData Mining Model Viewers
Afficher des exemples de différents types de requête que vous pouvez utiliser sur des modèles d'exploration de données.View examples of the different types of queries that you can use against data mining models. Requêtes d'exploration de donnéesData Mining Queries

Utilisez les liens suivants pour obtenir des informations spécifiques sur l'utilisation des modèles d'exploration de donnéesUse the following links to get more specific information about working with data mining models

TâcheTask LienLink
Ajouter et supprimer des modèles d'exploration de donnéesAdd and delete mining models Ajouter un modèle d’exploration de données à une structure d’exploration de données existanteAdd a Mining Model to an Existing Mining Structure

supprimer un modèle d'exploration de données d'une structure d'exploration de donnéesDelete a Mining Model from a Mining Structure
Utiliser des colonnes de modèle d'exploration de donnéesWork with mining model columns Exclure une colonne d'un modèle d'exploration de donnéesExclude a Column from a Mining Model

Créer un alias pour une colonne du modèleCreate an Alias for a Model Column

Modifier la discrétisation d’une colonne dans un modèle d’exploration de donnéesChange the Discretization of a Column in a Mining Model

Spécifier une colonne à utiliser comme régresseur dans un modèleSpecify a Column to Use as Regressor in a Model
Modifier les propriétés du modèleAlter model properties Modifier les propriétés d’un modèle d’exploration de donnéesChange the Properties of a Mining Model

Appliquer un filtre à un modèle d’exploration de donnéesApply a Filter to a Mining Model

Supprimer un filtre d’un modèle d’exploration de donnéesDelete a Filter from a Mining Model

Activer l’extraction pour un modèle d’exploration de donnéesEnable Drillthrough for a Mining Model

Afficher ou modifier les paramètres d’un algorithmeView or Change Algorithm Parameters
Copier,Copy. déplacer ou gérer les modèlesmove, or manage models Faire une copie d’un modèle d’exploration de donnéesMake a Copy of a Mining Model

Copier une vue d’un modèle d’exploration de donnéesCopy a View of a Mining Model

EXPORT (DMX)EXPORT (DMX)

IMPORT (DMX)IMPORT (DMX)
Remplir les modèles avec des données ou mettre à jour des données dans un modèlePopulate models with data, or update data in a model Traiter un modèle d’exploration de donnéesProcess a Mining Model
Utiliser des modèles OLAPWork with OLAP models Créer une dimension d’exploration de donnéesCreate a Data Mining Dimension

Voir aussiSee Also

Objets de bases de données (Analysis Services – Données multidimensionnelles)Database Objects (Analysis Services - Multidimensional Data)