Structures d'exploration de données (Analysis Services – exploration de données)Mining Structures (Analysis Services - Data Mining)

S’APPLIQUE À :ouiSQL Server Analysis ServicesnonAzure Analysis ServicesAPPLIES TO:yesSQL Server Analysis ServicesnoAzure Analysis ServicesLa structure d’exploration de données définit les données à partir duquel les modèles d’exploration de données sont créés : il spécifie la vue de source de données, le nombre et le type de colonnes, et affecte à une partition facultative en jeux d’apprentissage et de test. The mining structure defines the data from which mining models are built: it specifies the source data view, the number and type of columns, and an optional partition into training and testing sets. Une structure d'exploration de données individuelle peut prendre en charge plusieurs modèles d'exploration de données qui partagent le même domaine.A single mining structure can support multiple mining models that share the same domain. Le diagramme suivant illustre la relation de la structure d'exploration de données par rapport à la source de données et à ses modèles d'exploration de données constitutifs.The following diagram illustrates the relationship of the data mining structure to the data source, and to its constituent data mining models.

Traitement des données : source à structure à modèleProcessing of data: source to structure to model

La structure d'exploration de données dans le diagramme repose sur une source de données qui contient plusieurs tables ou vues, jointes dans le champ CustomerID.The mining structure in the diagram is based on a data source that contains multiple tables or views, joined on the CustomerID field. Une table contient des informations sur les clients, telles que la région géographique, l’âge, le revenu et le genre, alors que la table imbriquée connexe contient plusieurs lignes d'informations supplémentaires sur chaque client, telles que les produits achetés par le client.One table contains information about customers, such as the geographical region, age, income and gender, while the related nested table contains multiple rows of additional information about each customer, such as products the customer has purchased. Le diagramme montre que plusieurs modèles peuvent être construits sur une même structure d'exploration de données, et que ces modèles peuvent utiliser des colonnes différentes de la structure.The diagram shows that multiple models can be built on one mining structure, and that the models can use different columns from the structure.

Modèle 1 Utilise CustomerID, Income, Age, Region, et filtre les données sur Region.Model 1 Uses CustomerID, Income, Age, Region, and filters the data on Region.

Modèle 2 Utilise CustomerID, Income, Age, Region, et filtre les données sur Age.Model 2 Uses CustomerID, Income, Age, Region and filters the data on Age.

Modèle 3 Utilise CustomerID, Age, Gender et la table imbriquée, sans filtre.Model 3 Uses CustomerID, Age, Gender, and the nested table, with no filter.

Comme les modèles utilisent des colonnes différentes pour l'entrée et comme deux des modèles limitent également les données utilisées dans le modèle en appliquant un filtre, les modèles peuvent avoir des résultats très différents bien qu'ils soient basés sur les mêmes données.Because the models use different columns for input, and because two of the models additionally restrict the data that is used in the model by applying a filter, the models might have very different results even though they are based on the same data. Notez que la colonne CustomerID est requise dans tous les modèles parce que c'est la seule colonne disponible qui peut être utilisée comme clé de cas.Note that the CustomerID column is required in all models because it is the only available column that can be used as the case key.

Cette section explique l'architecture de base des structures d'exploration de données : procédure pour définir une structure d'exploration de données, pour la remplir avec des données et pour l'utiliser afin de créer des modèles.This section explains the basic architecture of data mining structures: how you define a mining structure, how you populate it with data, and how you use it to create models. Pour plus d’informations sur la façon de gérer ou d’exporter des structures d’exploration de données existantes, consultez Gestion des solutions et des objets d’exploration de données.For more information about how to manage or export existing data mining structures, see Management of Data Mining Solutions and Objects.

Définition d'une structure d'exploration de donnéesDefining a Mining Structure

La configuration d'une structure d'exploration de données inclut les étapes suivantes :Setting up a data mining structure includes the following steps:

  • Définissez une source de données.Define a data source.

  • Sélectionnez les colonnes de données à inclure dans la structure (toutes les colonnes ne doivent pas être ajoutées au modèle) et en définissant une clé.Select columns of data to include in the structure (not all columns need to be added to the model) and defining a key.

  • Définissez une clé pour la structure, notamment la clé pour la table imbriquée, le cas échéant.Define a key for the structure, including the key for the bested table, if applicable.

  • Spécifiez si les données sources doivent être séparées dans un jeu d'apprentissage et un jeu de test.Specify whether the source data should be separate into a training set and testing set. Cette étape est facultative.This step is optional.

  • Traitez la structure.Process the structure.

    Ces étapes sont décrites de manière plus détaillée dans les sections suivantes.These steps are described in more detail in the following sections.

Sources de données des structures d'exploration de donnéesData Sources for Mining Structures

Lorsque vous définissez une structure d'exploration de données, vous utilisez des colonnes qui sont disponibles dans une vue de source de données existante.When you define a mining structure, you use columns that are available in an existing data source view. Une vue de source de données est un objet partagé qui vous permet de combiner plusieurs sources de données et de les utiliser comme source unique.A data source view is a shared object that lets you combine multiple data sources and use them as a single source. Les sources de données d'origine ne sont pas visibles par les applications clientes, et vous pouvez utiliser les propriétés de la vue de source de données pour modifier les types de données, créer des agrégations ou définir des alias de colonne.The original data sources are not visible to client applications, and you can use the properties of the data source view to modify data types, create aggregations, or alias columns.

Si vous construisez plusieurs modèles d'exploration de données à partir de la même structure d'exploration de données, les modèles peuvent utiliser des colonnes différentes de la structure.If you build multiple mining models from the same mining structure, the models can use different columns from the structure. Par exemple, vous pouvez créer une structure unique, puis construire à partir d'elle des modèles d'arbre de décision et de clustering distincts, chaque modèle utilisant des colonnes différentes et prévoyant des attributs différents.For example, you can create a single structure and then build separate decision tree and clustering models from it, with each model using different columns and predicting different attributes.

De plus, chaque modèle peut utiliser les colonnes de la structure de différentes façons.Moreover, each model can use the columns from the structure in different ways. Par exemple, votre vue de source de données peut contenir une colonne Revenus que vous pouvez lier de différentes façons pour différents modèles.For example, your data source view might contain an Income column, which you can bin in different ways for different models.

La structure d’exploration de données stocke la définition de la source de données et des colonnes qu’elle contient sous forme de liaisons aux données sources.The data mining structure stores the definition of the data source and the columns in it in the form of bindings to the source data. Pour plus d’informations sur les liaisons de sources de données, consultez Sources de données et liaisons (SSAS Multidimensionnel).For more information about data source bindings, see Data Sources and Bindings (SSAS Multidimensional). Notez toutefois que vous pouvez également créer une structure d’exploration de données sans la lier à une source de données spécifique en utilisant l’instruction DMX CREATE MINING STRUCTURE (DMX).However, note that you can also create a data mining structure without binding it to a specific data source by using the DMX CREATE MINING STRUCTURE (DMX) statement.

Colonnes de structure d'exploration de donnéesMining Structure Columns

Les composants constituant la structure d'exploration de données sont les colonnes de structure d'exploration de données qui décrivent les données inscrites dans la source de données.The building blocks of the mining structure are the mining structure columns, which describe the data that the data source contains. Ces colonnes contiennent des informations, telles que le type de données, le type de contenu et le mode de distribution des données.These columns contain information such as data type, content type, and how the data is distributed. La structure d'exploration de données ne contient pas d'informations sur la façon dont les colonnes sont utilisées pour un modèle d'exploration de données spécifique, ni sur le type d'algorithme utilisé pour générer un modèle ; ces informations sont définies dans le modèle d'exploration de données lui-même.The mining structure does not contain information about how columns are used for a specific mining model, or about the type of algorithm that is used to build a model; this information is defined in the mining model itself.

Une structure d'exploration de données peut également contenir des tables imbriquées.A mining structure can also contain nested tables. Une table imbriquée représente une relation un-à-plusieurs entre l'entité d'un cas et les attributs qui lui sont associés.A nested table represents a one-to-many relationship between the entity of a case and its related attributes. Par exemple, si les informations décrivant le client se trouvent dans une table et que les achats du client se trouvent dans une autre table, vous pouvez utiliser des tables imbriquées pour combiner les informations dans un seul cas.For example, if the information that describes the customer resides in one table, and the customer's purchases reside in another table, you can use nested tables to combine the information into a single case. L'identificateur du client est alors l'entité tandis que les achats sont les attributs associés.The customer identifier is the entity, and the purchases are the related attributes. Pour plus d’informations sur l’utilisation des tables imbriquées, consultez Tables imbriquées (Analysis Services - Exploration de données ).For more information about when to use nested tables, see Nested Tables (Analysis Services - Data Mining).

Pour créer un modèle d'exploration de données dans Outils de données SQL Server (SSDT)SQL Server Data Tools (SSDT), vous devez d'abord créer une structure d'exploration de données.To create a data mining model in Outils de données SQL Server (SSDT)SQL Server Data Tools (SSDT), you must first create a data mining structure. L'Assistant Exploration de données vous guide tout au long du processus de création d’une structure d'exploration de données, de choix des données et d’ajout d’un modèle d’exploration de données.The Data Mining wizard walks you through the process of creating a mining structure, choosing data, and adding a mining model.

Si vous créez un modèle d’exploration de données avec les extensions DMX (Data Mining Extensions), vous pouvez spécifier le modèle et les colonnes qu’il contient pour que DMX crée automatiquement la structure d’exploration de données requise.If you create a mining model by using Data Mining Extensions (DMX), you can specify the model and the columns in it, and DMX will automatically create the required mining structure. Pour plus d’informations, consultez CREATE MINING MODEL (DMX).For more information, see CREATE MINING MODEL (DMX).

Pour plus d’informations, consultez Colonnes de structure d’exploration de données.For more information, see Mining Structure Columns.

Division des données dans des jeux d'apprentissage et de testDividing the Data into Training and Testing Sets

Lorsque vous définissez les données d'une structure d'exploration de données, vous pouvez également spécifier que certaines données soient utilisées pour l'apprentissage et d'autres pour les tests.When you define the data for the mining structure, you can also specify that some of the data be used for training, and some for testing. Par conséquent, il n'est plus nécessaire de séparer vos données avant de créer une structure d'exploration de données.Therefore, it is no longer necessary to separate your data in advance of creating a data mining structure. À la place, tandis que vous créez votre modèle, vous pouvez spécifier qu'un certain pourcentage des données soit réservé pour les tests et le reste utilisé pour l'apprentissage, ou vous pouvez spécifier un certain nombre de cas à utiliser comme jeu de données de test.Instead, while you create your model, you can specify that a certain percentage of the data be held out for testing, and the rest used for training, or you can specify a certain number of cases to use as the test data set. Les informations sur les jeux de données d'apprentissage et de test sont mises en cache avec la structure d'exploration de données ; par conséquent, le même jeu de test peut être utilisé avec tous les modèles basés sur cette structure.The information about the training and testing data sets is cached with the mining structure, and as a result, the same test set can be used with all models that are based on that structure.

Pour plus d'informations, voir Training and Testing Data Sets.For more information, see Training and Testing Data Sets.

Activation de l'extractionEnabling Drillthrough

Vous pouvez ajouter des colonnes à la structure d'exploration de données même si vous n'envisagez pas d'utiliser la colonne dans un modèle d'exploration de données spécifique.You can add columns to the mining structure even if you do not plan to use the column in a specific mining model. Cela est utile si, par exemple, vous souhaitez récupérer les adresses de messagerie des clients dans un modèle de clustering, sans utiliser l'adresse de messagerie pendant le processus d'analyse.This is useful if, for example, you want to retrieve the e-mail addresses of customers in a clustering model, without using the e-mail address during the analysis process. Pour ignorer une colonne pendant l'analyse et la phase de prédiction, vous devez l'ajouter à la structure, mais ne spécifiez pas d'utilisation pour la colonne, ou définissez l'indicateur d'utilisation sur Ignorer.To ignore a column during the analysis and prediction phase, you add it to the structure but do not specify a usage for the column, or set the usage flag to Ignore. Des données marquées de cette façon peuvent toujours être utilisées dans des requêtes si l'extraction a été activée sur le modèle d'exploration de données et si vous disposez des autorisations appropriées.Data flagged in this way can still be used in queries if drillthrough has been enabled on the mining model, and if you have the appropriate permissions. Par exemple, vous pouvez examiner les clusters qui résultent de l'analyse de tous les clients, puis utiliser une requête d'extraction pour obtenir les noms et les adresses de messagerie des clients dans un cluster particulier, même si ces colonnes de données n'ont pas été utilisées pour générer le modèle.For example, you could review the clusters resulting from analysis of all customers, and then use a drillthrough query to get the names and e-mail addresses of customers in a particular cluster, even though those columns of data were not used to build the model.

Pour plus d’informations, consultez Requêtes d’extraction (exploration de données).For more information, see Drillthrough Queries (Data Mining).

Traitement des structures d'exploration de donnéesProcessing Mining Structures

Une structure d'exploration de données est un simple conteneur de métadonnées tant qu'elle n'est pas traitée.A mining structure is just a metadata container until it is processed. Quand vous traitez une structure d’exploration de données, Analysis ServicesAnalysis Services crée un cache qui stocke des statistiques sur les données, ainsi que des informations sur la manière dont les attributs continus sont discrétisés et toute autre information qui sera utilisée ultérieurement par les modèles d’exploration de données.When you process a mining structure, Analysis ServicesAnalysis Services creates a cache that stores statistics about the data, information about how any continuous attributes are discretized, and other information that is later used by mining models. Le modèle d'exploration de données lui-même ne stocke pas ces informations de synthèse, mais référence à la place des informations qui ont été mises en cache lorsque la structure d'exploration de données a été traitée.The mining model itself does not store this summary information, but instead references the information that was cached when the mining structure was processed. Par conséquent, vous n'avez pas à retraiter la structure chaque fois que vous ajoutez un nouveau modèle à une structure existante ; vous pouvez simplement traiter le modèle.Therefore, you do not need to reprocess the structure each time you add a new model to an existing structure; you can process just the model.

Vous pouvez choisir d'ignorer ce cache après le traitement, s'il est très volumineux ou si vous souhaitez supprimer des données détaillées.You can opt to discard this cache after processing, if the cache is very large or you want to remove detailed data. Si vous ne voulez pas mettre ces données en cache, vous pouvez affecter à la propriété CacheMode de la structure d’exploration de données la valeur ClearAfterProcessing.If you do not want the data to be cached, you can change the CacheMode property of the mining structure to ClearAfterProcessing. Cela détruira le cache lorsque tous les modèles auront été traités.This will destroy the cache after any models are processed. L’affectation de la valeur ClearAfterProcessing à la propriété CacheMode désactive l’extraction dans le modèle d’exploration de données.Setting the CacheMode property to ClearAfterProcessing will disable drillthrough from the mining model.

Toutefois, après avoir détruit le cache, vous ne pouvez pas ajouter de nouveaux modèles à la structure d'exploration de données.However, after you destroy the cache, you will not be able to add new models to the mining structure. Si vous ajoutez un nouveau modèle d'exploration de données à la structure, ou modifiez les propriétés de modèles existants, vous devez d'abord retraiter la structure d'exploration de données.If you add a new mining model to the structure, or change the properties of existing models, you would need to reprocess the mining structure first. Pour plus d’informations, consultez Exigences et considérations concernant le traitement (exploration de données).For more information, see Processing Requirements and Considerations (Data Mining).

Affichage des structures d'exploration de donnéesViewing Mining Structures

Vous ne pouvez pas utiliser de visionneuses pour parcourir les données dans une structure d'exploration de données.You cannot use viewers to browse the data in a mining structure. Toutefois, dans Outils de données SQL Server (SSDT)SQL Server Data Tools (SSDT), vous pouvez utiliser l’onglet Structure d’exploration de données du Concepteur de modèle d’exploration de données pour afficher les colonnes de structure et leurs définitions.However, in Outils de données SQL Server (SSDT)SQL Server Data Tools (SSDT), you can use the Mining Structure tab of Data Mining Designer to view the structure columns and their definitions. Pour plus d’informations, consultez Concepteur d’exploration de données.For more information, see Data Mining Designer.

Si vous souhaitez consulter les données de la structure d'exploration de données, vous pouvez créer des requêtes à l'aide des extensions DMX.If you want to review the data in the mining structure, you can create queries by using Data Mining Extensions (DMX). Par exemple, l'instruction SELECT * FROM <structure>.CASES renvoie toutes les données incluses dans la structure d'exploration de données.For example, the statement SELECT * FROM <structure>.CASES returns all the data in the mining structure. Pour extraire ces informations, la structure d'exploration de données doit avoir été traitée, et les résultats du traitement doivent être mis en cache.To retrieve this information, the mining structure must have been processed, and the results of processing must be cached.

L'instruction SELECT * FROM <model>.CASES renvoie les mêmes colonnes, mais uniquement pour les cas inclus dans le modèle en question.The statement SELECT * FROM <model>.CASES returns the same columns, but only for the cases in that particular model. Pour plus d’informations, consultez SELECT FROM <structure>.CASES et SELECT FROM <modèle>.CASES (DMX).For more information, see SELECT FROM <structure>.CASES and SELECT FROM <model>.CASES (DMX).

Utilisation des modèles d'exploration de données avec les structures d'exploration de donnéesUsing Data Mining Models with Mining Structures

Un modèle d'exploration de données applique un algorithme de modèle d'exploration de données aux données qui sont représentées par une structure d'exploration de données.A data mining model applies a mining model algorithm to the data that is represented by a mining structure. Un modèle d'exploration de données est un objet appartenant à une certaine structure d'exploration de données, et il hérite de toutes les valeurs des propriétés définies par la structure d'exploration de données.A mining model is an object that belongs to a particular mining structure, and the model inherits all the values of the properties that are defined by the mining structure. Le modèle peut utiliser toutes les colonnes que contient la structure d'exploration de données ou un sous-ensemble de ces colonnes.The model can use all the columns that the mining structure contains or a subset of the columns. Vous pouvez ajouter plusieurs copies d'une colonne de structure à une structure.You can add multiple copies of a structure column to a structure. Vous pouvez également ajouter plusieurs copies d’une colonne de structure à un modèle, puis assigner des noms différents, ou alias, à chaque colonne de structure dans le modèle.You can also add multiple copies of a structure column to a model, and then assign different names, or aliases, to each structure column in the model. Pour plus d’informations sur l’affectation d’alias aux colonnes de structure, consultez Créer un alias pour une colonne du modèle et Propriétés du modèle d’exploration de données.For more information about aliasing structure columns, see Create an Alias for a Model Column and Mining Model Properties.

Pour plus d’informations sur l’architecture des modèles d’exploration de données, consultez Modèles d’exploration de données (Analysis Services - Exploration de données).For more information about the architecture of data mining models, see Mining Models (Analysis Services - Data Mining).

Utilisez les liens fournis ici pour en savoir plus sur la manière de définir, gérer et utiliser les structures d'exploration de données.Use the links provided her to learn more about how to define, manage, and use mining structures.

TâchesTasks LiensLinks
Utiliser des structures d'exploration de données relationnellesWork with relational mining structures créer une structure d'exploration de données relationnelleCreate a New Relational Mining Structure

Ajouter une table imbriquée à une structure d’exploration de donnéesAdd a Nested Table to a Mining Structure
Utiliser des structures d'exploration de données basées sur des cubes OLAPWork with mining structures based on OLAP cubes Créer une structure d’exploration de données OLAPCreate a New OLAP Mining Structure
Utiliser des colonnes dans une structure d'exploration de donnéesWork with columns in a mining structure Ajouter des colonnes à une structure d’exploration de donnéesAdd Columns to a Mining Structure

Supprimer des colonnes d'une structure d'exploration de donnéesRemove Columns from a Mining Structure
Modifier ou interroger les propriétés et les données de structure d'exploration de donnéesChange or query mining structure properties and data Modifier les propriétés d'une structure d'exploration de donnéesChange the Properties of a Mining Structure
Utiliser des sources de données sous-jacentes et mettre à jour des données sourcesWork with the underlying data sources and update source data Modifier la vue de source de données utilisée pour une structure d’exploration de donnéesEdit the Data Source View used for a Mining Structure

traiter une structure d'exploration de donnéesProcess a Mining Structure

Voir aussiSee Also

Objets de bases de données (Analysis Services - Données multidimensionnelles ) Database Objects (Analysis Services - Multidimensional Data)
Modèles d’exploration de données (Analysis Services - Exploration de données)Mining Models (Analysis Services - Data Mining)