Architecture logique (Analysis Services - Exploration de données)Logical Architecture (Analysis Services - Data Mining)

L'exploration de données est un processus qui implique l'interaction de plusieurs composants.Data mining is a process that involves the interaction of multiple components.

  • Vous accédez aux sources de données dans une base de données SQL Server ou à toute autre source de données à utiliser pour l’apprentissage, le test ou les prédictions.You access sources of data in a SQL Server database or any other data source to use for training, testing, or prediction.

  • Vous définissez des structures et des modèles d'exploration de données à l'aide de Outils de données SQL Server (SSDT)SQL Server Data Tools (SSDT) ou Visual Studio.You define data mining structures and models by using Outils de données SQL Server (SSDT)SQL Server Data Tools (SSDT) or Visual Studio.

  • Vous gérez des objets d'exploration de données et créez des prédictions ainsi que des requêtes avec SQL Server Management StudioSQL Server Management Studio.You manage data mining objects and create predictions and queries by using SQL Server Management StudioSQL Server Management Studio.

  • Quand la solution est complète, vous pouvez la déployer sur une instance d’ Analysis ServicesAnalysis Services.When the solution is complete, you deploy it to an instance of Analysis ServicesAnalysis Services.

    Le processus de création de ces objets de solution a déjà été décrit.The process of creating these solution objects has already been described elsewhere. Pour plus d’informations, consultez Solutions d’exploration de données.For more information, see Data Mining Solutions.

    Les sections suivantes décrivent l'architecture logique des objets d'une solution d'exploration de données.The following sections describe the logical architecture of the objects in a data mining solution.

    Données issues d'une source d'exploration de donnéesData Mining Source Data

    Structures d'exploration de donnéesMining Structures

    Modèles d'exploration de donnéesMining Models

    Objets d'exploration de données personnalisésCustom Data Mining Objects

Données issues d'une source d'exploration de données Data Mining Source Data

Les données utilisées dans l'exploration de données ne sont pas stockées dans la solution d'exploration de données ; seules les liaisons sont stockées.The data that you use in data mining is not stored in the data mining solution; only the bindings are stored. Les données peuvent résider dans une base de données créée dans une version précédente de SQL Server, un système CRM, ou même un fichier plat.The data might reside in a database created in a previous version of SQL Server, a CRM system, or even a flat file. Lors de l'apprentissage de la structure ou du modèle par traitement, un résumé statistiques des données est créé et stocké dans un cache qui peut être rendu persistant pour une utilisation dans des opérations ultérieures, ou supprimé après le traitement.When you train the structure or model by processing, a statistical summary of the data is created and stored in a cache that can be persisted for use in later operations, or deleted after processing. Pour plus d’informations, consultez Structures d’exploration de données (Analysis Services - Exploration de données).For more information, see Mining Structures (Analysis Services - Data Mining).

Vous combinez des données disparates dans l’objet de vue de source de données Analysis ServicesAnalysis Services, qui fournit une couche d’abstraction sur votre source de données.You combine disparate data within the Analysis ServicesAnalysis Services data source view (DSV) object, which provides an abstraction layer on top of your data source. Vous pouvez spécifier des jointures entre les tables ou ajouter des tables qui ont une relation plusieurs-à-un pour créer des colonnes de table imbriquée.You can specify joins between tables, or add tables that have a many-to-one relationship to create nested table columns. La définition de ces objets, la source de données et la vue de source de données sont stockées dans la solution avec les extensions de noms de fichiers .ds et \.dsv.The definition of these objects, the data source and the data source view, are stored within the solution with the file name extensions, .ds and \.dsv. Pour plus d’informations sur la création et l’utilisation des vues de sources de données et des sources de données Analysis ServicesAnalysis Services, consultez Sources de données prises en charge (SSAS - Modèle multidimensionnel).For more information about creating and using Analysis ServicesAnalysis Services data sources and data source views, see Supported Data Sources (SSAS - Multidimensional).

Vous pouvez également définir et modifier des sources de données et des vues de source de données en utilisant AMO ou XMLA.You can also define and alter data sources and data source views by using AMO or XMLA. Pour plus d’informations sur l’utilisation de ces objets par programmation, consultez Vue d’ensemble de l’architecture logique (Analysis Services - Données multidimensionnelles).For more information about working with these objects programmatically, see Logical Architecture Overview (Analysis Services - Multidimensional Data).

Mining Structures Mining Structures

Une structure d'exploration de données est un conteneur de données logiques qui définit le domaine de données à partir duquel les modèles d'exploration de données sont créés.A data mining structure is a logical data container that defines the data domain from which mining models are built. Une structure d'exploration de données unique peut prendre en charge plusieurs modèles d'exploration de données.A single mining structure can support multiple mining models.

Lorsque vous devez utiliser les données de la solution d'exploration de données, Analysis Services les lit à partir de la source et génère un cache d'agrégats et d'autres informations.When you need to use the data in the data mining solution, Analysis Services reads the data from the source and generates a cache of aggregates and other information. Par défaut ce cache est persistant afin que les données d'apprentissage puissent être réutilisées pour prendre en charge les modèles supplémentaires.By default this cache is persisted so that training data can be reused to support additional models. Si vous devez supprimer le cache, affectez à la propriété CacheMode sur l’objet de structure d’exploration de données la valeur ClearAfterProcessing.If you need to delete the cache, change the CacheMode property on the mining structure object to the value, ClearAfterProcessing. Pour plus d’informations, consultez Classes d’exploration de données AMO.For more information, see AMO Data Mining Classes.

Analysis Services fournit également la possibilité de séparer vos données en jeux d’apprentissage et jeux de données, de test afin que vous pouvez tester vos modèles d’exploration de données sur un jeu de données représentatif, sélectionné de façon aléatoire.Analysis Services also provides the ability to separate your data into training and testing data sets, so that you can test your mining models on a representative, randomly selected set of data. Les données ne sont pas réellement stockées séparément ; en revanche, les données de cas dans le cache de la structure sont identifiées par une propriété qui indique si ce cas particulier est utilisé pour l'apprentissage ou pour le test.The data is not actually stored separately; rather, case data in the structure cache is marked with a property that indicates whether that particular case is used for training or for testing. Si le cache est supprimé, ces informations ne peuvent pas être récupérées.If the cache is deleted, that information cannot be retrieved.

Pour plus d’informations, consultez Structures d’exploration de données (Analysis Services - Exploration de données).For more information, see Mining Structures (Analysis Services - Data Mining).

Une structure d'exploration de données peut contenir des tables imbriquées.A data mining structure can contain nested tables. Une table imbriquée fournit des détails supplémentaires sur le cas modélisé dans la table de données primaire.A nested table provides additional detail about the case that is modeled in the primary data table. Pour plus d’informations, consultez Tables imbriquées (Analysis Services - Exploration de données).For more information, see Nested Tables (Analysis Services - Data Mining)

Mining Models Mining Models

Avant le traitement, un modèle d'exploration de données n'est qu'une combinaison de propriétés de métadonnées.Before processing, a data mining model is only a combination of metadata properties. Ces propriétés spécifient une structure d'exploration de données, un algorithme d'exploration de données ainsi qu’une collection définie de paramétrages et de paramètres de filtre qui affectent les données utilisées et leur mode de traitement.These properties specify a mining structure, specify a data mining algorithm, and a define collection of parameter and filter settings that affect how the data is processed. Pour plus d’informations, consultez Modèles d’exploration de données (Analysis Services - Exploration de données).For more information, see Mining Models (Analysis Services - Data Mining).

Lorsque vous traitez le modèle, les données d'apprentissage qui étaient stockées dans le cache de la structure d'exploration de données sont utilisées pour générer des schémas, basés sur les propriétés statistiques des données et sur l'heuristique définie par l'algorithme et ses paramètres.When you process the model, the training data that was stored in the mining structure cache is used to generate patterns, based both on statistical properties of the data and on heuristics defined by the algorithm and its parameters. Ceci porte le nom d’apprentissage du modèle.This is known as training the model.

Le résultat de l’apprentissage est un jeu de données de synthèse, qui figure dans le contenu de modèle et décrit les schémas trouvés, et fournit les règles selon lesquelles les prédictions sont générées.The result of training is a set of summary data, contained within the model content, which describes the patterns that were found and provides rules by which to generate predictions. Pour plus d’informations, consultez Contenu du modèle d’exploration (Analysis Services - Exploration de données).For more information, see Mining Model Content (Analysis Services - Data Mining).

Dans certains cas, la structure logique du modèle peut également être exportée dans un fichier qui représente des formules de modèle et des liaisons de données conformément à un format standard, le langage PMML (Predictive Modeling Markup Language).In limited cases, the logical structure of the model can also be exported into a file that represents model formulas and data bindings according to a standard format, the Predictive Modeling Markup Language (PMML). Cette structure logique peut être importée dans d'autres systèmes qui utilisent PMML et le modèle ainsi décrit peut ensuite être utilisé pour la prédiction.This logical structure can be imported into other systems that utilize PMML and the model so described can then be used for prediction. Pour plus d’informations, consultez Présentation de l’instruction DMX Select.For more information, see Understanding the DMX Select Statement.

Objets d'exploration de données personnalisés Custom Data Mining Objects

D'autres objets que vous utilisez dans le contexte d'un projet d'exploration de données, tels que les graphiques d'analyse de précision ou des requêtes de prédiction, ne sont pas conservés dans la solution, mais peuvent faire l'objet d'un script à l'aide d'ASSL ou être générés à l'aide d'AMO.Other objects that you use in the context of a data mining project, such as accuracy charts or prediction queries, are not persisted within the solution, but can be scripted using ASSL or built using AMO.

En outre, vous pouvez étendre les services et les fonctionnalités disponibles sur une instance d' Analysis ServicesAnalysis Services en ajoutant ces objets personnalisés :Additionally, you can extend the services and features available on an instance of Analysis ServicesAnalysis Services by adding these custom objects:

Assemblys personnalisésCustom assemblies
Les assemblys .NET peuvent être définis à l'aide du langage compatible CLR ou COM, puis enregistrés avec une instance de SQL Server..NET assemblies can be defined by using any CLR-or COM-complaint language, and then registered with an instance of SQL Server. Les fichiers d'assemblys sont chargés à partir de l'emplacement défini par l'application et une copie est enregistrée avec les données, dans le serveur.Assembly files are loaded from the location defined by the application, and a copy is saved in the server along with the data. La copie du fichier d'assembly est utilisée pour charger l'assembly chaque fois que le service est démarré.The copy of the assembly file is used to load the assembly every time the service is started.

Pour plus d’informations, consultez Gestion des assemblys de modèles multidimensionnels.For more information, see Multidimensional Model Assemblies Management.

Procédures stockées personnaliséesCustom stored procedures
Analysis ServicesAnalysis Servicesexploration de données prend en charge l’utilisation de procédures stockées pour travailler avec les objets d’exploration de données. data mining supports the use of stored procedures to work with data mining objects. Vous pouvez créer vos propres procédures stockées pour étendre les fonctionnalités et utiliser plus facilement les données retournées par des requêtes de prédiction et des requêtes de contenu.You can create your own stored procedures to extend functionality and more easily work with data returned by prediction queries and content queries.

Définition de procédures stockéesDefining Stored Procedures

Les procédures stockées suivantes sont prises en charge pour être utilisées dans les validations croisées.The following stored procedures are supported for use in performing cross-validation.

Procédures stockées d’exploration de données (Analysis Services - Exploration de données)Data Mining Stored Procedures (Analysis Services - Data Mining)

En outre, Analysis ServicesAnalysis Services contient de nombreuses procédures stockées système qui sont utilisées en interne pour l'exploration de données.Additionally, Analysis ServicesAnalysis Services contains many system stored procedures that are used internally for data mining. Bien que les procédures stockées système sont réservées à un usage interne, elles peuvent s'avérer d'utiles raccourcis.Although the system stored procedures are for internal use, you might find them useful shortcuts. Microsoft se réserve le droit de modifier ces procédures stockées si nécessaire ; par conséquent, dans un environnement de production, nous vous recommandons de créer des requêtes avec DMX, AMO, ou XMLA.Microsoft reserves the right to change these stored procedures as needed; therefore, for production use, we recommend that you create queries by using DMX, AMO, or XMLA.

Algorithmes de plug-in personnalisésCustom plug-in algorithms
Analysis ServicesAnalysis Servicesfournit un mécanisme pour créer vos propres algorithmes, puis en ajoutant les algorithmes comme un nouveau service d’exploration de données à l’instance de serveur. provides a mechanism for creating your own algorithms, and then adding the algorithms as a new data mining service to the server instance.

Analysis Services utilise ces interfaces COM pour communiquer avec les algorithmes de plug-in.Analysis Services uses COM interfaces to communicate with plugin algorithms. Pour en savoir plus sur la manière d’implémenter de nouveaux algorithmes, consultez Algorithmes de plug-in.To learn more about how to implement new algorithms, see Plugin Algorithms.

Vous devez inscrire chaque nouveau algorithme avant de pouvoir l'utiliser.You must register each new algorithm before you can use it. Pour inscrire un algorithme, ajoutez les métadonnées requises pour les algorithmes dans le fichier .ini de l'instance d' Analysis ServicesAnalysis Services.To register an algorithm, you add the required metadata for the algorithms in the .ini file of the instance of Analysis ServicesAnalysis Services. Vous devez ajouter les informations à chaque instance dans laquelle vous envisagez d'utiliser le nouvel algorithme.You must add the information to each instance where you plan to use the new algorithm. Après avoir ajouté l'algorithme, vous pouvez redémarrer l'instance, puis utilisez l'ensemble de lignes de schéma MINING_SERVICES pour afficher le nouvel algorithme, y compris les options et les fournisseurs que l'algorithme prend en charge.After you have added the algorithm, you can restart the instance, and use the MINING_SERVICES schema rowset to view the new algorithm, including the options and providers that the algorithm supports.

Voir aussiSee Also

Traitement d’un modèle multidimensionnel (Analysis Services) Processing a multidimensional model (Analysis Services)
Informations de référence sur le langage DMX (Data Mining Extensions)Data Mining Extensions (DMX) Reference