Personnaliser les modèles et les structures d'exploration de donnéesCustomize Mining Models and Structure

S’APPLIQUE À :ouiSQL Server Analysis ServicesnonAzure Analysis ServicesAPPLIES TO:yesSQL Server Analysis ServicesnoAzure Analysis ServicesAprès avoir sélectionné un algorithme qui répond aux besoins de votre entreprise, vous pouvez personnaliser le modèle d’exploration de données dans les méthodes suivantes pour améliorer les résultats. After you have selected an algorithm that meets your business needs, you can customize the mining model in the following ways to potentially improve results.

  • Utilisez des colonnes de données différentes dans le modèle ou modifiez l'utilisation, le type de contenu ou la méthode de discrétisation pour les colonnes.Use different columns of data in the model, or change the usage, content type, or discretization method for the columns.

  • Créez des filtres sur le modèle d'exploration de données pour limiter les données utilisées dans l'apprentissage du modèle.Create filters on the mining model to restrict the data used in training the model.

  • Modifiez l'algorithme utilisé pour analyser les données.Change the algorithm that was used to analyze data.

  • Définissez les paramètres d'algorithme pour contrôler les seuils, les fractionnements d'arborescence et d'autres conditions importantes.Set algorithm parameters to control thresholds, tree splits, and other important conditions.

    Cette rubrique décrit ces options.This topic describes these options.

Modification des données utilisées par le modèleChanging Data Used by the Model

Les décisions que vous prenez concernant les colonnes de données à utiliser dans le modèle et la façon d'utiliser et de traiter ces données affectent considérablement les résultats de l'analyse.The decisions that you make about which columns of data to use in the model, and how to use and process that data, greatly affect the results of analysis. Les rubriques suivantes fournissent des informations vous permettant de comprendre ces choix.The following topics provide information to help you understand these choices.

Utilisation de la sélection des fonctionnalitésUsing Feature Selection

La plupart des algorithmes d'exploration de données dans Analysis ServicesAnalysis Services utilise un processus appelé sélection des fonctionnalités pour sélectionner uniquement les attributs les plus utiles pour l'ajout à un modèle.Most data mining algorithms in Analysis ServicesAnalysis Services use a process called feature selection to select only the most useful attributes for addition to a model. Le fait de réduire le nombre de colonnes et d'attributs peut améliorer les performances et la qualité du modèle.Reducing the number of columns and attributes can improve performance and the quality of the model. Les méthodes de sélection de fonctionnalités qui sont disponibles diffèrent en fonction de l'algorithme que vous choisissez.The feature selection methods that are available differ depending on the algorithm that you choose.

Sélection des fonctionnalités (exploration de données).Feature Selection (Data Mining).

Modification de l'utilisationChanging Usage

Vous pouvez modifier les colonnes incluses dans un modèle d'exploration de données et la façon dont chaque colonne est utilisée.You can change which columns are included in a mining model and how each column is used. Si vous n'obtenez pas les résultats attendus, vous devez référencer les colonnes vous avez utilisées comme entrée et vous demander si les colonnes sont un choix adéquat et si vous pouvez faire quelque chose pour améliorer la gestion des données, notamment :If you do not get the results you expect, you should example the columns you used as input, and ask yourself whether the columns are a good choice, and whether there is anything you can do to improve the handling of data, including:

  • Identifier des variables catégorielles étiquetées par erreur en tant que nombres.Identifying categorical variables that have mistakenly labeled as numbers.

  • Ajouter des catégories pour réduire le nombre d'attributs et permettre de trouver des corrélations plus facilement.Adding categories to collapse the number of attributes and make it easier t find correlations.

  • Modifier la façon dont les nombres sont placés dans un conteneur ou discrétisés.Changing the way that numbers are binned, or discretized.

  • Supprimer des colonnes qui possèdent de nombreuses valeurs uniques ou qui sont des données de référence réelles inutiles pour l'analyse, telles qu'une adresse ou un deuxième prénom.Removing columns that have a lot of unique values, or columns that are really reference data and not useful for analysis, such as addresses or middle names.

    Il n'est pas nécessaire de supprimer physiquement les colonnes de la structure d'exploration de données ; vous pouvez simplement marquer la colonne comme Ignorer.You don’t need to physically remove columns from the mining structure; you can just flag the column as Ignore. La colonne est supprimée du modèle d'exploration de données, mais elle peut encore être utilisée par d'autres modèles d'exploration de données dans la structure, ou référencée dans une requête d'extraction.The column is removed from the mining model, but can still be used by other mining models in the structure, ore referenced in a drillthrough query.

Créer des alias pour des colonnes du modèleCreating Aliases for Model Columns

Lorsque Analysis ServicesAnalysis Services crée le modèle d'exploration de données, il utilise les mêmes noms de colonnes que ceux de la structure d'exploration de données.When Analysis ServicesAnalysis Services creates the mining model, it uses the same column names that are in the mining structure. Vous pouvez ajouter un alias à toute colonne du modèle d'exploration de données.You can add an alias to any column in the mining model. Cela peut simplifier la compréhension du contenu ou de l'utilisation des colonnes, ou permettre de raccourcir les noms afin de simplifier la création de requêtes.This might make it easier to understand the column contents or usage, or make the name shorter for convenience in creating queries. Les alias sont également utiles lorsque vous souhaitez créer une copie d'une colonne et lui donner un nom descriptif.Aliases are also helpful when you want to create a copy of a column and name it something descriptive.

Vous pouvez créer un alias en modifiant la propriété Name de la colonne du modèle d'exploration de données.You create an alias by editing the Name property of the mining model column. Analysis ServicesAnalysis Services continue à utiliser le nom d'origine comme ID de la colonne et la nouvelle valeur que vous tapez pour Nom devient l'alias de colonne et apparaît dans la grille dans les parenthèses situées à côté de l'utilisation de colonne. continues to use the original name as the ID of the column, and the new value that you type for Name becomes the column alias, and appears in the grid in parentheses next to the column usage.

alias d’exploration de données sur des colonnes de modèlealiases on mining model columns

Le graphique illustre des modèles connexes qui ont plusieurs copies d'une colonne de structure d'exploration de données, tous en rapport avec le Revenu.The graphic shows related models that have multiple copies of a mining structure column, all related to Income. Chaque copie de la colonne de structure a été discrétisée d'une manière différente.Each copy of the structure column has been discretized in a different way. Les modèles du diagramme utilisent chacun une colonne différente de la structure d’exploration de données ; toutefois, pour simplifier la comparaison des colonnes des différents modèles, la colonne dans chaque modèle a été renommée [Revenus].The models in the diagram each use a different column from the mining structure; however, for convenience in comparing the columns across the models, the column in each model has been renamed to [Income].

Ajout de filtresAdding Filters

Vous pouvez ajouter un filtre à un modèle d'exploration de données.You can add a filter to a mining model. Un filtre est un ensemble de conditions WHERE qui restreignent les données dans les cas de modèles à un certain sous-ensemble.A filter is a set of WHERE conditions that restrict the data in the model cases to some subset. Le filtre est utilisé lors de la formation du modèle et peut éventuellement être utilisé lorsque vous testez le modèle ou créez des graphiques d'analyse de précision.The filter is used when training the model, and can optionally be used when you test the model or create accuracy charts.

En ajoutant des filtres, vous pouvez réutiliser des structures d'exploration de données mais aussi créer des modèles basés sur des sous-ensembles de données très différents.By adding filters, you can reuse mining structures but create models based on very different subsets of the data. vous pouvez aussi simplement utiliser des filtres pour éliminer certaines lignes et améliorer la qualité de l'analyse.Or, you can simply use filters to eliminate certain rows and improve the quality of analysis.

Pour plus d’informations, consultez Filtres pour les modèles d’exploration de données (Analysis Services - Exploration de données).For more information, see Filters for Mining Models (Analysis Services - Data Mining).

Modifier l'algorithmeChanging the Algorithm

Bien que les nouveaux modèles ajoutés à une structure d'exploration de données partagent le même jeu de données, vous pouvez obtenir des résultats différents en utilisant un algorithme différent (si les données le prennent en charge), ou en modifiant les paramètres de l'algorithme.Although new models that you add to a mining structure share the same data set, you can get different results by using a different algorithm (if the data supports it), or by changing the parameters for the algorithm. Vous pouvez également définir des indicateurs de modélisation.You can also set modeling flags.

Le choix de l'algorithme détermine le type de résultats que vous obtiendrez.The choice of algorithm determines what kind of results you will get. Pour obtenir des informations générales sur le fonctionnement d’un algorithme spécifique, ou sur les scénarios professionnels où l’utilisation d’un algorithme particulier vous serait profitable, consultez Algorithmes d’exploration de données (Analysis Services – Exploration de données).For general information about how a specific algorithm works, or the business scenarios where you would benefit from using a particular algorithm, see Data Mining Algorithms (Analysis Services - Data Mining).

Consultez la rubrique de références techniques pour chaque algorithme pour obtenir une description des exigences et des restrictions, ainsi que des informations détaillées sur les personnalisations prises en charge par chaque algorithme.See the technical reference topic for each algorithm for a description of the requirements and restrictions, as well as detailed information about the customizations that each algorithm supports.

Algorithme MDT (Microsoft Decision Trees)Microsoft Decision Trees Algorithm Algorithme MTS (Microsoft Time Series)Microsoft Time Series Algorithm
Algorithme de gestion de clusters MicrosoftMicrosoft Clustering Algorithm Algorithme MNN (Microsoft Neural Network)Microsoft Neural Network Algorithm
Algorithme MNB (Microsoft Naive Bayes)Microsoft Naive Bayes Algorithm Algorithme MLR (Microsoft Logistic Regression)Microsoft Logistic Regression Algorithm
Algorithme Microsoft AssociationMicrosoft Association Algorithm Algorithme MLR (Microsoft Linear Regression)Microsoft Linear Regression Algorithm
Algorithme MSC (Microsoft Sequence Clustering)Microsoft Sequence Clustering Algorithm

Personnaliser les paramètres d'algorithmeCustomizing Algorithm Parameters

Chaque algorithme prend en charge des paramètres que vous pouvez utiliser pour personnaliser le comportement de l'algorithme et optimiser les résultats de votre modèle.Each algorithm supports parameters that you can use to customize the behavior of the algorithm and fine-tune the results of your model. Pour obtenir une description de l'utilisation de chaque paramètre, consultez les rubriques suivantes :For a description of how to use each parameter, see the following topics:

La rubrique relative à chaque type d'algorithme répertorie également les fonctions de prédiction qui peuvent être utilisées avec les modèles basés sur cet algorithme.The topic for each algorithm type also lists the prediction functions that can be used with models based on that algorithm.

Nom de la propriétéProperty name S'applique àApplies to
AUTO_DETECT_PERIODICITYAUTO_DETECT_PERIODICITY Références techniques relatives à l'algorithme MTS (Microsoft Time Series)Microsoft Time Series Algorithm Technical Reference
CLUSTER_COUNTCLUSTER_COUNT Informations techniques de référence sur l’algorithme Microsoft ClusteringMicrosoft Clustering Algorithm Technical Reference

Références techniques relatives à l'algorithme MSC (Microsoft Sequence Clustering)Microsoft Sequence Clustering Algorithm Technical Reference
CLUSTER_SEEDCLUSTER_SEED Informations techniques de référence sur l’algorithme Microsoft ClusteringMicrosoft Clustering Algorithm Technical Reference
CLUSTERING_METHODCLUSTERING_METHOD Informations techniques de référence sur l’algorithme Microsoft ClusteringMicrosoft Clustering Algorithm Technical Reference
COMPLEXITY_PENALTYCOMPLEXITY_PENALTY Informations techniques de référence sur l’algorithme MDT (Microsoft Decision Trees)Microsoft Decision Trees Algorithm Technical Reference

Informations techniques de référence sur l’algorithme MTS (Microsoft Time Series)Microsoft Time Series Algorithm Technical Reference
FORCE_REGRESSORFORCE_REGRESSOR Informations techniques de référence sur l’algorithme MDT (Microsoft Decision Trees)Microsoft Decision Trees Algorithm Technical Reference

Informations techniques de référence sur l’algorithme Microsoft Linear RegressionMicrosoft Linear Regression Algorithm Technical Reference

Indicateurs de modélisation (exploration de données)Modeling Flags (Data Mining)
FORECAST_METHODFORECAST_METHOD Informations techniques de référence sur l’algorithme MTS (Microsoft Time Series)Microsoft Time Series Algorithm Technical Reference
HIDDEN_NODE_RATIOHIDDEN_NODE_RATIO Informations techniques de référence sur l’algorithme MNN (Microsoft Neural Network)Microsoft Neural Network Algorithm Technical Reference
HISTORIC_MODEL_COUNTHISTORIC_MODEL_COUNT Informations techniques de référence sur l’algorithme MTS (Microsoft Time Series)Microsoft Time Series Algorithm Technical Reference
HISTORICAL_MODEL_GAPHISTORICAL_MODEL_GAP Informations techniques de référence sur l’algorithme MTS (Microsoft Time Series)Microsoft Time Series Algorithm Technical Reference
HOLDOUT_PERCENTAGEHOLDOUT_PERCENTAGE Références techniques relatives à l'algorithme MLR (Microsoft Logistic Regression)Microsoft Logistic Regression Algorithm Technical Reference

Informations techniques de référence sur l’algorithme MNN (Microsoft Neural Network)Microsoft Neural Network Algorithm Technical Reference

Remarque : ce paramètre est différent de la valeur du pourcentage de données d’exclusion qui s’applique à une structure d’exploration de données.Note: This parameter is different from the holdout percentage value that applies to a mining structure.
HOLDOUT_SEEDHOLDOUT_SEED Informations techniques de référence sur l’algorithme Microsoft Logistic RegressionMicrosoft Logistic Regression Algorithm Technical Reference

Informations techniques de référence sur l’algorithme MNN (Microsoft Neural Network)Microsoft Neural Network Algorithm Technical Reference

Remarque : ce paramètre est différent de la valeur de départ de données d’exclusion qui s’applique à une structure d’exploration de données.Note: This parameter is different from the holdout seed value that applies to a mining structure.
INSTABILITY_SENSITIVITYINSTABILITY_SENSITIVITY Informations techniques de référence sur l’algorithme MTS (Microsoft Time Series)Microsoft Time Series Algorithm Technical Reference
MAXIMUM_INPUT_ATTRIBUTESMAXIMUM_INPUT_ATTRIBUTES Informations techniques de référence sur l’algorithme Microsoft ClusteringMicrosoft Clustering Algorithm Technical Reference

Informations techniques de référence sur l’algorithme MDT (Microsoft Decision Trees)Microsoft Decision Trees Algorithm Technical Reference

Informations techniques de référence sur l’algorithme Microsoft Linear RegressionMicrosoft Linear Regression Algorithm Technical Reference

Références techniques relatives à l'algorithme MNB (Microsoft Naive Bayes)Microsoft Naive Bayes Algorithm Technical Reference

Informations techniques de référence sur l’algorithme MNN (Microsoft Neural Network)Microsoft Neural Network Algorithm Technical Reference

Informations techniques de référence sur l’algorithme Microsoft Logistic RegressionMicrosoft Logistic Regression Algorithm Technical Reference
MAXIMUM_ITEMSET_COUNTMAXIMUM_ITEMSET_COUNT Informations techniques de référence sur l’algorithme Microsoft AssociationMicrosoft Association Algorithm Technical Reference
MAXIMUM_ITEMSET_SIZEMAXIMUM_ITEMSET_SIZE Informations techniques de référence sur l’algorithme Microsoft AssociationMicrosoft Association Algorithm Technical Reference
MAXIMUM_OUTPUT_ATTRIBUTESMAXIMUM_OUTPUT_ATTRIBUTES Informations techniques de référence sur l’algorithme MDT (Microsoft Decision Trees)Microsoft Decision Trees Algorithm Technical Reference

Références techniques relatives à l'algorithme MLR (Microsoft Linear Regression)Microsoft Linear Regression Algorithm Technical Reference

Informations techniques de référence sur l’algorithme Microsoft Logistic RegressionMicrosoft Logistic Regression Algorithm Technical Reference

Informations techniques de référence sur l’algorithme MNB (Microsoft Naive Bayes)Microsoft Naive Bayes Algorithm Technical Reference

Microsoft Neural Network Algorithm Technical ReferenceMicrosoft Neural Network Algorithm Technical Reference
MAXIMUM_SEQUENCE_STATESMAXIMUM_SEQUENCE_STATES Informations techniques de référence sur l’algorithme MSC (Microsoft Sequence Clustering)Microsoft Sequence Clustering Algorithm Technical Reference
MAXIMUM_SERIES_VALUEMAXIMUM_SERIES_VALUE Informations techniques de référence sur l’algorithme MTS (Microsoft Time Series)Microsoft Time Series Algorithm Technical Reference
MAXIMUM_STATESMAXIMUM_STATES Informations techniques de référence sur l’algorithme Microsoft ClusteringMicrosoft Clustering Algorithm Technical Reference

Informations techniques de référence sur l’algorithme MNN (Microsoft Neural Network)Microsoft Neural Network Algorithm Technical Reference

Informations techniques de référence sur l’algorithme MSC (Microsoft Sequence Clustering)Microsoft Sequence Clustering Algorithm Technical Reference
MAXIMUM_SUPPORTMAXIMUM_SUPPORT Informations techniques de référence sur l’algorithme Microsoft AssociationMicrosoft Association Algorithm Technical Reference
MINIMUM_IMPORTANCEMINIMUM_IMPORTANCE Informations techniques de référence sur l’algorithme Microsoft AssociationMicrosoft Association Algorithm Technical Reference
MINIMUM_ITEMSET_SIZEMINIMUM_ITEMSET_SIZE Références techniques relatives à l'algorithme Microsoft AssociationMicrosoft Association Algorithm Technical Reference
MINIMUM_DEPENDENCY_PROBABILITYMINIMUM_DEPENDENCY_PROBABILITY Informations techniques de référence sur l’algorithme MNB (Microsoft Naive Bayes)Microsoft Naive Bayes Algorithm Technical Reference
MINIMUM_PROBABILITYMINIMUM_PROBABILITY Informations techniques de référence sur l’algorithme Microsoft AssociationMicrosoft Association Algorithm Technical Reference
MINIMUM_SERIES_VALUEMINIMUM_SERIES_VALUE Informations techniques de référence sur l’algorithme MTS (Microsoft Time Series)Microsoft Time Series Algorithm Technical Reference
MINIMUM_SUPPORTMINIMUM_SUPPORT Informations techniques de référence sur l’algorithme Microsoft AssociationMicrosoft Association Algorithm Technical Reference

Références techniques relatives à l'algorithme de gestion de clusters MicrosoftMicrosoft Clustering Algorithm Technical Reference

Informations techniques de référence sur l’algorithme MDT (Microsoft Decision Trees)Microsoft Decision Trees Algorithm Technical Reference

Informations techniques de référence sur l’algorithme MSC (Microsoft Sequence Clustering)Microsoft Sequence Clustering Algorithm Technical Reference

Informations techniques de référence sur l’algorithme MTS (Microsoft Time Series)Microsoft Time Series Algorithm Technical Reference
MISSING_VALUE_SUBSTITUTIONMISSING_VALUE_SUBSTITUTION Informations techniques de référence sur l’algorithme MTS (Microsoft Time Series)Microsoft Time Series Algorithm Technical Reference
MODELLING_CARDINALITYMODELLING_CARDINALITY Informations techniques de référence sur l’algorithme Microsoft ClusteringMicrosoft Clustering Algorithm Technical Reference
PERIODICITY_HINTPERIODICITY_HINT Informations techniques de référence sur l’algorithme MTS (Microsoft Time Series)Microsoft Time Series Algorithm Technical Reference
PREDICTION_SMOOTHINGPREDICTION_SMOOTHING Informations techniques de référence sur l’algorithme MTS (Microsoft Time Series)Microsoft Time Series Algorithm Technical Reference
SAMPLE_SIZESAMPLE_SIZE Informations techniques de référence sur l’algorithme Microsoft ClusteringMicrosoft Clustering Algorithm Technical Reference

Informations techniques de référence sur l’algorithme Microsoft Logistic RegressionMicrosoft Logistic Regression Algorithm Technical Reference

Informations techniques de référence sur l’algorithme MNN (Microsoft Neural Network)Microsoft Neural Network Algorithm Technical Reference
SCORE_METHODSCORE_METHOD Références techniques relatives à l'algorithme MDT (Microsoft Decision Trees)Microsoft Decision Trees Algorithm Technical Reference
SPLIT_METHODSPLIT_METHOD Informations techniques de référence sur l’algorithme MDT (Microsoft Decision Trees)Microsoft Decision Trees Algorithm Technical Reference
STOPPING_TOLERANCESTOPPING_TOLERANCE Informations techniques de référence sur l’algorithme Microsoft ClusteringMicrosoft Clustering Algorithm Technical Reference

Voir aussiSee Also

Algorithmes d’exploration de données (Analysis Services – Exploration de données) Data Mining Algorithms (Analysis Services - Data Mining)
Architecture physique (Analysis Services - Exploration de données)Physical Architecture (Analysis Services - Data Mining)