Personnalisation d'un modèle d'exploration de données (Analysis Services - Exploration de données)

Après avoir sélectionné un algorithme qui répond aux besoins de votre entreprise, vous pouvez personnaliser le modèle d'exploration de données de plusieurs façons pour éventuellement améliorer les résultats.

  • Utilisez des colonnes de données différentes du modèle, ou modifiez l'utilisation ou les types de contenu des colonnes.

  • Créez des filtres sur le modèle d'exploration de données pour limiter les données utilisées dans l'apprentissage du modèle.

  • Définissez les paramètres d'algorithme pour contrôler les seuils, les divisions des arbres et d'autres conditions.

  • Changez l'algorithme par défaut utilisé pour analyser les données ou effectuer des prédictions.

Modification des données utilisées par le modèle

Les décisions que vous prenez concernant les colonnes de données à utiliser dans le modèle et la façon d'utiliser et de traiter ces données peuvent considérablement affecter les résultats de l'analyse. Les rubriques suivantes fournissent des informations vous permettant de comprendre ces choix.

Si vous utilisez l'Assistant Exploration de données, Analysis Services peut également sélectionner automatiquement les données qui sont les plus utiles pour générer un modèle particulier.

Personnalisation de paramètres d'algorithme

Le choix de l'algorithme détermine le type de résultats que vous obtiendrez. Pour obtenir des informations générales sur le fonctionnement d'un algorithme spécifique, ou sur les scénarios professionnels où l'utilisation d'un algorithme particulier vous serait profitable, consultez Algorithmes d'exploration de données (Analysis Services – exploration de données).

Les algorithmes d'exploration de données fournis dans Analysis Services sont également largement personnalisables. Vous pouvez contrôler le comportement de l'algorithme et la façon dont il traite des données en définissant des paramètres d'algorithme. Les rubriques suivantes fournissent des informations détaillées sur les paramètres pris en charge par chaque algorithme.

Références techniques relatives à l'algorithme MDT (Microsoft Decision Trees)

Références techniques relatives à l'algorithme Clusters Microsoft

Références techniques relatives à l'algorithme MNB (Microsoft Naive Bayes)

Références techniques relatives à l'algorithme Microsoft Association

Références techniques relatives à l'algorithme MSC (Microsoft Sequence Clustering)

Références techniques relatives à l'algorithme MNN (Microsoft Neural Network)

Références techniques relatives à l'algorithme MLR (Microsoft Logistic Regression)

Références techniques relatives à l'algorithme MLR (Microsoft Linear Regression)

Références techniques relatives à l'algorithme MTS (Microsoft Time Series)

La rubrique relative à chaque type d'algorithme répertorie également les fonctions de prédiction qui peuvent être utilisées avec les modèles basés sur cet algorithme.

Liste des paramètres d'algorithme

Chaque algorithme prend en charge des paramètres que vous pouvez utiliser pour personnaliser le comportement de l'algorithme et optimiser les résultats de votre modèle. Pour obtenir une description de l'utilisation de chaque paramètre, consultez les rubriques suivantes :

Nom de la propriété

S'applique à

AUTO_DETECT_PERIODICITY

Références techniques relatives à l'algorithme MTS (Microsoft Time Series)

CLUSTER_COUNT

Références techniques relatives à l'algorithme Clusters Microsoft

Références techniques relatives à l'algorithme MSC (Microsoft Sequence Clustering)

CLUSTER_SEED

Références techniques relatives à l'algorithme Clusters Microsoft

CLUSTERING_METHOD

Références techniques relatives à l'algorithme Clusters Microsoft

COMPLEXITY_PENALTY

Références techniques relatives à l'algorithme MDT (Microsoft Decision Trees)

Références techniques relatives à l'algorithme MTS (Microsoft Time Series)

FORCED_REGRESSOR

Références techniques relatives à l'algorithme MDT (Microsoft Decision Trees)

Références techniques relatives à l'algorithme MLR (Microsoft Linear Regression)

FORECAST_METHOD

Références techniques relatives à l'algorithme MTS (Microsoft Time Series)

HIDDEN_NODE_RATIO

Références techniques relatives à l'algorithme MNN (Microsoft Neural Network)

HISTORIC_MODEL_COUNT

Références techniques relatives à l'algorithme MTS (Microsoft Time Series)

HISTORICAL_MODEL_GAP

Références techniques relatives à l'algorithme MTS (Microsoft Time Series)

HOLDOUT_PERCENTAGE

Références techniques relatives à l'algorithme MLR (Microsoft Logistic Regression)

Références techniques relatives à l'algorithme MNN (Microsoft Neural Network)

RemarqueRemarque
Ce paramètre est différent de la valeur de pourcentage d'exclusion qui s'applique à une structure d'exploration de données.

HOLDOUT_SEED

Références techniques relatives à l'algorithme MLR (Microsoft Logistic Regression)

Références techniques relatives à l'algorithme MNN (Microsoft Neural Network)

RemarqueRemarque
Ce paramètre est différent de la valeur de départ d'exclusion qui s'applique à une structure d'exploration de données.

INSTABILITY_SENSITIVITY

Références techniques relatives à l'algorithme MTS (Microsoft Time Series)

MAXIMUM_INPUT_ATTRIBUTES

Références techniques relatives à l'algorithme Clusters Microsoft

Références techniques relatives à l'algorithme MDT (Microsoft Decision Trees)

Références techniques relatives à l'algorithme MLR (Microsoft Linear Regression)

Références techniques relatives à l'algorithme MNB (Microsoft Naive Bayes)

Références techniques relatives à l'algorithme MNN (Microsoft Neural Network)

Références techniques relatives à l'algorithme MLR (Microsoft Logistic Regression)

MAXIMUM_ITEMSET_COUNT

Références techniques relatives à l'algorithme Microsoft Association

MAXIMUM_ITEMSET_SIZE

Références techniques relatives à l'algorithme Microsoft Association

MAXIMUM_OUTPUT_ATTRIBUTES

Références techniques relatives à l'algorithme MDT (Microsoft Decision Trees)

Références techniques relatives à l'algorithme MLR (Microsoft Linear Regression)

Références techniques relatives à l'algorithme MLR (Microsoft Logistic Regression)

Références techniques relatives à l'algorithme MNB (Microsoft Naive Bayes)

Références techniques relatives à l'algorithme MNN (Microsoft Neural Network)

MAXIMUM_SEQUENCE_STATES

Références techniques relatives à l'algorithme MSC (Microsoft Sequence Clustering)

MAXIMUM_SERIES_VALUE

Références techniques relatives à l'algorithme MTS (Microsoft Time Series)

MAXIMUM_STATES

Références techniques relatives à l'algorithme Clusters Microsoft

Références techniques relatives à l'algorithme MNN (Microsoft Neural Network)

Références techniques relatives à l'algorithme MSC (Microsoft Sequence Clustering)

MAXIMUM_SUPPORT

Références techniques relatives à l'algorithme Microsoft Association

MINIMUM_IMPORTANCE

Références techniques relatives à l'algorithme Microsoft Association

MINIMUM_ITEMSET_SIZE

Références techniques relatives à l'algorithme Microsoft Association

MINIMUM_DEPENDENCY_PROBABILITY

Références techniques relatives à l'algorithme MNB (Microsoft Naive Bayes)

MINIMUM_PROBABILITY

Références techniques relatives à l'algorithme Microsoft Association

MINIMUM_SERIES_VALUE

Références techniques relatives à l'algorithme MTS (Microsoft Time Series)

MINIMUM_SUPPORT

Références techniques relatives à l'algorithme Microsoft Association

Références techniques relatives à l'algorithme Clusters Microsoft

Références techniques relatives à l'algorithme MDT (Microsoft Decision Trees)

Références techniques relatives à l'algorithme MSC (Microsoft Sequence Clustering)

Références techniques relatives à l'algorithme MTS (Microsoft Time Series)

MISSING_VALUE_SUBSTITUTION

Références techniques relatives à l'algorithme MTS (Microsoft Time Series)

MODELLING_CARDINALITY

Références techniques relatives à l'algorithme Clusters Microsoft

PERIODICITY_HINT

Références techniques relatives à l'algorithme MTS (Microsoft Time Series)

PREDICTION_SMOOTHING

Références techniques relatives à l'algorithme MTS (Microsoft Time Series)

SAMPLE_SIZE

Références techniques relatives à l'algorithme Clusters Microsoft

Références techniques relatives à l'algorithme MLR (Microsoft Logistic Regression)

Références techniques relatives à l'algorithme MNN (Microsoft Neural Network)

SCORE_METHOD

Références techniques relatives à l'algorithme MDT (Microsoft Decision Trees)

SPLIT_METHOD

Références techniques relatives à l'algorithme MDT (Microsoft Decision Trees)

STOPPING_TOLERANCE

Références techniques relatives à l'algorithme Clusters Microsoft

Autres conditions requises

Le choix et la préparation des données est une partie importante du processus d'exploration de données. Par exemple, les algorithmes fournis par Microsoft n'autorisent pas les clés dupliquées. Le type des données qui est requis pour chaque modèle diffère en fonction de l'algorithme. Pour plus d'informations, consultez la section relative aux spécifications des rubriques suivantes :

Personnalisation des résultats à l'aide de requêtes et de fonctions de prédiction

Une fois que le modèle a été créé et traité, vous pouvez afficher les informations à l'aide de l'une des visionneuses spécifiques à chaque type de modèle. Vous pouvez également écrire des requêtes personnalisées en utilisant la syntaxe DMX (Data Mining Extensions) pour obtenir des informations plus techniques ou plus détaillées sur les modèles trouvés dans les données.

Pour plus d'informations sur la création de requêtes qui retournent le contenu du modèle, consultez Interrogation de modèles d'exploration de données (Analysis Services - Exploration de données).

Vous pouvez utiliser des fonctions pour étendre les résultats retournés par un modèle d'exploration de données. Certaines fonctions retournent également des statistiques qui représentent la probabilité d'un résultat, ou d'autres scores. En outre, les algorithmes individuels prennent également en charge des fonctions supplémentaires. Par exemple, si un modèle d'exploration de données utilise le clustering, vous pouvez utiliser des fonctions spéciales pour rechercher des informations relatives aux clusters. Toutefois, si votre modèle est basé sur l'algorithme MTS (Microsoft Time Series), un ensemble de fonctions différent est disponible pour effectuer des prédictions et interroger le contenu du modèle. Pour plus d'informations, consultez la rubrique de références techniques de chaque algorithme.

Pour obtenir des exemples illustrant l'interrogation d'un modèle d'exploration de données et l'utilisation des fonctions de prédiction conçues pour des types de modèles spécifiques, consultez Interrogation de modèles d'exploration de données (Analysis Services - Exploration de données).

Pour obtenir la liste des fonctions de prédiction prises en charge pour tous les types d'algorithmes, consultez Mappage des fonctions sur les type de requêtes (DMX).

Évaluation des modifications dans un modèle

Lorsque vous testez des modèles différents pour résoudre un problème commercial ou créez des variations sur un modèle, vous devez mesurer l'exactitude de chaque modèle et également évaluer comment chaque modèle répond à ce problème commercial. Pour obtenir des informations générales sur l'évaluation de modèles d'exploration de données, consultez Validation des modèles d'exploration de données (Analysis Services - Exploration de données). Pour plus d'informations sur la représentation graphique de l'exactitude de différents modèles d'exploration de données, consultezOutils de création de diagramme de précision de modèle (Analysis Services - Exploration de données).