Algorithmes d'exploration de données (Analysis Services - Exploration de données)Data Mining Algorithms (Analysis Services - Data Mining)

S’APPLIQUE À :ouiSQL Server Analysis ServicesnonAzure Analysis ServicesAPPLIES TO:yesSQL Server Analysis ServicesnoAzure Analysis ServicesUn algorithme dans les données d’exploration de données (ou d’apprentissage) est un ensemble d’heuristiques et les calculs qui crée un modèle à partir des données. An algorithm in data mining (or machine learning) is a set of heuristics and calculations that creates a model from data. Pour créer un modèle, l'algorithme analyse d'abord les données que vous fournissez, à la recherche de types spécifiques de modèles ou de tendances.To create a model, the algorithm first analyzes the data you provide, looking for specific types of patterns or trends. L’algorithme utilise les résultats de cette analyse sur plusieurs itérations pour trouver les paramètres optimaux pour la création du modèle d’exploration de données.The algorithm uses the results of this analysis over many iterations to find the optimal parameters for creating the mining model. Ensuite, ces paramètres sont appliqués au jeu de données entier pour extraire des modèles utilisables et des statistiques détaillées.These parameters are then applied across the entire data set to extract actionable patterns and detailed statistics.

Le modèle d'exploration de données qu'un algorithme crée à partir de vos données peut prendre des formes variées, dont les suivantes :The mining model that an algorithm creates from your data can take various forms, including:

  • Un ensemble de clusters qui décrivent la manière dont les cas sont liés dans un dataset.A set of clusters that describe how the cases in a dataset are related.

  • Un arbre de décision qui prédit les résultats et décrit comment les différents critères affectent ces résultats.A decision tree that predicts an outcome, and describes how different criteria affect that outcome.

  • Un modèle mathématique permettant de prévoir les ventes.A mathematical model that forecasts sales.

  • Un ensemble de règles qui décrivent la manière dont les produits sont regroupés dans une transaction et les probabilités que les produits soient achetés ensemble.A set of rules that describe how products are grouped together in a transaction, and the probabilities that products are purchased together.

    Les algorithmes fournis dans SQL ServerSQL Server Data Mining sont des méthodes bien connues, mais aussi les plus populaires, pour dériver des modèles à partir de données.The algorithms provided in SQL ServerSQL Server Data Mining are the most popular, well-researched methods of deriving patterns from data. Pour prendre un exemple, le clustering K-means est l’un des algorithmes de clustering les plus anciens. Largement répandu dans une multitude d’outils différents, il propose de nombreuses implémentations et options.To take one example, K-means clustering is one of the oldest clustering algorithms and is available widely in many different tools and with many different implementations and options. Toutefois, l’implémentation spécifique du clustering K-means utilisée dans SQL ServerSQL Server Data Mining a été développée par Microsoft Research, puis optimisée en terme de performances avec Analysis ServicesAnalysis Services.However, the particular implementation of K-means clustering used in SQL ServerSQL Server Data Mining was developed by Microsoft Research and then optimized for performance with Analysis ServicesAnalysis Services. Tous les algorithmes d’exploration de données Microsoft sont largement personnalisables et entièrement programmables à l’aide des API fournies.All of the Microsoft data mining algorithms can be extensively customized and are fully programmable, using the provided APIs. Vous pouvez également automatiser la création, la formation et le recyclage de modèles à l’aide des composants d’exploration de données fournis dans Integration ServicesIntegration Services.You can also automate the creation, training, and retraining of models by using the data mining components in Integration ServicesIntegration Services.

    Vous pouvez également utiliser des algorithmes tiers qui sont conformes à la spécification OLE DB pour l’exploration de données, ou développer des algorithmes personnalisés qui peuvent être inscrits en tant que services, puis utilisés dans l’infrastructure d’exploration de données SQL ServerSQL Server .You can also use third-party algorithms that comply with the OLE DB for Data Mining specification, or develop custom algorithms that can be registered as services and then used within the SQL ServerSQL Server Data Mining framework.

Choix de l'algorithme adéquatChoosing the Right Algorithm

Le choix du meilleur algorithme à utiliser pour une tâche analytique spécifique peut être un véritable défi.Choosing the best algorithm to use for a specific analytical task can be a challenge. Vous pouvez utiliser des algorithmes différents pour effectuer la même tâche professionnelle, mais chaque algorithme produit un résultat différent et certains algorithmes peuvent produire plusieurs types de résultats.While you can use different algorithms to perform the same business task, each algorithm produces a different result, and some algorithms can produce more than one type of result. Par exemple, vous pouvez utiliser l’algorithme MDT ( MicrosoftMicrosoft Decision Trees) pas seulement pour des prédictions, mais aussi comme manière de réduire le nombre de colonnes dans un dataset, car l’arbre de décision peut identifier les colonnes qui n’affectent pas le modèle d’exploration de données final.For example, you can use the MicrosoftMicrosoft Decision Trees algorithm not only for prediction, but also as a way to reduce the number of columns in a dataset, because the decision tree can identify columns that do not affect the final mining model.

Choix d'un algorithme par typeChoosing an Algorithm by Type

SQL ServerSQL Server L’exploration de données inclut les types d’algorithmes suivants : Data Mining includes the following algorithm types:

  • Lesalgorithmes de classification prévoient une ou plusieurs variables discrètes, en fonction des autres attributs du jeu de données.Classification algorithms predict one or more discrete variables, based on the other attributes in the dataset.

  • Lesalgorithmes de régression prévoient une ou plusieurs variables continues, telles que les bénéfices ou les pertes, en fonction d’autres attributs du jeu de données.Regression algorithms predict one or more continuous numeric variables, such as profit or loss, based on other attributes in the dataset.

  • Lesalgorithmes de segmentation répartissent les données dans des groupes (ou clusters) d’éléments possédant des propriétés similaires.Segmentation algorithms divide data into groups, or clusters, of items that have similar properties.

  • Lesalgorithmes d’association recherchent des corrélations entre différents attributs d’un jeu de données.Association algorithms find correlations between different attributes in a dataset. L'application la plus courante de ce genre d'algorithme concerne la création de règles d'association, utilisables dans une analyse de panier d'achat.The most common application of this kind of algorithm is for creating association rules, which can be used in a market basket analysis.

  • Lesalgorithmes d’analyse de séquence synthétisent les séquences ou épisodes fréquents dans des données, comme une série de clics dans un site web ou une série de d’événements de journaux précédant la maintenance d’une machine.Sequence analysis algorithms summarize frequent sequences or episodes in data, such as a series of clicks in a web site, or a series of log events preceding machine maintenance.

    Toutefois, il n'y a aucune raison pour laquelle vous devriez être limité à un algorithme dans vos solutions.However, there is no reason that you should be limited to one algorithm in your solutions. Les analystes expérimentés utilisent parfois un algorithme pour déterminer les entrées les plus efficaces (autrement dit, les variables), puis appliquent un algorithme différent pour prédire un résultat spécifique en fonction de ces données.Experienced analysts will sometimes use one algorithm to determine the most effective inputs (that is, variables), and then apply a different algorithm to predict a specific outcome based on that data. SQL ServerSQL Server L’exploration de données vous permet de générer plusieurs modèles sur une structure d’exploration de données unique ; ainsi, avec une seule solution d’exploration de données, vous pouvez utiliser un algorithme de clustering, un modèle d’arbres de décision et un modèle Naïve Bayes pour obtenir des vues différentes de vos données. Data Mining lets you build multiple models on a single mining structure, so within a single data mining solution you could use a clustering algorithm, a decision trees model, and a Naïve Bayes model to get different views on your data. Vous pouvez également utiliser plusieurs algorithmes dans une seule solution pour effectuer des tâches distinctes : par exemple, vous pouvez utiliser la régression pour obtenir des prévisions financières et un algorithme de réseau neuronal pour effectuer une analyse des facteurs qui influencent les prévisions.You might also use multiple algorithms within a single solution to perform separate tasks: for example, you could use regression to obtain financial forecasts, and use a neural network algorithm to perform an analysis of factors that influence forecasts.

Choix d'un algorithme par tâcheChoosing an Algorithm by Task

Pour vous aider à sélectionner un algorithme en vue d'une utilisation avec une tâche spécifique, le tableau suivant fournit des suggestions pour les types de tâches pour lesquelles chaque algorithme est traditionnellement utilisé.To help you select an algorithm for use with a specific task, the following table provides suggestions for the types of tasks for which each algorithm is traditionally used.

Exemples de tâchesExamples of tasks Algorithmes Microsoft à utiliserMicrosoft algorithms to use
Prédiction d’un attribut discret :Predicting a discrete attribute:

Signaler les clients dans une liste de prospects comme intéressants ou inintéressants.Flag the customers in a prospective buyers list as good or poor prospects.

Calculer la probabilité qu'un serveur échoue dans les 6 mois suivants.Calculate the probability that a server will fail within the next 6 months.

Classer les résultats des patients et explorer les facteurs connexes.Categorize patient outcomes and explore related factors.
Algorithme MDT (Microsoft Decision Trees)Microsoft Decision Trees Algorithm

Algorithme MNB (Microsoft Naive Bayes)Microsoft Naive Bayes Algorithm

Algorithme de gestion de clusters MicrosoftMicrosoft Clustering Algorithm

Algorithme MNN (Microsoft Neural Network)Microsoft Neural Network Algorithm
Prédiction d’un attribut continu :Predicting a continuous attribute:

Prévoir les ventes de l'année suivante.Forecast next year's sales.

Prédire les visiteurs du site compte tendu des tendances historiques et saisonnières passées.Predict site visitors given past historical and seasonal trends.

Générer un score de risque en fonction de données démographiques.Generate a risk score given demographics.
Algorithme MDT (Microsoft Decision Trees)Microsoft Decision Trees Algorithm

Algorithme MTS (Microsoft Time Series)Microsoft Time Series Algorithm

Algorithme MLR (Microsoft Linear Regression)Microsoft Linear Regression Algorithm
Prédiction d’une séquence :Predicting a sequence:

Effectuer une analyse des parcours de visite du site Web d'une société.Perform clickstream analysis of a company's Web site.

Analyser les facteurs conduisant à la défaillance d'un serveur.Analyze the factors leading to server failure.

Capturer et analyser les séquences d'activités pendant les visites de patients, afin de formuler les meilleures pratiques autour des activités courantes.Capture and analyze sequences of activities during outpatient visits, to formulate best practices around common activities.
Algorithme MSC (Microsoft Sequence Clustering)Microsoft Sequence Clustering Algorithm
Recherche de groupes d’éléments communs dans des transactions :Finding groups of common items in transactions:

Utiliser l'analyse du panier d'achat pour déterminer le placement d'un produit.Use market basket analysis to determine product placement.

Suggérer des produits supplémentaires à acheter par un client.Suggest additional products to a customer for purchase.

Analyser les données d'enquête de participants à un événement afin de rechercher les activités qui ont été mises en corrélation, pour planifier de futures activités.Analyze survey data from visitors to an event, to find which activities or booths were correlated, to plan future activities.
Algorithme Microsoft AssociationMicrosoft Association Algorithm

Algorithme MDT (Microsoft Decision Trees)Microsoft Decision Trees Algorithm
Recherche de groupes d’éléments similaires :Finding groups of similar items:

Créer des groupes de patients avec profils à risque basés sur des attributs tels que des données démographiques et des comportements.Create patient risk profiles groups based on attributes such as demographics and behaviors.

Analyser les utilisateurs par consultation des habitudes d'achat.Analyze users by browsing and buying patterns.

Identifier les serveurs qui ont des caractéristiques d'utilisation similaires.Identify servers that have similar usage characteristics.
Algorithme de gestion de clusters MicrosoftMicrosoft Clustering Algorithm

Algorithme MSC (Microsoft Sequence Clustering)Microsoft Sequence Clustering Algorithm

Le tableau suivant fournit des liens vers des ressources d’apprentissage pour chacun des algorithmes d’exploration de données fournis dans SQL ServerSQL Server :The following table provides links to learning resources for each of the data mining algorithms that are provided in SQL ServerSQL Server Data Mining:

Description de l'algorithme de baseBasic algorithm description Explique le rôle de l'algorithme et son fonctionnement, et présente les scénarios d'entreprise possibles dans lesquels l'algorithme peut être utile.Explains what the algorithm does and how it works, and outlines possible business scenarios where the algorithm might be useful.
Algorithme Microsoft AssociationMicrosoft Association Algorithm

Algorithme de gestion de clusters MicrosoftMicrosoft Clustering Algorithm

Algorithme MDT (Microsoft Decision Trees)Microsoft Decision Trees Algorithm

Algorithme MLR (Microsoft Linear Regression)Microsoft Linear Regression Algorithm

Algorithme MLR (Microsoft Logistic Regression)Microsoft Logistic Regression Algorithm

Algorithme MNB (Microsoft Naive Bayes)Microsoft Naive Bayes Algorithm

Algorithme MNN (Microsoft Neural Network)Microsoft Neural Network Algorithm

Algorithme MSC (Microsoft Sequence Clustering)Microsoft Sequence Clustering Algorithm

Algorithme MTS (Microsoft Time Series)Microsoft Time Series Algorithm
Références techniquesTechnical reference Fournit des informations techniques sur l'implémentation de l'algorithme, à l'aide de références universitaires selon les besoins.Provides technical detail about the implementation of the algorithm, with academic references as necessary. Dresse la liste des paramètres que vous pouvez configurer pour contrôler le comportement de l'algorithme et personnaliser les résultats dans le modèle.Lists the parameters that you can set to control the behavior of the algorithm and customize the results in the model. Décrit les spécifications de données et fournit des conseils en matière de performances, si possible.Describes data requirements and provides performance tips if possible.
Informations techniques de référence sur l’algorithme Microsoft AssociationMicrosoft Association Algorithm Technical Reference

Références techniques relatives à l'algorithme de gestion de clusters MicrosoftMicrosoft Clustering Algorithm Technical Reference

Informations techniques de référence sur l’algorithme MDT (Microsoft Decision Trees)Microsoft Decision Trees Algorithm Technical Reference

Références techniques relatives à l'algorithme MLR (Microsoft Linear Regression)Microsoft Linear Regression Algorithm Technical Reference

Informations techniques de référence sur l’algorithme Microsoft Logistic RegressionMicrosoft Logistic Regression Algorithm Technical Reference

Informations techniques de référence sur l’algorithme MNB (Microsoft Naive Bayes)Microsoft Naive Bayes Algorithm Technical Reference

Informations techniques de référence sur l’algorithme MNN (Microsoft Neural Network)Microsoft Neural Network Algorithm Technical Reference

Informations techniques de référence sur l’algorithme MSC (Microsoft Sequence Clustering)Microsoft Sequence Clustering Algorithm Technical Reference

Informations techniques de référence sur l’algorithme MTS (Microsoft Time Series)Microsoft Time Series Algorithm Technical Reference
Contenu de modèleModel content Explique comment les informations sont structurées dans chaque type de modèle d'exploration de données et indique comment interpréter les informations stockées dans chacun des nœuds.Explains how information is structured within each type of data mining model, and explains how to interpret the information stored in each of the nodes.
Contenu du modèle d’exploration de données pour les modèles d’association (Analysis Services - Exploration de données)Mining Model Content for Association Models (Analysis Services - Data Mining)

Contenu du modèle d’exploration de données pour les modèles de clustering (Analysis Services - Exploration de données)Mining Model Content for Clustering Models (Analysis Services - Data Mining)

Contenu du modèle d’exploration de données pour les modèles d’arbre de décision (Analysis Services - Exploration de données)Mining Model Content for Decision Tree Models (Analysis Services - Data Mining)

Contenu du modèle d’exploration de données pour les modèles de régression linéaire (Analysis Services - Exploration de données)Mining Model Content for Linear Regression Models (Analysis Services - Data Mining)

Contenu du modèle d’exploration de données pour les modèles de régression logistique (Analysis Services - Exploration de données)Mining Model Content for Logistic Regression Models (Analysis Services - Data Mining)

Contenu du modèle d’exploration de données pour les modèles Naive Bayes (Analysis Services - Exploration de données)Mining Model Content for Naive Bayes Models (Analysis Services - Data Mining)

Contenu du modèle d’exploration de données pour les modèles de réseau neuronal (Analysis Services - Exploration de données)Mining Model Content for Neural Network Models (Analysis Services - Data Mining)

Contenu du modèle d’exploration de données pour les modèles Sequence Clustering (Analysis Services - Exploration de données)Mining Model Content for Sequence Clustering Models (Analysis Services - Data Mining)

Contenu du modèle d’exploration de données pour les modèles de séries chronologiques (Analysis Services - Exploration de données)Mining Model Content for Time Series Models (Analysis Services - Data Mining)
Requêtes d’exploration de donnéesData mining queries Fournit plusieurs requêtes que vous pouvez utiliser avec chaque type de modèle.Provides multiple queries that you can use with each model type. Les exemples incluent des requêtes de contenu qui vous permettent d'en savoir plus sur les schémas du modèle, ainsi que des requêtes de prédiction pour vous aider à établir des prédictions en fonction de ces schémas.Examples include content queries that let you learn more about the patterns in the model, and prediction queries to help you build predictions based on those patterns.
Exemples de requêtes de modèle d’associationAssociation Model Query Examples

Exemples de requêtes de modèle de clusteringClustering Model Query Examples

Exemples de requêtes de modèle d’arbre de décisionDecision Trees Model Query Examples

Exemples de requête de modèle de régression linéaireLinear Regression Model Query Examples

Exemples de requêtes de modèle de régression logistiqueLogistic Regression Model Query Examples

Naive Bayes Model Query ExamplesNaive Bayes Model Query Examples

Neural Network Model Query ExamplesNeural Network Model Query Examples

Exemples de requêtes de modèle Sequence ClusteringSequence Clustering Model Query Examples

Time Series Model Query ExamplesTime Series Model Query Examples
RubriqueTopic DescriptionDescription
Déterminer l'algorithme utilisé par un modèle d'exploration de donnéesDetermine the algorithm used by a data mining model Interroger les paramètres utilisés pour créer un modèle d’exploration de donnéesQuery the Parameters Used to Create a Mining Model
Créer un algorithme de plug-in personnaliséCreate a Custom Plug-In Algorithm Algorithmes de plug-inPlugin Algorithms
Explorer un modèle à l'aide d'une visionneuse d'algorithmeExplore a model using an algorithm-specific viewer Visionneuses de modèle d’exploration de donnéesData Mining Model Viewers
Afficher le contenu d'un modèle à l'aide d'un format tabulaire génériqueView the content of a model using a generic table format Explorer un modèle à l'aide de la visionneuse de l'arborescence de contenu générique MicrosoftBrowse a Model Using the Microsoft Generic Content Tree Viewer
En savoir plus sur la configuration de vos données et l'utilisation d'algorithmes pour créer des modèlesLearn about how to set up your data and use algorithms to create models Structures d’exploration de données (Analysis Services - Exploration de données)Mining Structures (Analysis Services - Data Mining)

Modèles d’exploration de données (Analysis Services - Exploration de données)Mining Models (Analysis Services - Data Mining)

Voir aussiSee Also

Outils d'exploration de donnéesData Mining Tools