Algoritmi di data mining (Analysis Services - Data mining)Data Mining Algorithms (Analysis Services - Data Mining)

SI APPLICA A: sìSQL Server Analysis Services noAzure Analysis Services noPower BI PremiumAPPLIES TO: yesSQL Server Analysis Services noAzure Analysis Services noPower BI Premium

Un algoritmo in data mining (o Machine Learning) è un set di approcci euristici e calcoli che consente di creare un modello dai dati.An algorithm in data mining (or machine learning) is a set of heuristics and calculations that creates a model from data. Per creare un modello, tramite l'algoritmo vengono innanzitutto analizzati i dati forniti, ricercando tipi specifici di modelli o tendenze.To create a model, the algorithm first analyzes the data you provide, looking for specific types of patterns or trends. I risultati dell'analisi vengono usati dall'algoritmo su più interazioni per definire i parametri ottimali per la creazione del modello di data mining.The algorithm uses the results of this analysis over many iterations to find the optimal parameters for creating the mining model. Questi parametri vengono quindi applicati all'intero set di dati per estrarre modelli utilizzabili e statistiche dettagliate.These parameters are then applied across the entire data set to extract actionable patterns and detailed statistics.

Il modello di data mining creato da un algoritmo con i dati in uso può avere forme diverse, tra cui:The mining model that an algorithm creates from your data can take various forms, including:

  • Set di cluster con cui viene descritto in che modo i case di un set di dati sono correlati.A set of clusters that describe how the cases in a dataset are related.

  • Albero delle decisioni per la stima di un risultato e per la descrizione della modalità con cui criteri diversi possono incidere su tale risultato.A decision tree that predicts an outcome, and describes how different criteria affect that outcome.

  • Modello matematico per la previsione delle vendite.A mathematical model that forecasts sales.

  • Set di regole mediante le quali viene descritto in che modo i prodotti vengono raggruppati in una transazione e le probabilità con cui tali prodotti vengano acquistati insieme.A set of rules that describe how products are grouped together in a transaction, and the probabilities that products are purchased together.

Gli algoritmi disponibili in Data mining di SQL ServerSQL Server sono i metodi più diffusi e consolidati per la derivazione dei modelli dai dati.The algorithms provided in SQL ServerSQL Server Data Mining are the most popular, well-researched methods of deriving patterns from data. A titolo di esempio, il clustering K-Means è uno degli algoritmi di clustering meno recenti ed è ampiamente disponibile in molti strumenti diversi e con molte implementazioni e opzioni diverse.To take one example, K-means clustering is one of the oldest clustering algorithms and is available widely in many different tools and with many different implementations and options. Tuttavia, l'implementazione specifica del clustering K-Means usata in Data mining di SQL ServerSQL Server è stata sviluppata da Microsoft Research e quindi ottimizzata per le prestazioni con Analysis ServicesAnalysis Services.However, the particular implementation of K-means clustering used in SQL ServerSQL Server Data Mining was developed by Microsoft Research and then optimized for performance with Analysis ServicesAnalysis Services. Tutti gli algoritmi di data mining di Microsoft possono essere ampiamente personalizzati e sono completamente programmabili tramite le API fornite.All of the Microsoft data mining algorithms can be extensively customized and are fully programmable, using the provided APIs. È inoltre possibile automatizzare la creazione, la formazione e la ripetizione del training dei modelli usando i componenti di data mining in Integration ServicesIntegration Services.You can also automate the creation, training, and retraining of models by using the data mining components in Integration ServicesIntegration Services.

È possibile usare inoltre algoritmi di terze parti che siano conformi alla specifica OLE DB per il data mining o che consentano lo sviluppo di algoritmi personalizzati registrabili come servizi, quindi usati all'interno del framework Data mining di SQL ServerSQL Server .You can also use third-party algorithms that comply with the OLE DB for Data Mining specification, or develop custom algorithms that can be registered as services and then used within the SQL ServerSQL Server Data Mining framework.

Scelta dell'algoritmo correttoChoosing the Right Algorithm

La scelta dell'algoritmo più appropriato da utilizzare per un'attività analitica specifica può rivelarsi complessa.Choosing the best algorithm to use for a specific analytical task can be a challenge. Sebbene sia possibile utilizzare algoritmi diversi per eseguire la stessa attività aziendale, ogni algoritmo produce un risultato diverso e alcuni algoritmi possono produrre più di un tipo di risultato.While you can use different algorithms to perform the same business task, each algorithm produces a different result, and some algorithms can produce more than one type of result. È ad esempio possibile usare l'algoritmo MicrosoftMicrosoft Decision Trees non solo per le stime ma anche per ridurre il numero di colonne in un set di dati, in quanto l'albero delle decisioni può consentire di identificare colonne che non hanno effetto sul modello di data mining finale.For example, you can use the MicrosoftMicrosoft Decision Trees algorithm not only for prediction, but also as a way to reduce the number of columns in a dataset, because the decision tree can identify columns that do not affect the final mining model.

Scelta di un algoritmo in base al tipoChoosing an Algorithm by Type

SQL ServerSQL Server - Data mining di SQL Server include i tipi di algoritmi seguenti:Data Mining includes the following algorithm types:

  • Algoritmi di classificazione che consentono di stimare una o più variabili discrete, in base agli altri attributi del set di dati.Classification algorithms predict one or more discrete variables, based on the other attributes in the dataset.

  • Algoritmi di regressione che consentono di stimare una o più variabili continue, ad esempio profitto o perdita, in base ad altri attributi del set di dati.Regression algorithms predict one or more continuous numeric variables, such as profit or loss, based on other attributes in the dataset.

  • Algoritmi di segmentazione che consentono di dividere i dati in gruppi, o cluster, di elementi con proprietà simili.Segmentation algorithms divide data into groups, or clusters, of items that have similar properties.

  • Algoritmi di associazione che consentono di trovare le correlazioni tra attributi diversi in un set di dati.Association algorithms find correlations between different attributes in a dataset. L'applicazione più comune di questo tipo di algoritmo è costituita dall'utilizzo per la creazione di regole di associazione, che è possibile utilizzare in Market basket analysis.The most common application of this kind of algorithm is for creating association rules, which can be used in a market basket analysis.

  • Algoritmi di analisi delle sequenze che consentono di riepilogare sequenze o episodi frequenti nei dati, ad esempio una serie di clic in un sito Web o una serie di eventi di log che precedono la manutenzione del computer.Sequence analysis algorithms summarize frequent sequences or episodes in data, such as a series of clicks in a web site, or a series of log events preceding machine maintenance.

Tuttavia, non esiste alcun motivo per cui sia necessario limitarsi all'utilizzo di un solo algoritmo nelle soluzioni.However, there is no reason that you should be limited to one algorithm in your solutions. Analisti esperti utilizzeranno qualche volta un algoritmo per determinare gli input più efficaci, ovvero variabili, quindi applicheranno un algoritmo diverso per stimare un risultato specifico in base a tali dati.Experienced analysts will sometimes use one algorithm to determine the most effective inputs (that is, variables), and then apply a different algorithm to predict a specific outcome based on that data. SQL ServerSQL Server - Data mining di SQL Server consente di compilare più modelli in una sola struttura di data mining, pertanto all'interno di una singola soluzione di data mining è possibile usare un algoritmo di clustering, un modello di alberi delle decisioni e un modello Naïve Bayes per ottenere viste diverse sui dati.Data Mining lets you build multiple models on a single mining structure, so within a single data mining solution you could use a clustering algorithm, a decision trees model, and a Naïve Bayes model to get different views on your data. È possibile usare inoltre più algoritmi in una singola soluzione per eseguire attività separate. Ad esempio, è possibile usare la regressione per ottenere previsioni finanziarie e usare un algoritmo della rete neurale per eseguire un'analisi dei fattori che incidono sulle previsioni.You might also use multiple algorithms within a single solution to perform separate tasks: for example, you could use regression to obtain financial forecasts, and use a neural network algorithm to perform an analysis of factors that influence forecasts.

Scelta di un algoritmo in base all'attivitàChoosing an Algorithm by Task

Per facilitare la selezione di un algoritmo da utilizzare con un'attività specifica, nella tabella seguente sono disponibili suggerimenti sui tipi di attività per cui ciascun algoritmo viene utilizzato in modo tradizionale.To help you select an algorithm for use with a specific task, the following table provides suggestions for the types of tasks for which each algorithm is traditionally used.

Esempi di attivitàExamples of tasks Algoritmo Microsoft da utilizzareMicrosoft algorithms to use
Stima di un attributo discreto:Predicting a discrete attribute:

Contrassegnare i clienti in un elenco di potenziali acquirenti come buone o scarse possibilità.Flag the customers in a prospective buyers list as good or poor prospects.

Calcolare la probabilità di un errore del server entro i prossimi sei mesi.Calculate the probability that a server will fail within the next 6 months.

Suddividere in categorie i risultati dei pazienti ed esplorare i fattori correlati.Categorize patient outcomes and explore related factors.
Algoritmo Microsoft Decision TreesMicrosoft Decision Trees Algorithm

Algoritmo Microsoft Naive BayesMicrosoft Naive Bayes Algorithm

Algoritmo Microsoft ClusteringMicrosoft Clustering Algorithm

Algoritmo Microsoft Neural NetworkMicrosoft Neural Network Algorithm
Stima di un attributo continuo:Predicting a continuous attribute:

Prevedere le vendite del prossimo anno.Forecast next year's sales.

Stimare i visitatori del sito in base a tendenze storiche passate e stagionali.Predict site visitors given past historical and seasonal trends.

Generare un punteggio di rischio in base ai dati demografici.Generate a risk score given demographics.
Algoritmo Microsoft Decision TreesMicrosoft Decision Trees Algorithm

Algoritmo Microsoft Time SeriesMicrosoft Time Series Algorithm

Algoritmo Microsoft Linear RegressionMicrosoft Linear Regression Algorithm
Stima di una sequenza:Predicting a sequence:

Eseguire un'analisi clickstream del sito Web di una società.Perform clickstream analysis of a company's Web site.

Analizzare i fattori che portano a un errore del server.Analyze the factors leading to server failure.

Acquisire e analizzare sequenze di attività durante le visite dei pazienti in uscita, per formulare le procedure consigliate circa le attività comuni.Capture and analyze sequences of activities during outpatient visits, to formulate best practices around common activities.
Microsoft Sequence Clustering AlgorithmMicrosoft Sequence Clustering Algorithm
Ricerca di gruppi di elementi comuni nelle transazioni:Finding groups of common items in transactions:

Utilizzare Market basket analysis per determinare la posizione del prodotto.Use market basket analysis to determine product placement.

Suggerire prodotti aggiuntivi a un cliente per l'acquisto.Suggest additional products to a customer for purchase.

Analizzare i dati dei sondaggi provenienti dai visitatori a un evento, per scoprire quali attività o stand fossero correlati, per pianificare le attività future.Analyze survey data from visitors to an event, to find which activities or booths were correlated, to plan future activities.
Algoritmo Microsoft Association RulesMicrosoft Association Algorithm

Algoritmo Microsoft Decision TreesMicrosoft Decision Trees Algorithm
Ricerca di gruppi di elementi simili:Finding groups of similar items:

Creare gruppi di profili di rischi dei pazienti in base ad attributi quali i dati demografici e i comportamenti.Create patient risk profiles groups based on attributes such as demographics and behaviors.

Analizzare gli utenti esplorando e comprando modelli.Analyze users by browsing and buying patterns.

Identificare i server che dispongono di caratteristiche di utilizzo simili.Identify servers that have similar usage characteristics.
Algoritmo Microsoft ClusteringMicrosoft Clustering Algorithm

Microsoft Sequence Clustering AlgorithmMicrosoft Sequence Clustering Algorithm

La tabella seguente fornisce collegamenti a risorse didattiche per ognuno degli algoritmi di data mining disponibili in Data mining di SQL ServerSQL Server :The following table provides links to learning resources for each of the data mining algorithms that are provided in SQL ServerSQL Server Data Mining:

Descrizione dell'algoritmo di baseBasic algorithm description Vengono spiegati la funzione e il funzionamento dell'algoritmo nonché descritti i possibili scenari aziendali in cui l'algoritmo potrebbe risultare utile.Explains what the algorithm does and how it works, and outlines possible business scenarios where the algorithm might be useful.
Algoritmo Microsoft Association RulesMicrosoft Association Algorithm

Algoritmo Microsoft ClusteringMicrosoft Clustering Algorithm

Algoritmo Microsoft Decision TreesMicrosoft Decision Trees Algorithm

Algoritmo Microsoft Linear RegressionMicrosoft Linear Regression Algorithm

Algoritmo Microsoft Logistic RegressionMicrosoft Logistic Regression Algorithm

Algoritmo Microsoft Naive BayesMicrosoft Naive Bayes Algorithm

Algoritmo Microsoft Neural NetworkMicrosoft Neural Network Algorithm

Microsoft Sequence Clustering AlgorithmMicrosoft Sequence Clustering Algorithm

Algoritmo Microsoft Time SeriesMicrosoft Time Series Algorithm
Riferimento tecnicoTechnical reference Vengono forniti dettagli tecnici sull'implementazione dell'algoritmo, con riferimenti accademici, se necessario.Provides technical detail about the implementation of the algorithm, with academic references as necessary. Sono elencati i parametri che è possibile impostare per controllare il comportamento dell'algoritmo e personalizzare i risultati nel modello.Lists the parameters that you can set to control the behavior of the algorithm and customize the results in the model. Vengono descritti i requisiti dei dati e forniti suggerimenti sulle prestazioni, se possibile.Describes data requirements and provides performance tips if possible.
Riferimento tecnico per l'algoritmo Microsoft Association RulesMicrosoft Association Algorithm Technical Reference

Riferimento tecnico per l'algoritmo Microsoft ClusteringMicrosoft Clustering Algorithm Technical Reference

Riferimento tecnico per l'algoritmo Microsoft Decision TreesMicrosoft Decision Trees Algorithm Technical Reference

Riferimento tecnico per l'algoritmo Microsoft Linear RegressionMicrosoft Linear Regression Algorithm Technical Reference

Riferimento tecnico per l'algoritmo Microsoft Logistic RegressionMicrosoft Logistic Regression Algorithm Technical Reference

Riferimento tecnico per l'algoritmo Microsoft Naive BayesMicrosoft Naive Bayes Algorithm Technical Reference

Riferimento tecnico per l'algoritmo Microsoft Neural NetworkMicrosoft Neural Network Algorithm Technical Reference

Riferimento tecnico per l'algoritmo Microsoft Sequence ClusteringMicrosoft Sequence Clustering Algorithm Technical Reference

Riferimento tecnico per l'algoritmo Microsoft Time SeriesMicrosoft Time Series Algorithm Technical Reference
Contenuto del modelloModel content Viene spiegato come sono strutturate le informazioni all'interno di ciascun tipo di modello di data mining e viene illustrato come interpretare le informazioni archiviate in ognuno dei nodi.Explains how information is structured within each type of data mining model, and explains how to interpret the information stored in each of the nodes.
Contenuto dei modelli di data mining per i modelli di associazione (Analysis Services - Data mining)Mining Model Content for Association Models (Analysis Services - Data Mining)

Contenuto dei modelli di data mining per i modelli di clustering (Analysis Services - Data mining)Mining Model Content for Clustering Models (Analysis Services - Data Mining)

Contenuto dei modelli di data mining per i modelli di albero delle decisioni (Analysis Services - Data mining)Mining Model Content for Decision Tree Models (Analysis Services - Data Mining)

Contenuto dei modelli di data mining per i modelli di regressione lineare (Analysis Services - Data mining)Mining Model Content for Linear Regression Models (Analysis Services - Data Mining)

Contenuto dei modelli di data mining per i modelli di regressione logistica (Analysis Services - Data mining)Mining Model Content for Logistic Regression Models (Analysis Services - Data Mining)

Contenuto dei modelli di data mining per i modelli Naïve Bayes (Analysis Services - Data mining)Mining Model Content for Naive Bayes Models (Analysis Services - Data Mining)

Contenuto dei modelli di data mining per i modelli di rete neurale (Analysis Services - Data mining)Mining Model Content for Neural Network Models (Analysis Services - Data Mining)

Contenuto dei modelli di data mining per i modelli Sequence Clustering (Analysis Services - Data Mining)Mining Model Content for Sequence Clustering Models (Analysis Services - Data Mining)

Contenuto dei modelli di data mining per i modelli Time Series (Analysis Services - Data mining)Mining Model Content for Time Series Models (Analysis Services - Data Mining)
Query di data miningData mining queries Vengono fornite più query che è possibile utilizzare con ogni tipo di modello.Provides multiple queries that you can use with each model type. Negli esempi sono incluse query contenuto che consentono di acquisire informazioni sui modelli nel modello e query di stima per facilitare la compilazione di stime in base a tali modelli.Examples include content queries that let you learn more about the patterns in the model, and prediction queries to help you build predictions based on those patterns.
Esempi di query sul modello di associazioneAssociation Model Query Examples

Esempi di query sul modello di clusteringClustering Model Query Examples

Esempi di query sul modello di alberi delle decisioniDecision Trees Model Query Examples

Esempi di query sul modello di regressione lineareLinear Regression Model Query Examples

Esempi di query sul modello di regressione logisticaLogistic Regression Model Query Examples

Esempi di query sul modello Naive BayesNaive Bayes Model Query Examples

Neural Network Model Query ExamplesNeural Network Model Query Examples

Esempi di query su modelli Sequence ClusteringSequence Clustering Model Query Examples

Time Series Model Query ExamplesTime Series Model Query Examples
ArgomentoTopic DescrizioneDescription
Determinare l'algoritmo utilizzato da un modello di data miningDetermine the algorithm used by a data mining model Eseguire query sui parametri usati per creare un modello di data miningQuery the Parameters Used to Create a Mining Model
Creare un algoritmo plug-in personalizzatoCreate a Custom Plug-In Algorithm Algoritmi plug-inPlugin Algorithms
Esplorare un modello utilizzando un visualizzatore specifico dell'algoritmoExplore a model using an algorithm-specific viewer Visualizzatori modello di data miningData Mining Model Viewers
Visualizzare il contenuto di un modello utilizzando un formato di tabella genericoView the content of a model using a generic table format Visualizzare un modello utilizzando Microsoft Generic Content Tree ViewerBrowse a Model Using the Microsoft Generic Content Tree Viewer
Acquisire informazioni sulla configurazione dei dati e sull'utilizzo degli algoritmi per la creazione di modelliLearn about how to set up your data and use algorithms to create models Strutture di data mining (Analysis Services - Data mining)Mining Structures (Analysis Services - Data Mining)

Modelli di data mining (Analysis Services - Data mining)Mining Models (Analysis Services - Data Mining)

Vedere ancheSee Also

Strumenti di data miningData Mining Tools