Algoritmo Microsoft Association RulesMicrosoft Association Algorithm

Si applica a: yesSQL Server Analysis Services alcunAzure Analysis ServicesAPPLIES TO: yesSQL Server Analysis Services noAzure Analysis Services

L'algoritmo MicrosoftMicrosoft Association Rules è un algoritmo di associazione spesso usato per i motori dei suggerimenti.The MicrosoftMicrosoft Association algorithm is an algorithm that is often used for recommendation engines. Un motore dei suggerimenti consiglia articoli ai clienti in base agli articoli che hanno già acquistato o a cui sono interessati.A recommendation engine recommends items to customers based on items they have already bought, or in which they have indicated an interest. L'algoritmo MicrosoftMicrosoft Association Rules è utile anche per analisi di mercato sugli acquisti.The MicrosoftMicrosoft Association algorithm is also useful for market basket analysis.

I modelli di associazione vengono compilati in base a set di dati che includono sia gli indicatori dei singoli case che gli indicatori degli elementi contenuti nei case.Association models are built on datasets that contain identifiers both for individual cases and for the items that the cases contain. Un gruppo di elementi in un case viene chiamato set di elementi.A group of items in a case is called an itemset. Un modello di associazione è costituito da una serie di set di elementi e di regole che descrivono la modalità di raggruppamento di tali elementi all'interno dei case.An association model consists of a series of itemsets and the rules that describe how those items are grouped together within the cases. È possibile utilizzare le regole identificate dall'algoritmo per stimare i probabili acquisti futuri di un cliente, in base agli elementi già esistenti nel relativo carrello acquisti.The rules that the algorithm identifies can be used to predict a customer's likely future purchases, based on the items that already exist in the customer's shopping cart. Nel diagramma seguente viene illustrata una serie di regole all'interno di un set di elementi.The following diagram shows a series of rules in an itemset.

Un set di regole per un modello di associazioneA set of rules for an association model

Come illustrato nel diagramma, l'algoritmo MicrosoftMicrosoft Association Rules può individuare potenzialmente un numero elevato di regole all'interno di un set di dati.As the diagram illustrates, the MicrosoftMicrosoft Association algorithm can potentially find many rules within a dataset. L'algoritmo utilizza due parametri, uno di supporto e l'altro di probabilità, per descrivere i set di elementi e le regole generati.The algorithm uses two parameters, support and probability, to describe the itemsets and rules that it generates. Se ad esempio X e Y rappresentano due elementi contenuti in un carrello acquisti, il parametro di supporto è il numero di case del set di dati che contengono la combinazione di elementi X e Y. Se il parametro di supporto viene usato insieme ai parametri definiti dall'utente, MINIMUM_SUPPORT e MAXIMUM_SUPPORT, , l'algoritmo controlla il numero di set di elementi generati.For example, if X and Y represent two items that could be in a shopping cart, the support parameter is the number of cases in the dataset that contain the combination of items, X and Y. By using the support parameter in combination with the user-defined parameters, MINIMUM_SUPPORT and MAXIMUM_SUPPORT, the algorithm controls the number of itemsets that are generated. Il parametro di probabilità, definito anche confidenza, rappresenta la frazione di case del set di dati che contengono sia l'elemento X che l'elemento Y. Se il parametro di probabilità viene usato insieme al parametro MINIMUM_PROBABILITY , l'algoritmo controlla il numero di regole generate.The probability parameter, also named confidence, represents the fraction of cases in the dataset that contain X and that also contain Y. By using the probability parameter in combination with the MINIMUM_PROBABILITY parameter, the algorithm controls the number of rules that are generated.

EsempioExample

L'azienda Adventure WorksAdventure Works Cycle intende riprogettare la funzionalità del relativo sito Web.The Adventure WorksAdventure Works Cycle company is redesigning the functionality of its Web site. L'obiettivo della riprogettazione è aumentare le vendite effettive dei prodotti.The goal of the redesign is to increase sell-through of products. Poiché l'azienda registra ogni vendita in un database transazionale, è possibile usare l'algoritmo MicrosoftMicrosoft Association Rules per identificare i set di prodotti che tendono ad essere acquistati insieme.Because the company records each sale in a transactional database, they can use the MicrosoftMicrosoft Association algorithm to identify sets of products that tend to be purchased together. In seguito, è possibile stimare elementi aggiuntivi a cui può essere interessato un cliente, in base agli elementi già esistenti nel relativo carrello acquisti.They can then predict additional items that a customer might be interested in, based on items that are already in the customer's shopping basket.

Funzionamento dell'algoritmoHow the Algorithm Works

L'algoritmo MicrosoftMicrosoft Association Rules attraversa un set di dati per trovare elementi che ricorrono insieme in un case.The MicrosoftMicrosoft Association algorithm traverses a dataset to find items that appear together in a case. Successivamente, l'algoritmo raggruppa in set gli elementi associati che ricorrono almeno nel numero di case specificati dal parametro MINIMUM_SUPPORT .The algorithm then groups into itemsets any associated items that appear, at a minimum, in the number of cases that are specified by the MINIMUM_SUPPORT parameter. Un set di elementi, ad esempio, potrebbe essere "Mountain 200=Existing, Sport 100=Existing", con un valore di supporto pari a 710.For example, an itemset could be "Mountain 200=Existing, Sport 100=Existing", and could have a support of 710. L'algoritmo genera quindi le regole dai set di elementi.The algorithm then generates rules from the itemsets. Tali regole vengono utilizzate per stimare la presenza di un elemento nel database, in base alla presenza di altri elementi specifici che l'algoritmo identifica come importanti.These rules are used to predict the presence of an item in the database, based on the presence of other specific items that the algorithm identifies as important. Ad esempio, una regola potrebbe essere "if Touring 1000=existing and Road bottle cage=existing, then Water bottle=existing", con un valore di probabilità pari a 0,812.For example, a rule could be "if Touring 1000=existing and Road bottle cage=existing, then Water bottle=existing", and could have a probability of 0.812. In questo esempio, in base alla presenza di pneumatici Touring 1000 e del contenitore per bottiglie di acqua nel carrello acquisti, l'algoritmo stima che tale carrello contiene probabilmente anche una bottiglia di acqua.In this example, the algorithm identifies that the presence in the basket of the Touring 1000 tire and the water bottle cage predicts that a water bottle would also likely be in the basket.

Per una spiegazione più dettagliata dell'algoritmo, insieme a un elenco di parametri per la personalizzazione del comportamento dell'algoritmo e il controllo dei risultati nel modello di data mining, vedere Riferimento tecnico per l'algoritmo Microsoft Association Rules.For a more detailed explanation of the algorithm, together with a list of parameters for customizing the behavior of the algorithm and controlling the results in the mining model, see Microsoft Association Algorithm Technical Reference.

Dati richiesti per i modelli di associazioneData Required for Association Models

Quando si preparano i dati da utilizzare in un modello Association Rules, verificare che siano chiari i requisiti per l'algoritmo specifico, tra cui la quantità di dati necessari e la modalità di utilizzo dei dati.When you prepare data for use in an association rules model, you should understand the requirements for the particular algorithm, including how much data is needed, and how the data is used.

I requisiti per un modello Association Rules sono i seguenti:The requirements for an association rules model are as follows:

  • Una colonna a chiave singola Ogni modello deve contenere una colonna numerica o di testo che identifichi in modo univoco ogni record.A single key column Each model must contain one numeric or text column that uniquely identifies each record. Le chiavi composte non sono consentite.compound keys not permitted.

  • Una singola colonna stimabile Un modello di associazione può includere un'unica colonna stimabile.A single predictable column An association model can have only one predictable column. In genere si tratta della colonna chiave della tabella nidificata, ad esempio il campo in cui sono elencati i prodotti acquistati.Typically it is the key column of the nested table, such as the filed that lists the products that were purchased. I valori devono essere discreti o discretizzati.The values must be discrete or discretized.

  • Colonne di input .Input columns . Le colonne di input devono essere discrete.The input columns must be discrete. Spesso, i dati di input per il modello di associazione sono contenuti in due tabelle.The input data for an association model often is contained in two tables. Ad esempio, una tabella può contenere informazioni sui clienti mentre l'altra può contenere informazioni sugli acquisti dei clienti.For example, one table might contain customer information while another table contains customer purchases. È possibile inserire tali dati nel modello tramite una tabella nidificata.You can input this data into the model by using a nested table. Per altre informazioni sulle tabelle annidate, vedere Tabelle annidate (Analysis Services - Data mining).For more information about nested tables, see Nested Tables (Analysis Services - Data Mining).

    Per informazioni più dettagliate sui tipi di contenuto e i tipi di dati supportati per i modelli di associazione, vedere la sezione Requisiti di Riferimento tecnico per l'algoritmo Microsoft Association Rules.For more detailed information about the content types and data types supported for association models, see the Requirements section of Microsoft Association Algorithm Technical Reference.

Visualizzazione di un modello di associazioneViewing an Association Model

Per esplorare il modello, è possibile usare il Visualizzatore Microsoft Association Rules.To explore the model, you can use the Microsoft Association Viewer. Quando si visualizza un modello di associazione, in Analysis ServicesAnalysis Services vengono presentate le correlazioni da diverse angolazioni, in modo che sia possibile identificare più facilmente le relazioni e le regole individuate nei dati.When you view an association model, Analysis ServicesAnalysis Services presents the correlations from different angles so that you can better understand the relationships and rules that were found in the data. Il riquadro Set di elementi del visualizzatore fornisce una suddivisione dettagliata delle combinazioni più comuni, ovvero set di elementi.The Itemset pane in the viewer provides a detailed breakdown of the most common combinations, or itemsets. Il riquadro Regole presenta un elenco di regole generalizzate dai dati e consente di aggiungere calcoli di probabilità, nonché di classificare le regole in base all'importanza relativa.The Rules pane presents a list of rules that have been generalized from the data, adds calculations of probability, and ranks the rules by relative importance. Il visualizzatore di reti di dipendenza consente di esplorare visivamente le connessioni tra elementi diversi.the dependency network viewer lets you visually explore how individual different items are connected. Per altre informazioni, vedere Visualizzare un modello usando il Visualizzatore Microsoft Clustering.For more information, see Browse a Model Using the Microsoft Cluster Viewer.

Per altri dettagli sui set di elementi e le regole, è possibile esplorare il modello in Microsoft Generic Content Tree Viewer.If you want to find out more detail about any of the itemsets and rules, you can browse the model in the Microsoft Generic Content Tree Viewer. Il contenuto archiviato per il modello include il supporto per ogni set di elementi, un punteggio per ogni regola e altre statistiche.The content stored for the model includes the support for each itemset, a score for each rule, and other statistics. Per altre informazioni, vedere Mining Model Content for Association Models (Analysis Services - Data Mining).For more information, see Mining Model Content for Association Models (Analysis Services - Data Mining).

Creazione di stimeCreating Predictions

Dopo l'elaborazione del modello, è possibile utilizzare le regole e i set di elementi per eseguire stime.After the model has been processed, you can use the rules and itemsets to make predictions. In un modello di associazione una stima indica quale elemento è probabile che si verifichi data la presenza dell'elemento specificato. La stima può includere informazioni come la probabilità, il supporto o la priorità.In an association model, a prediction tells you what item is likely to occur given the presence of the specified item, and the prediction can include such information as the probability, the support, or the importance. Per alcuni esempi su come creare query su un modello di associazione, vedere Esempi di query sul modello di associazione.For examples of how to create queries against an association model, see Association Model Query Examples.

Per informazioni generali sulla creazione di query su un modello di data mining, vedere Query di data mining.For general information about how to create a query against a data mining model, see Data Mining Queries.

restazioniPerformance

Il processo di creazione di set di elementi e di conteggio delle correlazioni può richiedere tempi lunghi.The process of creating itemsets and counting correlations can be time-consuming. Anche se l'algoritmo MicrosoftMicrosoft Association Rules usa tecniche di ottimizzazione per risparmiare spazio e velocizzare l'elaborazione, tenere presente che in condizioni analoghe alle seguenti possono verificarsi problemi di prestazioni:Although the MicrosoftMicrosoft Association Rules algorithm uses optimization techniques to save space and make processing faster, you should know that performance issues can occur under conditions such as the following:

  • Il set di dati è di grandi dimensioni con molti singoli elementi.Data set is large with many individual items.

  • La dimensione minima del set di elementi è impostata su un valore eccessivamente basso.Minimum itemset size is set too low.

    Per ridurre i tempi di elaborazione e la complessità dei set di elementi, provare a raggruppare gli elementi correlati per categorie prima di analizzare i dati.To minimize processing time and reduce the complexity of the itemsets, you might try grouping related items by categories before you analyze the data.

OsservazioniRemarks

  • Non supporta l'utilizzo del linguaggio PMML (Predictive Model Markup Language) per la creazione di modelli di data mining.Does not support the use of Predictive Model Markup Language (PMML) to create mining models.

  • Supporta il drill-through.Supports drillthrough.

  • Supporta l'utilizzo di modelli di data mining OLAP.Supports the use of OLAP mining models.

  • Supporta la creazione di dimensioni di data mining.Supports the creation of data mining dimensions.

Vedere ancheSee Also

Algoritmi di Data Mining & #40; Analysis Services - Data Mining & #41; Data Mining Algorithms (Analysis Services - Data Mining)
Visualizzare un modello utilizzando il visualizzatore Microsoft Association Rules Browse a Model Using the Microsoft Association Rules Viewer
Contenuto del modello di data mining per i modelli di associazione & #40; Analysis Services - Data Mining & #41; Mining Model Content for Association Models (Analysis Services - Data Mining)
Riferimento tecnico per l'algoritmo Microsoft Association Rules Microsoft Association Algorithm Technical Reference
Esempi di Query sul modello AssociationAssociation Model Query Examples