Contenuto dei modelli di data mining per i modelli di clustering (Analysis Services - Data mining)Mining Model Content for Clustering Models (Analysis Services - Data Mining)

SI APPLICA A: sìSQL Server Analysis Services noAzure Analysis Services noPower BI PremiumAPPLIES TO: yesSQL Server Analysis Services noAzure Analysis Services noPower BI Premium

In questo argomento viene descritto il contenuto dei modelli di data mining specifico per i modelli che utilizzano l'algoritmo Microsoft Clustering.This topic describes mining model content that is specific to models that use the Microsoft Clustering algorithm. Per una spiegazione generale del contenuto del modello di data mining valida per tutti i tipi di modello, vedere Mining Model Content (Analysis Services - Data Mining).For a general explanation of mining model content for all model types, see Mining Model Content (Analysis Services - Data Mining).

Informazioni sulla struttura di un modello di clusteringUnderstanding the Structure of a Clustering Model

Un modello di clustering ha una struttura semplice.A clustering model has a simple structure. Ogni modello include un singolo nodo padre che rappresenta il modello e i relativi metadati e ogni nodo padre è associato a un elenco semplice di cluster (NODE_TYPE = 5).Each model has a single parent node that represents the model and its metadata, and each parent node has a flat list of clusters (NODE_TYPE = 5). Questa organizzazione è illustrata nell'immagine seguente.This organization is shown in the following image.

struttura del contenuto del modello per il clusteringstructure of model content for clustering

Ogni nodo figlio rappresenta un singolo cluster e contiene statistiche dettagliate sugli attributi dei relativi case,Each child node represents a single cluster and contains detailed statistics about the attributes of the cases in that cluster. tra cui un conteggio del numero di case nel cluster e la distribuzione di valori che distinguono un cluster dagli altri.This includes a count of the number of cases in the cluster, and the distribution of values that distinguish the cluster from other clusters.

Nota

Non è necessario scorrere i nodi per ottenere un conteggio o una descrizione dei cluster; anche il nodo padre del modello contiene un conteggio e un elenco dei cluster.You do not need to iterate through the nodes to get a count or description of the clusters; the model parent node also counts and lists the clusters.

Il nodo padre contiene statistiche utili che descrivono la distribuzione effettiva di tutti i case di training.The parent node contains useful statistics that describe the actual distribution of all the training cases. Queste statistiche si trovano nella colonna della tabella nidificata, NODE_DISTRIBUTION.These statistics are found in the nested table column, NODE_DISTRIBUTION. Ad esempio, nella tabella seguente sono illustrate diverse righe della tabella NODE_DISTRIBUTION che descrivono la distribuzione di dati demografici dei clienti per il modello di clustering TM_Clusteringcreato nell' Esercitazione di base sul data mining:For example, the following table shows several rows from the NODE_DISTRIBUTION table that describe the distribution of customer demographics for the clustering model, TM_Clustering, that you create in the Basic Data Mining Tutorial:

ATTRIBUTE_NAMEATTRIBUTE_NAME ATTRIBUTE_VALUEATRIBUTE_VALUE SUPPORTSUPPORT PROBABILITYPROBABILITY varianceVARIANCE VALUE_TYPEVALUE_TYPE
AgeAge MissingMissing 00 00 00 1 (Mancante)1 (Missing)
AgeAge 44.901615271659344.9016152716593 1293912939 11 125.663453102554125.663453102554 3 (Continuo)3 (Continuous)
GenderGender MissingMissing 00 00 00 1 (Mancante)1 (Missing)
GenderGender FF 63506350 0.4907643558234790.490764355823479 00 4 (discreto)4 (Discrete)
GenderGender MM 65896589 0.5092356441765210.509235644176521 00 4 (discreto)4 (Discrete)

Da questi risultati emerge che sono stati utilizzati 12939 case per compilare il modello, che il rapporto tra maschi e femmine è approssimativamente 50-50 e che l'età media è 44 anni.From these results, you can see that there were 12939 cases used to build the model, that the ratio of males to females was about 50-50, and that the mean age was 44. Le statistiche descrittive variano a seconda che l'attributo riportato sia un tipo di dati numerico continuo, ad esempio l'età, o un tipo di valore discreto, ad esempio il sesso.The descriptive statistics vary depending on whether the attribute being reported is a continuous numeric data type, such as age, or a discrete value type, such as gender. Le misure statistiche media e varianza vengono calcolate per i tipi di dati continui, mentre probabilità e supporto vengono calcolate per i tipi di dati discreti.The statistical measures mean and variance are computed for continuous data types, whereas probability and support are computed for discrete data types.

Nota

La varianza rappresenta la varianza totale per il cluster.The variance represents the total variance for the cluster. Se il valore relativo alla varianza è piccolo, significa che la maggior parte dei valori della colonna sono relativamente vicini alla media.When the value for variance is small, it indicates that most values in the column were fairly close to the mean. Per ottenere la deviazione standard, calcolare la radice quadrata della varianza.To obtain the standard deviation, calculate the square root of the variance.

Si noti che per ogni attributo è presente un tipo di valore Missing che indica il numero di case in cui i dati per tale attributo sono mancanti.Note that for each of the attributes there is a Missing value type that tells you how many cases had no data for that attribute. I dati mancanti possono essere significativi e influiscono sui calcoli in vari modi, a seconda del tipo di dati.Missing data can be significant and affects calculations in different ways, depending on the data type. Per altre informazioni, vedere Valori mancanti (Analysis Services - Data mining).For more information, see Missing Values (Analysis Services - Data Mining).

Contenuto di un modello di clusteringModel Content for a Clustering Model

In questa sezione vengono forniti dettagli ed esempi relativi solo alle colonne del contenuto dei modelli di data mining pertinenti per i modelli di clustering.This section provides detail and examples only for those columns in the mining model content that are relevant for clustering models.

Per informazioni sulle colonne generiche del set di righe dello schema, ad esempio MODEL_CATALOG e MODEL_NAME, vedere Mining Model Content (Analysis Services - Data Mining).For information about the general-purpose columns in the schema rowset, such as MODEL_CATALOG and MODEL_NAME, see Mining Model Content (Analysis Services - Data Mining).

MODEL_CATALOGMODEL_CATALOG
Nome del database in cui è archiviato il modello.Name of the database where the model is stored.

MODEL_NAMEMODEL_NAME
Nome del modello.Name of the model.

ATTRIBUTE_NAMEATTRIBUTE_NAME
Sempre vuota nei modelli di clustering perché non è disponibile alcun attributo stimabile nel modello.Always blank in clustering models because there is no predictable attribute in the mode.

NODE_NAMENODE_NAME
Sempre uguale a NODE_UNIQUE_NAME.Always same as NODE_UNIQUE_NAME.

NODE_UNIQUE_NAMENODE_UNIQUE_NAME
Identificatore univoco del nodo all'interno del modello.A unique identifier for the node within the model. Questo valore non può essere modificato.This value cannot be changed.

NODE_TYPENODE_TYPE
Un modello di clustering restituisce i tipi di nodo seguenti:A clustering model outputs the following node types:

ID e nome del nodoNode ID and Name DescrizioneDescription
1 (Model)1 (Model) Nodo radice per il modello.Root node for model.
5 (Cluster)5 (Cluster) Contiene un conteggio dei case nel cluster, le caratteristiche dei case nel cluster e statistiche che descrivono i valori nel cluster.Contains a count of cases in the cluster, the characteristics of cases in the cluster, and statistics that describe the values in the cluster.

NODE_CAPTIONNODE_CAPTION
Nome descrittivo a scopo di visualizzazione.A friendly name for display purposes. Quando si crea un modello, il valore di NODE_UNIQUE_NAME viene automaticamente utilizzato come didascalia.When you create a model, the value of NODE_UNIQUE_NAME is automatically used as the caption. Tuttavia, è possibile modificare il valore di NODE_CAPTION per aggiornare il nome visualizzato per il cluster, a livello di programmazione o tramite il visualizzatore.However, you can change the value for NODE_CAPTION to update the display name for the cluster, either programmatically or by using the viewer.

Nota

Quando si rielabora il modello, tutte le modifiche dei nomi verranno sovrascritte dai nuovi valori.When you reprocess the model, all name changes will be overwritten by the new values. Non è possibile impostare come persistenti i nomi nel modello né effettuare il rilevamento delle modifiche nell'appartenenza al cluster tra versioni diverse di un modello.You cannot persist names in the model, or track changes in cluster membership between different versions of a model.

CHILDREN_CARDINALITYCHILDREN_CARDINALITY
Stima del numero di nodi figlio del nodo.An estimate of the number of children that the node has.

Nodo padre Indica il numero di cluster nel modello.Parent node Indicates the number of clusters in the model.

Nodi del cluster Sempre 0.Cluster nodes Always 0.

PARENT_UNIQUE_NAMEPARENT_UNIQUE_NAME
Nome univoco dell'elemento padre del nodo.The unique name of the node's parent.

Nodo padre Sempre NULL.Parent node Always NULL

Nodi del cluster Solitamente 000.Cluster nodes Usually 000.

NODE_DESCRIPTIONNODE_DESCRIPTION
Descrizione del nodo.A description of the node.

Nodo padre Sempre (All) .Parent node Always (All).

Nodi del cluster Elenco delimitato da virgole degli attributi principali che distinguono il cluster dagli altri.Cluster nodes A comma-separated list of the primary attributes that distinguish the cluster from other clusters.

NODE_RULENODE_RULE
Opzione non utilizzata per i modelli di clustering.Not used for clustering models.

MARGINAL_RULEMARGINAL_RULE
Opzione non utilizzata per i modelli di clustering.Not used for clustering models.

NODE_PROBABILITYNODE_PROBABILITY
Probabilità associata a questo nodo.The probability associated with this node. Nodo padre Sempre 1.Parent node Always 1.

Nodi del cluster La probabilità rappresenta la probabilità composta degli attributi, con alcuni adattamenti a seconda dell'algoritmo usato per creare il modello di clustering.Cluster nodes The probability represents the compound probability of the attributes, with some adjustments depending on the algorithm used to create the clustering model.

MARGINAL_PROBABILITYMARGINAL_PROBABILITY
Probabilità di raggiungere il nodo dal nodo padre.The probability of reaching the node from the parent node. In un modello di clustering la probabilità marginale corrisponde sempre alla probabilità del nodo.In a clustering model, the marginal probability is always the same as the node probability.

NODE_DISTRIBUTIONNODE_DISTRIBUTION
Tabella contenente l'istogramma delle probabilità del nodo.A table that contains the probability histogram of the node.

Nodo padre Vedere l'introduzione di questo argomento.Parent node See the Introduction to this topic.

Nodi del cluster Rappresenta la distribuzione di attributi e valori per i case inclusi nel cluster.Cluster nodes Represents the distribution of attributes and values for cases that are included in this cluster.

NODE_SUPPORTNODE_SUPPORT
Numero di case che supportano il nodo.The number of cases that support this node. Nodo padre Indica il numero di case di training per l'intero modello.Parent node Indicates the number of training cases for the entire model.

Nodi del cluster Indica la dimensione del cluster come numero di case.Cluster nodes Indicates the size of the cluster as a number of cases.

Nota Se il modello usa il clustering K-medie, ogni case può appartenere a un unico cluster.Note If the model uses K-Means clustering, each case can belong to only one cluster. Se invece il modello utilizza il clustering EM, ogni case può appartenere a cluster diversi e gli viene assegnata una distanza ponderata per ogni cluster cui appartiene.However, if the model uses EM clustering, each case can belong to different cluster, and the case is assigned a weighted distance for each cluster to which it belongs. Pertanto, per i modelli EM la somma del supporto per un singolo cluster è maggiore del supporto per il modello complessivo.Therefore, for EM models the sum of support for an individual cluster is greater than support for the overall model.

MSOLAP_MODEL_COLUMNMSOLAP_MODEL_COLUMN
Opzione non utilizzata per i modelli di clustering.Not used for clustering models.

MSOLAP_NODE_SCOREMSOLAP_NODE_SCORE
Visualizza un punteggio associato al nodo.Displays a score associated with the node.

Nodo padre Punteggio BIC (Bayesian Information Criterion) per il modello di clustering.Parent node The Bayesian Information Criterion (BIC) score for the clustering model.

Nodi del cluster Sempre 0.Cluster nodes Always 0.

MSOLAP_NODE_SHORT_CAPTIONMSOLAP_NODE_SHORT_CAPTION
Etichetta utilizzata a scopo di visualizzazione.A label used for display purposes. Questa didascalia non può essere modificata.You cannot change this caption.

Nodo padre il tipo di modello: Modello di clusterParent node The type of model: Cluster model

Nodi del cluster Nome del cluster.Cluster nodes The name of the cluster. Esempio: Cluster 1.Example: Cluster 1.

NoteRemarks

Analysis ServicesAnalysis Services offre più metodi per la creazione di un modello di clustering.provides multiple methods for creating a clustering model. Se non si conosce il metodo impiegato per creare il modello in uso, è possibile recuperare a livello di programmazione i metadati del modello, utilizzando un client ADOMD o AMO oppure eseguendo una query sul set di righe dello schema di data mining.If you do not know which method was used to create the model that you are working with, you can retrieve the model metadata programmatically, by using an ADOMD client or AMO, or by querying the data mining schema rowset. Per altre informazioni, vedere Eseguire query sui parametri usati per creare un modello di data mining.For more information, see Query the Parameters Used to Create a Mining Model.

Nota

La struttura e il contenuto del modello rimangono invariati, indipendentemente dal metodo di clustering o dai parametri utilizzati.The structure and content of the model stay the same, regardless of which clustering method or parameters you use.

Vedere ancheSee Also

Contenuto dei modelli di data mining (Analysis Services - Data mining) Mining Model Content (Analysis Services - Data Mining)
Visualizzatori modello di data mining Data Mining Model Viewers
Algoritmo Microsoft Clustering Microsoft Clustering Algorithm
Query di data miningData Mining Queries