Distribuzioni delle colonne (Data mining)

Si applica a: SQL Server Analysis Services Azure Analysis Services Power BI Premium

In è possibile definire distribuzioni di colonne in una struttura di data mining per influire sul modo in cui gli algoritmi elaborano i dati in tali colonne quando Microsoft SQL Server Analysis Services si creano modelli di data mining. Per alcuni algoritmi è utile definire la distribuzione dei dati nelle colonne continue prima di elaborare il modello, se è noto che tali colonne contengono valori con distribuzioni comuni. Se non si definiscono le distribuzioni, i modelli di data mining risultanti possono produrre stime meno accurate, perché gli algoritmi dispongono di meno informazioni per l'interpretazione dei dati.

Gli algoritmi disponibili in Analysis Services supportano i tipi di distribuzioni seguenti:

Normal
I valori della colonna continua formano un istogramma con una distribuzione normale.

Istogramma con distribuzione normale

Logaritmica normale
I valori della colonna continua formano un istogramma in cui l'estremità superiore della curva è allungata e l'estremità inferiore è asimmetrica.

Istogramma con distribuzione normale dei log

Uniforme
I valori della colonna continua formano una curva uniforme, in cui tutti i valori hanno la stessa probabilità.

Istogramma con distribuzione uniforme

Per altre informazioni sugli algoritmi forniti da Analysis Services, vedere Algoritmi di data mining (Analysis Services - Data mining).

Vedere anche

Tipi di contenuto (data mining)
Strutture di data mining (Analysis Services - Data mining)
Metodi di discretizzazione (data mining)
Distribuzioni (DMX)
Colonne della struttura di data mining