Query di data mining

Si applica a: SQL Server 2019 e versioni precedenti di Analysis Services Azure Analysis Services Fabric/Power BI Premium

Importante

Il data mining è stato deprecato in SQL Server 2017 Analysis Services e ora è stato interrotto in SQL Server 2022 Analysis Services. La documentazione non viene aggiornata per le funzionalità deprecate e non più disponibili. Per altre informazioni, vedere Compatibilità con le versioni precedenti di Analysis Services.

Le query di data mining sono utili per molti scopi. È possibile:

  • Applicare il modello ai nuovi dati per eseguire una o più stime. È possibile fornire valori di input come parametri o in un batch.

  • Ottenere un riepilogo statistico dei dati utilizzati per il training.

  • Estrarre schemi e regole o generare un profilo del case tipico che rappresenta uno schema nel modello.

  • Estrarre formule di regressione e altri calcoli che consentono di spiegare i modelli.

  • Ottenere i case adatti per uno schema particolare.

  • Recuperare dettagli su singoli case utilizzati nel modello, tra cui i dati non utilizzati nell'analisi.

  • Ripetere il training di un modello aggiungendo nuovi dati o eseguire una stima incrociata.

In questa sezione viene fornita una panoramica delle informazioni necessarie per iniziare a utilizzare le query di data mining. Vengono descritti i tipi di query che è possibile creare sugli oggetti di data mining, introdotti gli strumenti e i linguaggi delle query, nonché forniti collegamenti a esempi di query che è possibile creare sui modelli compilati utilizzando gli algoritmi disponibili in Data mining di SQL Server.

Informazioni sulle query di data mining

Interfacce e strumenti di query

Query per tipi di modello diversi

Requisiti

Informazioni sulle query di data mining

SQL Server Analysis Services data mining supporta i tipi di query seguenti:

  • Prediction Queries (Data Mining)

    Query mediante le quali vengono eseguite inferenze in base agli schemi del modello e dai dati di input.

  • Query sul contenuto (Data mining)

    Query mediante le quali vengono restituiti metadati, statistiche e altre informazioni sul modello stesso.

  • Query drill-through (Data mining)

    Query mediante le quali è possibile recuperare i dati del case sottostanti per il modello o persino i dati della struttura che non è stata utilizzata nel modello.

  • Query di definizione dei dati (Data mining)

    Query mediante le quali non vengono restituite informazioni dal modello, ma piuttosto vengono utilizzate per compilare modelli e strutture o per aggiornare i dati in un modello o una struttura.

Prima di creare query, è consigliabile acquisire familiarità con le differenze tra i modelli creati con ognuno degli algoritmi di data mining forniti da SQL Server.

Interfacce e strumenti di query

È possibile compilare in modo interattivo query di data mining tramite uno degli strumenti di query forniti da SQL Server. Il generatore di query di stima grafico viene fornito sia in SQL Server Data Tools che in SQL Server Management Studio. Se si utilizza il generatore delle query di stima per la prima volta, è consigliabile attenersi ai passaggi descritti in Basic Data Mining Tutorial per acquisire familiarità con l'interfaccia. Per una rapida panoramica dei passaggi, vedere la sezione relativa alla creazione di una Query in Creare una query di stima utilizzando Generatore query di stima.

Il generatore delle query di stima è utile per avviare le query che verranno personalizzate in un secondo momento. È possibile aggiungere facilmente origini dati ed eseguire il relativo mapping alle colonne, quindi passare alla vista DMX e personalizzare la query aggiungendo una clausola WHERE o altre funzioni.

Una volta acquisita familiarità con i modelli di data mining e con la compilazione di query, queste ultime possono anche essere scritte direttamente tramite DMX (Data Mining Extensions). DMX è un linguaggio di query simile a Transact-SQL che può essere utilizzato da molti client diversi ed è lo strumento ideale per la creazione sia di stime personalizzate sia di query complesse. Per un'introduzione a DMX, vedere Creazione ed esecuzione di query sui modelli di data mining con DMX: esercitazioni (Analysis Services - Data Mining).

Gli editor DMX vengono forniti sia in SQL Server Data Tools che in SQL Server Management Studio. Il generatore delle query di stima può essere utilizzato anche per avviare le query, quindi per modificare la vista nell'editor di testo e copiare l'istruzione DMX in un altro client. Per altre informazioni, vedere Data Mining Query Tools(Strumenti query di data mining).

È possibile comporre istruzioni DMX a livello di codice e inviarle dal client al server di SQL Server Analysis Services usando AMO o XMLA. Tuttavia, DMX è il linguaggio che è necessario utilizzare per creare query su un modello di data mining.

È inoltre possibile eseguire una query sui metadati, sulle statistiche o su parte del contenuto del modello tramite DMV basate sui set di righe dello schema di data mining. Queste DMV facilitano il recupero delle informazioni sul modello tramite la digitazione di istruzioni SELECT; tuttavia non è possibile creare stime. Per altre informazioni sulle DMV supportate da SQL Server Analysis Services, vedere Usare viste di gestione dinamica (DMV) per monitorare Analysis Services.

Infine, è possibile creare query di data mining da utilizzare nei pacchetti di Integration Services tramite l' Data Mining Query Tasko la Data Mining Query Transformation. L'attività del flusso di controllo supporta più tipi di query DMX, mentre la trasformazione del flusso di dati supporta solo le query che vengono utilizzate nei dati del flusso di dati, ovvero le query in cui viene utilizzata la sintassi PREDICTION JOIN.

Query per tipi diversi di modelli

L'algoritmo utilizzato durante la creazione del modello influenza ampiamente il tipo di informazioni che è possibile ottenere da una query di data mining. Il motivo di tali differenze consiste nel fatto che ogni algoritmo consente di elaborare i dati in modo differente e di archiviare tipi diversi di modelli. Ad esempio, alcuni algoritmi consentono di creare cluster, altri invece alberi. Pertanto, potrebbe essere necessario utilizzare funzioni di stima e di query specifiche, a seconda del tipo di modello in uso.

Nell'elenco seguente viene fornito un riepilogo delle funzioni che è possibile utilizzare nelle query:

  • Funzioni di stima generali: la funzione Predict è polimorfica, ovvero può essere utilizzata in tutti i tipi di modelli. Questa funzione consentirà di rilevare automaticamente il tipo di modello in uso. Per tale funzione verrà richiesto di aggiungere ulteriori parametri. Per altre informazioni, vedere Predict (DMX).

    Avviso

    Non tutti i modelli vengono utilizzati per eseguire stime. Ad esempio, è possibile creare un modello di clustering che non dispone di un attributo stimabile. Tuttavia, anche se un modello non dispone di un attributo stimabile, è possibile creare query di stima tramite cui vengono restituiti altri tipi di informazioni utili dal modello.

  • Funzioni di stima personalizzate: in ogni tipo di modello è disponibile un set di funzioni di stima progettate per essere utilizzate con gli schemi creati da tale algoritmo.

    Ad esempio, la funzione Lag è fornita per i modelli Time Series, per consentire di visualizzare i dati cronologici utilizzati per il modello. Per i modelli di clustering, le funzioni come ClusterDistance sono più significative.

    Per ulteriori informazioni sulle funzioni supportate per ogni tipo di modello, vedere i collegamenti seguenti:

    È anche possibile chiamare le funzioni VBA o creare delle proprie funzioni. Per altre informazioni, vedere Funzioni (DMX).

  • Statistiche generali: esistono alcune funzioni che possono essere utilizzate con quasi ogni tipo di modello e tramite cui viene restituito un set standard di statistiche descrittive, ad esempio la deviazione standard.

    Ad esempio, tramite la funzione PredictHistogram viene restituita una tabella in cui sono elencati tutti gli stati della colonna specificata.

    Per altre informazioni, vedere Funzioni di stima generale (DMX).

  • Statistiche personalizzate: vengono fornite funzioni di supporto aggiuntive per ogni tipo di modello per generare statistiche attinenti all'attività analitica specifica.

    Ad esempio, quando si utilizza un modello di clustering, è possibile utilizzare la funzione PredictCaseLikelihoodper restituire il punteggio di probabilità associato a un determinato case e a un cluster. Tuttavia, se è stato creato un modello di regressione lineare, sarebbe più utile recuperare il coefficiente e intercettarlo utilizzando una query sul contenuto.

  • Funzioni relative al contenuto del modello: il contenuto di tutti i modelli viene rappresentato in un formato standardizzato che consente di recuperare le informazioni con una query semplice. È possibile creare query sul contenuto del modello tramite DMX. È anche possibile ottenere alcuni tipi di contenuto del modello utilizzando i set di righe dello schema di data mining.

    Nel contenuto del modello, il significato di ogni riga o nodo della tabella restituito differisce a seconda del tipo di algoritmo utilizzato per compilare il modello, nonché del tipo di dati della colonna. Per altre informazioni, vedere Query di contenuto (data mining).

Requisiti

Prima che sia possibile creare una query su un modello, deve essere stato elaborato il modello di data mining. L'elaborazione di oggetti SQL Server Analysis Services richiede autorizzazioni speciali. Per altre informazioni sull'elaborazione dei modelli di data mining, vedere Requisiti di elaborazione e considerazioni (data mining).

Per eseguire query su un modello di data mining sono necessari diversi livelli di autorizzazioni, a seconda del tipo di query in esecuzione. Ad esempio, l'esecuzione del drill-through ai dati del case o della struttura richiede in genere autorizzazioni aggiuntive che possono essere impostate sull'oggetto della struttura o del modello di data mining.

Tuttavia, se nella query vengono utilizzati dati esterni e sono incluse istruzioni quali OPENROWSET o OPENQUERY, il database sul quale si sta eseguendo una query deve consentire l'abilitazione di queste istruzioni ed è necessario disporre dell'autorizzazione per gli oggetti di database sottostanti.

Per altre informazioni sui contesti di sicurezza necessari per eseguire query di data mining, vedere Panoramica della sicurezza (data mining)

Contenuto della sezione

Gli argomenti di questa sezione introducono ogni tipo di query di data mining in modo più dettagliato e forniscono collegamenti ad esempi dettagliati di come creare query sui modelli mingin dei dati.

Prediction Queries (Data Mining)

Query sul contenuto (Data mining)

Query drill-through (Data mining)

Query di definizione dei dati (Data mining)

Strumenti query di data mining

Utilizzare questi collegamenti per informazioni sulla creazione e sull'utilizzo di query di data mining.

Attività Collegamenti
Visualizzare esercitazioni e procedure dettagliate su query di data mining Lezione 6: Creazione e utilizzo di stime (Esercitazione di base sul data mining)

Esercitazione su DMX per le stime basate su serie temporali
Usare gli strumenti di query di data mining in SQL Server Management Studio e SQL Server Data Tools Creare una query DMX in SQL Server Management Studio

Creare una query di stima utilizzando Generatore query di stima

Applicare le funzioni di stima a un modello

Modificare manualmente un query di stima
Utilizzare i dati esterni presenti nelle query di stima Scegliere ed eseguire il mapping di dati di input per una query di stima

Scegliere ed eseguire il mapping di dati di input per una query di stima
Utilizzo dei risultati delle query Visualizzare e salvare i risultati di una query di stima
Utilizzare modelli di query DMX e XMLA forniti in Management Studio Creare una query di stima singleton da un modello

Creare una query di data mining usando XMLA

Usare i modelli di Analysis Services in SQL Server Management Studio
Acquisire ulteriori informazioni sulle query sul contenuto e visualizzare esempi Creare una query sul contenuto di un modello di data mining

Eseguire query sui parametri utilizzati per creare un modello di data mining

Query sul contenuto (Data mining)
Impostare opzioni di query e risolvere problemi relativi ad autorizzazioni ed errori attinenti alle query Modificare il valore di timeout per le query di data mining
Utilizzare i componenti di data mining in Integration Services Attività Query di data mining

Trasformazione Query di data mining

Vedere anche

Algoritmi di data mining (Analysis Services - Data mining)
Mining Model Content (Analysis Services - Data Mining)