Creazione di stime (Esercitazione di base sul data mining)

 

Si applica a: SQL Server 2016 Preview

Dopo aver testato l'accuratezza dei modelli di data mining e ha deciso che si è soddisfatti dei risultati, è possibile generare stime utilizzando il generatore di Query di stima nel Stima modello di Data Mining scheda in Progettazione modelli di Data Mining.

Nel generatore delle query di stima sono disponibili tre viste. Con il Progettazione e Query visualizzazioni, è possibile compilare ed esaminare la query. È quindi possibile eseguire la query e visualizzare i risultati nella risultato visualizzazione.

Tutte le query di stima utilizzano DMX, ovvero la forma abbreviata per il linguaggio Data Mining Extensions (DMX). La sintassi di DMX è simile a quella di T-SQL e viene utilizzata specificamente per le query sugli oggetti di data mining. Sebbene la sintassi DMX non è complicata, utilizzando un generatore di query come questa o quella di SQL Server Data Mining Add-Ins for Office, risulta molto più semplice selezionare gli input e la compilazione di espressioni, pertanto è consigliabile che le nozioni.

Creazione della query

Il primo passaggio per creare una query di stima consiste nel selezionare un modello di data mining e una tabella di input.

Per selezionare un modello e una tabella di input

  1. Nel Stima modello di Data Mining scheda Progettazione modelli di Data Mining, nel modello di Data Mining fare clic su Seleziona modello.

  2. Nel Seleziona modello di Data Mining finestra di dialogo passare attraverso la struttura per il Targeted Mailing struttura, espandere la struttura, selezionare TM_Decision_Tree, quindi fare clic su OK.

  3. Nel Seleziona tabella/e di Input fare clic su Seleziona tabella del Case.

  4. Nel Seleziona tabella della finestra di dialogo di origine dati selezionare la vista origine dati Adventure Works DW Multidimensional 2012.

  5. In nome tabella/vista, selezionare il ProspectiveBuyer (dbo) tabella e quindi fare clic su OK.

    Il ProspectiveBuyer tabella rispecchia maggiormente la vTargetMail tabella del case.

Mapping delle colonne

Dopo aver selezionato la tabella di input, il generatore delle query di stima crea un mapping predefinito tra il modello di data mining e la tabella di input in base ai nomi delle colonne. Almeno una colonna della struttura deve corrispondere a una colonna dei dati esterni.

Importante


I dati utilizzati per determinare l'accuratezza dei modelli devono contenere una colonna della quale è possibile eseguire il mapping alla colonna stimabile. Se tale colonna non esiste, è possibile crearne una con valori vuoti, ma deve contenere lo stesso tipo di dati della colonna stimabile.

Per eseguire il mapping degli input al modello

  1. Fare doppio clic su linee che connettono il modello di Data Mining finestra per il Seleziona tabella di Input finestra e selezionare Modifica connessioni.

    Si noti che non su tutte le colonne viene eseguito il mapping. Si aggiungerà i mapping per molti colonne della tabella. Verrà inoltre generata una nuova colonna per la data di nascita in base alla colonna della data corrente in modo da ottenere una maggiore corrispondenza tra le colonne.

  2. In colonna della tabella, fare clic sui Bike Buyer cella e selezionare Prospectivebuyer dall'elenco a discesa.

    Verrà eseguito il mapping della colonna stimabile [Bike Buyer] a una colonna della tabella di input.

  3. Scegliere OK.

  4. In Esplora, fare doppio clic sui Targeted Mailing vista origine dati e selezionare Visualizza finestra di progettazione.

  5. La tabella ProspectiveBuyer, mouse e scegliere nuovo calcolo denominato.

  6. Nel Crea calcolo denominato nella finestra di dialogo per nome della colonna, tipo calcAge.

  7. Per Descrizione, tipo calcolare l'età in base alla data di nascita.

  8. Nel espressione digitare DATEDIFF(YYYY,[BirthDate],getdate()) e quindi fare clic su OK.

    Poiché la tabella di input non contiene Age colonna corrispondente a quello del modello, è possibile utilizzare questa espressione per calcolare l'età del cliente dalla colonna BirthDate della tabella di input. Poiché Age è stato identificato come più influenti colonna per la stima dell'acquisto di biciclette, deve esistere sia nel modello e della tabella di input.

  9. Progettazione modelli di Data Mining, selezionare il Stima modello di Data Mining scheda e aprire nuovamente la Modifica connessioni finestra.

  10. In colonna della tabella, fare clic sui Age cella e selezionare CalcAge dall'elenco a discesa.

    Avviso


    Se la colonna non viene visualizzata nell'elenco, potrebbe essere necessario aggiornare la definizione della vista origine dati caricata nella finestra di progettazione. A tale scopo, il File dal menu Salva tutto, quindi chiudere e riaprire il progetto nella finestra di progettazione.

  11. Scegliere OK.

Progettazione della query di stima

  1. Il primo pulsante sulla barra degli strumenti del Stima modello di Data Mining scheda è di passare alla progettazione visualizzare / passa alla visualizzazione dei risultati / passa alla visualizzazione query pulsante. Fare clic sulla freccia rivolta verso il basso su questo pulsante e selezionare Progettazione.

  2. Nella griglia al Stima modello di Data Mining scheda, fare clic sulla cella nella prima riga vuota nel origine colonna e quindi selezionare funzione di stima.

  3. Nel funzione di stima riga il campo colonna, selezionare PredictProbability.

    Nel Alias colonna della stessa riga, tipo probabilità del risultato.

  4. Da di modello di Data Mining finestra precedente, selezionare e trascinare [Bike Buyer] nella criteri/argomento cella.

    Quando si rilasciando la selezione, [TM_Decision_Tree]. [Bike Buyer] è presente il criteri/argomento cella.

    Specifica la colonna di destinazione per il PredictProbability (funzione). Per ulteriori informazioni sulle funzioni, vedere Data Mining Extensions ( DMX ) Riferimento alla funzione.

  5. Fare clic sulla riga vuota successiva nella origine colonna e quindi Seleziona modello di data mining TM_Decision_Tree**.**

  6. Nel TM_Decision_Tree riga il campo colonna, selezionare Bike Buyer.

  7. Nel TM_Decision_Tree riga il criteri/argomento colonna, tipo = 1.

  8. Fare clic sulla riga vuota successiva nella origine colonna e quindi selezionare tabella ProspectiveBuyer.

  9. Nel ProspectiveBuyer riga il campo colonna, selezionare ProspectiveBuyerKey.

    Verrà aggiunto un identificatore univoco alla query di stima che consente di identificare la probabilità di acquisto di una bicicletta da parte dei singoli clienti.

  10. Aggiungere altre cinque righe alla griglia. Per ogni riga, selezionare tabella ProspectiveBuyer come il origine e quindi aggiungere le colonne seguenti nel campo celle:

    • calcAge

    • LastName

    • FirstName

    • AddressLine1

    • AddressLine2

Eseguire infine la query e visualizzare i risultati.

Il Generatore Query di stima include anche questi controlli:

  • Mostra casella di controllo

    Consente di rimuovere le clausole dalla query senza doverle eliminare dalla finestra di progettazione. Questa operazione può risultare utile quando si utilizzano query complesse e si desidera mantenere la sintassi senza dover copiare e incollare il codice DMX nella finestra.

  • Gruppo

    Inserisce una parentesi (sinistra) di apertura all'inizio della riga selezionata o inserisce una parentesi (destra) di chiusura alla fine della riga corrente.

  • AND/OR

    Inserisce il AND operatore o OR operatore immediatamente dopo la funzione corrente o la colonna.

Per eseguire la query e visualizzare i risultati

  1. Nel Stima modello di Data Mining selezionare il risultato pulsante.

  2. Dopo l'esecuzione della query e la visualizzazione dei risultati, è possibile rivedere i risultati.

    Il Stima modello di Data Mining scheda vengono visualizzate le informazioni di contatto dei potenziali clienti che probabilmente acquirenti di biciclette. Il probabilità del risultato colonna indica la probabilità che la stima sia corretta. È possibile utilizzare questi risultati per determinare quali tra i clienti potenziali sono da considerare come potenziali destinatari di messaggi promozionali.

  3. A questo punto, è possibile salvare i risultati. Sono disponibili tre opzioni:

    • Fare doppio clic su una riga di dati nei risultati e selezionare Copia per salvare solo il valore (e l'intestazione di colonna) negli Appunti.

    • Fare doppio clic su qualsiasi riga nei risultati e selezionare Copia tutto per copiare l'intero set di risultati, incluse le intestazioni di colonna, negli Appunti.

    • Fare clic su Salva risultati query per salvare i risultati direttamente in un database, come indicato di seguito:

      1. Nel salvare Query risultati di Data Mining la finestra di dialogo, selezionare un'origine dati oppure definire una nuova origine dati.

      2. Digitare un nome per la tabella in cui saranno contenuti i risultati della query.

      3. Utilizzare l'opzione aggiungere alla vista origine dati, per creare la tabella e aggiungerlo a una vista origine dati esistente. Questa opzione è utile se si desidera mantenere tutte le tabelle correlate per un modello, quali dati di training, dati di stima dell'origine e risultati query, nella stessa vista origine dati.

      4. Utilizzare l'opzione sovrascrivere se esiste, per aggiornare una tabella esistente con i risultati più recenti.

        È necessario utilizzare l'opzione per sovrascrivere la tabella se sono state aggiunte tutte le colonne alla query di stima, modificati i nomi o i tipi di dati di tutte le colonne nella query di stima o se sono state eseguite tutte le istruzioni ALTER sulla tabella di destinazione.

        Inoltre, se più colonne con lo stesso nome (ad esempio, il nome di colonna predefinito espressione) è necessario creare un alias per le colonne con nomi duplicati o verrà generato un errore quando la finestra di progettazione tenta di salvare i risultati in SQL Server. Il motivo è che SQL Server non consente più colonne con lo stesso nome.

        Per ulteriori informazioni, vedere salvare dati Mining dialogo risultato della Query ( N. 41; & visualizzazione stima modello di data mining.

Attività successiva della lezione

Tramite il drill-through nella struttura dati ( Esercitazione di base di Data Mining )

Vedere anche

Creare una query di stima utilizzando Generatore query di stima