Client di data mining per Excel (componenti aggiuntivi Data mining di SQL Server)

Il client di data mining per Excel è un set di strumenti che consentono di eseguire attività comuni di data mining, dalla pulizia dei dati alla compilazione dei modelli e alle query di stima. È possibile utilizzare i dati in intervalli o tabelle di Excel o accedere alle origini dati esterne.

DM DM

  • Usare i dati

    Caricare i dati in Excel ed effettuarne la pulizia, verificare la presenza di outlier e creare riepiloghi statistici. È inoltre possibile eseguire diversi tipi di campionamento, profilare i dati e testare i modelli utilizzando dati esterni. Il client di data mining costituisce il modo più semplice per preparare i dati per l'analisi senza script o processi ETL complessi.

  • Compilazione di modelli e analisi

    Questi strumenti offrono le interfacce delle procedure guidate per gli algoritmi di data mining noti ed empiricamente testati, incluso il clustering (k-medie ed EM), l'analisi di associazione, l'analisi delle serie temporali e gli alberi delle decisioni. Le opzioni di modellazione avanzate per ogni procedura guidata consentono di selezionare algoritmi diversi, quali Naïve Bayes o reti neurali, e personalizzare il comportamento, ad esempio le dimensioni iniziali del campionamento o del seeding del cluster.

    Tutti gli algoritmi di data mining sono ospitati in un'istanza di Analysis Services, consentendo di creare modelli complessi.

  • Test, query e convalida di modelli

    Il client di data mining fornisce strumenti standard del settore per testare i modelli, inclusi i grafici di accuratezza e la convalida incrociata. Le procedure guidate vengono fornite per semplificare il test della validità del set di dati e della relativa accuratezza. La procedura guidata Query consente di compilare le query per utilizzare i modelli per la stima e l'assegnazione dei punteggi.

  • Visualizzare i modelli

    I grafici generati dalla maggior parte degli strumenti possono essere salvati direttamente in Excel. Usare lo strumento Esplora modelli in Excel (SQL Server componenti aggiuntivi data mining) per esplorare i modelli.

  • Gestione, documentazione e distribuzione

    Il client di data mining per Excel mantiene una connessione attiva al server, pertanto è possibile salvare il modello di data mining nel server per utilizzarlo per ulteriori prove o per distribuirlo in un server di produzione per una maggiore scalabilità.

Utilizzo dei dati

Il gruppo Preparazione dati contiene le procedure guidate seguenti che consentono di analizzare e pulire i dati in preparazione alle attività di data mining. La maggior parte delle procedure guidate consente di separare i dati in set di training e di testing.

Esplorazione dati (componenti aggiuntivi Data mining di SQL Server)
Per la compilazione e l'archiviazione dei modelli i componenti aggiuntivi supportano le connessioni dati seguenti:

  • Connessione a un server Analysis Services per archiviare ed elaborare i modelli.

  • Connessioni facoltative a origini dati esterne. È possibile compilare il modello usando qualsiasi tipo di dati che può essere definito come origine dati di Analysis Services oppure usare semplicemente i dati già in Excel.

Esplorazione dati (componenti aggiuntivi Data mining di SQL Server)
La procedura guidata Esplorazione dati consente di conoscere il tipo e la quantità di dati della tabella dati mediante la creazione di un grafico della distribuzione e dei valori delle colonne selezionate, una alla volta.

Dati di esempio (componenti aggiuntivi Data mining di SQL Server)
La creazione del tipo appropriato di dati per il training e il testing dei modelli costituisce una parte importante del data mining, ma senza gli strumenti appropriati può rivelarsi un'operazione noiosa. La procedura guidata Dati di esempio semplifica l'operazione di suddivisione dei dati utilizzati per un modello in due gruppi, uno per la compilazione del modello e uno per il testing. È possibile utilizzare il campionamento casuale o il sovracampionamento.

Calcolo stime (Strumenti di analisi tabelle per Excel)
La procedura guidata Rimozione outlier offre diversi strumenti per identificare e gestire in modo appropriato gli outlier. Consente di visualizzare la distribuzione dei valori e la relazione tra gli outlier e gli altri dati fornendo la possibilità di decidere se rimuovere o modificare gli outlier.

Calcolo stime (Strumenti di analisi tabelle per Excel)
La procedura guidata Modifica etichette consente di creare nuove etichette per i dati per semplificare la comprensione dei risultati dell'analisi. È ad esempio possibile rinominare un intervallo di dati con un nome più descrittivo oppure scegliere un valore rappresentativo nell'elenco.

Compilazione di modelli e analisi

Le opzioni disponibili nella sezione Modellazione dati della barra degli strumenti consentono di derivare modelli dai dati, raggruppare le righe di dati in base ad attributi specifici oppure esplorare le associazioni. Le procedure guidate in questa barra multifunzione dello strumento si basano sugli algoritmi di data mining avanzati disponibili in Analysis Services. Diversamente da strumenti simili inclusi in Strumenti di analisi tabelle per Excel, queste procedure guidate consentono di personalizzare il comportamento dell'algoritmo e di utilizzare un'ampia gamma di origini dati.

Procedura guidata Classificazione (componenti aggiuntivi Data mining per Excel)
La procedura guidata Classificazione consente di generare un modello di classificazione in base a dati esistenti di una tabella di Excel, un intervallo di Excel o un'origine dati esterna. Un modello di classificazione consente di estrarre modelli dai dati che indicano somiglianze e di eseguire stime basate su raggruppamenti di valori. È possibile utilizzare un modello di classificazione, ad esempio, per stimare i rischi in base ai modelli di ricavo o costi.

La procedura guidata Classificazione supporta l'uso di questi algoritmi di data mining Microsoft: algoritmo Decision Tree, Regressione logistica, Bayes naïve, reti neurali.

Procedura guidata Stima (componenti aggiuntivi Data mining per Excel)
La procedura guidata Valutazione consente di creare un modello di valutazione. Un modello di valutazione consente di estrarre modelli dai dati e di utilizzarli per stimare un risultato numerico come valuta, importo delle vendite, data o ora.

La procedura guidata Valutazione utilizza questi algoritmi di data mining di Microsoft: Decision Trees, Linear Regression, Logistic Regression e Neural Networks.

Analizza fattori di influenza chiave (Strumenti di analisi tabelle per Excel)
Le procedura guidata Cluster consente di compilare un modello di clustering. Un modello di clustering consente di rilevare gruppi di righe che condividono caratteristiche simili. Questa procedura guidata è utile per esplorare i modelli in qualsiasi tipo di dati.

La procedura guidata Cluster utilizza l'algoritmo Microsoft Clustering, che include sia k-medie che EM.

Procedura guidata Associazione (client di data mining per Excel)
La procedura guidata Associazione consente di creare un modello di data mining utilizzando l'algoritmo Microsoft Association Rules, che rileva gli elementi o gli eventi che si verificano spesso contemporaneamente. Questo tipo di modello di associazione risulta particolarmente utile per generare suggerimenti e indicazioni.

La procedura guidata Associazione utilizza l'algoritmo Microsoft Association Rules.

Procedura guidata Previsione (componenti aggiuntivi Data mining per Excel)
La procedura guidata Previsione consente di stimare i valori in una serie temporale. In genere, i dati utilizzati nelle previsioni contengono un tipo di serie temporale, indicatore di data o ID sequenza, che è possibile scegliere per derivare i modelli da utilizzare per la stima di valori futuri.

La procedura guidata Previsione utilizza l'algoritmo Microsoft Time Series.

Modellazione avanzata (componenti aggiuntivi Data mining per Excel)
Se si ha già familiarità con il data mining, è possibile utilizzare le opzioni di modellazione dati Avanzate per creare strutture dei dati personalizzate e compilare modelli utilizzando le personalizzazioni non incluse negli altri strumenti e procedure guidate.

Test, query e convalida di modelli

Utilizzare le procedure guidate sulla barra degli strumenti Accuratezza e convalida per utilizzare test standard del settore per la convalida dell'accuratezza dei modelli e per la valutazione dell'affidabilità del set di dati per la creazione di modelli.

Analizza fattori di influenza chiave (Strumenti di analisi tabelle per Excel)
Consente di valutare le prestazioni di un modello di data mining tramite la generazione di un grafico di accuratezza o di una grafico a dispersione.

Matrice di classificazione (componenti aggiuntivi Data mining di SQL Server)
Consente di valutare le prestazioni di un modello di classificazione tramite la creazione di un grafico di riepilogo delle stime accurate e non accurate effettuate dal modello.

Grafico profitti (componenti aggiuntivi Data mining di SQL Server)
Consente di capire l'impatto di un modello di data mining tramite la rappresentazione grafica dell'accuratezza delle stime insieme ai costi e ai vantaggi delle azioni intraprese in base alla stima.

Convalida incrociata (componenti aggiuntivi Data mining di SQL Server)
Consente di creare un report in cui è riepilogata l'accuratezza del modello in più sottoinsiemi del set di dati, in modo che sia possibile determinare la stabilità del modello.

I dati disponibili in una tabella di Excel possono inoltre essere utilizzati come input per query di stima da eseguire su un modello di data mining archiviato nel server.

Query (componenti aggiuntivi Data mining di SQL Server)
La procedura guidata Query consente di creare stime in base a un modello di data mining esistente.

Editor avanzato query di data mining
Per gli utenti esperti, questo strumento fornisce un'interfaccia di trascinamento a DMX. È possibile creare facilmente query di stima o nuovi modelli senza preoccuparsi della sintassi.

Visualizzazione di modelli

I modelli creati vengono automaticamente aperti per l'esplorazione. Tuttavia, è possibile esplorare i modelli nel server e generare nuove visualizzazioni. Utilizzare Forme di Visio per esportare i diagrammi di modello in un'area di disegno personalizzabile.

Esplorazione di modelli in Excel (componenti aggiuntivi Data mining di SQL Server)
Visualizzare i modelli creati utilizzando i grafici interattivi personalizzati in ogni tipo di modello.

Documentazione di modelli di data mining (componenti aggiuntivi Data mining per Excel)
Questa procedura guidata consente di creare report che forniscono un riepilogo statistico del set di dati e dei metadati relativi al modello, per semplificare l'analisi e l'interpretazione.

Gestione, documentazione e distribuzione

Questi strumenti consentono di connettersi a un server di data mining nonché di gestire ed esportare modelli e di monitorare l'attività di data mining.

Gestione modelli (componenti aggiuntivi Data mining di SQL Server)
Se si dispone delle autorizzazioni appropriate, è possibile eliminare, modificare, rinominare o elaborare modelli e strutture di data mining esistenti senza uscire da Excel.

Traccia (client di data mining per Excel)
Fare clic su Traccia per visualizzare un'acquisizione continua dell'interazione tra il client Excel e il server di SQL Server. Tutte le attività vengono archiviate come istruzioni DMX o XMLA in modo da poter risolvere eventuali problemi della sessione di data mining o salvare le informazioni per riutilizzarle in seguito.

Connessione al server di data mining
Per usare Excel come client per il data mining, è necessario stabilire una connessione a un'istanza di Analysis Services. La connessione consente di accedere al motore di Analysis Services. Se si dispone delle autorizzazioni appropriate, tramite la connessione è inoltre possibile archiviare gli eventuali modelli individuati e modificare oggetti di data mining esistenti.

La barra degli strumenti Connessioni fornisce procedure guidate per la gestione delle connessioni a un'istanza di Analysis Services. È necessario definire una connessione a un'istanza di Analysis Services per usare gli strumenti e gli algoritmi di data mining. È possibile creare la connessione durante l'installazione del componente aggiuntivo o aggiungere una connessione in un secondo momento.

Per iniziare
Fare clic sul pulsante Introduzione per avviare una configurazione guidata che illustra il processo di creazione di una connessione a un'istanza di Analysis Services e ottenere le autorizzazioni necessarie per eseguire il data mining.

?
Il menu a discesa ? fornisce collegamenti alla Guida, a siti Web e a una configurazione guidata per il completamento dell'installazione e l'avvio del data mining.

Nella pagina della Guida sono inoltre presenti collegamenti a risorse online, inclusa la Guida per il componente aggiuntivo, e ulteriori video, demo ed esempi.

Vedere anche

Strumenti di analisi tabelle per Excel
Risoluzione dei problemi relativi ai diagrammi di data mining di Visio (componenti aggiuntivi Data mining di SQL Server)