Data mining (SSAS)

Analysis Services offre una piattaforma integrata per le soluzioni che includono data mining. Per creare soluzioni di Business Intelligence con analisi predittiva è possibile utilizzare i dati relazionali o del cubo.

Vantaggi del data mining

Nel data mining vengono utilizzati principi statistici analizzati in modo approfondito per individuare modelli nei dati, consentendo di prendere decisioni intelligenti sui problemi complessi. Applicando gli algoritmi di data mining in Analysis Services ai dati, è possibile prevedere tendenze, identificare i modelli, creare regole e raccomandazioni, analizzare la sequenza di eventi in set di dati complessi e ottenere nuove informazioni dettagliate.

In SQL Server 2014, il data mining è potente, accessibile e integrato con gli strumenti che molti utenti preferiscono usare per l'analisi e la creazione di report. Per ottenere un'utile panoramica generale sul data mining che si desidera avviare, vedere i collegamenti di questa sezione.

Caratteristiche principali del data mining

In SQL Server sono disponibili le caratteristiche seguenti per il supporto di soluzioni di data mining integrate:

  • Più origini dati: non è necessario creare un data warehouse o un cubo OLAP per eseguire il data mining. È possibile utilizzare dati tabulari forniti da provider esterni o disponibili in fogli di calcolo o addirittura file di testo. È anche possibile estrarre facilmente cubi OLAP creati in Analysis Services. Tuttavia, non è possibile usare i dati di un database in memoria.

  • Pulizia dati integrata, gestione dati ed ETL: in Data Quality Services sono disponibili strumenti avanzati per il profiling e la pulizia dei dati. Integration Services può essere utilizzato per compilare processi ETL per la pulizia dei dati, nonché per la compilazione, l'elaborazione, il training e l'aggiornamento di modelli.

  • Più algoritmi personalizzabili: oltre a fornire algoritmi quali quelli di clustering, reti neurali e alberi delle decisioni, la piattaforma supporta lo sviluppo di algoritmi plug-in personalizzati.

  • Infrastruttura di test del modello: testare i modelli e i set di dati utilizzando importanti strumenti statistici come la convalida incrociata, le matrici di classificazione, i grafici di accuratezza e a dispersione. Creare e gestire facilmente i set di testing e di training.

  • Esecuzione di query e drill-through: creare query di stima, recuperare schemi e statistiche del modello ed eseguire il drill-through nei dati del case.

  • Strumenti client: oltre agli strumenti di sviluppo e progettazione forniti da SQL Server, è possibile utilizzare i componenti aggiuntivi Data mining per Excel per creare ed esplorare i modelli, nonché per eseguirvi query. In alternativa creare client personalizzati, inclusi i servizi Web.

  • Supporto del linguaggio di scripting e API gestita: tutti gli oggetti di data mining sono completamente programmabili. Lo scripting è possibile tramite MDX, XMLA o le estensioni di PowerShell per Analysis Services. Utilizzare il linguaggio DMX (Data Mining Extensions) per eseguire query e generare script velocemente.

  • Sicurezza e distribuzione: fornisce la sicurezza basata sui ruoli tramite Analysis Services, incluse autorizzazioni separate per il drill-through per i dati del modello e della struttura. Distribuzione semplice di modelli agli altri server, in modo che gli utenti possano accedere agli schemi o effettuare stime

Contenuto della sezione

Negli argomenti di questa sezione sono illustrate le caratteristiche principali di Data mining di SQL Server e le attività correlate.