Usare Azure Machine Learning con SQL Data Warehouse

Azure Machine Learning è un servizio di analisi predittive completamente gestito, che può essere usato per creare modelli predittivi dei dati in SQL Data Warehouse e pubblicarli come servizi pronti all'uso. Per le nozioni di base sull'analisi predittiva e su Machine Learning, vedere Introduzione a Machine Learning in Azure. Sarà quindi possibile imparare a creare, eseguire il training, assegnare punteggi e testare un modello di Machine Learning usando l'esercitazione per la creazione di esperimenti.

Questo articolo illustra come effettuare le operazioni seguenti usando Azure Machine Learning Studio:

  • Leggere i dati dal database da creare, eseguire il training e il punteggio di un modello di stima
  • Scrivere dati nel database

Leggere dati da SQL Data Warehouse

Si leggeranno i dati dalla tabella Product nel database AdventureWorksDW.

Passaggio 1

Avviare un nuovo esperimento facendo clic su +NEW nella parte inferiore della finestra di Machine Learning Studio, selezionare EXPERIMENT, quindi Blank Experiment. Selezionare il nome dell'esperimento predefinito nella parte superiore dell'area di disegno e denominarlo in modo significativo, ad esempio Bicycle price prediction.

Passaggio 2

Cercare il modulo Reader nella tavolozza dei set di dati e moduli a sinistra dell'area di disegno dell'esperimento. Trascinare il set di dati nell'area di disegno dell'esperimento.

Passaggio 3

Selezionare il modulo Reader e compilare il riquadro delle proprietà.

  1. Selezionare il database SQL di Azure in Data Source.
  2. Database server name: digitare il nome del server. Per trovarlo, è possibile usare il portale di Azure.

  1. Database name: digitare il nome del database nel server specificato.
  2. Server user account name: digitare il nome utente di un account con autorizzazioni di accesso al database.
  3. Server user account password: fornire la password per l'account utente specificato.
  4. Accept any server certificate: usare questa opzione (meno sicura) se si vuole evitare di rivedere il certificato del sito prima di leggere i dati.
  5. Database query: immettere un'istruzione SQL che descriva i dati da leggere. In questo caso si leggeranno i dati dalla tabella Product usando la query seguente.
SELECT ProductKey, EnglishProductName, StandardCost,
        ListPrice, Size, Weight, DaysToManufacture,
        Class, Style, Color
FROM dbo.DimProduct;

Passaggio 4

  1. Eseguire l'esperimento facendo clic su Run sotto l'area di disegno dell'esperimento.
  2. Al termine dell'esperimento, il modulo Reader sarà contraddistinto da un segno di spunta verde per indicarne il corretto completamento. Si noti anche lo stato Esecuzione terminata nell'angolo in alto a destra.

  1. Per visualizzare tutti i dati importati, fare clic sulla porta di output nella parte inferiore del set di dati relativo alle automobili e selezionare Visualize.

Creare, eseguire il training e assegnare un punteggio a un modello

A questo punto è possibile utilizzare questo set di dati per:

  • Creare un modello: elaborare i dati e definire le funzionalità
  • Il training del modello: selezionare e applicare un algoritmo di apprendimento
  • Assegnare un punteggio e testare il modello: stima di un nuovo prezzo di biciclette

Per altre informazioni su come creare, eseguire il training, assegnare punteggi e testare un modello di Machine Learning, usare l'esercitazione per la creazione di esperimenti.

Scrivere dati in Azure SQL Data Warehouse

Si scriverà il set di risultati nella tabella ProductPriceForecast del database AdventureWorksDW.

Passaggio 1

Cercare il modulo Writer nella tavolozza dei set di dati e moduli a sinistra dell'area di disegno dell'esperimento. Trascinare il set di dati nell'area di disegno dell'esperimento.

Passaggio 2

Selezionare il modulo Writer e compilare il riquadro delle proprietà.

  1. Selezionare il database SQL di Azure in Data Destination.
  2. Database server name: digitare il nome del server. Per trovarlo, è possibile usare il portale di Azure.
  3. Database name: digitare il nome del database nel server specificato.
  4. Server user account name: digitare il nome utente di un account con autorizzazioni di scrittura nel database.
  5. Server user account password: fornire la password per l'account utente specificato.
  6. Accept any server certificate (insecure): selezionare questa opzione se non si vuole visualizzare il certificato.
  7. Comma-separated list of columns to be saved: fornire un elenco del set di dati o delle colonne dei risultati da generare.
  8. Data table name: specificare il nome della tabella dati.
  9. Comma-separated list of datatable columns: specificare i nomi delle colonne da usare nella nuova tabella. I nomi di colonna possono essere diversi da quelli del set di dati di origine, ma è necessario elencare lo stesso numero di colonne definite per la tabella di output.
  10. Number of rows written per SQL Azure operation: è possibile configurare il numero di righe scritte in un database SQL in un'unica operazione.

Passaggio 3

  1. Eseguire l'esperimento facendo clic su Run sotto l'area di disegno dell'esperimento.
  2. Al termine dell'esperimento, tutti i moduli saranno contraddistinti da un segno di spunta verde per indicarne il corretto completamento.

Passaggi successivi

Per altri suggerimenti sullo sviluppo, vedere Panoramica sullo sviluppo per SQL Data Warehouse.