Esercitazione: Integrazione di Power BI: creare il modello predittivo usando Machine Learning automatizzato (parte 1 di 2)

Nella prima parte di questa esercitazione si eseguono il training e la distribuzione di un modello predittivo di Machine Learning usando Machine Learning (ML) automatizzato nello studio di Azure Machine Learning. Nella parte 2 si userà il modello con prestazioni migliori per prevedere i risultati in Microsoft Power BI.

In questa esercitazione:

  • Creare un cluster di elaborazione di Azure Machine Learning.
  • Creare un set di dati.
  • Creare un'esecuzione di Machine Learning automatizzato.
  • Distribuire il modello migliore in un endpoint di assegnazione punteggi in tempo reale.

Esistono tre modi per creare e distribuire il modello che verrà usato in Power BI. Questo articolo illustra l'opzione C: Eseguire il training e la distribuzione di modelli con Machine Learning automatizzato nello studio. Questa opzione offre un'esperienza di creazione senza codice. Automatizza completamente la preparazione dei dati e il training dei modelli.

Tuttavia, è possibile usare una delle altre opzioni:

Prerequisiti

Creare un cluster di elaborazione

Machine Learning automatizzato esegue il training di molti modelli diversi di Machine Learning per trovare l'algoritmo e i parametri migliori. Azure Machine Learning parallelizza l'esecuzione del training dei modelli in un cluster di elaborazione.

Per iniziare, nel menu a sinistra dello studio di Azure Machine Learning selezionare Calcolo. Aprire la scheda Cluster di elaborazione. Quindi selezionare Nuovo:

Screenshot che mostra come creare un cluster di elaborazione.

Nella pagina Crea cluster di elaborazione:

  1. Selezionare una dimensione di VM. Per questa esercitazione, è possibile selezionare una VM Standard_D11_v2.
  2. Selezionare Avanti.
  3. Specificare un nome di ambiente di calcolo valido.
  4. Mantenere Numero minimo di nodi impostato su 0.
  5. Impostare Numero massimo di nodi su 4.
  6. Selezionare Crea.

Lo stato del cluster diventa In fase di creazione.

Nota

Il nuovo cluster ha 0 nodi, quindi non si incorre in costi di calcolo. Vengono addebitati costi solo quando viene eseguito il processo di Machine Learning automatizzato. Il numero di nodi del cluster torna automaticamente a 0 dopo 120 secondi di inattività.

Creare un set di dati

In questa esercitazione si usa il set di dati Diabetes. Questo set di dati è disponibile nei set di dati aperti di Azure.

Per creare il set di dati, nel menu a sinistra selezionare Set di dati. Quindi selezionare Crea set di dati. Vengono visualizzate le opzioni seguenti:

Screenshot che mostra come creare un nuovo set di dati.

Selezionare Da set di dati aperti. Quindi nella pagina Crea set di dati dai set di dati aperti:

  1. Usare la barra di ricerca per trovare diabetes.
  2. Selezionare Sample: Diabetes.
  3. Selezionare Avanti.
  4. Assegnare al set di dati il nome diabetes.
  5. Selezionare Crea.

Per esplorare i dati, selezionare il set di dati e quindi Esplora:

Screenshot che mostra come esplorare il set di dati.

I dati contengono 10 variabili di input di base, ad esempio età, sesso, indice di massa corporea, pressione sanguigna media e sei misurazioni del siero. Contengono inoltre una variabile di destinazione denominata Y. Questa variabile di destinazione è una misura quantitativa della progressione del diabete un anno dopo quello di riferimento.

Creare un'esecuzione di Machine Learning automatizzato

Nel menu a sinistra dello studio di Azure Machine Learning selezionare ML automatizzato. Quindi selezionare Nuova esecuzione di ML automatizzato:

Screenshot che mostra come creare una nuova esecuzione di Machine Learning automatizzato.

Selezionare quindi il set di dati diabetes creato in precedenza. Selezionare Avanti:

Screenshot che mostra come selezionare un set di dati.

Nella pagina Configura esecuzione:

  1. In Nome esperimento selezionare Crea nuovo.
  2. Assegnare un nome all'esperimento.
  3. Nel campo Colonna di destinazione selezionare Y.
  4. Nel campo Seleziona cluster di elaborazione selezionare il cluster di elaborazione creato in precedenza.

Il modulo completato sarà simile al seguente:

Screenshot che mostra come configurare Machine Learning automatizzato.

Infine, selezionare un'attività di Machine Learning. In questo caso, l'attività è Regressione:

Screenshot che mostra come configurare un'attività.

Selezionare Fine.

Importante

Per completare il training dei 100 modelli in Machine Learning automatizzato, sono necessari circa 30 minuti.

Distribuire il modello migliore

Al termine dell'esecuzione di Machine Learning automatizzato, è possibile visualizzare tutti i modelli usati per i tentativi selezionando la scheda Modelli. I modelli vengono ordinati in base alle prestazioni. Il modello con le prestazioni migliori verrà visualizzato per primo. Dopo aver selezionato il modello migliore, il pulsante Distribuisci risulterà abilitato:

Screenshot che mostra l'elenco di modelli.

Selezionare Distribuisci per aprire la finestra Distribuisci un modello:

  1. Assegnare al modello il nome diabetes-model.
  2. Selezionare Servizio Azure Container.
  3. Selezionare Distribuisci.

Verrà visualizzato un messaggio che indica che il modello è stato distribuito correttamente.

Passaggi successivi

In questa esercitazione è stato descritto come eseguire il training e la distribuzione di un modello di Machine Learning usando Machine Learning automatizzato. Nell'esercitazione successiva viene descritto come utilizzare questo modello in Power BI per assegnare punteggi.