Introduzione

Completato

Python è uno dei linguaggi di programmazione più diffusi al mondo. È ampiamente usato nella community dei data scientist per il Machine Learning e l'analisi statistica. Uno dei motivi della sua popolarità è la disponibilità di migliaia di librerie open source, ad esempio NumPy, Pandas, Matplotlib e scikit-learn, che consentono a programmatori e ricercatori di esplorare, trasformare, analizzare e visualizzare i dati.

Azure Notebooks è una piattaforma basata sul cloud per la compilazione e l'esecuzione di notebook di Jupyter. Jupyter è un ambiente basato su IPython che facilita la programmazione interattiva e l'analisi dei dati con Python e altri linguaggi di programmazione. Azure Notebooks offre gratuitamente Jupyter come servizio. È un modo pratico per scrivere codice Python senza dover installare e gestire un server Jupyter. La soluzione è basata sul Web ed è ideale per la collaborazione online.

In questo modulo si creerà un notebook di Azure, si importerà un set di dati contenente informazioni relative agli arrivi puntuali per un'importante compagnia aerea statunitense e si caricherà il set di dati nel notebook. Si pulirà quindi il set di dati con Pandas, si creerà un modello di Machine Learning con scikit-learn e si userà Matplotlib per visualizzare l'output dal modello.

Obiettivi di apprendimento

Contenuto del modulo:

  • Creare un notebook Jupyter in Azure Notebooks, importare i dati e visualizzare i dati caricati nel notebook.
  • Usare Pandas per pulire e preparare i dati da usare per il modello di Machine Learning.
  • Usare scikit-learn per creare il modello di Machine Learning.
  • Usare Matplotlib per visualizzare le prestazioni del modello.