Introducción

Python es uno de los lenguajes de programación más populares del mundo. Se usa ampliamente en la comunidad de ciencia de datos para el aprendizaje automático y el análisis estadístico. Uno de los motivos de su popularidad es la disponibilidad de miles de bibliotecas de código abierto, como NumPy, Pandas, Matplotlib y Scikit-learn, lo que permite a investigadores y programadores explorar, transformar, analizar y visualizar los datos.

Azure Notebooks es una plataforma basada en la nube para compilar y ejecutar cuadernos de Jupyter. Jupyter es un entorno basado en IPython que facilita la programación interactiva y el análisis de datos mediante Python y otros lenguajes de programación. Azure Notebooks proporciona Jupyter como un servicio gratuito. Es una manera cómoda de escribir código de Python sin tener que instalar y administrar un servidor de Jupyter. Además está basado en Internet, lo que lo convierte en una solución ideal para la colaboración en línea.

En este módulo, creará un cuaderno de Azure Notebooks, importará un conjunto de datos que contiene información sobre la puntualidad de las llegadas de una aerolínea de EE. UU. y cargará el conjunto de datos en el cuaderno. Después, limpiará el conjunto de datos con Pandas, creará un modelo de Machine Learning con Scikit-learn y usará Matplotlib para visualizar el resultado del modelo.

Objetivos de aprendizaje

En este módulo, aprenderá a:

  • Crear un cuaderno de Jupyter en Azure Notebooks, importar datos y ver los datos cargados en el cuaderno.
  • Usar Pandas para limpiar y preparar los datos que se van a usar en el modelo de Machine Learning.
  • Usar Scikit-learn para crear el modelo de Machine Learning.
  • Usar Matplotlib para visualizar el rendimiento del modelo.