Uso de Apache Spark en Azure Databricks

Intermedio
Ingeniero de datos
Azure Databricks

Azure Databricks se basa en Apache Spark y permite a los ingenieros y analistas de datos ejecutar trabajos de Spark para transformar, analizar y visualizar datos a escala.

Objetivos de aprendizaje

En este módulo aprenderá a:

  • Describir los elementos clave de la arquitectura de Apache Spark.
  • Cree y configure un clúster de Spark.
  • Describir los casos de uso de Spark.
  • Use Spark para procesar y analizar los datos almacenados en archivos.
  • Use Spark para visualizar los datos.

Requisitos previos

Antes de iniciar este módulo, debe tener conocimientos básicos de Azure Databricks. Considere la posibilidad de completar el módulo Explorar Azure Databricks antes de este.