Uso de Apache Spark en Azure Databricks

Módulo
9 Unidades

Intermedio

Ingeniero de datos

Azure Databricks

Azure Databricks se basa en Apache Spark y permite a los ingenieros y analistas de datos ejecutar trabajos de Spark para transformar, analizar y visualizar datos a escala.

Objetivos de aprendizaje

En este módulo aprenderá a:

Describir los elementos clave de la arquitectura de Apache Spark.
Cree y configure un clúster de Spark.
Describir los casos de uso de Spark.
Use Spark para procesar y analizar los datos almacenados en archivos.
Use Spark para visualizar los datos.

Requisitos previos

Antes de iniciar este módulo, debe tener conocimientos básicos de Azure Databricks. Considere la posibilidad de completar el módulo Explorar Azure Databricks antes de este.

Introducción min
Descubra Spark min
Creación de un clúster de Spark min
Uso de Spark en cuadernos min
Uso de Spark para trabajar con archivos de datos min
Visualización de datos min
Ejercicio: Uso de Spark en Azure Databricks min
Prueba de conocimientos min
Resumen min