Usar Apache Spark no Azure Databricks

Intermediário
Engenheiro de dados
Azure Databricks

O Azure Databricks é baseado no Apache Spark e permite que engenheiros de dados e analistas executem trabalhos do Spark para transformar, analisar e visualizar dados em escala.

Objetivos de aprendizagem

Neste módulo, você aprenderá a:

  • Descreva os principais elementos da arquitetura do Apache Spark.
  • Crie e configure um cluster do Spark.
  • Descreva casos de uso do Spark.
  • Use o Spark para processar e analisar dados armazenados em arquivos.
  • Usar o Spark para visualizar dados.

Pré-requisitos

Antes de iniciar este módulo, você deve ter um conhecimento básico do Azure Databricks. Considere concluir o módulo Explorar o Azure Databricks antes deste.