Utiliser Apache Spark dans Azure Databricks

Intermédiaire
Ingénieur Data
Azure Databricks

Azure Databricks repose sur Apache Spark et permet aux ingénieurs et analystes Données d’exécuter des travaux Spark pour transformer, analyser et visualiser des données à grande échelle.

Objectifs d’apprentissage

Dans ce module, vous allez découvrir comment :

  • Décrire les éléments clés de l’architecture Apache Spark.
  • Créer et configurer un cluster Spark.
  • Décrire les cas d’usage pour Spark.
  • Utiliser Spark pour traiter et analyser les données stockées dans des fichiers.
  • Utiliser Spark pour visualiser les données.

Prérequis

Avant de commencer ce module, vous devez connaître les bases d’Azure Databricks. Envisagez de terminer le module Explorer Azure Databricks avant celui-ci.