Introduction

Effectué

Azure Databricks offre une plateforme hautement scalable pour l’analytique et le traitement des données à l’aide d’Apache Spark.

Spark est une plateforme flexible qui prend en charge de nombreux langages de programmation et d’API différents. La plupart des tâches de traitement et d’analytique des données peuvent être effectuées à l’aide de l’API Dataframe, et c’est ce sur quoi nous allons nous concentrer dans ce module.

Dans ce module, vous allez découvrir comment :

  • Décrire les éléments clés de l’architecture Apache Spark.
  • Créer et configurer un cluster Spark.
  • Décrire les cas d’usage pour Spark.
  • Utiliser Spark pour traiter et analyser les données stockées dans des fichiers.
  • Utiliser Spark pour visualiser les données.