Utiliser Delta Lake dans Azure Databricks

Intermédiaire
Ingénieur Data
Azure Databricks

Delta Lake est une zone de stockage relationnelle open source pour Spark que vous pouvez utiliser pour implémenter une architecture de lakehouse de données dans Azure Databricks.

Objectifs d’apprentissage

Dans ce module, vous allez découvrir comment :

  • Décrire les principales fonctionnalités de Delta Lake.
  • Créer et utiliser des tables Delta Lake dans Azure Databricks.
  • Créer des tables de catalogue Spark pour les données Delta Lake.
  • Utiliser des tables Delta Lake pour la diffusion en continu de données.

Prérequis

Avant de démarrer ce module, vous devez savoir comment utiliser Apache Spark dans Azure Databricks. Envisagez de terminer le module Utiliser Apache Spark dans Azure Databricks avant celui-ci.