Creación de canalizaciones de datos con Databricks Delta

Intermedio
Desarrollador
Ingeniero de datos
Científico de datos
Azure
Databricks

Obtenga información sobre cómo usar Databricks Delta en Azure para administrar el flujo de datos (una canalización de datos) que entra y sale de Data Lake. Este sistema incluye mecanismos para crear, anexar e insertar datos en tablas de Apache Spark, aprovechando las optimizaciones y la confiabilidad integradas. Obtenga información sobre cómo la arquitectura de Databricks Delta contribuye a acelerar las lecturas y permite que varios autores modifiquen un conjunto de datos de forma simultánea y visualicen la misma vista. Por último, implemente una arquitectura lambda mediante el procesamiento de datos por lotes y de streaming con Delta.

En este módulo, aprenderá a:

  • Usar Databricks Delta para crear y anexar tablas, así como insertar contenido en ellas.
  • Trabajar con datos de streaming.
  • Realizar optimizaciones en Delta.
  • Implementar una arquitectura lambda mediante el procesamiento de datos por lotes y de streaming con Delta.

Requisitos previos

Necesita una suscripción a Azure. Si no tiene ninguna, cree una cuenta y agregue una suscripción antes de empezar. El tipo de suscripción Prueba gratuita de Azure no funciona con Databricks, pero los ejercicios se pueden completar de forma gratuita con la prueba gratuita de 14 días de Databricks en una suscripción de pago por uso. En los ejercicios se incluyen instrucciones para usar la evaluación gratuita.