Introducción

Suponga que trabaja para una startup de análisis de datos en fase de expansión con una base de clientes creciente. Recibe datos de clientes de distintos orígenes en diferentes formatos sin procesar. Para controlar de forma eficaz enormes cantidades de datos de los clientes, la compañía ha decidido invertir en Azure Databricks. Su equipo es responsable de analizar cómo admite Databricks las funciones de control de datos diarios, como las lecturas, escrituras y consultas.

Nota

Los laboratorios de este módulo se pueden completar de forma gratuita con la versión de prueba de 14 días de Databricks, pero no se puede usar una suscripción de prueba gratuita de Azure para crear un área de trabajo de Databricks. Para pasar de una suscripción de prueba gratuita a una de pago por uso, vaya a su perfil y cambie la oferta de suscripción a pago por uso. También es posible que deba quitar el límite de gasto y solicitar un aumento de cuota de vCPU en su región. Al crear el área de trabajo de Azure Databricks, puede seleccionar el plan de tarifa de versión de prueba (Premium, con 14 días de DBU gratuitas) para permitir el acceso al área de trabajo a DBU Premium de Azure Databricks durante 14 días.

Objetivos de aprendizaje

En este módulo, aprenderá a hacer lo siguiente:

  • Usar Azure Databricks para trabajar con varios orígenes de datos.
  • Combinar entradas de archivos y almacenes de datos como Azure SQL Database.
  • Transformar y almacenar esos datos para el análisis avanzado.

Requisitos previos

  • Una suscripción de Azure. Si no tiene una suscripción de Azure, cree una cuenta gratuita.