Ingeniería de datos de Databricks

Las características de la ingeniería de datos de Databricks componen un entorno sólido para la colaboración entre científicos de datos, ingenieros de datos y analistas de datos. Las tareas de ingeniería de datos también son el pilar de las soluciones de aprendizaje automático de Databricks .

Nota:

Si es analista de datos y trabaja principalmente con consultas de SQL y herramientas de BI, quizá prefiera Databricks SQL.

Nombre Use esta herramienta cuando quiera...
Delta Live Tables Aprender a crear canalizaciones de datos para la ingesta y transformación con Databricks Delta Live Tables.
Structured Streaming Obtener información sobre el streaming, las cargas de trabajo incrementales y en tiempo real con tecnología de Structured Streaming en Databricks.
Spark de Apache Obtenga información sobre cómo funciona Apache Spark en Databricks y en la plataforma de Databricks.
Proceso Obtener información sobre los clústeres de Databricks, y cómo crearlos y administrarlos.
Blocs de notas Obtener información sobre qué es un cuaderno de Azure Databricks y cómo usar y administrar cuadernos para procesar, analizar y visualizar los datos.
Flujos de trabajo Aprenda a organizar el procesamiento de datos, el aprendizaje automático y los flujos de trabajo de análisis de datos en la plataforma de Databricks.
Bibliotecas Obtener información sobre cómo hacer que el código de terceros o personalizado esté disponible en Databricks mediante bibliotecas. Obtener información sobre los diferentes modos para instalar bibliotecas en Databricks.
Carpetas Git Aprender a usar Git para controlar las versiones de los cuadernos y otros archivos de desarrollo en Databricks.
DBFS Obtener información sobre el sistema de archivos de Databricks (DBFS), que es un sistema de archivos distribuido montado en un área de trabajo de Databricks y está disponible en los clústeres de Databricks.
Archivos Descubrir las opciones para trabajar con archivos en Databricks.
Migración Aprender a migrar aplicaciones de datos como trabajos ETL, almacenamientos de datos de empresa, ML, ciencia de datos y análisis a Databricks.
Optimización y rendimiento Obtener información sobre las optimizaciones y las recomendaciones de rendimiento en Databricks.