Ingeniería de datos de Databricks
Las características de la ingeniería de datos de Databricks componen un entorno sólido para la colaboración entre científicos de datos, ingenieros de datos y analistas de datos. Las tareas de ingeniería de datos también son el pilar de las soluciones de aprendizaje automático de Databricks .
Nota:
Si es analista de datos y trabaja principalmente con consultas de SQL y herramientas de BI, quizá prefiera Databricks SQL.
Nombre | Use esta herramienta cuando quiera... |
---|---|
Delta Live Tables | Aprender a crear canalizaciones de datos para la ingesta y transformación con Databricks Delta Live Tables. |
Structured Streaming | Obtener información sobre el streaming, las cargas de trabajo incrementales y en tiempo real con tecnología de Structured Streaming en Databricks. |
Spark de Apache | Obtenga información sobre cómo funciona Apache Spark en Databricks y en la plataforma de Databricks. |
Proceso | Obtener información sobre los clústeres de Databricks, y cómo crearlos y administrarlos. |
Blocs de notas | Obtener información sobre qué es un cuaderno de Azure Databricks y cómo usar y administrar cuadernos para procesar, analizar y visualizar los datos. |
Flujos de trabajo | Aprenda a organizar el procesamiento de datos, el aprendizaje automático y los flujos de trabajo de análisis de datos en la plataforma de Databricks. |
Bibliotecas | Obtener información sobre cómo hacer que el código de terceros o personalizado esté disponible en Databricks mediante bibliotecas. Obtener información sobre los diferentes modos para instalar bibliotecas en Databricks. |
Carpetas Git | Aprender a usar Git para controlar las versiones de los cuadernos y otros archivos de desarrollo en Databricks. |
DBFS | Obtener información sobre el sistema de archivos de Databricks (DBFS), que es un sistema de archivos distribuido montado en un área de trabajo de Databricks y está disponible en los clústeres de Databricks. |
Archivos | Descubrir las opciones para trabajar con archivos en Databricks. |
Migración | Aprender a migrar aplicaciones de datos como trabajos ETL, almacenamientos de datos de empresa, ML, ciencia de datos y análisis a Databricks. |
Optimización y rendimiento | Obtener información sobre las optimizaciones y las recomendaciones de rendimiento en Databricks. |