Engineering données Databricks

Les fonctionnalités d’engineering données Databricks sont un environnement robuste pour la collaboration entre les scientifiques des données, les ingénieurs données et les analystes de données. Les tâches d’engineering données sont également l’épine dorsale des solutions de Machine Learning Databricks.

Notes

Si vous êtes un analyste de données qui travaille principalement avec des requêtes SQL et des outils décisionnels, vous pouvez préférer Databricks SQL.

Nom Utilisez-le quand vous souhaitez...
Delta Live Tables Découvrez comment créer des pipelines de données pour l’ingestion et la transformation avec Databricks Delta Live Tables.
Structured Streaming Découvrez les charges de travail de diffusion en continu, incrémentielles et en temps réel optimisées par Structured Streaming sur Databricks.
Apache Spark Découvrez comment Apache Spark fonctionne sur Databricks et la plateforme Databricks.
Calcul Découvrez les clusters Databricks et comment les créer et les gérer.
Blocs-notes Découvrez ce qu’est un notebook Databricks et comment utiliser et gérer des notebooks pour traiter, analyser et visualiser vos données.
Workflows Découvrez comment orchestrer des workflows de traitement des données, de Machine Learning et d’analyse des données sur la plateforme Databricks.
Bibliothèques Découvrez comment rendre du code tiers ou personnalisé disponible dans Databricks à l’aide de bibliothèques. Découvrez les différents modes d’installation des bibliothèques sur Databricks.
Dossiers Git Découvrez comment utiliser Git pour contrôler les versions de vos notebooks et d’autres fichiers à des fins de développement dans Databricks.
DBFS En savoir plus sur le système de fichiers Databricks (DBFS), un système de fichiers distribué monté dans un espace de travail Databricks et disponible sur les clusters Databricks
Fichiers Découvrez les options d’utilisation des fichiers sur Databricks.
Migration Découvrez comment migrer des applications de données telles que des travaux ETL, des entrepôts de données d’entreprise, le ML, la science des données et l’analytique vers Databricks.
Optimisation et performances Découvrez les optimisations et les recommandations en matière de performances sur Databricks.