Identifier les charges de travail Azure Databricks

Effectué

Azure Databricks est une plateforme complète qui offre de nombreuses fonctionnalités de traitement des données. Bien que vous puissiez utiliser le service pour prendre en charge toute charge de travail nécessitant un traitement évolutif des données, Azure Databricks prend spécifiquement en charge les types de charges de travail de données suivants :

  • Science des données et engineering
  • Machine Learning
  • SQL*

*Les charges de travail SQL sont disponibles uniquement dans les espaces de travail de niveau Premium.

Science des données et engineering

Azure Databricks fournit un traitement, une ingestion et une analyse basés sur Apache Spark de grands volumes de données dans un data lakehouse. Les ingénieurs Données, les scientifiques des données et les analystes Données peuvent utiliser des notebooks interactifs pour exécuter du code dans Python, Scala, SparkSQL ou autres langages pour nettoyer, transformer, agréger et analyser des données.

Capture d’écran du portail Azure Databricks pour la science des données et l’engineering Données.

Machine Learning

Azure Databricks prend en charge les charges de travail de machine learning qui impliquent l’exploration et la préparation des données, l’entraînement et l’évaluation des modèles Machine Learning, et la mise en service des modèles afin de générer des prédictions pour les applications et les analyses. Les scientifiques des données et les ingénieurs ML peuvent utiliser AutoML pour entraîner rapidement des modèles prédictifs ou appliquer leurs compétences avec des frameworks de machine learning courants comme SparkML, Scikit-Learn, PyTorch et Tensorflow. Ils peuvent également gérer le cycle de vie du machine learning de bout en bout avec MLFlow.

Capture d’écran du portail Azure Databricks pour le machine learning.

Entrepôt de données

Azure Databricks prend en charge l’interrogation basée sur SQL pour les données stockées dans des tables dans un entrepôt SQL. Cette fonctionnalité permet aux analystes Données d’interroger, d’agréger, de synthétiser et de visualiser des données en utilisant la syntaxe SQL courante et un large éventail d’outils d’analyse et de visualisation de données basés sur SQL.

Capture d’écran du portail Azure Databricks pour SQL.

Notes

Les entrepôts SQL Warehouse sont disponibles uniquement dans les espaces de travail Azure Databricks Premium.