Wat is Azure Databricks?

Azure Databricks is een platform voor gegevens analyse dat is geoptimaliseerd voor het Microsoft Azure Cloud Services-platform. Azure Databricks biedt twee omgevingen voor het ontwikkelen van gegevensintensieve toepassingen: Azure Databricks SQL Analytics en Azure Databricks werk ruimte.

Azure DATABRICKS SQL Analytics beschikt over een eenvoudig te gebruiken platform voor analisten die SQL-query's willen uitvoeren op hun data Lake, meerdere visualisatie typen moeten maken om query resultaten uit verschillende perspectieven te verkennen en dash boards te bouwen en te delen.

Azure Databricks werk ruimte biedt een interactieve werk ruimte waarmee gegevens technici, gegevens wetenschappers en machine learning engineers kunnen samen werken. Voor een big data pijp lijn worden de gegevens (RAW of Structured) opgenomen in azure via Azure Data Factory in batches of bijna in realtime gestreamd met behulp van Apache Kafka, Event hub of IoT Hub. Deze gegevens komen terecht in een data lake voor langdurige permanente opslag, in Azure Blob Storage of Azure Data Lake Storage. Als onderdeel van uw analyse werk stroom gebruikt u Azure Databricks om gegevens te lezen uit meerdere gegevens bronnen en deze in te scha kelen in grensverleggende inzichten met behulp van Spark.

Als u een omgeving wilt selecteren, start u een Azure Databricks-werk ruimte, klikt u op het pictogram app-schakelaar onder aan de zijbalk Azure Databricks app-schakelaar.

Volgende stappen