Wat is Azure Databricks?

Azure Databricks is een platform voor gegevensanalyse dat is geoptimaliseerd voor Microsoft Azure platform voor cloudservices. Azure Databricks biedt drie omgevingen voor het ontwikkelen van gegevensintensieve toepassingen: Databricks SQL, Databricks Data Science & Engineering en Databricks Machine Learning.

Databricks SQL biedt een eenvoudig te gebruiken platform voor analisten die SQL-query's op hun data lake willen uitvoeren, meerdere visualisatietypen willen maken om queryresultaten vanuit verschillende perspectieven te verkennen en dashboards te bouwen en te delen.

Databricks Data Science Engineering biedt een interactieve werkruimte die samenwerking mogelijk maakt tussen data engineers, gegevenswetenschappers en machine learning engineers. Voor een big data-pijplijn worden de gegevens (onbewerkt of gestructureerd) opgenomen in Azure via Azure Data Factory in batches of bijna in realtime gestreamd met behulp van Apache Kafka, Event Hub of IoT Hub. Deze gegevens komen terecht in een data lake voor langdurige permanente opslag, in Azure Blob Storage of Azure Data Lake Storage. Gebruik als onderdeel van uw analysewerkstroom Azure Databricks om gegevens uit meerdere gegevensbronnen te lezen en deze om te zetten in nieuwe inzichten met behulp van Spark.

Databricks Machine Learning is een geïntegreerde end-to-end machine learning-omgeving waarin beheerde services worden opgenomen voor het bijhouden van experimenten, modeltraining, functieontwikkeling en -beheer en functies en modellen.

Als u een omgeving wilt selecteren, start u Azure Databricks werkruimte en gebruikt u de schakelaar persona in de zijbalk:

Azure Databricks Persona Switcher.

Volgende stappen