Vad är Azure Databricks?

Azure Databricks är en dataanalysplattform som är optimerad för Microsoft Azure plattform för molntjänster. Azure Databricks erbjuder tre miljöer för att utveckla dataintensiva program: Databricks SQL, Databricks Data Science Engineering och & Databricks Machine Learning.

Databricks SQL är en lättanvänd plattform för analytiker som vill köra SQL-frågor på datasjön, skapa flera visualiseringstyper för att utforska frågeresultat från olika perspektiv och skapa och dela instrumentpaneler.

Databricks Data Science Teknikerna tillhandahåller en interaktiv arbetsyta som möjliggör samarbete mellan datatekniker, dataforskare och maskininlärningstekniker. För en stordatapipeline matas data (rådata eller strukturerade) in i Azure via Azure Data Factory i batchar eller strömmas nästan i realtid med hjälp av Apache Kafka, Event Hub eller IoT Hub. Dessa data hamnar i en datasjö för långsiktig beständig lagring i Azure Blob Storage eller Azure Data Lake Storage. Som en del av ditt analysarbetsflöde kan du använda Azure Databricks för att läsa data från flera datakällor och omvandla dem till banbrytande insikter med spark.

Databricks Machine Learning är en integrerad maskininlärningsmiljö från slutet till slut med hanterade tjänster för experimentspårning, modellträning, funktionsutveckling och -hantering samt funktion och modellhantering.

Om du vill välja en miljö startar Azure Databricks en arbetsyta och använder persona-växlaren i sidofältet:

Azure Databricks Persona Switcher.

Nästa steg