Data Analytics-megoldás implementálása az Azure Databricksszel

Haladó
Data Engineer
Azure Databricks

Megtanulhatja, hogyan hasznosíthatja az Apache Spark és az Azure Databricks platformján futó fürtök hatékonyságát ahhoz, hogy nagy méretű adatfeldolgozási számítási feladatokat futtasson a felhőben.

Előfeltételek

Egyik sem

A képzési terv moduljai

Az Azure Databricks egy felhőszolgáltatás, amely skálázható platformot biztosít az Apache Spark használatával végzett adatelemzéshez.

Az Azure Databricks az Apache Sparkra épül, és lehetővé teszi az adatmérnökök és elemzők számára, hogy Spark-feladatokat futtasson az adatok nagy léptékű átalakításához, elemzéséhez és vizualizációjához.

A Delta Lake egy nyílt forráskód relációs tárolóterület a Spark számára, amellyel data lakehouse-architektúrát implementálhat az Azure Databricksben.

Az Azure Databricks olyan SQL Warehouse-t biztosít, amely lehetővé teszi az adatelemzők számára, hogy ismerős relációs SQL-lekérdezések használatával dolgozzanak az adatokkal.

Az Azure Data Factoryben futó folyamatok használatával jegyzetfüzeteket futtathat az Azure Databricksben, így felhőszinten automatizálhatja az adatelemzési folyamatokat.