Az Apache Spark használata az Azure Databricksben
Az Azure Databricks az Apache Sparkra épül, és lehetővé teszi az adatmérnökök és elemzők számára, hogy Spark-feladatokat futtasson az adatok nagy léptékű átalakításához, elemzéséhez és vizualizációjához.
Tanulási célkitűzések
Ebben a modulban a következőket sajátíthatja el:
- Az Apache Spark-architektúra főbb elemeinek ismertetése.
- Spark-fürt létrehozása és konfigurálása.
- A Spark használati eseteinek leírása.
- A Spark használatával feldolgozhatja és elemezheti a fájlokban tárolt adatokat.
- Adatok vizualizációja a Spark használatával.
Előfeltételek
A modul megkezdése előtt rendelkeznie kell az Azure Databricks alapszintű ismeretével. Fontolja meg az Azure Databricks felfedezése modul elvégzését a fenti előtt.