Összegzés

Befejeződött

Az Apache Spark a big data-elemzések egyik kulcsfontosságú technológiája, és az Azure Databricks Spark-támogatása lehetővé teszi, hogy a big data-feldolgozást a Sparkban nagy léptékű adatelemzéssel kombinálja.

Ebben a modulban megtanulta, hogyan végezheti el az alábbi műveleteket:

  • Az Apache Spark-architektúra főbb elemeinek ismertetése.
  • Spark-fürt létrehozása és konfigurálása.
  • A Spark használati eseteinek leírása.
  • A Spark használatával feldolgozhatja és elemezheti a fájlokban tárolt adatokat.
  • Adatok vizualizációja a Spark használatával.