Azure HDInsight'ta Apache Spark ve Kafka ile gelişmiş akış veri dönüştürmeleri gerçekleştirme

Orta
Data Engineer
Data Scientist
Azure HDInsight

Bu modülde, Apache Kafka ve Apache Spark ile Azure HDInsight kullanarak bulutta gerçek zamanlı akış veri analizi işlem hatları ve uygulamaları oluşturmayı öğreneceksiniz.

Öğrenme hedefleri

Bu modülün sonunda şunları anlarsınız:

  • HDInsight ile Apache Spark ve Kafka ne zaman kullanılır?
  • Spark Yapılandırılmış Akış.
  • Kafka ve Spark çözümünün mimarisi.
  • HDInsight sağlama, Kafka üreticisi oluşturma ve Kafka verilerini jupyter not defterine akışla aktarma.
  • İkincil kümeye veri çoğaltma.

Önkoşullar

Aşağıdaki önkoşullar tamamlanmalıdır:

  • Azure portalında başarıyla oturum açın.
  • Azure depolama seçeneklerini anlama.
  • Azure işlem seçeneklerini anlama.
  • Azure portalında HDInsight Kümesi oluşturun ve yapılandırın.