Membangun Solusi Analitik Perangkat Lunak Sumber Terbuka (OSS) dengan Azure HDInsight

Menengah
Data Engineer
Data Scientist
Azure HDInsight

Dalam jalur pembelajaran ini, pelajar diperkenalkan ke HDInsight dan cara menerapkan teknologi ini untuk menyelesaikan berbagai tantangan dunia nyata.

Prasyarat

Prasyarat berikut harus diselesaikan

  • Berhasil masuk ke portal Azure
  • Memahami pilihan penyimpanan Azure
  • Memahami pilihan komputasi Azure

Modul dalam jalur pembelajaran ini

Di akhir modul ini, Anda akan mempelajari bahwa Azure HDInsight adalah layanan cloud yang dikelola penuh yang memungkinkan Anda memproses data dalam jumlah besar secara efisien menggunakan kerangka kerja sumber terbuka paling populer.

Dalam modul ini, Anda mempelajari berbagai konfigurasi untuk memastikan penggunaan HDInsight yang optimal dari perspektif performa dan biaya.

Dalam modul ini, Anda mempelajari cara membuat Kluster HDInsight, memantau kluster, dan mengetahui masalah provisi umum.

Mempelajari bagaimana HBase menyediakan akses acak dan konsistensi yang kuat untuk sejumlah besar data yang tidak terstruktur dan semi terstruktur dalam skema database yang lebih sedikit diatur oleh keluarga kolom.

Dalam modul ini, Anda mempelajari cara membuat alur dan aplikasi analitik data streaming real-time di cloud dengan menggunakan Azure HDInsight dengan Apache Kafka dan Apache Spark.

Pada akhir modul ini, Anda dapat melakukan kueri ad hoc pada kumpulan big-data. Menggunakan Interactive Query HDInsight membantu mencapai latensi kueri kurang dari satu detik.

Azure HDInsight dengan layanan Azure lainnya menyediakan solusi keamanan multi-tingkat yang komprehensif dan merupakan tanggung jawab bersama antara Microsoft dan pelanggan.