Vytváření open-sourcových analytických řešení pomocí Azure HDInsight

Středně pokročilý
Data Engineer
Data Scientist
Azure HDInsight

V tomto studijním programu se seznámí s HDInsight a s tím, jak tuto technologii použít k řešení celé řady výzev z reálného světa.

Požadavky

Měly by být splněné následující požadavky:

  • Úspěšné přihlášení na Azure Portal
  • Znalost možností úložiště v Azure
  • Znalost možností výpočtů v Azure

Moduly v tomto studijním programu

Na konci tohoto modulu se dozvíte, že Azure HDInsight je plně spravovaná cloudová služba, která umožňuje efektivně zpracovávat obrovské objemy dat pomocí nejoblíbenějších opensourcových architektur.

V tomto modulu se seznámíte s různými konfiguracemi pro zajištění optimálního využití služby HDInsight z hlediska výkonu i nákladů.

V tomto modulu se dozvíte, jak vytvořit cluster HDInsight, monitorovat cluster a vědět o běžných problémech se zřizováním.

Zjistěte, jak HBase poskytuje náhodný přístup a silnou konzistenci pro velké objemy nestrukturovaných a částečně strukturovaných dat ve schématu bez databáze uspořádané podle rodin sloupců.

V tomto modulu se naučíte vytvářet kanály a aplikace analýzy dat v reálném čase v cloudu pomocí Azure HDInsight s Apache Kafka a Apache Sparkem.

Na konci tohoto modulu můžete provádět ad hoc dotazy na sadu velkých objemů dat. Použití interaktivního dotazu HDInsight pomáhá dosáhnout latencí podsekundových dotazů.

Azure HDInsight s dalšími službami Azure poskytuje komplexní vícevrstvé řešení zabezpečení a je sdílenou odpovědností mezi Microsoftem a zákazníkem.