Provádění nulové analýzy ETL s využitím interaktivního dotazu HDInsight

Začátečník
Data Engineer
Data Scientist
Azure HDInsight

Na konci tohoto modulu můžete provádět ad hoc dotazy na sadu velkých objemů dat. Použití interaktivního dotazu HDInsight pomáhá dosáhnout latencí podsekundových dotazů.

Cíle výuky

V tomto modulu se naučíte:

  • Vhodné scénáře pro nasazení clusterů HDInsight Interactive Query
  • Seznamte se se vzory architektury.
  • Nasaďte cluster pro aplikaci nemovitostí a dotazujte se na data.
  • Naučte se integrovat dotazy Apache Spark a Hive LLAP pomocí Připojení oru Hive Warehouse.
  • Vytvořte řídicí panel pro interaktivní dotazy ve velkém měřítku pro vyhodnocení hodnot a umístění nemovitostí.

Požadavky

Je třeba splňovat následující požadavky:

  • Úspěšně se přihlaste k webu Azure Portal.
  • Seznamte se s možnostmi úložiště Azure.
  • Seznamte se s možnostmi výpočetních prostředků Azure.
  • Vytvořte a nakonfigurujte cluster HDInsight na webu Azure Portal.