Použití Apache Zeppelinu ke spouštění dotazů Apache Phoenix přes Apache HBase ve službě Azure HDInsight

Apache Phoenix je opensourcová, masivně paralelní relační databázová vrstva založená na HBase. Phoenix umožňuje používat SQL, jako jsou dotazy přes HBase. Phoenix používá ovladače JDBC, které vám umožní vytvářet, odstraňovat, měnit tabulky SQL, indexy, zobrazení a sekvence. Phoenix můžete také použít k aktualizaci řádků jednotlivě a hromadně. Phoenix používá nativní kompilaci NOSQL místo použití MapReduce ke kompilaci dotazů, což umožňuje vytváření aplikací s nízkou latencí nad HBase.

Apache Zeppelin je opensourcový webový poznámkový blok, který umožňuje vytvářet dokumenty založené na datech založené na spolupráci pomocí interaktivní analýzy dat a jazyků, jako jsou SQL a Scala. Pomáhá vývojářům dat a datovým vědcům vyvíjet, organizovat, spouštět a sdílet kód pro manipulaci s daty. Umožňuje vizualizovat výsledky, aniž byste museli odkazovat na příkazový řádek nebo potřebovat podrobnosti clusteru.

Uživatelé SLUŽBY HDInsight můžou k dotazování tabulek Phoenix použít Apache Zeppelin. Apache Zeppelin je integrovaný s clusterem HDInsight a neexistuje žádný další postup, jak ho použít. Vytvoření poznámkového bloku Zeppelin s interpretem JDBC a zahájením psaní dotazů Phoenix SQL

Požadavky

Cluster Apache HBase ve službě HDInsight. Viz Začínáme s Apache HBase.

Vytvoření poznámky Apache Zeppelin

  1. Nahraďte CLUSTERNAME názvem vašeho clusteru v následující adrese URL https://CLUSTERNAME.azurehdinsight.net/zeppelin. Pak zadejte adresu URL ve webovém prohlížeči. Zadejte uživatelské jméno a heslo pro přihlášení ke clusteru.

  2. Na stránce Zeppelin vyberte Vytvořit novou poznámku.

    HDInsight Interactive Query zeppelin.

  3. V dialogovém okně Vytvořit novou poznámku zadejte nebo vyberte následující hodnoty:

    • Název poznámky: Zadejte název poznámky.
    • Výchozí interpret: V rozevíracím seznamu vyberte jdbc .

    Pak vyberte Vytvořit poznámku.

  4. Ujistěte se, že záhlaví poznámkového bloku zobrazuje stav připojení. Označuje se zelenou tečkou v pravém horním rohu.

    Zeppelin notebook status.

  5. Vytvořte tabulku HBase. Zadejte následující příkaz a stiskněte Shift +Enter:

    %jdbc(phoenix)
    CREATE TABLE Company (
        company_id INTEGER PRIMARY KEY,
        name VARCHAR(225)
    );
    

    Příkaz %jdbc(phoenix) na front-line říká poznámkovému bloku, aby používal interpret Phoenix JDBC.

  6. Zobrazení vytvořených tabulek

    %jdbc(phoenix)
    SELECT DISTINCT table_name
    FROM SYSTEM.CATALOG
    WHERE table_schem is null or table_schem <> 'SYSTEM';
    
  7. Vložte do tabulky hodnoty.

    %jdbc(phoenix)
    UPSERT INTO Company VALUES(1, 'Microsoft');
    UPSERT INTO Company (name, company_id) VALUES('Apache', 2);
    
  8. Zadejte dotaz na tabulku.

    %jdbc(phoenix)
    SELECT * FROM Company;
    
  9. Odstranění záznamu

    %jdbc(phoenix)
    DELETE FROM Company WHERE COMPANY_ID=1;
    
  10. Přetáhněte tabulku.

    %jdbc(phoenix)
    DROP TABLE Company;
    

Další kroky