Rövid útmutató: Apache Hive-lekérdezések végrehajtása az Azure HDInsightban az Apache Zeppelinnel

Ebben a rövid útmutatóban megtudhatja, hogyan futtathat Apache Hive-lekérdezéseket az Azure HDInsightban az Apache Zeppelin használatával. A HDInsight Interaktív lekérdezésfürtök olyan Apache Zeppelin-jegyzetfüzeteket tartalmaznak, amelyekkel interaktív Hive-lekérdezéseket futtathat.

Ha még nincs Azure-előfizetése, kezdés előtt hozzon létre egy ingyenes fiókot.

Előfeltételek

EGY HDInsight interaktív lekérdezési fürt. HdInsight-fürt létrehozásához lásd a fürt létrehozása című témakört. Győződjön meg arról, hogy az Interaktív lekérdezés fürttípust választja.

Apache Zeppelin-megjegyzés létrehozása

  1. Cserélje le CLUSTERNAME a fürt nevét a következő URL-címen https://CLUSTERNAME.azurehdinsight.net/zeppelin. Ezután adja meg az URL-címet egy webböngészőben.

  2. Adja meg a fürt bejelentkezési felhasználónevét és jelszavát. A Zeppelin lapon létrehozhat egy új jegyzetet, vagy megnyithatja a meglévő jegyzeteket. A HiveSample tartalmaz néhány hive-mintalekérdezéseket.

    HDInsight Interactive Query zeppelin.

  3. Válassza az Új jegyzet létrehozása lehetőséget.

  4. Az Új jegyzet létrehozása párbeszédpanelen írja be vagy válassza ki a következő értékeket:

    • Megjegyzés neve: Adja meg a jegyzet nevét.
    • Alapértelmezett értelmező: Válassza ki a jdbc-t a legördülő listából.
  5. Válassza a Jegyzet létrehozása lehetőséget.

  6. Írja be a következő Hive-lekérdezést a kódszakaszba, majd nyomja le a Shift + Enter billentyűkombinációt:

    %jdbc(hive)
    show tables
    

    HDInsight Interactive Query zeppelin runs query.

    Az első sorban található %jdbc(hive) utasítás azt jelzi a jegyzetfüzetnek, hogy használja a Hive JDBC-értelmezőt.

    A lekérdezésnek egy hivesampletable nevű Hive-táblát kell visszaadni.

    A következő két további Hive-lekérdezést futtathat a hivesampletable használatával:

    %jdbc(hive)
    select * from hivesampletable limit 10
    
    %jdbc(hive)
    select ${group_name}, count(*) as total_count
    from hivesampletable
    group by ${group_name=market,market|deviceplatform|devicemake}
    limit ${total_count=10}
    

    A hagyományos Hive-hez képest a lekérdezési eredményeknek gyorsabban kell visszatérniük.

További példák

  1. Tábla létrehozása. Hajtsa végre az alábbi kódot a Zeppelin-jegyzetfüzetben:

    %jdbc(hive)
    CREATE EXTERNAL TABLE log4jLogs (
        t1 string,
        t2 string,
        t3 string,
        t4 string,
        t5 string,
        t6 string,
        t7 string)
    ROW FORMAT DELIMITED
    FIELDS TERMINATED BY ' '
    STORED AS TEXTFILE;
    
  2. Adatok betöltése az új táblába. Hajtsa végre az alábbi kódot a Zeppelin-jegyzetfüzetben:

    %jdbc(hive)
    LOAD DATA
    INPATH 'wasbs:///example/data/sample.log'
    INTO TABLE log4jLogs;
    
  3. Egyetlen rekord beszúrása. Hajtsa végre az alábbi kódot a Zeppelin-jegyzetfüzetben:

    %jdbc(hive)
    INSERT INTO TABLE log4jLogs2
    VALUES ('A', 'B', 'C', 'D', 'E', 'F', 'G');
    

További szintaxisért tekintse át a Hive nyelvi kézikönyvét .

Az erőforrások eltávolítása

A rövid útmutató elvégzése után érdemes lehet törölni a fürtöt. A HDInsight használatával az adatok az Azure Storage-ban lesznek tárolva, így biztonságosan törölheti a fürtöt, ha nincs használatban. A HDInsight-fürtökért is díjat számítunk fel, még akkor is, ha nincs használatban. Mivel a fürt díjai sokszor nagyobbak, mint a tárolási díjak, érdemes törölni a fürtöket, ha nincsenek használatban.

A fürtök törléséről a HDInsight-fürt törlése a böngésző, a PowerShell vagy az Azure CLI használatával című témakörben olvashat.

Következő lépések

Ebben a rövid útmutatóban megtanulta, hogyan futtathat Apache Hive-lekérdezéseket az Azure HDInsightban az Apache Zeppelin használatával. Ha többet szeretne megtudni a Hive-lekérdezésekről, a következő cikk bemutatja, hogyan hajthat végre lekérdezéseket a Visual Studióval.