Snelstartgids: Apache Hive query's uitvoeren in azure HDInsight met Apache ZeppelinQuickstart: Execute Apache Hive queries in Azure HDInsight with Apache Zeppelin

In deze Quick Start leert u hoe u Apache Zeppelin gebruikt om Apache Hive query's uit te voeren in azure HDInsight.In this quickstart, you learn how to use Apache Zeppelin to run Apache Hive queries in Azure HDInsight. HDInsight Interactive query-clusters bevatten Apache Zeppelin -notebooks die u kunt gebruiken om interactieve Hive-query's uit te voeren.HDInsight Interactive Query clusters include Apache Zeppelin notebooks that you can use to run interactive Hive queries.

Als u nog geen abonnement op Azure hebt, maak dan een gratis account aan voordat u begint.If you don't have an Azure subscription, create a free account before you begin.

VereistenPrerequisites

An HDInsight interactieve query cluster.An HDInsight Interactive Query cluster. Zie cluster maken om een HDInsight-cluster te maken.See Create cluster to create an HDInsight cluster. Zorg ervoor dat u het interactieve query cluster type kiest.Make sure to choose the Interactive Query cluster type.

Een Apache Zeppelin-opmerking makenCreate an Apache Zeppelin Note

  1. Vervang CLUSTERNAME door de naam van uw cluster in de volgende URL https://CLUSTERNAME.azurehdinsight.net/zeppelin.Replace CLUSTERNAME with the name of your cluster in the following URL https://CLUSTERNAME.azurehdinsight.net/zeppelin. Voer vervolgens de URL in een webbrowser in.Then enter the URL in a web browser.

  2. Voer de gebruikers naam en het wacht woord voor uw cluster aanmelding in.Enter your cluster login username and password. Op de pagina Zeppelin kunt u een nieuwe notitie maken of bestaande notities openen.From the Zeppelin page, you can either create a new note or open existing notes. HiveSample bevat een aantal voor beelden van Hive-query's.HiveSample contains some sample Hive queries.

    Zeppelin voor HDInsight interactieve query

  3. Selecteer nieuwe notitie maken.Select Create new note.

  4. Typ of Selecteer in het dialoog venster nieuwe notitie maken de volgende waarden:From the Create new note dialog, type or select the following values:

    • Notitie naam: Voer een naam in voor de opmerking.Note Name: Enter a name for the note.
    • Standaard-interpreter: Selecteer JDBC in de vervolg keuzelijst.Default interpreter: Select jdbc from the drop-down list.
  5. Selecteer notitie maken.Select Create Note.

  6. Voer de volgende Hive-query in de code sectie in en druk op SHIFT + ENTER:Enter the following Hive query in the code section, and then press Shift + Enter:

    %jdbc(hive)
    show tables
    

    Query voor uitvoering van HDInsight Interactive query Zeppelin

    De instructie % JDBC (Hive) in de eerste regel geeft aan dat het notitie blok de Hive JDBC-interpreter moet gebruiken.The %jdbc(hive) statement in the first line tells the notebook to use the Hive JDBC interpreter.

    De query retourneert een Hive-tabel met de naam hivesampletable.The query shall return one Hive table called hivesampletable.

    Hieronder vindt u twee extra Hive-query's die u kunt uitvoeren op hivesampletable:The following are two additional Hive queries that you can run against hivesampletable:

    %jdbc(hive)
    select * from hivesampletable limit 10
    
    %jdbc(hive)
    select ${group_name}, count(*) as total_count
    from hivesampletable
    group by ${group_name=market,market|deviceplatform|devicemake}
    limit ${total_count=10}
    

    Vergelijking met de traditionele component, worden de query resultaten sneller weer gegeven.Comparing to the traditional Hive, the query results come back must faster.

Aanvullende voorbeeldenAdditional examples

  1. Een tabel maken.Create a table. Voer de volgende code uit in de Zeppelin-notebook:Execute the code below in the Zeppelin Notebook:

    %jdbc(hive)
    CREATE EXTERNAL TABLE log4jLogs (
        t1 string,
        t2 string,
        t3 string,
        t4 string,
        t5 string,
        t6 string,
        t7 string)
    ROW FORMAT DELIMITED
    FIELDS TERMINATED BY ' '
    STORED AS TEXTFILE;
    
  2. Gegevens laden in de nieuwe tabel.Load data into the new table. Voer de volgende code uit in de Zeppelin-notebook:Execute the code below in the Zeppelin Notebook:

    %jdbc(hive)
    LOAD DATA
    INPATH 'wasbs:///example/data/sample.log'
    INTO TABLE log4jLogs;
    
  3. Voeg één record in.Insert a single record. Voer de volgende code uit in de Zeppelin-notebook:Execute the code below in the Zeppelin Notebook:

    %jdbc(hive)
    INSERT INTO TABLE log4jLogs2
    VALUES ('A', 'B', 'C', 'D', 'E', 'F', 'G');
    

Raadpleeg de hand leiding voor de Hive-taal voor aanvullende syntaxis.Review the Hive language manual for additional syntax.

Resources opschonenClean up resources

Nadat u de Snelstartgids hebt voltooid, kunt u het cluster verwijderen.After you complete the quickstart, you may want to delete the cluster. Met HDInsight worden uw gegevens opgeslagen in Azure Storage, zodat u een cluster veilig kunt verwijderen wanneer deze niet in gebruik is.With HDInsight, your data is stored in Azure Storage, so you can safely delete a cluster when it isn't in use. U betaalt ook voor een HDInsight-cluster, zelfs wanneer het niet in gebruik is.You're also charged for an HDInsight cluster, even when it isn't in use. Omdat de kosten voor het cluster veel keren meer zijn dan de kosten voor opslag, is het economisch zinvol om clusters te verwijderen wanneer ze niet worden gebruikt.Since the charges for the cluster are many times more than the charges for storage, it makes economic sense to delete clusters when they aren't in use.

Als u een cluster wilt verwijderen, raadpleegt u een HDInsight-cluster verwijderen met behulp van uw browser, Power shell of de Azure cli.To delete a cluster, see Delete an HDInsight cluster using your browser, PowerShell, or the Azure CLI.

Volgende stappenNext steps

In deze Quick Start hebt u geleerd hoe u Apache Zeppelin gebruikt om Apache Hive query's uit te voeren in azure HDInsight.In this quickstart, you learned how to use Apache Zeppelin to run Apache Hive queries in Azure HDInsight. Meer informatie over Hive-query's vindt u in het volgende artikel wordt uitgelegd hoe u query's kunt uitvoeren met Visual Studio.To learn more about Hive queries, the next article will show you how to execute queries with Visual Studio.