Schnellstart: Ausführen von Apache Hive-Abfragen in Azure HDInsight mit Apache ZeppelinQuickstart: Execute Apache Hive queries in Azure HDInsight with Apache Zeppelin

In diesem Schnellstart erfahren Sie, wie Sie mit Apache Zeppelin Apache Hive-Abfragen in Azure HDInsight ausführen können.In this quickstart, you learn how to use Apache Zeppelin to run Apache Hive queries in Azure HDInsight. Interactive Query-Cluster von HDInsight umfassen Apache Zeppelin-Notebooks, mit denen Sie interaktive Hive-Abfragen ausführen können.HDInsight Interactive Query clusters include Apache Zeppelin notebooks that you can use to run interactive Hive queries.

Wenn Sie kein Azure-Abonnement besitzen, können Sie ein kostenloses Konto erstellen, bevor Sie beginnen.If you don't have an Azure subscription, create a free account before you begin.

VoraussetzungenPrerequisites

Ein HDInsight Interactive Query-Cluster.An HDInsight Interactive Query cluster. Weitere Informationen zum Erstellen eines HDInsight-Clusters finden Sie unter Erstellen von Clustern.See Create cluster to create an HDInsight cluster. Stellen Sie sicher, dass Sie den Clustertyp Interactive Query auswählen.Make sure to choose the Interactive Query cluster type.

Erstellen einer Apache Zeppelin-NotizCreate an Apache Zeppelin Note

  1. Ersetzen Sie CLUSTERNAME durch den Namen Ihres Clusters in der folgenden URL https://CLUSTERNAME.azurehdinsight.net/zeppelin.Replace CLUSTERNAME with the name of your cluster in the following URL https://CLUSTERNAME.azurehdinsight.net/zeppelin. Geben Sie dann die URL in einem Webbrowser ein.Then enter the URL in a web browser.

  2. Geben Sie Ihren Benutzernamen und das Kennwort für die Clusteranmeldung ein.Enter your cluster login username and password. Auf der Zeppelin-Seite können Sie entweder eine neue Notiz erstellen oder vorhandene Notizen öffnen.From the Zeppelin page, you can either create a new note or open existing notes. HiveSample enthält einige Hive-Beispielabfragen.HiveSample contains some sample Hive queries.

    HDInsight Interactive Query Zeppelin

  3. Wählen Sie Neue Notiz erstellen aus.Select Create new note.

  4. Geben Sie im Dialogfeld Neue Notiz erstellen die folgenden Werte ein oder wählen Sie sie aus:From the Create new note dialog, type or select the following values:

    • Notizname: Geben Sie einen Namen für die Notiz ein.Note Name: Enter a name for the note.
    • Standardinterpreter: Wählen Sie jdbc aus der Dropdownliste aus.Default interpreter: Select jdbc from the drop-down list.
  5. Wählen Sie Notiz erstellen aus.Select Create Note.

  6. Geben Sie die folgende Hive-Abfrage in den Codeabschnitt ein, und drücken Sie dann UMSCHALT + EINGABETASTE:Enter the following Hive query in the code section, and then press Shift + Enter:

    %jdbc(hive)
    show tables
    

    HDInsight Interactive Query Zeppelin führt Abfrage aus

    Die Anweisung %jdbc(hive) in der ersten Zeile gibt dem Notebook an, dass es den Hive-JDBC-Interpreter verwenden soll.The %jdbc(hive) statement in the first line tells the notebook to use the Hive JDBC interpreter.

    Die Abfrage soll eine Hive-Tabelle namens hivesampletable zurückgeben.The query shall return one Hive table called hivesampletable.

    Im Folgenden finden Sie zwei weitere Hive-Abfragen, die Sie für hivesampletable ausführen können:The following are two additional Hive queries that you can run against hivesampletable:

    %jdbc(hive)
    select * from hivesampletable limit 10
    
    %jdbc(hive)
    select ${group_name}, count(*) as total_count
    from hivesampletable
    group by ${group_name=market,market|deviceplatform|devicemake}
    limit ${total_count=10}
    

    Verglichen mit früheren Hive-Abfragen werden die Abfrageergebnisse viel schneller zurückgegeben.Comparing to the traditional Hive, the query results come back must faster.

Bereinigen von RessourcenClean up resources

Nachdem Sie den Schnellstart abgeschlossen haben, können Sie den Cluster löschen.After you complete the quickstart, you may want to delete the cluster. Mit HDInsight werden Ihre Daten im Azure-Speicher gespeichert, sodass Sie einen Cluster problemlos löschen können, wenn er nicht verwendet wird.With HDInsight, your data is stored in Azure Storage, so you can safely delete a cluster when it is not in use. Für einen HDInsight-Cluster fallen auch dann Gebühren an, wenn er nicht verwendet wird.You are also charged for an HDInsight cluster, even when it is not in use. Da die Gebühren für den Cluster erheblich höher sind als die Kosten für den Speicher, ist es sinnvoll, nicht verwendete Cluster zu löschen.Since the charges for the cluster are many times more than the charges for storage, it makes economic sense to delete clusters when they are not in use.

Informationen zum Löschen eines Clusters finden Sie unter Löschen eines HDInsight-Clusters mit Ihrem Browser, PowerShell oder der Azure CLI.To delete a cluster, see Delete an HDInsight cluster using your browser, PowerShell, or the Azure CLI.

Nächste SchritteNext steps

In diesem Schnellstart haben Sie erfahren, wie Sie mit Apache Zeppelin Apache Hive-Abfragen in Azure HDInsight ausführen können.In this quickstart, you learned how to use Apache Zeppelin to run Apache Hive queries in Azure HDInsight. Im nächsten Artikel erfahren Sie, wie Sie Abfragen mit Visual Studio ausführen können, um mehr Informationen über Hive-Abfragen zu erhalten.To learn more about Hive queries, the next article will show you how to execute queries with Visual Studio.

Weitere InformationenSee also