Verbinden von Excel mit Apache Hadoop in Azure HDInsight mithilfe des Microsoft Hive ODBC-TreibersConnect Excel to Apache Hadoop in Azure HDInsight with the Microsoft Hive ODBC driver

Die Big Data-Lösung von Microsoft integriert Microsoft Business Intelligence (BI)-Komponenten in Apache Hadoop-Cluster, die in Azure HDInsight bereitgestellt wurden.Microsoft's Big Data solution integrates Microsoft Business Intelligence (BI) components with Apache Hadoop clusters that have been deployed in Azure HDInsight. Ein Beispiel für diese Integration ist die Möglichkeit, Excel mit dem Hive-Data Warehouse eines Hadoop-Clusters in HDInsight über den Microsoft Hive Open Database Connectivity (ODBC) Driver zu verbinden.An example of this integration is the ability to connect Excel to the Hive data warehouse of a Hadoop cluster in HDInsight using the Microsoft Hive Open Database Connectivity (ODBC) Driver.

Es ist ebenfalls möglich, die zu einem HDInsight-Cluster gehörigen Daten und andere Datenquellen, einschließlich anderer Hadoop-Cluster (nicht aus HDInsight), zu verbinden. Hierbei verwenden Sie in Excel das Add-In Microsoft Power Query für Excel.It is also possible to connect the data associated with an HDInsight cluster and other data sources, including other (non-HDInsight) Hadoop clusters, from Excel using the Microsoft Power Query add-in for Excel. Informationen zur Installation und Verwendung von Power Query finden Sie unter Verbinden von Excel mit HDInsight über Power Query.For information on installing and using Power Query, see Connect Excel to HDInsight with Power Query.

VoraussetzungenPrerequisites

Bevor Sie mit diesem Artikel beginnen können, benötigen Sie Folgendes:Before you begin this article, you must have the following items:

  • einen HDInsight Hadoop-Cluster.An HDInsight Hadoop cluster. Hinweise zum Erstellen finden Sie unter Erste Schritte mit Azure HDInsight.To create one, see Get started with Azure HDInsight.
  • Eine Arbeitsstation mit Office 2010 Professional Plus oder höher oder Excel 2010 oder höher.A workstation with Office 2010 Professional Plus or later, or Excel 2010 or later.

Installieren des Microsoft Hive ODBC-TreibersInstall Microsoft Hive ODBC driver

Laden Sie die Microsoft Hive ODBC-Treiberversion herunter, die der Version der Anwendung entspricht, in der Sie den ODBC-Treiber verwenden, und installieren Sie die Version.Download and install the Microsoft Hive ODBC Driver version that matches the version of the application where you will be using the ODBC driver. In diesem Artikel wird der Treiber für Office Excel verwendet.For this article, the driver is used for Office Excel.

Erstellen einer Apache Hive ODBC-DatenquelleCreate Apache Hive ODBC data source

Die folgenden Schritte zeigen Ihnen, wie Sie eine Hive-ODBC-Datenquelle erstellen können.The following steps show you how to create a Hive ODBC Data Source.

  1. Navigieren Sie von Windows zu „Start > Windows-Verwaltungsprogramme > ODBC-Datenquellen (32-Bit)/(64-Bit)“.From Windows, navigate to Start > Windows Administrative Tools > ODBC Data Sources (32-bit)/(64-bit). Hierdurch wird das Dialogfeld ODBC-Datenquellen-Administrator geöffnet.This opens the ODBC Data Source Administrator window.

    ODBC-Datenquellen-AdministratorOBDC data source administrator

  2. Wählen Sie auf der Registerkarte Benutzer-DSN die Option Hinzufügen aus, um das Fenster Neue Datenquelle erstellen zu öffnen.From the User DSN tab, select Add to open the Create New Data Source window.

  3. Wählen Sie Microsoft Hive ODBC-Treiber und dann Fertig stellen aus, um das Fenster DSN-Setup für Microsoft Hive ODBC-Treiber zu öffnen.Select Microsoft Hive ODBC Driver, and then select Finish to open the Microsoft Hive ODBC Driver DSN Setup window.

  4. Geben Sie folgende Werte ein bzw. wählen diese aus:Type or select the following values:

    EigenschaftProperty BESCHREIBUNGDescription
    Name der DatenquelleData Source Name Geben Sie einen Namen für die Datenquelle an.Give a name to your data source
    Host(s)Host(s) Geben Sie HDInsightClusterName.azurehdinsight.net ein.Enter HDInsightClusterName.azurehdinsight.net. Zum Beispiel, myHDICluster.azurehdinsight.netFor example, myHDICluster.azurehdinsight.net
    PortPort Verwenden Sie 443.Use 443. (Dieser Port wurde von 563 in 443 geändert.)(This port has been changed from 563 to 443.)
    DatenbankDatabase Verwenden Sie default.Use default.
    MechanismusMechanism Wählen Sie Microsoft Azure HDInsight Service.Select Windows Azure HDInsight Service
    BenutzernameUser Name Geben Sie Ihren HTTP-Benutzernamen für den HDInsight-Cluster an.Enter HDInsight cluster HTTP user username. Der Standard-Benutzername lautet admin.The default username is admin.
    KennwortPassword Geben Sie Ihr Benutzerkennwort für den HDInsight-Cluster an.Enter HDInsight cluster user password. Aktivieren Sie das Kontrollkästchen Kennwort speichern (verschlüsselt) .Select the checkbox Save Password (Encrypted).
  5. Optional: Wählen Sie Erweiterte Optionen aus.Optional: Select Advanced Options...

    ParameterParameter BESCHREIBUNGDescription
    Use Native QueryUse Native Query Wenn diese Option ausgewählt ist, versucht der ODBC-Treiber NICHT, TSQL in HiveQL zu konvertieren.When it is selected, the ODBC driver does NOT try to convert TSQL into HiveQL. Verwenden Sie diese Option nur, wenn Sie sich absolut sicher sind, dass Sie reine HiveQL-Anweisungen absenden.You shall use it only if you are 100% sure you are submitting pure HiveQL statements. Wenn Sie eine Verbindung mit SQL Server oder Azure SQL-Datenbank herstellen, sollten Sie die Option nicht aktivieren.When connecting to SQL Server or Azure SQL Database, you should leave it unchecked.
    Rows fetched per blockRows fetched per block Wenn Sie viele Datensätze abrufen, ist es möglicherweise erforderlich, diesen Parameter zu optimieren, um optimale Leistung zu garantieren.When fetching a large number of records, tuning this parameter may be required to ensure optimal performances.
    Default string column length, Binary column length, Decimal column scaleDefault string column length, Binary column length, Decimal column scale Längen und Genauigkeiten der Datentypen können beeinflussen, wie die Daten zurückgegeben werden.The data type lengths and precisions may affect how data is returned. Bei zu geringer Genauigkeit und/oder Abschneiden werden falsche Informationen zurückgegeben.They cause incorrect information to be returned due to loss of precision and/or truncation.

    Erweiterte OptionenAdvanced options

  6. Wählen Sie Testen aus, um die Datenquelle zu testen.Select Test to test the data source. Wenn die Datenquelle richtig konfiguriert wurde, wird SUCCESS! als Testergebnis angezeigt.When the data source is configured correctly, the test result shows SUCCESS!.

  7. Wählen Sie OK aus, um das Testfenster zu schließen.Select OK to close the Test window.

  8. Wählen Sie OK aus, um das Fenster DSN-Setup für Microsoft Hive ODBC-Treiber zu schließen.Select OK to close the Microsoft Hive ODBC Driver DSN Setup window.

  9. Wählen Sie OK aus, um das Fenster ODBC-Datenquellen-Administrator zu schließen.Select OK to close the ODBC Data Source Administrator window.

Importieren von Daten aus HDInsight in ExcelImport data into Excel from HDInsight

In den folgenden Schritten wird beschrieben, wie Sie mithilfe der ODBC-Datenquelle, die Sie im vorangegangenen Abschnitt erstellt haben, Daten aus einer Hive-Tabelle in eine Excel-Arbeitsmappe importieren.The following steps describe the way to import data from a Hive table into an Excel workbook using the ODBC data source that you created in the previous section.

  1. Öffnen Sie eine neue oder bereits vorhandene Arbeitsmappe in Excel.Open a new or existing workbook in Excel.

  2. Navigieren Sie auf der Registerkarte Daten zu Daten abrufen > Aus anderen Quellen > Aus ODBC, um das Fenster Aus ODBC zu öffnen.From the Data tab, navigate to Get Data > From Other Sources > From ODBC to launch the From ODBC window.

    Öffnen des Datenverbindungs-AssistentenOpen data connection wizard

  3. Wählen Sie in der Dropdownliste den im letzten Abschnitt erstellten Datenquellennamen aus, und wählen Sie anschließend OK.From the drop-down list, select the data source name that you created in the last section and then select OK.

  4. Bei der ersten Verwendung wird das Dialogfeld ODBC-Treiber geöffnet.For the first use, an ODBC driver dialog will open. Wählen Sie im Menü auf der linken Seite die Option Windows.Select Windows from the left menu. Wählen Sie anschließend Verbinden, um das Fenster Navigator zu öffnen.Then select Connect to open the Navigator window.

  5. Navigieren Sie von Navigator zu HIVE > Standard > hivesampletable, und wählen Sie dann Laden aus.From Navigator, navigate to HIVE > default > hivesampletable, and then select Load. Es dauert einige Augenblicke, bis die Daten in Excel importiert werden.It takes a few moments before data gets imported to Excel.

    HDInsight-Hive-ODBC-NavigatorHDInsight Hive ODBC navigator

Nächste SchritteNext steps

In diesem Artikel haben Sie erfahren, wie Sie den Microsoft Hive ODBC-Treiber verwenden, um Daten aus dem HDInsight-Dienst nach Excel zu übertragen.In this article, you learned how to use the Microsoft Hive ODBC driver to retrieve data from the HDInsight Service into Excel. Ebenso können Sie Daten aus dem HDInsight-Dienst in eine SQL-Datenbank übertragen.Similarly, you can retrieve data from the HDInsight Service into SQL Database. Es ist außerdem möglich, Daten in einen HDInsight-Dienst hochzuladen.It is also possible to upload data into an HDInsight Service. Weitere Informationen finden Sie unter:To learn more, see: