Verbinden von Excel mit Apache Hadoop mithilfe von Power QueryConnect Excel to Apache Hadoop by using Power Query

Eine der wichtigsten Features der Big Data-Lösung von Microsoft ist die Integration von Microsoft BI-Komponenten (Business Intelligence) in Apache Hadoop-Cluster in Azure HDInsight.One key feature of the Microsoft big-data solution is the integration of Microsoft business intelligence (BI) components with Apache Hadoop clusters in Azure HDInsight. Ein gutes Beispiel ist die Möglichkeit, Excel mithilfe von Microsoft Power Query für Excel-Add-Ins mit dem Azure Storage-Konto zu verbinden, das die dem Hadoop-Cluster zugeordneten Daten enthält.A primary example is the ability to connect Excel to the Azure Storage account that contains the data associated with your Hadoop cluster by using the Microsoft Power Query for Excel add-in. Dieser Artikel beschreibt die Einrichtung und Verwendung von Power Query für die Abfrage von Daten aus einem mit HDInsight verwalteten Hadoop-Cluster.This article walks you through how to set up and use Power Query to query data associated with a Hadoop cluster managed with HDInsight.

VoraussetzungenPrerequisites

Bevor Sie mit diesem Artikel beginnen können, benötigen Sie Folgendes:Before you begin this article, you must have the following items:

  • Einen HDInsight-Cluster.An HDInsight cluster. Hinweise zum Konfigurieren finden Sie unter [Get started with Azure HDInsight (Erste Schritte mit Azure HDInsight)][hdinsight-get-started].To configure one, see [Get started with Azure HDInsight][hdinsight-get-started].
  • Eine Arbeitsstation mit Windows 7, Windows Server 2008 R2 oder einem späteren Betriebssystem.A workstation that is running Windows 7, Windows Server 2008 R2, or a later operating system.
  • Office 2016, Office 2013 Professional Plus, Office 365 ProPlus, Excel 2013 Standalone oder Office 2010 Professional Plus.Office 2016, Office 2013 Professional Plus, Office 365 ProPlus, Excel 2013 Standalone, or Office 2010 Professional Plus.

Installieren von Power QueryInstall Power Query

Power Query kann Daten importieren, die von einem Hadoop-Auftrag, der in einem HDInsight-Cluster ausgeführt wird, ausgegeben bzw. generiert wurden.Power Query can import data that has been output or that has been generated by a Hadoop job running on an HDInsight cluster.

Power Query wurde in Excel 2016 in das Menüband „Daten“ im Abschnitt zum Abrufen und Transformieren integriert.In Excel 2016, Power Query has been integrated into the Data ribbon under the Get & Transform section. Laden Sie bei älteren Excel-Versionen Microsoft Power Query für Excel aus dem Microsoft Download Center herunter, und installieren Sie es.For older Excel versions, download Microsoft Power Query for Excel from the Microsoft Download Center and install it.

Importieren von HDInsight-Daten in ExcelImport HDInsight data into Excel

Das Power Query für Excel-Add-In erleichtert den Import von Daten aus Ihrem HDInsight-Cluster in Excel. Business Intelligence-Tools wie z. B. PowerPivot und Power Map dienen zur Inspektion, Analyse und Darstellung der Daten.The Power Query add-in for Excel makes it easy to import data from your HDInsight cluster into Excel, where BI tools such as PowerPivot and Power Map can be used to inspect, analyze, and present the data.

So importieren Sie Daten aus einem HDInsight-ClusterTo import data from an HDInsight cluster

  1. Öffnen Sie Excel.Open Excel.

  2. Erstellen Sie eine neue leere Arbeitsmappe.Create a new blank workbook.

  3. Führen Sie je nach Excel-Version die folgenden Schritte aus:Perform the following steps based on the Excel version:

    • Excel 2016Excel 2016

      • Klicken Sie auf das Menü Daten, anschließend auf dem Menüband Daten abrufen und transformieren auf Daten abrufen, dann auf Aus Azure und schließlich auf Aus Azure HDInsight(HDFS).Click the Data menu, click Get Data from the Get & Transform Data ribbon, click From Azure, and then click From Azure HDInsight(HDFS).

        HDI.PowerQuery.SelectHdiSource

    • Excel 2013/2010Excel 2013/2010

      • Klicken Sie auf das Menü Power Query, klicken Sie auf Von Azure, und klicken Sie dann auf Von Microsoft Azure HDInsight.Click the Power Query menu, click From Azure, and then click From Microsoft Azure HDInsight.

        HDI.PowerQuery.SelectHdiSource

        Hinweis: Falls das Menü Power Query nicht angezeigt wird, klicken Sie auf Datei > Optionen > Add-Ins, und wählen Sie unten auf der Seite im Dropdownfeld Verwalten die Option COM Add-Ins aus.Note: If you don't see the Power Query menu, go to File > Options > Add-ins, and select COM Add-ins from the drop-down Manage box at the bottom of the page. Klicken Sie auf die Schaltfläche Los... , und vergewissern Sie sich, dass das Optionsfeld des Power Query für Excel-Add-Ins markiert ist.Select the Go... button and verify that the box for the Power Query for Excel add-in has been checked.

        Hinweis: Mit Power Query können Sie auch Daten aus dem Hadoop Distributed File System (HDFS) importieren. Klicken Sie dazu auf Aus anderen Quellen.Note: Power Query also allows you to import data from HDFS by clicking From Other Sources.

  4. Geben Sie den Kontonamen des mit Ihrem Cluster verbundenen Azure Blob Storage-Kontos ein, und klicken Sie dann auf OK.For Account Name, enter the name of the Azure Blob storage account associated with your cluster, and then click OK. Bei diesem Konto kann es sich um das Standardspeicherkonto oder ein verknüpftes Speicherkonto handeln.This account can be the default storage account or a linked storage account. Das Format lautet https://<Speicherkontoname>.blob.core.windows.net/.The format is https://<StorageAccountName>.blob.core.windows.net/.

  5. Geben Sie den Kontoschlüssel für das Blobspeicherkonto ein, und klicken Sie dann auf Speichern.For Account Key, enter the key for the Blob storage account, and then click Save. (Sie müssen die Kontoinformationen nur beim ersten Zugriff auf diesen Speicher eingeben.)(You need to enter the account information only the first time you access this store.)

  6. Doppelklicken Sie im Navigationsbereich links vom Abfrage-Editor auf den Namen des Blobspeichercontainers.In the Navigator pane on the left of the Query Editor, double-click the Blob storage container name. Der Containername ist standardmäßig derselbe Name wie der Clustername.By default, the container name is the same name as the cluster name.

  7. Suchen Sie HiveSampleData.txt in der Spalte Name (der Pfad zum Ordner lautet ../hive/warehouse/hivesampletable/) und klicken Sie links von HiveSampleData.txt auf Binär.Locate HiveSampleData.txt in the Name column (the folder path is ../hive/warehouse/hivesampletable/), and then click Binary on the left of HiveSampleData.txt. „HiveSampleData.txt“ enthält alle Cluster.HiveSampleData.txt comes with all the cluster. Sie können optional auch Ihre eigene Datei verwenden.Optionally, you can use your own file.

    HDI.PowerQuery.ImportData

  8. Bei Bedarf können Sie die Spaltennamen ändern.If you want, you can rename the column names. Klicken Sie auf, wenn Sie fertig sind, Schließen und laden.When you are ready, click Close & Load. Die Daten wurden in Ihre Arbeitsmappe geladen.The data has been loaded to your workbook:

    HDI.PowerQuery.ImportedTable

Nächste SchritteNext steps

In diesem Artikel haben Sie gelernt, wie Sie Daten aus HDInsight mithilfe von Power Query in Excel verwenden können.In this article, you learned how to use Power Query to retrieve data from HDInsight into Excel. Auf ähnliche Weise können Sie Daten aus HDInsight für die Azure SQL-Datenbank abrufen.Similarly, you can retrieve data from HDInsight into Azure SQL Database. Außerdem können Sie Daten nach HDInsight hochladen.It is also possible to upload data into HDInsight. Weitere Informationen finden Sie in den folgenden Artikeln:To learn more, see the following articles: