Excel verbinden met Apache Hadoop met Power QueryConnect Excel to Apache Hadoop by using Power Query

Een belangrijke functie van de Microsoft big data-oplossing is de integratie van Microsoft business intelligence (BI)-onderdelen met Apache Hadoop-clusters in Azure HDInsight.One key feature of the Microsoft big-data solution is the integration of Microsoft business intelligence (BI) components with Apache Hadoop clusters in Azure HDInsight. Een voorbeeld van een primaire is de mogelijkheid om Excel verbinden met de Azure Storage-account met de gegevens die zijn gekoppeld aan uw Hadoop-cluster met behulp van de Microsoft Power Query voor Excel-invoegtoepassing.A primary example is the ability to connect Excel to the Azure Storage account that contains the data associated with your Hadoop cluster by using the Microsoft Power Query for Excel add-in. Dit artikel helpt u bij het instellen en gebruiken van Power Query om gegevens te doorzoeken die zijn gekoppeld aan een beheerd met HDInsight Hadoop-cluster.This article walks you through how to set up and use Power Query to query data associated with a Hadoop cluster managed with HDInsight.

VereistenPrerequisites

Voordat u dit artikel, hebt u de volgende items:Before you begin this article, you must have the following items:

  • Een HDInsight-cluster.An HDInsight cluster. Zie configureren van een [aan de slag met Azure HDInsight] [hdinsight-get-started].To configure one, see [Get started with Azure HDInsight][hdinsight-get-started].
  • Een werkstation waarop Windows 7, Windows Server 2008 R2 of een nieuwer besturingssysteem wordt uitgevoerd.A workstation that is running Windows 7, Windows Server 2008 R2, or a later operating system.
  • Office 2016, Office 2013 Professional Plus, Office 365 ProPlus, zelfstandige versie van Excel 2013 of Office 2010 Professional Plus.Office 2016, Office 2013 Professional Plus, Office 365 ProPlus, Excel 2013 Standalone, or Office 2010 Professional Plus.

Installeren van Power QueryInstall Power Query

Power Query kunt importeren van gegevens die de uitvoer heeft zijn of die is gegenereerd door een Hadoop-taak die wordt uitgevoerd op een HDInsight-cluster.Power Query can import data that has been output or that has been generated by a Hadoop job running on an HDInsight cluster.

In Excel 2016, is Power Query geïntegreerd in het lint gegevens onder de sectie ophalen en transformeren.In Excel 2016, Power Query has been integrated into the Data ribbon under the Get & Transform section. Download voor oudere versies van Excel, Microsoft Power Query voor Excel uit de [Microsoft Download Center] powerquery-download en installeer deze.For older Excel versions, download Microsoft Power Query for Excel from the Microsoft Download Center and install it.

HDInsight-gegevens importeren in ExcelImport HDInsight data into Excel

De Power Query-invoegtoepassing voor Excel kunt u eenvoudig gegevens importeren uit uw HDInsight-cluster in Excel, waar BI-hulpprogramma's zoals PowerPivot en Power Map kunnen worden gebruikt om te controleren, analyseren en de gegevens te presenteren.The Power Query add-in for Excel makes it easy to import data from your HDInsight cluster into Excel, where BI tools such as PowerPivot and Power Map can be used to inspect, analyze, and present the data.

Gegevens importeren uit een HDInsight-clusterTo import data from an HDInsight cluster

  1. Open Excel.Open Excel.

  2. Maak een nieuwe lege werkmap.Create a new blank workbook.

  3. Voer de volgende stappen uit op basis van de versie van Excel:Perform the following steps based on the Excel version:

    • Excel 2016Excel 2016

      • Klik op de gegevens menu, klikt u op gegevens ophalen uit de gegevens ophalen en transformeren lint, klikt u op van Azure, en klik vervolgens op Uit Azure HDInsight(HDFS) .Click the Data menu, click Get Data from the Get & Transform Data ribbon, click From Azure, and then click From Azure HDInsight(HDFS).

        HDI.PowerQuery.SelectHdiSource

    • Excel 2013/2010Excel 2013/2010

      • Klik op de Power Query menu, klikt u op van Azure, en klik vervolgens op van Microsoft Azure HDInsight.Click the Power Query menu, click From Azure, and then click From Microsoft Azure HDInsight.

        HDI.PowerQuery.SelectHdiSource

        Opmerking: Als er geen de Power Query menu, gaat u naar bestand > opties > -invoegtoepassingen, en selecteer COM-invoegtoepassingen in de vervolgkeuzelijst beheren vak aan de onderkant van de pagina.Note: If you don't see the Power Query menu, go to File > Options > Add-ins, and select COM Add-ins from the drop-down Manage box at the bottom of the page. Selecteer de gaan... knop en controleer of het selectievakje in voor de Power Query voor Excel-invoegtoepassing is ingeschakeld.Select the Go... button and verify that the box for the Power Query for Excel add-in has been checked.

        Opmerking: Power Query kunt u gegevens importeren uit HDFS door te klikken op ook van andere bronnen.Note: Power Query also allows you to import data from HDFS by clicking From Other Sources.

  4. Voor accountnaam, voer de naam van de Azure Blob storage-account dat is gekoppeld aan het cluster en klik vervolgens op OK.For Account Name, enter the name of the Azure Blob storage account associated with your cluster, and then click OK. Dit account kan worden het standaardaccount voor opslag of een gekoppelde storage-account.This account can be the default storage account or a linked storage account. De indeling is https://<StorageAccountName >.blob.core.windows.net/ .The format is https://<StorageAccountName>.blob.core.windows.net/.

  5. Voor Accountsleutel, voer de sleutel voor de Blob storage-account en klik vervolgens op opslaan.For Account Key, enter the key for the Blob storage account, and then click Save. (U moet de account informatie alleen de eerste keer dat u toegang dit archief tot invoeren.)(You need to enter the account information only the first time you access this store.)

  6. In de Navigator in het linkerdeelvenster van de Query-Editor, dubbelklikt u op de naam van de Blob storage-container.In the Navigator pane on the left of the Query Editor, double-click the Blob storage container name. Standaard is de naam van dezelfde naam als de naam van het cluster.By default, the container name is the same name as the cluster name.

  7. Zoek HiveSampleData.txt in de naam kolom (pad naar de map is ... / hive/datawarehouse/hivesampletable/ ), en klik vervolgens op binaire aan de linkerkant van HiveSampleData.txt.Locate HiveSampleData.txt in the Name column (the folder path is ../hive/warehouse/hivesampletable/), and then click Binary on the left of HiveSampleData.txt. HiveSampleData.txt wordt geleverd met alle het cluster.HiveSampleData.txt comes with all the cluster. Desgewenst kunt u uw eigen-bestand.Optionally, you can use your own file.

    HDI.PowerQuery.ImportData

  8. Als u wilt, kunt u de namen van kolommen wijzigen.If you want, you can rename the column names. Wanneer u klaar bent, klikt u op sluiten en laden.When you are ready, click Close & Load. De gegevens zijn geladen in uw werkmap:The data has been loaded to your workbook:

    HDI.PowerQuery.ImportedTable

Volgende stappenNext steps

In dit artikel hebt u geleerd hoe u Power Query voor het ophalen van gegevens uit HDInsight in Excel.In this article, you learned how to use Power Query to retrieve data from HDInsight into Excel. Op deze manier kunt u gegevens ophalen uit HDInsight in Azure SQL Database.Similarly, you can retrieve data from HDInsight into Azure SQL Database. Het is ook mogelijk om gegevens te uploaden naar HDInsight.It is also possible to upload data into HDInsight. Zie de volgende artikelen voor meer informatie:To learn more, see the following articles: