Excel verbinden met Apache Hadoop met behulp van Power QueryConnect Excel to Apache Hadoop by using Power Query

Een belang rijke functie van de micro soft-oplossing voor Big data is de integratie van micro soft business intelligence-onderdelen (BI) met Apache Hadoop clusters in azure HDInsight.One key feature of the Microsoft big-data solution is the integration of Microsoft business intelligence (BI) components with Apache Hadoop clusters in Azure HDInsight. Een primair voor beeld is de mogelijkheid om Excel te verbinden met het Azure Storage-account dat de gegevens bevat die aan uw Hadoop-cluster zijn gekoppeld met behulp van de Microsoft Power Query voor Excel-invoeg toepassing.A primary example is the ability to connect Excel to the Azure Storage account that contains the data associated with your Hadoop cluster by using the Microsoft Power Query for Excel add-in. In dit artikel vindt u instructies voor het instellen en gebruiken van Power Query voor het opvragen van gegevens die zijn gekoppeld aan een Hadoop-cluster dat wordt beheerd met HDInsight.This article walks you through how to set up and use Power Query to query data associated with a Hadoop cluster managed with HDInsight.

VereistenPrerequisites

Voordat u met dit artikel begint, moet u beschikken over de volgende items:Before you begin this article, you must have the following items:

  • An HDInsight cluster.An HDInsight cluster. Zie aan de slag met Azure HDInsightom een configuratie te configureren.To configure one, see Get started with Azure HDInsight.
  • Een werk station met Windows 7, Windows Server 2008 R2 of een later besturings systeem.A workstation that is running Windows 7, Windows Server 2008 R2, or a later operating system.
  • Office 2016, office 2013 Professional Plus, office 365 ProPlus, Excel 2013 zelfstandige of office 2010 Professional Plus.Office 2016, Office 2013 Professional Plus, Office 365 ProPlus, Excel 2013 Standalone, or Office 2010 Professional Plus.

Power Query installerenInstall Power Query

Power Query kunt gegevens importeren die zijn uitgevoerd of die zijn gegenereerd door een Hadoop-taak die wordt uitgevoerd op een HDInsight-cluster.Power Query can import data that has been output or that has been generated by a Hadoop job running on an HDInsight cluster.

In Excel 2016 is Power Query geïntegreerd in het gegevens lint onder het gedeelte & trans formatie ophalen.In Excel 2016, Power Query has been integrated into the Data ribbon under the Get & Transform section. Voor oudere Excel-versies downloadt u Microsoft Power Query voor Excel van het micro soft Download centrum en installeert u het.For older Excel versions, download Microsoft Power Query for Excel from the Microsoft Download Center and install it.

HDInsight-gegevens importeren in ExcelImport HDInsight data into Excel

Met de invoeg toepassing Power Query voor Excel kunt u eenvoudig gegevens uit uw HDInsight-cluster importeren in Excel, waar BI-hulpprogram ma's zoals Power Pivot en Power Map kunnen worden gebruikt om de gegevens te controleren, analyseren en presen teren.The Power Query add-in for Excel makes it easy to import data from your HDInsight cluster into Excel, where BI tools such as PowerPivot and Power Map can be used to inspect, analyze, and present the data.

Gegevens importeren uit een HDInsight-clusterTo import data from an HDInsight cluster

  1. Open Excel.Open Excel.

  2. Een nieuwe lege werkmap maken.Create a new blank workbook.

  3. Voer de volgende stappen uit op basis van de Excel-versie:Perform the following steps based on the Excel version:

    • Excel 2016Excel 2016

      • Klik op het menu Data , klik op gegevens ophalen in het lint gegevens ophalen & transformeren , Klik in azureen klik vervolgens op van Azure HDInsight (HDFS) .Click the Data menu, click Get Data from the Get & Transform Data ribbon, click From Azure, and then click From Azure HDInsight(HDFS).

        HDI. PowerQuery. SelectHdiSource. 2016

    • Excel 2013/2010Excel 2013/2010

      • Klik op het menu Power query , Klik in azureen klik vervolgens op van Microsoft Azure HDInsight.Click the Power Query menu, click From Azure, and then click From Microsoft Azure HDInsight.

        HDI.PowerQuery.SelectHdiSource

        Opmerking: Als u het menu Power query niet ziet, gaat u naar Bestands > Opties > invoeg toepassingenen selecteert u com -invoeg toepassingen in de vervolg keuzelijst beheren onder aan de pagina.Note: If you don't see the Power Query menu, go to File > Options > Add-ins, and select COM Add-ins from the drop-down Manage box at the bottom of the page. Selecteer de knop go... en controleer of het selectie vakje voor de Power query voor Excel-invoeg toepassing is ingeschakeld.Select the Go... button and verify that the box for the Power Query for Excel add-in has been checked.

        Opmerking: Met Power Query kunt u ook gegevens importeren uit HDFS door te klikken uit andere bronnen.Note: Power Query also allows you to import data from HDFS by clicking From Other Sources.

  4. Voer bij account naamde naam in van het Azure Blob Storage-account dat is gekoppeld aan uw cluster en klik vervolgens op OK.For Account Name, enter the name of the Azure Blob storage account associated with your cluster, and then click OK. Dit account kan het standaard opslag account of een gekoppeld opslag account zijn.This account can be the default storage account or a linked storage account. De indeling is https://<StorageAccountName >. blob. core. Windows. net/ .The format is https://<StorageAccountName>.blob.core.windows.net/.

  5. Voer voor account sleutelde sleutel voor het Blob Storage-account in en klik vervolgens op Opslaan.For Account Key, enter the key for the Blob storage account, and then click Save. (U hoeft alleen de account gegevens op te geven voor de eerste keer dat u toegang tot deze winkel hebt.)(You need to enter the account information only the first time you access this store.)

  6. Dubbel klik in het Navigatie deel venster aan de linkerkant van de query-editor op de container naam van de Blob-opslag.In the Navigator pane on the left of the Query Editor, double-click the Blob storage container name. De naam van de container is standaard hetzelfde als de naam van het cluster.By default, the container name is the same name as the cluster name.

  7. Zoek HiveSampleData. txt in de kolom naam (het mappad is . /Hive/Warehouse/hivesampletable/ ) en klik vervolgens op binair aan de linkerkant van HiveSampleData. txt.Locate HiveSampleData.txt in the Name column (the folder path is ../hive/warehouse/hivesampletable/), and then click Binary on the left of HiveSampleData.txt. HiveSampleData. txt wordt geleverd met alle clusters.HiveSampleData.txt comes with all the cluster. U kunt desgewenst uw eigen bestand gebruiken.Optionally, you can use your own file.

    HDI Excel Power query-gegevens importeren

  8. Als u wilt, kunt u de naam van de kolom namen wijzigen.If you want, you can rename the column names. Wanneer u klaar bent, klikt u op sluiten & laden.When you are ready, click Close & Load. De gegevens zijn geladen in uw werkmap:The data has been loaded to your workbook:

    Geïmporteerde tabel HDI Excel Power query

Volgende stappenNext steps

In dit artikel hebt u geleerd hoe u Power Query kunt gebruiken om gegevens uit HDInsight op te halen in Excel.In this article, you learned how to use Power Query to retrieve data from HDInsight into Excel. Op dezelfde manier kunt u gegevens ophalen van HDInsight in Azure SQL Database.Similarly, you can retrieve data from HDInsight into Azure SQL Database. Het is ook mogelijk om gegevens te uploaden naar HDInsight.It is also possible to upload data into HDInsight. Raadpleeg de volgende artikelen voor meer informatie:To learn more, see the following articles: