Excel verbinden met Apache Hadoop in azure HDInsight met het micro soft Hive ODBC-stuur programmaConnect Excel to Apache Hadoop in Azure HDInsight with the Microsoft Hive ODBC driver

De Big Data-oplossing van micro soft integreert micro soft Business Intelligence-onderdelen (BI) met Apache Hadoop clusters die zijn geïmplementeerd in azure HDInsight.Microsoft's Big Data solution integrates Microsoft Business Intelligence (BI) components with Apache Hadoop clusters that have been deployed in Azure HDInsight. Een voor beeld van deze integratie is de mogelijkheid om Excel te verbinden met het Hive-Data Warehouse van een Hadoop-cluster in HDInsight met behulp van het micro soft-stuur programma voor Hive Open Database Connectivity (ODBC).An example of this integration is the ability to connect Excel to the Hive data warehouse of a Hadoop cluster in HDInsight using the Microsoft Hive Open Database Connectivity (ODBC) Driver.

Het is ook mogelijk om de gegevens die zijn gekoppeld aan een HDInsight-cluster en andere gegevens bronnen, waaronder andere (niet-HDInsight) Hadoop-clusters, te verbinden vanuit Excel met behulp van de micro soft Power Query-invoeg toepassing voor Excel.It's also possible to connect the data associated with an HDInsight cluster and other data sources, including other (non-HDInsight) Hadoop clusters, from Excel using the Microsoft Power Query add-in for Excel. Zie voor meer informatie over het installeren en gebruiken van Power Query verbinding maken tussen Excel en HDInsight met Power query.For information on installing and using Power Query, see Connect Excel to HDInsight with Power Query.

VereistenPrerequisites

Voordat u met dit artikel begint, moet u beschikken over de volgende items:Before you begin this article, you must have the following items:

  • An HDInsight Hadoop-cluster.An HDInsight Hadoop cluster. Zie aan de slag met Azure HDInsightom een account te maken.To create one, see Get started with Azure HDInsight.
  • Een werk station met Office 2010 Professional Plus of hoger of Excel 2010 of hoger.A workstation with Office 2010 Professional Plus or later, or Excel 2010 or later.

Micro soft Hive ODBC-stuur programma installerenInstall Microsoft Hive ODBC driver

Down load en installeer de versie van het micro soft Hive ODBC-stuur programma die overeenkomt met de versie van de toepassing waarin u het ODBC-stuur programma gaat gebruiken.Download and install the Microsoft Hive ODBC Driver version that matches the version of the application where you'll be using the ODBC driver. Voor dit artikel wordt het stuur programma gebruikt voor Office Excel.For this article, the driver is used for Office Excel.

Apache Hive ODBC-gegevens bron makenCreate Apache Hive ODBC data source

De volgende stappen laten zien hoe u een Hive-ODBC-gegevens bron maakt.The following steps show you how to create a Hive ODBC Data Source.

  1. Ga vanuit Windows naar Start > Windows-beheer Programma's > ODBC-gegevens bronnen (32-bits)/(64-bits).From Windows, navigate to Start > Windows Administrative Tools > ODBC Data Sources (32-bit)/(64-bit). Hiermee opent u het venster ODBC-gegevens bron beheer .This opens the ODBC Data Source Administrator window.

    OBDC-gegevens bron beheerderOBDC data source administrator

  2. Klik op het tabblad gebruikers-DSN op toevoegen om het venster nieuwe gegevens bron maken te openen.From the User DSN tab, select Add to open the Create New Data Source window.

  3. Selecteer micro soft Hive ODBC-stuur programmaen selecteer vervolgens volt ooien om het venster micro soft Hive ODBC-stuur programma voor DSN-instellingen te openen.Select Microsoft Hive ODBC Driver, and then select Finish to open the Microsoft Hive ODBC Driver DSN Setup window.

  4. Typ of selecteer de volgende waarden:Type or select the following values:

    EigenschapProperty BeschrijvingDescription
    Naam van de gegevensbronData Source Name Geef uw gegevensbron een naamGive a name to your data source
    Host (s)Host(s) Voer HDInsightClusterName.azurehdinsight.net in.Enter HDInsightClusterName.azurehdinsight.net. Bijvoorbeeld: myHDICluster.azurehdinsight.netFor example, myHDICluster.azurehdinsight.net
    PortPort Gebruik 443.Use 443. (Deze poort is gewijzigd van 563 in 443.)(This port has been changed from 563 to 443.)
    DatabaseDatabase Standaard instellinggebruiken.Use default.
    MechanismeMechanism Selecteer de Windows Azure HDInsight-serviceSelect Windows Azure HDInsight Service
    GebruikersnaamUser Name Voer de gebruikers naam van het HDInsight-cluster in.Enter HDInsight cluster HTTP user username. De standaardgebruikersnaam admin.The default username is admin.
    WachtwoordPassword Voer het gebruikers wachtwoord voor het HDInsight-cluster in.Enter HDInsight cluster user password. Schakel het selectie vakje wacht woord opslaan (versleuteld) in.Select the checkbox Save Password (Encrypted).
  5. Optioneel: Selecteer Geavanceerde opties...Optional: Select Advanced Options...

    ParameterParameter BeschrijvingDescription
    Systeem eigen query gebruikenUse Native Query Wanneer deze is geselecteerd, probeert het ODBC-stuur programma geen TSQL te converteren naar HiveQL.When it's selected, the ODBC driver does NOT try to convert TSQL into HiveQL. U dient deze alleen te gebruiken als u 100% zeker weet dat u HiveQL-instructies verzendt.You shall use it only if you're 100% sure you're submitting pure HiveQL statements. Wanneer u verbinding maakt met SQL Server of Azure SQL Database, moet u het selectie vakje uitgeschakeld laten.When connecting to SQL Server or Azure SQL Database, you should leave it unchecked.
    Opgehaalde rijen per blokRows fetched per block Bij het ophalen van een groot aantal records is het mogelijk dat deze para meter moet worden afgestemd om optimale prestaties te garanderen.When fetching a large number of records, tuning this parameter may be required to ensure optimal performances.
    Standaard lengte van een teken reeks kolom, binaire kolom lengte, decimale kolom schaalDefault string column length, Binary column length, Decimal column scale De lengten en nauw keurigheid van het gegevens type kunnen van invloed zijn op hoe gegevens worden geretourneerd.The data type lengths and precisions may affect how data is returned. Ze leiden ertoe dat onjuiste gegevens worden geretourneerd vanwege verlies van nauw keurigheid en/of afkap ping.They cause incorrect information to be returned due to loss of precision and/or truncation.

    Geavanceerde configuratie opties voor DSNAdvanced DSN configuration options

  6. Selecteer testen om de gegevens bron te testen.Select Test to test the data source. Wanneer de gegevens bron op de juiste wijze is geconfigureerd, wordt in het test resultaat de waarde geslaagdweer gegeven.When the data source is configured correctly, the test result shows SUCCESS!.

  7. Selecteer OK om het test venster te sluiten.Select OK to close the Test window.

  8. Selecteer OK om het venster micro soft Hive ODBC-stuur programma DSN-instellingen te sluiten.Select OK to close the Microsoft Hive ODBC Driver DSN Setup window.

  9. Selecteer OK om het venster ODBC-gegevens bron beheer te sluiten.Select OK to close the ODBC Data Source Administrator window.

Gegevens in Excel importeren vanuit HDInsightImport data into Excel from HDInsight

In de volgende stappen wordt beschreven hoe u gegevens uit een Hive-tabel importeert in een Excel-werkmap met behulp van de ODBC-gegevens bron die u hebt gemaakt in de vorige sectie.The following steps describe the way to import data from a Hive table into an Excel workbook using the ODBC data source that you created in the previous section.

  1. Open een nieuwe of bestaande werkmap in Excel.Open a new or existing workbook in Excel.

  2. Ga op het tabblad gegevens naar gegevens > ophalen uit andere bronnen > van ODBC om het venster van ODBC te starten.From the Data tab, navigate to Get Data > From Other Sources > From ODBC to launch the From ODBC window.

    Wizard Excel-gegevens verbinding openenOpen Excel data connection wizard

  3. Selecteer in de vervolg keuzelijst de naam van de gegevens bron die u in de laatste sectie hebt gemaakt en selecteer vervolgens OK.From the drop-down list, select the data source name that you created in the last section and then select OK.

  4. Voor het eerste gebruik wordt het dialoog venster ODBC-stuur programma geopend.For the first use, an ODBC driver dialog will open. Selecteer Windows in het menu links.Select Windows from the left menu. Selecteer vervolgens verbinding maken om het Navigator venster te openen.Then select Connect to open the Navigator window.

  5. Navigeer vanuit Navigatornaar Hive > standaard > hivesampletable, en selecteer vervolgens laden.From Navigator, navigate to HIVE > default > hivesampletable, and then select Load. Het duurt enkele minuten voordat de gegevens in Excel worden geïmporteerd.It takes a few moments before data gets imported to Excel.

    ODBC-Navigator Excel-Hive van HDInsightHDInsight Excel Hive ODBC navigator

Volgende stappenNext steps

In dit artikel hebt u geleerd hoe u het micro soft Hive ODBC-stuur programma gebruikt om gegevens op te halen uit de HDInsight-service in Excel.In this article, you learned how to use the Microsoft Hive ODBC driver to retrieve data from the HDInsight Service into Excel. Op dezelfde manier kunt u gegevens ophalen van de HDInsight-service in SQL Database.Similarly, you can retrieve data from the HDInsight Service into SQL Database. Het is ook mogelijk om gegevens te uploaden naar een HDInsight-service.It's also possible to upload data into an HDInsight Service. Voor meer informatie zie:To learn more, see: