Excel verbinden met Apache Hadoop in Azure HDInsight met het Microsoft Hive ODBC-stuurprogrammaConnect Excel to Apache Hadoop in Azure HDInsight with the Microsoft Hive ODBC driver

Microsoft Business Intelligence (BI) onderdelen van Microsoft Big Data-oplossing geïntegreerd met Apache Hadoop-clusters die zijn geïmplementeerd in Azure HDInsight.Microsoft's Big Data solution integrates Microsoft Business Intelligence (BI) components with Apache Hadoop clusters that have been deployed in Azure HDInsight. Een voorbeeld van deze integratie is de mogelijkheid Excel verbindt met het Hive-datawarehouse van een Hadoop-cluster in HDInsight met behulp van het stuurprogramma Microsoft Hive Open Database Connectivity (ODBC).An example of this integration is the ability to connect Excel to the Hive data warehouse of a Hadoop cluster in HDInsight using the Microsoft Hive Open Database Connectivity (ODBC) Driver.

Het is ook mogelijk om de gegevens die zijn gekoppeld aan een HDInsight-cluster en andere gegevensbronnen, met inbegrip van andere (niet-HDInsight) Hadoop-clusters uit Excel met de Microsoft Power Query-invoegtoepassing voor Excel te verbinden.It is also possible to connect the data associated with an HDInsight cluster and other data sources, including other (non-HDInsight) Hadoop clusters, from Excel using the Microsoft Power Query add-in for Excel. Zie voor meer informatie over het installeren en met behulp van Power Query Excel verbinding maken met HDInsight met Power Query.For information on installing and using Power Query, see Connect Excel to HDInsight with Power Query.

VereistenPrerequisites

Voordat u dit artikel, hebt u de volgende items:Before you begin this article, you must have the following items:

  • Een HDInsight Hadoop-cluster.An HDInsight Hadoop cluster. Zie voor het maken van een aan de slag met Azure HDInsight.To create one, see Get started with Azure HDInsight.
  • Een werkstation met Office 2010 Professional Plus of hoger, of Excel 2010 of hoger.A workstation with Office 2010 Professional Plus or later, or Excel 2010 or later.

Microsoft Hive ODBC-stuurprogramma installerenInstall Microsoft Hive ODBC driver

Download en installeer de stuurprogramma Microsoft Hive ODBC versie die overeenkomt met de versie van de toepassing waar u het ODBC-stuurprogramma wordt gebruikt.Download and install the Microsoft Hive ODBC Driver version that matches the version of the application where you will be using the ODBC driver. In dit artikel wordt het stuurprogramma voor Office Excel gebruikt.For this article, the driver is used for Office Excel.

Apache Hive ODBC-gegevensbron makenCreate Apache Hive ODBC data source

De volgende stappen laten zien hoe u een Hive ODBC-gegevensbron maken.The following steps show you how to create a Hive ODBC Data Source.

  1. Vanuit Windows, navigeert u naar Start > Windows-beheerprogramma's > ODBC-gegevensbronnen (32-bit)/(64-bit).From Windows, navigate to Start > Windows Administrative Tools > ODBC Data Sources (32-bit)/(64-bit). Hiermee opent u de ODBC-gegevensbronbeheer venster.This opens the ODBC Data Source Administrator window.

    OBDC gegevensbronbeheerOBDC data source administrator

  2. Uit de gebruiker DSN tabblad toevoegen openen de nieuwe gegevensbron maken venster.From the User DSN tab, select Add to open the Create New Data Source window.

  3. Selecteer stuurprogramma Microsoft Hive ODBC, en selecteer vervolgens voltooien openen de Microsoft Hive ODBC-stuurprogramma DSN Setup venster.Select Microsoft Hive ODBC Driver, and then select Finish to open the Microsoft Hive ODBC Driver DSN Setup window.

  4. Typ of selecteer de volgende waarden:Type or select the following values:

    EigenschapProperty DescriptionDescription
    Naam van de gegevensbronData Source Name Geef uw gegevensbron een naamGive a name to your data source
    Host (s)Host(s) Voer HDInsightClusterName.azurehdinsight.net in.Enter HDInsightClusterName.azurehdinsight.net. Bijvoorbeeld: myHDICluster.azurehdinsight.netFor example, myHDICluster.azurehdinsight.net
    PoortPort Gebruik 443.Use 443. (Deze poort is gewijzigd van 563 in 443.)(This port has been changed from 563 to 443.)
    DatabaseDatabase Gebruik standaard.Use default.
    MechanismeMechanism Selecteer Windows Azure HDInsight ServiceSelect Windows Azure HDInsight Service
    GebruikersnaamUser Name HDInsight-cluster HTTP-gebruikersnaam invoeren.Enter HDInsight cluster HTTP user username. De standaardgebruikersnaam admin.The default username is admin.
    WachtwoordPassword Voer gebruikerswachtwoord van HDInsight-cluster.Enter HDInsight cluster user password. Schakel het selectievakje wachtwoord opslaan (versleutelde) .Select the checkbox Save Password (Encrypted).
  5. Optioneel: Selecteer geavanceerde opties...Optional: Select Advanced Options...

    ParameterParameter DescriptionDescription
    Systeemeigen Query gebruikenUse Native Query Wanneer deze optie is geselecteerd, probeert het ODBC-stuurprogramma niet TSQL converteren naar HiveQL.When it is selected, the ODBC driver does NOT try to convert TSQL into HiveQL. U dient deze alleen als u 100% zeker dat u verzendt pure HiveQL-instructies gebruiken.You shall use it only if you are 100% sure you are submitting pure HiveQL statements. Bij het verbinden met SQL Server of Azure SQL Database, laat u het vakje uitgeschakeld.When connecting to SQL Server or Azure SQL Database, you should leave it unchecked.
    Rijen per blok wordt opgehaaldRows fetched per block Tijdens het ophalen van een groot aantal records, kan afstemmen van deze parameter worden vereist om ervoor te zorgen van optimale prestaties.When fetching a large number of records, tuning this parameter may be required to ensure optimal performances.
    Standaard kolomlengte tekenreeks, lengte van de binaire kolom, decimaal kolomschaalDefault string column length, Binary column length, Decimal column scale De lengte van het gegevenstype en Precision-systemen kunnen beïnvloeden hoe gegevens worden geretourneerd.The data type lengths and precisions may affect how data is returned. Ze ervoor zorgen dat de onjuiste gegevens worden geretourneerd vanwege verlies van precisie-en/of moet worden afgekapt.They cause incorrect information to be returned due to loss of precision and/or truncation.

    Geavanceerde optiesAdvanced options

  6. Selecteer testen voor het testen van de gegevensbron.Select Test to test the data source. Wanneer de gegevensbron correct is geconfigureerd, ziet u de testresultaten SUCCES! .When the data source is configured correctly, the test result shows SUCCESS!.

  7. Selecteer OK om de Test-venster te sluiten.Select OK to close the Test window.

  8. Selecteer OK sluiten de Microsoft Hive ODBC-stuurprogramma DSN Setup venster.Select OK to close the Microsoft Hive ODBC Driver DSN Setup window.

  9. Selecteer OK sluiten de ODBC-gegevensbronbeheer venster.Select OK to close the ODBC Data Source Administrator window.

Gegevens in Excel importeren vanuit HDInsightImport data into Excel from HDInsight

De volgende stappen beschrijven de manier waarop gegevens importeren uit een Hive-tabel in een Excel-werkmap met behulp van de ODBC-gegevensbron die u in de vorige sectie hebt gemaakt.The following steps describe the way to import data from a Hive table into an Excel workbook using the ODBC data source that you created in the previous section.

  1. Open een nieuwe of bestaande werkmap in Excel.Open a new or existing workbook in Excel.

  2. Uit de gegevens tabblad, gaat u naar gegevens ophalen > van andere bronnen > uit ODBC starten de Uit ODBC venster.From the Data tab, navigate to Get Data > From Other Sources > From ODBC to launch the From ODBC window.

    Wizard Gegevensverbinding OpenOpen data connection wizard

  3. Selecteer de naam van de gegevensbron die u hebt gemaakt in de laatste sectie van de vervolgkeuzelijst en selecteer vervolgens OK.From the drop-down list, select the data source name that you created in the last section and then select OK.

  4. Voor het eerste gebruik, een ODBC-stuurprogramma dialoogvenster wordt geopend.For the first use, an ODBC driver dialog will open. Selecteer Windows in het menu links.Select Windows from the left menu. Selecteer vervolgens Connect openen de Navigator venster.Then select Connect to open the Navigator window.

  5. Van Navigator, gaat u naar HIVE > standaard > hivesampletable, en selecteer vervolgens Load.From Navigator, navigate to HIVE > default > hivesampletable, and then select Load. Het duurt een paar minuten voordat de gegevens naar Excel worden geïmporteerd.It takes a few moments before data gets imported to Excel.

    HDInsight Hive ODBC-navigatorHDInsight Hive ODBC navigator

Volgende stappenNext steps

In dit artikel hebt u geleerd hoe u gegevens ophaalt uit de HDInsight-Service in Excel met het Microsoft Hive ODBC-stuurprogramma.In this article, you learned how to use the Microsoft Hive ODBC driver to retrieve data from the HDInsight Service into Excel. Op deze manier kunt u gegevens ophalen uit de HDInsight-Service in SQL-Database.Similarly, you can retrieve data from the HDInsight Service into SQL Database. Het is ook mogelijk om gegevens te uploaden naar een HDInsight-Service.It is also possible to upload data into an HDInsight Service. Voor meer informatie zie:To learn more, see: