Microsoft Hive ODBC ドライバーを使用して Excel を Azure HDInsight 上の Apache Hadoop に接続するConnect Excel to Apache Hadoop in Azure HDInsight with the Microsoft Hive ODBC driver

Microsoft のビッグ データ ソリューションでは、Azure HDInsight にデプロイされた Apache Hadoop クラスターと Microsoft Business Intelligence (BI) コンポーネントが統合されます。Microsoft's Big Data solution integrates Microsoft Business Intelligence (BI) components with Apache Hadoop clusters that have been deployed in Azure HDInsight. たとえば、Microsoft Hive Open Database Connectivity (ODBC) ドライバーを使用すれば、HDInsight で Hadoop クラスターの Hive データ ウェアハウスに Excel を接続できます。An example of this integration is the ability to connect Excel to the Hive data warehouse of a Hadoop cluster in HDInsight using the Microsoft Hive Open Database Connectivity (ODBC) Driver.

また、Microsoft Power Query for Excel アドインを使用して Excel から HDInsight クラスターや、その他の (HDInsight 以外の) Hadoop クラスターなどのデータ ソースを接続することもできます。It's also possible to connect the data associated with an HDInsight cluster and other data sources, including other (non-HDInsight) Hadoop clusters, from Excel using the Microsoft Power Query add-in for Excel. Power Query のインストール方法と使用方法については、Power Query を使用した Excel から HDInsight への接続に関するページを参照してください。For information on installing and using Power Query, see Connect Excel to HDInsight with Power Query.

前提条件Prerequisites

この記事の操作を始める前に、以下を用意する必要があります。Before you begin this article, you must have the following items:

  • HDInsight Hadoop クラスター。An HDInsight Hadoop cluster. その作成方法については、Azure HDInsight の概要に関するページをご覧ください。To create one, see Get started with Azure HDInsight.
  • Office 2010 Professional Plus 以降または Excel 2010 以降を使用するワークステーション。A workstation with Office 2010 Professional Plus or later, or Excel 2010 or later.

Microsoft Hive ODBC ドライバーのインストールInstall Microsoft Hive ODBC driver

ODBC ドライバーを使用するアプリケーションのバージョンと一致した Microsoft Hive ODBC Driver のバージョンをダウンロードしてインストールします。Download and install the Microsoft Hive ODBC Driver version that matches the version of the application where you'll be using the ODBC driver. この記事では、Office Excel に対してこのドライバーを使用します。For this article, the driver is used for Office Excel.

Apache Hive ODBC データ ソースを作成するCreate Apache Hive ODBC data source

次の手順に従って、Hive ODBC データ ソースを作成します。The following steps show you how to create a Hive ODBC Data Source.

  1. Windows で、[スタート]、[Windows 管理ツール]、[ODBC データ ソース (32 ビット)/(64 ビット)] の順に移動します。From Windows, navigate to Start > Windows Administrative Tools > ODBC Data Sources (32-bit)/(64-bit). これにより、 [ODBC データ ソース アドミニストレーター] ウィンドウが開きます。This opens the ODBC Data Source Administrator window.

    ODBC データ ソース アドミニストレーターOBDC data source administrator

  2. [ユーザー DSN] タブで、 [追加] を選択して [データ ソースの新規作成] ウィンドウを開きます。From the User DSN tab, select Add to open the Create New Data Source window.

  3. [Microsoft Hive ODBC Driver] を選択してから、 [完了] を選択して Microsoft Hive ODBC Driver DSN セットアップ ウィンドウを開きます。Select Microsoft Hive ODBC Driver, and then select Finish to open the Microsoft Hive ODBC Driver DSN Setup window.

  4. 次の値を入力または選択します。Type or select the following values:

    プロパティProperty 説明Description
    データ ソース名Data Source Name データ ソースに名前を付けます。Give a name to your data source
    ホストHost(s) HDInsightClusterName.azurehdinsight.net 」を入力します。Enter HDInsightClusterName.azurehdinsight.net. たとえば、myHDICluster.azurehdinsight.net のように指定します。For example, myHDICluster.azurehdinsight.net
    PortPort 443 を使用します。Use 443. (このポートは 563 から 443 に変更されました)。(This port has been changed from 563 to 443.)
    DatabaseDatabase 既定値を使用します。Use default.
    メカニズムMechanism [Microsoft Azure HDInsight Service] を選択しますSelect Windows Azure HDInsight Service
    ユーザー名User Name HDInsight クラスター ユーザーの HTTP ユーザー名を入力します。Enter HDInsight cluster HTTP user username. 既定のユーザー名は adminです。The default username is admin.
    パスワードPassword HDInsight クラスター ユーザーのパスワードを入力します。Enter HDInsight cluster user password. [Save Password (Encrypted)](パスワードの保存 (暗号化済み)) チェック ボックスをオンにします。Select the checkbox Save Password (Encrypted).
  5. 省略可能: [詳細オプション] を選択します。Optional: Select Advanced Options...

    パラメーターParameter 説明Description
    ネイティブ クエリの使用Use Native Query これを選択すると、ODBC ドライバーは TSQL を HiveQL に変換しません。When it's selected, the ODBC driver does NOT try to convert TSQL into HiveQL. 純粋な HiveQL ステートメントを送信していることが 100% 確実な場合にのみ、使用する必要があります。You shall use it only if you're 100% sure you're submitting pure HiveQL statements. SQL Server または Azure SQL Database に接続している場合は、オフのままにします。When connecting to SQL Server or Azure SQL Database, you should leave it unchecked.
    ブロック単位でフェッチされた行Rows fetched per block 大量のレコードをフェッチする場合、このパラメーターを調整してパフォーマンスを最適化する必要がある場合があります。When fetching a large number of records, tuning this parameter may be required to ensure optimal performances.
    既定の文字列の列の長さ、バイナリ列の長さ、10 進数の列の桁数Default string column length, Binary column length, Decimal column scale データ型の長さおよび精度は、データが返される方法に影響する可能性があります。The data type lengths and precisions may affect how data is returned. 精度が失われたり、切り捨てられたりするために間違った情報が返されます。They cause incorrect information to be returned due to loss of precision and/or truncation.

    DSN 詳細構成オプションAdvanced DSN configuration options

  6. [テスト] を選択して、データ ソースをテストします。Select Test to test the data source. データ ソースが正しく構成された場合、テスト結果に "成功! " と表示されます。When the data source is configured correctly, the test result shows SUCCESS!.

  7. [OK] を選択して、[テスト] ウィンドウを閉じます。Select OK to close the Test window.

  8. [OK] を選択して、Microsoft Hive ODBC Driver DSN セットアップ ウィンドウを閉じます。Select OK to close the Microsoft Hive ODBC Driver DSN Setup window.

  9. [OK] を選択して、 [ODBC データ ソース アドミニストレーター] ウィンドウを閉じます。Select OK to close the ODBC Data Source Administrator window.

HDInsight から Excel へのデータのインポートImport data into Excel from HDInsight

ここでは、前のセクションで作成した ODBC データ ソースを使用して、Hive テーブルから Excel ブックへデータをインポートする方法を説明します。The following steps describe the way to import data from a Hive table into an Excel workbook using the ODBC data source that you created in the previous section.

  1. Excel で新しいブックまたは既存のブックを開きます。Open a new or existing workbook in Excel.

  2. [データ] タブで [データの取得] > [その他のデータ ソース] > [ODBC] の順に移動して、 [ODBC] ウィンドウを起動します。From the Data tab, navigate to Get Data > From Other Sources > From ODBC to launch the From ODBC window.

    Excel データ接続ウィザードを開くOpen Excel data connection wizard

  3. ドロップダウン リストから、前のセクションで作成したデータ ソース名を選択して、 [OK] を選択します。From the drop-down list, select the data source name that you created in the last section and then select OK.

  4. 初めて使用する場合は、 [ODBC ドライバー] ダイアログ ボックスが開きます。For the first use, an ODBC driver dialog will open. 左側のメニューで [Windows] を選択します。Select Windows from the left menu. 次に、 [接続] を選択して [ナビゲーター] ウィンドウを開きます。Then select Connect to open the Navigator window.

  5. [ナビゲーター] で、 [HIVE] > [既定値] > [hivesampletable] の順に移動し、次に [読み込み] を選択します。From Navigator, navigate to HIVE > default > hivesampletable, and then select Load. データが Excel にインポートされるまでに、しばらく時間がかかります。It takes a few moments before data gets imported to Excel.

    HDInsight Excel Hive ODBC ナビゲーターHDInsight Excel Hive ODBC navigator

次の手順Next steps

この記事では、Microsoft Hive ODBC ドライバーを使用して HDInsight サービスから Excel にデータを取得する方法を学習しました。In this article, you learned how to use the Microsoft Hive ODBC driver to retrieve data from the HDInsight Service into Excel. 同様に、SQL Database に HDInsight サービスからデータを取得することもできます。Similarly, you can retrieve data from the HDInsight Service into SQL Database. また、HDInsight サービスにデータをアップロードすることもできます。It's also possible to upload data into an HDInsight Service. 詳細については、次を参照してください。To learn more, see: