使用 Power Query 將 Excel 連線到 Apache Hadoop

Microsoft 巨量資料方案的主要功能之一,是將 Microsoft 商業智慧 (BI) 元件與 Azure HDInsight 上的 Apache Hadoop 叢集相整合。 舉例來說,可讓您使用 Microsoft Power Query for Excel 增益集,將 Excel 連接到包含 Hadoop 叢集相關聯資料的 Azure 儲存體帳戶。 本文將逐步解說如何設定及使用 Power Query,以查詢受 HDInsight 管理的 Hadoop 叢集相關聯資料。

必要條件

  • HDInsight 上的 Apache Hadoop 叢集。 請參閱開始在 Linux 上使用 HDInsight
  • 執行 Windows 10、7、Windows Server 2008 R2 或更新版本作業系統的工作站。
  • 企業版 Microsoft 365 應用程式、Office 2016、Office 2013 專業增強版、Excel 2013 獨立版或 Office 2010 專業增強版。

安裝 Microsoft Power Query

Power Query 可匯入在 HDInsight 叢集上執行的 Hadoop 工作所匯出或產生的資料。

在 Excel 2016 中,Power Query 已整合至 [Get & Transform] \(取得並轉換\) 區段下方的 [Data] \(資料\) 功能區。 如果是舊的 Excel 版本,請從 Microsoft 下載中心下載並安裝 Microsoft Power Query for Excel。

將 HDInsight 資料匯入 Excel 中

Power Query add-in for Excel 可協助您將 HDInsight 叢集中的資料匯入至 Excel,以便使用 PowerPivot 和 Power Map 等 BI 工具來檢查、分析及呈現資料。

  1. 啟動 Excel。

  2. 建立新的空白活頁簿。

  3. 依據 Excel 版本執行下列步驟:

    • Excel 2016

      • 選取 [資料] >> [取得資料] > [從 Azure] > [從 Azure HDInsight(HDFS)]

        HDI.PowerQuery.SelectHdiSource.2016.

    • Excel 2013/2010

      • 選取 [Power Query] > [從 Azure] > [從Microsoft Azure HDInsight]

        HDI.PowerQuery.SelectHdiSource.

        注意:如果 [Power Query] 功能表未顯示,則請移至 [檔案] > [選項] > [增益集],然後從頁面底部的下拉式 [管理] 方塊中,選取 [COM 增益集]。 選取 [移至...] 按鈕,並驗證 Power Query for Excel 增益集的方塊已勾選。

        注意:Power Query 也可讓您選取 [從其他來源],以從 HDFS 匯入資料。

  4. 從 [Azure HDInsight (HDFS)] 對話方塊的 [帳戶名稱或 URL] 文字方塊中,輸入與您叢集相關聯的 Azure Blob 儲存體帳戶名稱。 然後選取確定。 此帳戶可以是預設儲存體帳戶或連結儲存體帳戶。 格式為 https://StorageAccountName.blob.core.windows.net/

  5. 針對 [帳戶金鑰],輸入 Blob 儲存體帳戶的金鑰,然後選取 [連線]。 (只有在您第一次存取這個存放區時才必須輸入帳戶資訊)。

  6. 在 [查詢編輯器] 左側的 [導覽器] 窗格中,按兩下與您叢集相關聯的 Blob 儲存體容器名稱。 依預設,容器名稱與叢集名稱相同。

  7. 在 [名稱] 資料行中找出 HiveSampleData.txt (資料夾路徑為 ../hive/warehouse/hivesampletable/),然後選取 HiveSampleData.txt 左側的 [二進位]。 HiveSampleData.txt 隨附於所有叢集。 您也可以選擇使用您自己的檔案。

    HDI Excel power query import data.

  8. 如有需要,您可以將欄名稱重新命名。 當您準備好時,請選取 [關閉並載入]。 資料已載入至您的活頁簿:

    HDI Excel power query imported table.

下一步

在本文中,您已了解到如何使用 Power Query 將 HDInsight 中的資料擷取至 Excel。 同樣地,您也可以將 HDInsight 中的資料擷取至 Azure SQL Database。 此外也可以將資料上傳至 HDInsight。 如需詳細資訊,請參閱下列文章: