Az Excel és az Apache Hadoop csatlakoztatása az Azure HDInsightban a Microsoft Hive ODBC-illesztővel

A Microsoft Big Data-megoldása integrálja a Microsoft Business Intelligence (BI) összetevőit a HDInsightban üzembe helyezett Apache Hadoop-fürtökkel. Ilyen például az Excel csatlakoztatása egy Hadoop-fürt Hive-adattárházához. Csatlakozás a Microsoft Hive Open Database Csatlakozás ivity (ODBC) illesztőprogramjának használatával.

A HDInsight-fürthöz társított adatokat az Excelből csatlakoztathatja az Excel Microsoft Power Query bővítményével. További információ: Csatlakozás Excel to HDInsight a Power Queryvel.

Előfeltételek

A cikk megkezdése előtt a következő elemeket kell tartalmaznia:

  • EGY HDInsight Hadoop-fürt. A létrehozáshoz tekintse meg az Azure HDInsight használatának első lépéseit.
  • Az Office 2010 Professional Plus vagy újabb verzióval, illetve az Excel 2010-zel vagy újabb verzióval rendelkező munkaállomás.

A Microsoft Hive ODBC-illesztőprogram telepítése

Töltse le és telepítse a Microsoft Hive ODBC-illesztőprogramot. Válassza ki az alkalmazás azon verziójának megfelelő verziót, amelyben az ODBC-illesztőprogramot fogja használni. Ebben a cikkben az illesztőprogramot az Office Excelhez használjuk.

Apache Hive ODBC-adatforrás létrehozása

Az alábbi lépések bemutatják, hogyan hozhat létre Hive ODBC-adatforrást.

  1. A Windowsból lépjen a > Windows Rendszergazda istrative Tools ODBC Adatforrások > (32 bites)/(64 bites) elemre. Ez a művelet megnyitja az ODBC Adatforrás Rendszergazda istrator ablakot.

    OBDC data source administrator.

  2. A Felhasználói DSN lapon válassza a Hozzáadás lehetőséget az Új adatforrás létrehozása ablak megnyitásához.

  3. Válassza a Microsoft Hive ODBC-illesztőprogramot, majd a Befejezés lehetőséget a Microsoft Hive ODBC-illesztőprogram DSN telepítőablakának megnyitásához.

  4. Írja be vagy válassza ki az alábbi értékeket:

    Tulajdonság Leírás
    Adatforrás neve Adjon nevet az adatforrásának
    Házigazda Írja be HDInsightClusterName.azurehdinsight.net. Például: myHDICluster.azurehdinsight.net. Megjegyzés: HDInsightClusterName-int.azurehdinsight.net mindaddig támogatott, amíg az ügyfél virtuális gépe ugyanahhoz a virtuális hálózathoz van társviszonyban.
    Kikötő Használja a 443 számú portot. (Ez a port megváltozott a 563-ról 443-ra.)
    Adatbázis Használja az alapértelmezett beállítást.
    Mechanizmus A Windows Azure HDInsight szolgáltatás kiválasztása
    Felhasználónév Adja meg a HDInsight-fürt HTTP-felhasználónevét. Az alapértelmezett felhasználónév a következő admin: .
    Jelszó Adja meg a HDInsight-fürt felhasználói jelszavát. Jelölje be a Jelszó mentése (Titkosított) jelölőnégyzetet.
  5. Nem kötelező: Speciális beállítások kiválasztása ...

    Paraméter Leírás
    Natív lekérdezés használata Ha ki van választva, az ODBC-illesztő NEM próbálja a TSQL-t HiveQL-re konvertálni. Csak akkor használja, ha 100%-ig biztos abban, hogy tiszta HiveQL-utasításokat küld. Az SQL Serverhez vagy az Azure SQL Database-hez való csatlakozáskor hagyja bejelöletlenül.
    Blokkonként lekért sorok Nagy számú rekord beolvasásakor szükség lehet a paraméter finomhangolására az optimális teljesítmény biztosításához.
    Alapértelmezett sztringoszlop hossza, Bináris oszlop hossza, Tizedesoszlop skálája Az adattípus hossza és pontossága befolyásolhatja az adatok visszaadása módját. Helytelen adatokat adnak vissza a pontosság és a csonkolás elvesztése miatt.

    Advanced DSN configuration options.

  6. Válassza a Tesztelés lehetőséget az adatforrás teszteléséhez. Ha az adatforrás megfelelően van konfigurálva, a teszt eredménye SIKERES!

  7. A Teszt ablak bezárásához kattintson az OK gombra .

  8. Kattintson az OK gombra a Microsoft Hive ODBC-illesztőprogram DSN telepítőablakának bezárásához .

  9. Az OK gombra kattintva zárja be az ODBC Adatforrás Rendszergazda istrator ablakát.

Adatok importálása Excel formátumba a HDInsight-ból

Az alábbi lépések bemutatják, hogyan importálhat adatokat Egy Hive-táblából egy Excel-munkafüzetbe az előző szakaszban létrehozott ODBC-adatforrás használatával.

  1. Nyisson meg egy új vagy egy meglévő munkafüzetet Excelben.

  2. Az Adatok lapon navigáljon az Adatok>lekérése más forrásokból>ODBC-ből az ODBC-ből ablak elindításához.

    Open Excel data connection wizard.

  3. A legördülő listában válassza ki az előző szakaszban létrehozott adatforrásnevet, majd kattintson az OK gombra.

  4. Az első használathoz megnyílik egy ODBC-illesztő párbeszédpanel. Válassza a Windowst a bal oldali menüből. Ezután válassza a Csatlakozás a Kezelő ablak megnyitásához.

  5. A Kezelőben keresse meg a HIVE>alapértelmezett>hivesampletable elemét, majd válassza a Betöltés lehetőséget. Az adatok Excelbe való importálása néhány percet vesz igénybe.

    HDInsight Excel Hive ODBC navigator.

Következő lépések

Ebből a cikkből megtudhatja, hogyan kérhet le adatokat a HDInsight szolgáltatásból az Excelbe a Microsoft Hive ODBC-illesztővel. Hasonlóképpen adatokat is lekérhet a HDInsight szolgáltatásból az SQL Database-be. Adatokat is feltölthet egy HDInsight-szolgáltatásba. További információ: