Analýza dat v Azure Data Lake Storage Gen2 pomocí Power BI
V tomto článku se dozvíte, jak pomocí služby Power BI Desktop analyzovat a vizualizovat data uložená v účtu úložiště s hierarchickým oborem názvů (Azure Data Lake Storage Gen2).
Požadavky
Je nutné, abyste před zahájením tohoto kurzu splňovali následující požadavky:
- Předplatné Azure. Viz Získání bezplatné zkušební verze Azure.
- Účet úložiště, který má hierarchický obor názvů. Podle těchto pokynů ho vytvořte.
Tento článek předpokládá, že jste vytvořili účet úložiště s názvem
myadlsg2. - Účtu úložiště máte udělenou jednu z následujících rolí: Čtenář dat objektů blob, Přispěvatel dat objektů blob nebo Vlastník dat objektů blob .
- Ukázkový datový soubor umístěný
Drivers.txtve vašem účtu úložiště. Tuto ukázku si můžete stáhnout z úložiště Git Azure Data Lake apak tento soubor nahrát do svého účtu úložiště. - Power BI Desktop. Tento nástroj můžete stáhnout ze stránky Microsoft Download Center (Stažení softwaru společnosti Microsoft).
Vytvoření sestavy v Power BI Desktopu
Spusťte Power BI Desktop na svém počítači.
Na kartě Domů na pásu karet vyberte Získat data a pak vyberte Další.
V dialogovém okně Získat data vyberte Azure > Azure Data Lake Store Gen2 a pak vyberte Připojení.

V dialogovém okně Azure Data Lake Storage Gen2 můžete zadat adresu URL k účtu Azure Data Lake Storage Gen2, systému souborů nebo podsložce pomocí formátu koncového bodu kontejneru. Adresy URL pro Data Lake Storage Gen2 mají následující vzor:
https://<accountname>.dfs.core.windows.net/<filesystemname>/<subfolder>Můžete také vybrat, jestli chcete použít zobrazení systému souborů nebo Common Data Model složky.
Pokračujte výběrem tlačítka OK.

Pokud tuto adresu URL používáte poprvé, budete požádáni o výběr metody ověřování.
Pokud vyberete metodu účtu organizace, vyberte Přihlásit se a přihlaste se ke svému účtu úložiště. Budete přesměrováni na přihlašovací stránku vaší organizace. Postupujte podle pokynů a přihlaste se k účtu. Po úspěšném přihlášení vyberte Připojení.
Pokud vyberete metodu klíče účtu, zadejte klíč účtu a pak vyberte Připojení.

V dalším dialogovém okně se zobrazí všechny soubory pod adresou URL, kterou jste poskytli v kroku 4 výše, včetně souboru, který jste nahráli do účtu úložiště. Ověřte informace a pak vyberte Načíst.

Po úspěšném načtení dat do Power BI se na kartě Pole zobrazí následující pole.

Pokud ale chcete data vizualizovat a analyzovat, můžete upřednostnit, aby byla k dispozici pomocí následujících polí.

V dalších krocích aktualizujete dotaz tak, aby importovaná data převedl do požadovaného formátu.
Na kartě Domů na pásu karet vyberte Upravit dotazy.

V Editoru dotazů ve sloupci Obsah vyberte Binární. Soubor se automaticky rozpozná jako CSV a měl by se zobrazit výstup, jak je znázorněno níže. Vaše data jsou teď k dispozici ve formátu, který můžete použít k vytváření vizualizací.

Na kartě Domů na pásu karet vyberte Zavřít a & použít.

Po aktualizaci dotazu se na kartě Pole zobrazí nová pole, která jsou k dispozici pro vizualizaci.

Teď můžete vytvořit výsečový graf, který bude reprezentovat ovladače v jednotlivých městem dané země. Pokud to chcete udělat, proveďte následující výběry.
Na kartě Vizualizace vyberte symbol výsečového grafu.

V tomto příkladu budete používat sloupce Sloupec 4 (název města) a Sloupec 7 (název země). Přetáhněte tyto sloupce z karty Pole na kartu Vizualizace, jak je znázorněno níže.

Výsečový graf by teď měl vypadat podobně jako na obrázku níže.

Výběrem konkrétní země z filtrů na úrovni stránek teď můžete zobrazit počet řidičů v jednotlivých městem vybrané země. Například na kartě Vizualizace v části Filtry na úrovni stránky vyberte Brazílie.

Výsečový graf se automaticky aktualizuje tak, aby se ve městech Brazílie zobrazují řidiči.

V nabídce File (Soubor) vyberte Save (Uložit) a vizualizaci uložte jako Power BI Desktop souboru.
Publikování sestavy do Power BI služby
Po vytvoření vizualizací v Power BI Desktop můžete vizualizace sdílet s ostatními tak, že je publikujete do Power BI služby. Pokyny k tomu, jak to provést, najdete v tématu Publikování z Power BI Desktop.
Řešení potíží
V současné době Power Query Online konektor Azure Data Lake Storage Gen2 podporuje pouze cesty s kontejnerem, a ne podsložku nebo soubor. Například soubor <accountname> .https:// bude dfs.core.windows.net/ fungovat, zatímco <container> https:// <accountname> .dfs.core.windows.net/ <container> / <filename> nebo https:// <accountname> .dfs.core.windows.net/ <container> / <subfolder> se nezdaří.
Pokud je účet Azure Data Lake Storage Gen 2 (ADLS) v jiném tenantovi, Microsoft nepodporuje tok dat ani aktualizaci datové sady pomocí ověřování OAuth2. Toto omezení platí pouze pro ADLS, pokud je metoda ověřování OAuth2, to znamená, že se pokusíte připojit k ADLS napříč tenanty pomocí účtu Azure AD. V takovém případě doporučujeme použít jinou metodu ověřování, která není OAuth2/AAD, například metoda ověřování pomocí klíče.