Použití Pythonu v Editor Power Query

V power BI Desktopu Editor Power Query můžete použít Python, programovací jazyk široce používaný statistiky, datovými vědci a datovými analytiky. Tato integrace Pythonu do Editor Power Query umožňuje provádět čištění dat pomocí Pythonu a provádět pokročilé formování a analýzy dat v datových sadách, včetně dokončování chybějících dat, předpovědí a clusteringu, a to jen pro několik názvů. Python je výkonný jazyk a dá se použít v Editor Power Query k přípravě datového modelu a vytváření sestav.

Předpoklady

Než začnete, budete muset nainstalovat Python a knihovnu pandas.

  • Nainstalujte Python – Pokud chcete používat Python v Editor Power Query Power BI Desktopu, musíte python nainstalovat na místní počítač. Python si můžete stáhnout a nainstalovat zdarma z mnoha míst, včetně oficiální stránky pro stažení Pythonu a Anaconda.

  • Instalace knihovny pandas – Pokud chcete používat Python s Editor Power Query, budete také muset nainstalovat knihovnu pandas. Pandas se používá k přesouvání dat mezi Power BI a prostředím Pythonu.

Použití Pythonu s Editor Power Query

Pokud chcete ukázat, jak používat Python v Editor Power Query, podívejte se na tento příklad z datové sady burzovního trhu na základě souboru CSV, který si tady můžete stáhnout, a postupovat podle toho. Kroky pro tento příklad jsou následující postup:

  1. Nejprve načtěte data do Power BI Desktopu. V tomto příkladu načtěte soubor EuStockMarkets_NA.csv a z pásu karet Domů v Power BI Desktopu vyberte Získat datový>text/CSV.

    Screenshot of the Get Data ribbon in Power BI Desktop, showing the CSV selection.

  2. Vyberte soubor a vyberte Otevřít a sdílený svazek clusteru se zobrazí v dialogovém okně soubor CSV.

    Screenshot of the CSV file dialog, showing the selected CSV.

  3. Po načtení dat se zobrazí v podokně Pole v Power BI Desktopu.

    Screenshot of the Fields pane, showing the loaded data.

  4. Otevřete Editor Power Query výběrem možnosti Transformovat data na kartě Domů v Power BI Desktopu.

    Screenshot of the Power Query Editor in Power BI Desktop, showing the Transform data selection.

  5. Na kartě Transformace vyberte Spustit skript Pythonu a zobrazí se editor skriptů Spustit python, jak je znázorněno v dalším kroku. Řádky 15 a 20 trpí chybějícími daty, stejně jako ostatní řádky, které nevidíte na následujícím obrázku. Následující kroky ukazují, jak Python tyto řádky dokončí za vás.

    Screenshot of the Transform tab, showing rows of data.

  6. V tomto příkladu zadejte následující kód skriptu:

    import pandas as pd
    completedData = dataset.fillna(method='backfill', inplace=False)
    dataset["completedValues"] =  completedData["SMI missing values"]
    

    Poznámka

    Aby předchozí kód skriptu fungoval správně, musíte mít ve svém prostředí Pythonu nainstalovanou knihovnu pandas . Pokud chcete nainstalovat knihovnu pandas, spusťte v instalaci Pythonu následující příkaz: pip install pandas

    Při vložení do dialogového okna Spustit skript Pythonu vypadá kód jako v následujícím příkladu:

    Screenshot of the Run Python Script dialog, showing the script code.

  7. Po výběru možnosti OK Editor Power Query zobrazí upozornění na ochranu osobních údajů.

    Screenshot of the Power Query Editor pane, showing the warning about data privacy.

  8. Aby skripty Pythonu správně fungovaly v služba Power BI, musí být všechny zdroje dat nastavené na veřejné. Další informace o nastavení ochrany osobních údajů a jejich dopadech najdete v tématu Úrovně ochrany osobních údajů.

    Screenshot of the Privacy levels dialog, showing that Public is set.

    Všimněte si nového sloupce v podokně Pole s názvem completedValues. Všimněte si, že chybí několik datových prvků, například na řádku 15 a 18. Podívejte se, jak python to zpracovává v další části.

S pouhými třemi řádky skriptu Pythonu Editor Power Query vyplněné chybějícími hodnotami prediktivním modelem.

Vytváření vizuálů z dat skriptu Pythonu

Teď můžeme vytvořit vizuál, abychom viděli, jak kód skriptu Pythonu pomocí knihovny pandas dokončil chybějící hodnoty, jak je znázorněno na následujícím obrázku:

Screenshot of the visual, showing original data and completed missing values of the pandas library.

Po dokončení vizuálu a všech dalších vizuálů, které můžete chtít vytvořit pomocí Power BI Desktopu, můžete soubor Power BI Desktopu uložit. Soubory Power BI Desktopu se ukládají s příponou názvu souboru .pbix . Pak použijte datový model, včetně skriptů Pythonu, které jsou jeho součástí, v služba Power BI.

Poznámka

Chcete zobrazit dokončený soubor .pbix s těmito kroky? Máš štěstí. Dokončený soubor Power BI Desktopu použitý v těchto příkladech si můžete stáhnout přímo tady.

Po nahrání souboru .pbix do služba Power BI je potřeba provést několik dalších kroků, abyste umožnili aktualizaci dat ve službě a umožnili aktualizaci vizuálů ve službě. Data potřebují přístup k Pythonu, aby se vizuály aktualizovaly. Další kroky jsou následující:

  • Povolte plánovanou aktualizaci pro datovou sadu. Pokud chcete povolit plánovanou aktualizaci sešitu, který obsahuje datovou sadu se skripty Pythonu, přečtěte si téma Konfigurace plánované aktualizace, která obsahuje také informace o osobní bráně.
  • Nainstalujte osobní bránu. Na počítači, kde se soubor nachází, a kde je nainstalovaný Python, potřebujete nainstalovanou osobní bránu . Služba Power BI musí přistupovat k danému sešitu a znovu vykreslit všechny aktualizované vizuály. Další informace najdete v tématu Instalace a konfigurace osobní brány.

Úvahy a omezení

Dotazy, které obsahují skripty Pythonu vytvořené v Editor Power Query, mají určitá omezení:

  • Všechna nastavení zdroje dat Pythonu musí být nastavená na Veřejné a všechny další kroky v dotazu vytvořeném v Editor Power Query musí být také veřejné. Pokud se chcete dostat k nastavení zdroje dat, v Power BI Desktopu vyberte Možnosti souboru > a nastavení> Zdroje dat.

    Screenshot of the File menu in Power BI Desktop, showing the Data source settings selection.

    V dialogovém okně Zdroj dat Nastavení vyberte zdroje dat a pak vyberte Upravit oprávnění... a ujistěte se, že je úroveň ochrany osobních údajů nastavená na Veřejná.

    Screenshot of the Data source settings dialog, showing the Privacy Level is set to Public.

  • Pokud chcete povolit plánovanou aktualizaci vizuálů nebo datových sad Pythonu, musíte povolit plánovanou aktualizaci a mít nainstalovanou osobní bránu na počítači, ve kterém je sešit a instalace Pythonu. Další informace o obou najdete v předchozí části tohoto článku, který obsahuje odkazy na další informace o jednotlivých částech.

  • Vnořené tabulky, které jsou tabulkou tabulek, se v současné době nepodporují.

S Pythonem a vlastními dotazy můžete dělat nejrůznější věci, takže data můžete zkoumat a tvarovat tak, jak chcete, aby se zobrazovala.