Používanie jazyka Python v Power Query Editore

V editore údajov môžete používať jazyk Python- programovací jazyk, ktorý bežne používajú štatistici, dátoví vedeckí pracovníki a analytici údajov Power BI Desktop Power Query Editor. Integráciou jazyka Python do editora Power Query sa umožňuje vykonávať čistenie údajov pomocou jazyka Python a v množinách údajov vykonávať pokročilé tvarovanie a analýzy údajov vrátane dokončenia chýbajúcich údajov, predpovedí a klastrovania (a to je len pár príkladov). Jazyk Python je výkonný jazyk a v editore zostáv sa Power Query používať na prípravu dátového modelu a vytváranie zostáv.

Inštalácia jazyka Python

Ak chcete jazyk Python Power BI Desktop v Power Query editore, je potrebné jazyk Python nainštalovať do lokálneho počítača. Nástroj Python si môžete zdarma stiahnuť a nainštalovať z mnohých umiestnení, vrátane Oficiálnej stránky sťahovania nástroja Python a stránky Anaconda.

Používanie jazyka Using v aplikácii Power Query Editor

Ako používať jazyk Python v editore Power Query ukazuje príklad z množiny údajov akciového trhu na základe súboru .CSV, ktorý si môžete stiahnuť tu a postupovať podľa neho. Postup je v tomto prípade nasledovný:

  1. Najprv načítajte údaje do Power BI Desktop. V tomto príklade načítajte súborEuStockMarkets_NA.csv a vyberte položky Získať > text/CSV na páse s nástrojmi Domov v Power BI Desktop.

    Snímka obrazovky pása s nástrojmi Získať údaje v aplikácii Power BI Desktop znázorňujúca výber súboru C S V.

  2. Vyberte súbor a položku Otvoriť a súbor CSV sa zobrazí v dialógovom okne súboru CSV.

    Snímka obrazovky dialógového okna súboru C S V znázorňujúca vybratý súbor C S V.

  3. Údaje sa po načítaní zobrazia v programe Power BI Desktop na table Polia.

    Snímka obrazovky tably polí zobrazujúca načítané údaje.

  4. Otvorte Power Query údajov výberom položky Transformovať údaje na karte Domov v dialógovom okne Power BI Desktop.

    Snímka obrazovky editora Power Query aplikácii Power B I Desktop zobrazujúca výber možnosti Transformovať údaje.

  5. Na karte Transformovať vyberte možnosť Spustiť skript jazyka Python a zobrazí sa editor Spustiť skript jazyka Python (ako je znázornené v ďalšom kroku). Všimnite si, že v riadkoch 15 a 20 chýbajú údaje, ako aj v iných riadkoch, ktoré nie je na nasledujúcom obrázku možné vidieť. V nasledujúcich krokoch je znázornené, ako jazyk Python tieto riadky môže doplniť (a aj ich doplní) za vás.

    Snímka obrazovky karty Transformovať zobrazujúca riadky údajov.

  6. V tomto príklade zadajte nasledujúci kód skriptu:

       import pandas as pd
       completedData = dataset.fillna(method='backfill', inplace=False)
       dataset["completedValues"] =  completedData["SMI missing values"]
    

    Poznámka

    Aby predchádzajúci kód skriptu fungoval správne, musíte mať vo vašom prostredí jazyka Python nainštalovanú knižnicu pandas. Na inštaláciu knižnice pandas spustite v inštalácii jazyka Python tento príkaz: | > pip install pandas

    Kód po zadaní do dialógového okna Spustiť skript jazyka Python vyzerá asi takto:

    Snímka obrazovky dialógového okna Spustiť skript v jazyku Python, na ktorej je zobrazený kód skriptu.

  7. Po výbere OK sa Power Query zobrazí upozornenie o ochrane osobných údajov.

    Snímka obrazovky tably Power Query Editor zobrazujúca upozornenie o ochrane osobných údajov.

  8. Aby skripty jazyka Python v službe Power BI fungovali správne, musia sa všetky zdroje údajov nastaviť na verejné. Ďalšie informácie o nastavení ochrany osobných údajov a ich dôsledkoch nájdete v téme Úrovne ochrany osobných údajov.

    Snímka obrazovky dialógového okna úrovne ochrany osobných údajov znázorňujúca, že je nastavená úroveň Verejné.

    Na table Polia si všimnite nový stĺpec s názvom completedValues. Všimnite si, že chýba niekoľko prvkov údajov, napríklad v riadkoch 15 a 18. V ďalšej sekcii si pozrieme, ako si s tým jazyk Python podarí.

Na základe iba piatich riadkov skriptu jazyka Python Power Query Editor údajov vyplnil chýbajúce hodnoty pomocou prediktívneho modelu.

Tvorba vizuálov z údajov skriptu jazyka Python

Teraz môžeme vytvoriť vizuál, aby sme videli, ako kód skriptu jazyka Python pomocou knižnice pandas dokončil chýbajúce hodnoty, ako je znázornené na nasledujúcom obrázku:

Snímka obrazovky vizuálu, ktorá zobrazuje pôvodné údaje a vyplnené chýbajúce hodnoty knižnice pandas.

Po dokončení sa daný vizuál a všetky ďalšie vizuály, ktoré budete chcieť pomocou aplikácie Power BI Desktop vytvoriť, môžete súbor Power BI Desktop uložiť (ako súbor .pbix) a potom dátový model vrátane skriptov jazyka Python, ktoré sú jeho súčasťou, použiť v službe Power BI.

Poznámka

Chcete zobraziť dokončený súbor .pbix s už vykonanými krokmi? Máte šťastie – môžete si stiahnuť dokončený súbor Power BI Desktop použitý v týchto príkladoch priamo tu.

Po nahratí súboru .pbix do služby Power BI je potrebné vykonať niekoľko ďalších krokov na povolenie obnovenia údajov (v rámci služby) a umožniť aktualizáciu vizuálov v službe (údaje potrebujú prístup k jazyka Python na aktualizáciu vizuálov). Ďalšie kroky sú nasledovné:

  • Povolenie plánovaného obnovenia pre množinu údajov – informácie o tom, ako povoliť plánované obnovenie zošita, ktorý obsahuje množinu údajov so skriptami jazyka Python, nájdete v téme Konfigurácia plánovaného obnovenia, v ktorej nájdete aj informácie o osobnej bráne.
  • Inštalácia osobnej brány – v počítači, kde sa súbor nachádza a kde je nainštalovaný jazyk Python, potrebuje mať nainštalovanú osobnú bránu. Služba Power BI potrebuje prístup k danému zošitu a musí znova spracovať všetky aktualizované vizuály. Môžete získať ďalšie informácie o tom, ako osobnú bránu nainštalovať a konfigurovať.

Dôležité informácie a obmedzenia

Pri dotazoch, ktoré obsahujú skripty jazyka Python vytvorené v editore dotazov existujú Power Query obmedzenia:

  • Všetky nastavenia zdroja údajov jazyka Python musia byť nastavené na verejné a všetky ostatné kroky v prípade dotazu vytvoreného v programe Power Query Editor musia byť tiež verejné. K nastaveniam zdroja údajov v Power BI Desktop sa dostane výberom Súbor > Možnosti a nastavenia > Nastavenia zdroja údajov.

    Snímka obrazovky ponuky Súbor v aplikácii Power BI Desktop, v ktorej sa zobrazuje výber nastavenia zdroja údajov.

    V dialógovom okne Nastavenia zdroja údajov vyberte zdroje údajov a potom vyberte Upraviť povolenia a uistite sa, že Úroveň ochrany osobných údajov je nastavená na verejné.

    Snímka obrazovky dialógového okna nastavení zdroja údajov znázorňujúca Úroveň ochrany osobných údajov nastavenú na možnosť Verejné.

  • Na povolenie plánovaného obnovenia vizuálov jazyka Python alebo množiny údajov musíte povoliť Plánované obnovenie a v počítači, v ktorom sa nachádza zošit a inštalácia jazyka Python, mať nainštalovanú osobnú bránu. Ďalšie informácie o plánovanom obnovení aj o osobnej bráne nájdete v predchádzajúcej sekcii tohto článku, v ktorom sa nachádzajú prepojenia na ďalšie informácie.

  • Vnorené tabuľky (tabuľka tabuľky) nie sú momentálne podporované

Pomocou jazyka Python a vlastných dotazov môžete robiť celý rad vecí, takže svoje údaje môžete skúmať a tvarovať presne tak, ako sa majú zobrazovať.