Kurz: Vytvorenie modelu strojového učenia v službe Power BI

V tomto článku v rámci kurzu použijete automatizované strojové učenie na vytvorenie a použitie modelu binárnych predpovedí v službe Power BI. Kurz obsahuje pokyny na vytvorenie toku údajov služby Power BI a používanie entít definovaných v tok údajov na trénovanie a overovanie modelu strojového učenia priamo v službe Power BI. Potom použijeme tento model na bodovanie nových údajov a generovanie predpovedí.

Najprv vytvoríte model strojového učenia binárnych predpovedí na predpovedanie nákupného zámeru online nakupujúcich na základe množiny ich atribútov online relácie. Pre toto cvičenie sa používa referenčná množina údajov strojového učenia. Po natrénovaní modelu služba Power BI automaticky vygeneruje zostavu overenia s vysvetlením výsledkov modelu. Potom môžete skontrolovať zostavu overenia a použiť model na svoje údaje a bodovanie.

Tento kurz sa skladá z nasledujúcich krokov:

  • Vytvorenie toku údajov so vstupnými údajmi
  • Vytvorenie a trénovanie modelu strojového učenia
  • Skontrolovanie zostavy overenia modelu
  • Použitie modelu na entitu toku údajov
  • Použitie bodovaného výstupu z modelu v zostave Power BI

Vytvorenie toku údajov so vstupnými údajmi

Prvou časťou tohto kurzu je vytvorenie toku údajov so vstupnými údajmi. Tento proces má niekoľko krokov, ktoré sú uvedené v nasledujúcich častiach, pričom prvým je získavanie údajov.

Získať údaje

Prvým krokom pri vytváraní toku údajov je príprava zdrojov údajov. V našom prípade používame množinu údajov strojového učenia z množiny online relácií, z ktorých niektoré vyvrcholili nákupom. Množina údajov obsahuje množinu atribútov o týchto reláciách, ktoré použijeme na trénovanie nášho modelu.

Množinu údajov si môžete stiahnuť z webovej lokality UC Irvine. Na účely tohto kurzu je k dispozícii aj toto prepojenie: online_shoppers_intention.csv.

Vytvorenie entít

Ak chcete vytvoriť entity vo svojom toku údajov, prihláste sa do služby Power BI a prejdite do pracovného priestoru v kapacite, ktorá má povolenú umelú inteligenciu.

Ak ešte nemáte pracovný priestor, môžete si ho vytvoriť tak, že v ponuke navigačnej tably v službe Power BI vyberiete položku Pracovné priestory a potom v spodnej časti zobrazeného panela vyberiete položku Vytvoriť pracovný priestor. Otvorí sa panel na pravej strane, kde zadáte podrobnosti pracovného priestoru. Zadajte názov pracovného priestoru a vyberte položku Rozšírené. Potvrďte, že pracovný priestor používa vyhradenú kapacitu pomocou prepínača a že je priradený k inštancii kapacity, ktorá má zapnutú verziu ukážky umelej inteligencie. Potom vyberte položku Uložiť.

Vytvoriť pracovný priestor

Po vytvorení pracovného priestoru môžete vybrať položku Vynechať v pravom dolnom rohu uvítacej obrazovky, ako je znázornené na nasledujúcom obrázku.

Vynechajte, ak máte pracovný priestor

Vyberte tlačidlo Vytvoriť v pravej hornej časti pracovného priestoru a potom vyberte položku Tok údajov.

Vytvoriť tok údajov

Vyberte položku Pridať nové entity. Týmto sa spustí editor Power Query v prehliadači.

Pridanie novej entity

Ako zdroj údajov vyberte možnosť Text/CSV súbor, ako je znázornené na nasledujúcom obrázku.

Vybratá možnosť Text/CSV súbor

Na stránke Pripojenie k zdroju údajov, ktorá sa zobrazí ďalej, prilepte nasledujúce prepojenie na súbor online_shoppers_intention.csv do poľa Cesta k súboru alebo URL adresa a potom vyberte položku Ďalej.

https://raw.githubusercontent.com/santoshc1/PowerBI-AI-samples/master/Tutorial_AutomatedML/online_shoppers_intention.csv

Cesta k súboru

Editor Power Query zobrazuje ukážku údajov zo súboru CSV. Dotaz môžete premenovať na popisnejší názov tak, že zmeníte hodnotu v poli Názov, ktoré sa nachádza na pravej table. Názov súboru môžete zmeniť napríklad na Online návštevníci.

Zmeniť na popisný názov

Power Query automaticky odvodzuje typ stĺpcov. Typ stĺpca môžete zmeniť kliknutím na ikonu typu atribútu v hornej časti hlavičky stĺpca. V tomto príklade zmeníme typ stĺpca Výnos na hodnotu True/False.

Zmena typu údajov

Výberom tlačidla Uložiť a zavrieť zavrite editor Power Query. Zadajte názov toku údajov a potom v dialógovom okne vyberte položku Uložiť, ako je znázornené na nasledujúcom obrázku.

Uloženie toku údajov

Vytvorenie a trénovanie modelu strojového učenia

Ak chcete pridať model strojového učenia, vyberte tlačidlo Použiť model strojového učenia v zozname Akcie pre základnú entitu, ktorá obsahuje údaje o školení a informácie o označení, a potom vyberte položku Pridať model strojového učenia.

Pridať model strojového učenia

Prvým krokom pri vytváraní nášho modelu strojového učenia je identifikácia historických údajov vrátane poľa výsledku, ktoré chcete predpovedať. Model sa vytvorí učením z týchto údajov.

V prípade množiny údajov, ktorú používame, ide o pole Výnos. Vyberte položku Výnos ako hodnotu poľa výsledku a potom vyberte položku Ďalej.

Vybrať historické údaje

Ďalej musíme vybrať typ modelu strojového učenia, ktorý sa má vytvoriť. Power BI analyzuje hodnoty v poli výsledku, ktoré ste identifikovali, a navrhuje typy modelov strojového učenia, ktoré je možné vytvoriť na predpovedanie tohto poľa.

V tomto prípade, keďže predpovedáme binárny výsledok toho, či používateľ uskutoční nákup alebo nie, sa odporúča binárna predpoveď. Keďže chceme predpovedať používateľov, ktorí uskutočnia nákup, vyberte hodnotu True ako výsledok výnosu, ktorý vás najviac zaujíma. Môžete tiež zadať popisné označenia výsledkov, ktoré sa majú použiť v automaticky generovanej zostave sumarizujúcej výsledky overenia modelu. Potom vyberte položku Ďalej.

Vybratá možnosť Binárna predpoveď

V ďalšom kroku Power BI vykoná predbežnú kontrolu vzorky vašich údajov a navrhne vstupy, ktoré môžu produkovať presnejšie predpovede. Ak Power BI neodporučí niektoré pole, vedľa neho sa zobrazí vysvetlenie. Máte možnosť zmeniť výbery tak, aby obsahovali iba polia, ktoré má model skúmať, alebo môžete výberom políčka vedľa názvu entity vybrať všetky polia. Výberom položky Ďalej potvrďte vstupy.

Vybrať začiarkavacie políčko Ďalej

V poslednom kroku musíme zadať názov nášho modelu. Zadajte modelu názov Predpoveď zámeru nákupu. Ak chcete zobraziť rýchle výsledky, môžete skrátiť čas trénovania, alebo môžete čas venovaný trénovaniu predĺžiť, čím získate najlepší model. Potom vyberte položku Uložiť a trénovať, čím sa spustí trénovanie modelu.

Uloženie modelu

Proces trénovania sa začne vzorkovaním a normalizáciou historických údajov a rozdelením množiny údajov do dvoch nových entít Predpoveď zámeru nákupu – Trénovacie údajePredpoveď zámeru nákupu – Testovacie údaje.

V závislosti od veľkosti množiny údajov môže proces trénovania trvať od niekoľkých minút až po čas trénovania vybratý na predchádzajúcej obrazovke. V tomto momente si môžete model pozrieť na karte Modely strojového učenia toku údajov. Stav Pripravený udáva, že model bol zaradený do frontu na trénovanie alebo je trénovaný.

Môžete potvrdiť, že model je trénovaný a overený prostredníctvom stavu toku údajov. Zobrazí sa to ako priebeh obnovenia údajov na karte Toky údajov v pracovnom priestore.

Pripravený na trénovanie

Po dokončení trénovania modelu tok údajov zobrazí aktualizovaný čas obnovenia. Môžete potvrdiť, že model je trénovaný, prechodom na kartu Modely strojového učenia v toku údajov. Model, ktorý ste vytvorili, by mal zobrazovať stav ako Trénovanýčas Naposledy trénované by mal teraz byť aktualizovaný.

Naposledy trénované:

Skontrolovanie zostavy overenia modelu

Ak chcete skontrolovať zostavu overenia modelu, na karte Modely strojového učenia vyberte v stĺpci Akcie pre príslušný model tlačidlo Zobraziť zostavu trénovania. Táto zostava popisuje pravdepodobnú výkonnosť vášho modelu strojového učenia.

Na stránke Výkon modelu v zostave vyberte položku hlavné prediktory, čím sa zobrazia hlavné prediktory pre model. Výberom niektorého z prediktorov môžete zistiť priradenie distribúcie výsledkov k tomuto prediktoru.

Výkon modelu

Môžete použiť rýchly filter Prahová hodnota pravdepodobnosti na strane Výkon modelu a preskúmať jeho vplyv na presnosť a úplnosť modelu.

Prahová hodnota pravdepodobnosti

Ostatné strany zostavy popisujú štatistické metriky výkonu pre model.

Zostava obsahuje aj stranu Podrobnosti trénovania, ktorá popisuje rôzne iterácie, ktoré boli spustené, spôsob extrahovania funkcií zo vstupov a hyperparametre pre použitý finálny model.

Použitie modelu na entitu toku údajov

Výberom tlačidla Použiť model v hornej časti zostavy vyvolajte tento model. V dialógovom okne Použiť môžete zadať cieľovú entitu, ktorá obsahuje zdrojové údaje, na ktoré sa má model použiť.

Použiť model

Po zobrazení výzvy musíte obnoviť tok údajov, ak chcete ukážku výsledkov modelu.

Použitím modelu sa vytvoria dve nové entity s príponou – obohatená <názov_modelu> a – obohatená <názov_modelu> – vysvetlenia. V našom prípade sa použitím modelu na entitu Online návštevníci vytvorí entita Online návštevníci – obohatená Predpoveď zámeru nákupu, ktorá obsahuje predpovedaný výstup z modelu, a entita Online návštevníci – obohatená Predpoveď zámeru nákupu – vysvetlenia, ktorá obsahuje najvýznamnejšie vplyvy podľa záznamov pre predpoveď.

Pri použití modelu Binárna predpoveď sa pridajú štyri stĺpce s predpovedaným výsledkom, skóre pravdepodobnosti, najvýznamnejšími vplyvmi podľa záznamov a indexom vysvetlení, v každom prípade s predponou zadaného názvu stĺpca.

Tri stĺpce vo výsledku

Po dokončení obnovenia toku údajov môžete výberom entity Online návštevníci – obohatená Predpoveď zámeru nákupu zobraziť výsledky.

Zobrazenie výsledkov

Môžete tiež vyvolať akýkoľvek model automatizovaného strojového učenia v pracovnom priestore priamo v editore Power Query v svojom toku údajov. Ak chcete pristupovať k modelom automatizovaného strojového učenia, stlačte tlačidlo Upraviť pre entitu, ktorú chcete obohatiť prehľadmi zo svojho modelu automatizovaného strojového učenia, ako je to znázornené na nasledujúcom obrázku.

Úprava entity

Výberom tlačidla Upraviť sa otvorí editor Power Query pre entity vo vašom toku údajov. Na páse s nástrojmi vyberte tlačidlo Prehľady UI.

Prehľady UI

V ponuke navigačnej tably vyberte priečinok Modely strojového učenia služby Power BI. Všetky modely automatizovaného strojového učenia, ku ktorým máte prístup, sú uvedené ako funkcie služby Power Query. Vstupné parametre pre model automatizovaného strojového učenia sú tiež automaticky namapované ako parametre zodpovedajúcej funkcie Power Query. Všimnite si, že automatické mapovanie parametrov sa uskutoční iba v prípade, ak je názov a typ údajov parametra rovnaký.

Model automatizovaného strojového učenia môžete vyvolať určením ktoréhokoľvek stĺpca vybratej entity ako vstupu z rozbaľovacieho zoznamu. Môžete tiež zadať konštantnú hodnotu, ktorá sa má použiť ako vstup, a to tak, že prepnete ikonu stĺpca na ľavej strane dialógového okna vstupu.

Prehliadač funkcie PQO

Výberom položky Použiť zobrazíte ukážku výstupu modelov automatizovaného strojového učenia vo forme nových stĺpcov v tabuľke entít. Vyvolanie modelu sa zobrazí aj ako uplatnený krok pre dotaz.

Zobrazenie výsledkov

Keď uložíte tok údajov, model sa automaticky vyvolá po obnovení toku údajov, a to v prípade akýchkoľvek nových alebo aktualizovaných riadkov v tabuľke entít.

Použitie bodovaného výstupu z modelu v zostave Power BI

Ak chcete použiť bodovaný výstup z modelu strojového učenia, môžete sa pripojiť k svojmu toku údajov z aplikácie Power BI Desktop pomocou konektora Toky údajov. Entita Online návštevníci – obohatená Predpoveď zámeru nákupu sa teraz dá použiť na zahrnutie predpovedí z vášho modelu v zostavách Power BI.

Ďalšie kroky

V tomto kurze ste vytvorili a použili model binárnych predpovedí v službe Power BI pomocou týchto krokov:

  • Vytvorenie toku údajov so vstupnými údajmi
  • Vytvorenie a trénovanie modelu strojového učenia
  • Skontrolovanie zostavy overenia modelu
  • Použitie modelu na entitu toku údajov
  • Použitie bodovaného výstupu z modelu v zostave Power BI

Ďalšie informácie o automatizácii strojového učenia v službe Power BI nájdete v téme Automatizované strojové učenie v službe Power BI.