Kurz: Vytvorenie modelu strojového učenia v službe Power BITutorial: Build a Machine Learning model in Power BI

V tomto článku v rámci kurzu použijete automatizované strojové učenie na vytvorenie a použitie modelu binárnych predpovedí v službe Power BI.In this tutorial article, you use Automated Machine Learning to create and apply a binary prediction model in Power BI. Kurz obsahuje pokyny na vytvorenie toku údajov služby Power BI a používanie entít definovaných v tok údajov na trénovanie a overovanie modelu strojového učenia priamo v službe Power BI.The tutorial includes guidance for creating a Power BI dataflow, and using the entities defined in the dataflow to train and validate a machine learning model directly in Power BI. Potom použijeme tento model na bodovanie nových údajov a generovanie predpovedí.We then use that model for scoring new data to generate predictions.

Najprv vytvoríte model strojového učenia binárnych predpovedí na predpovedanie nákupného zámeru online nakupujúcich na základe množiny ich atribútov online relácie.First, you'll create a Binary Prediction machine learning model, to predict the purchase intent of online shoppers based on a set of their online session attributes. Pre toto cvičenie sa používa referenčná množina údajov strojového učenia.A benchmark machine learning dataset is used for this exercise. Po natrénovaní modelu služba Power BI automaticky vygeneruje zostavu overenia s vysvetlením výsledkov modelu.Once a model is trained, Power BI will automatically generate a validation report explaining the model results. Potom môžete skontrolovať zostavu overenia a použiť model na svoje údaje a bodovanie.You can then review the validation report and apply the model to your data for scoring.

Tento kurz sa skladá z nasledujúcich krokov:This tutorial consists of following steps:

  • Vytvorenie toku údajov so vstupnými údajmiCreate a dataflow with the input data
  • Vytvorenie a trénovanie modelu strojového učeniaCreate and train a machine learning model
  • Skontrolovanie zostavy overenia modeluReview the model validation report
  • Použitie modelu na entitu toku údajovApply the model to a dataflow entity
  • Použitie bodovaného výstupu z modelu v zostave Power BIUsing the scored output from the model in a Power BI report

Vytvorenie toku údajov so vstupnými údajmiCreate a dataflow with the input data

Prvou časťou tohto kurzu je vytvorenie toku údajov so vstupnými údajmi.The first part of this tutorial is to create a dataflow with input data. Tento proces má niekoľko krokov, ktoré sú uvedené v nasledujúcich častiach, pričom prvým je získavanie údajov.That process takes a few steps, as shown in the following sections, beginning with getting data.

Získať údajeGet data

Prvým krokom pri vytváraní toku údajov je príprava zdrojov údajov.The first step in creating a dataflow is to have your data sources ready. V našom prípade používame množinu údajov strojového učenia z množiny online relácií, z ktorých niektoré vyvrcholili nákupom.In our case, we use a machine learning dataset from a set of online sessions, some of which culminated in a purchase. Množina údajov obsahuje množinu atribútov o týchto reláciách, ktoré použijeme na trénovanie nášho modelu.The dataset contains a set of attributes about these sessions, which we'll use for training our model.

Množinu údajov si môžete stiahnuť z webovej lokality UC Irvine.You can download the dataset from the UC Irvine website. Na účely tohto kurzu je k dispozícii aj toto prepojenie: online_shoppers_intention.csv.We also have this available, for the purpose of this tutorial, from the following link: online_shoppers_intention.csv.

Vytvorenie entítCreate the entities

Ak chcete vytvoriť entity vo svojom toku údajov, prihláste sa do služby Power BI a prejdite do pracovného priestoru vo vyhradenej kapacite, ktorá má povolenú umelú inteligenciu.To create the entities in your dataflow, sign into the Power BI service and navigate to a workspace on your dedicated capacity that has AI enabled.

Ak ešte nemáte pracovný priestor, môžete si ho vytvoriť tak, že v ponuke navigačnej tably v službe Power BI vyberiete položku Pracovné priestory a potom v spodnej časti zobrazeného panela vyberiete položku Vytvoriť pracovný priestor.If you don't already have a workspace, you can create one by selecting Workspaces in the nav pane menu in the Power BI service, and select Create workspace at the bottom of the panel that appears. Otvorí sa panel na pravej strane, kde zadáte podrobnosti pracovného priestoru.This opens a panel on the right to enter the workspace details. Zadajte názov pracovného priestoru a vyberte položku Rozšírené.Enter a workspace name and select Advanced. Potvrďte, že pracovný priestor používa vyhradenú kapacitu pomocou prepínača a že je priradený k inštancii vyhradenej kapacity, ktorá má zapnutú verziu ukážky umelej inteligencie.Confirm that the workspace uses Dedicated Capacity using the radio button, and that it's assigned to a dedicated capacity instance that has the AI preview turned on. Potom vyberte položku Uložiť.Then select Save.

Vytvoriť pracovný priestor

Po vytvorení pracovného priestoru môžete vybrať položku Vynechať v pravom dolnom rohu uvítacej obrazovky, ako je znázornené na nasledujúcom obrázku.Once the workspace is created, you can select Skip in the bottom right of the Welcome screen, as shown in the following image.

Vynechajte, ak máte pracovný priestor

Vyberte tlačidlo Vytvoriť v pravej hornej časti pracovného priestoru a potom vyberte položku Tok údajov.Select the Create button at the top right of the workspace, and then select Dataflow.

Vytvoriť tok údajov

Vyberte položku Pridať nové entity.Select Add new entities. Týmto sa spustí editor Power Query v prehliadači.This launches a Power Query editor in the browser.

Pridanie novej entity

Ako zdroj údajov vyberte možnosť Text/CSV súbor, ako je znázornené na nasledujúcom obrázku.Select Text/CSV File as a data source, shown in the following image.

Vybratá možnosť Text/CSV súbor

Na stránke Pripojenie k zdroju údajov, ktorá sa zobrazí ďalej, prilepte nasledujúce prepojenie na súbor online_shoppers_intention.csv do poľa Cesta k súboru alebo URL adresa a potom vyberte položku Ďalej.In the Connect to a data source page that appears next, paste the following link to the online_shoppers_intention.csv into the File path or URL box, and then select Next.

https://raw.githubusercontent.com/santoshc1/PowerBI-AI-samples/master/Tutorial_AutomatedML/online_shoppers_intention.csv

Cesta k súboru

Editor Power Query zobrazuje ukážku údajov zo súboru CSV.The Power Query Editor shows a preview of the data from the CSV file. Dotaz môžete premenovať na popisnejší názov tak, že zmeníte hodnotu v poli Názov, ktoré sa nachádza na pravej table.You can rename the query to a friendlier name by changing the value in the Name box found in the right pane. Názov súboru môžete zmeniť napríklad na Online návštevníci.For example, you could change the Query name to Online Visitors.

Zmeniť na popisný názov

Power Query automaticky odvodzuje typ stĺpcov.Power Query automatically infers the type of columns. Typ stĺpca môžete zmeniť kliknutím na ikonu typu atribútu v hornej časti hlavičky stĺpca.You can change the column type by clicking on the attribute type icon at the top of the column header. V tomto príklade zmeníme typ stĺpca Výnos na hodnotu True/False.In this example, we change the type of the Revenue column to True/False.

Zmena typu údajov

Výberom tlačidla Uložiť a zavrieť zavrite editor Power Query.Select the Save & close button to close Power Query Editor. Zadajte názov toku údajov a potom v dialógovom okne vyberte položku Uložiť, ako je znázornené na nasledujúcom obrázku.Provide a name for the dataflow, and then select Save on the dialog, as shown in the following image.

Uloženie toku údajov

Vytvorenie a trénovanie modelu strojového učeniaCreate and train a machine learning model

Ak chcete pridať model strojového učenia, vyberte tlačidlo Použiť model strojového učenia v zozname Akcie pre základnú entitu, ktorá obsahuje údaje o školení a informácie o označení, a potom vyberte položku Pridať model strojového učenia.To add a machine learning model, Select the Apply ML model button in the Actions list for the base entity that contains your training data and label information, and then select Add a machine learning model.

Pridať model strojového učenia

Prvým krokom pri vytváraní nášho modelu strojového učenia je identifikácia historických údajov vrátane poľa výsledku, ktoré chcete predpovedať.The first step for creating our machine learning model is to identify the historical data including the outcome field that you want to predict. Model sa vytvorí učením z týchto údajov.The model will be created by learning from this data.

V prípade množiny údajov, ktorú používame, ide o pole Výnos.In the case of the dataset we're using, this is the Revenue field. Vyberte položku Výnos ako hodnotu poľa výsledku a potom vyberte položku Ďalej.Select Revenue as the 'Outcome field' value and then select Next.

Vybrať historické údaje

Ďalej musíme vybrať typ modelu strojového učenia, ktorý sa má vytvoriť.Next, we must select the type of machine learning model to create. Power BI analyzuje hodnoty v poli výsledku, ktoré ste identifikovali, a navrhuje typy modelov strojového učenia, ktoré je možné vytvoriť na predpovedanie tohto poľa.Power BI analyzes the values in the outcome field that you've identified and suggests the types of machine learning models that can be created to predict that field.

V tomto prípade, keďže predpovedáme binárny výsledok toho, či používateľ uskutoční nákup alebo nie, sa odporúča binárna predpoveď.In this case since we're predicting a binary outcome of whether a user will make a purchase or not, Binary Prediction is recommended. Keďže chceme predpovedať používateľov, ktorí uskutočnia nákup, vyberte hodnotu True ako výsledok výnosu, ktorý vás najviac zaujíma.Since we are interested in predicting users who will make a purchase, select True as the Revenue outcome that you're most interested in. Môžete tiež zadať popisné označenia výsledkov, ktoré sa majú použiť v automaticky generovanej zostave sumarizujúcej výsledky overenia modelu.Additionally, you can provide friendly labels for the outcomes to be used in the automatically generated report that will summarize the results of the model validation. Potom vyberte položku Ďalej.Then select Next.

Vybratá možnosť Binárna predpoveď

V ďalšom kroku Power BI vykoná predbežnú kontrolu vzorky vašich údajov a navrhne vstupy, ktoré môžu produkovať presnejšie predpovede.Next, Power BI does a preliminary scan of a sample of your data and suggests the inputs that may produce more accurate predictions. Ak Power BI neodporučí niektoré pole, vedľa neho sa zobrazí vysvetlenie.If Power BI doesn't recommend a field, an explanation would be provided next to it. Máte možnosť zmeniť výbery tak, aby obsahovali iba polia, ktoré má model skúmať, alebo môžete výberom políčka vedľa názvu entity vybrať všetky polia.You have the option to change the selections to include only the fields you want the model to study, or you can select all the fields by selecting the checkbox next to the entity name. Výberom položky Ďalej potvrďte vstupy.Select Next to accept the inputs.

Vybrať začiarkavacie políčko Ďalej

V poslednom kroku musíme zadať názov nášho modelu.In the final step, we must provide a name for our model. Zadajte modelu názov Predpoveď zámeru nákupu.Name the model Purchase Intent Prediction. Ak chcete zobraziť rýchle výsledky, môžete skrátiť čas trénovania, alebo môžete čas venovaný trénovaniu predĺžiť, čím získate najlepší model.You can choose to reduce the training time to see quick results or increase the amount of time spent in training to get the best model. Potom vyberte položku Uložiť a trénovať, čím sa spustí trénovanie modelu.Then select Save and train to start training the model.

Uloženie modelu

Proces trénovania sa začne vzorkovaním a normalizáciou historických údajov a rozdelením množiny údajov do dvoch nových entít Predpoveď zámeru nákupu – Trénovacie údajePredpoveď zámeru nákupu – Testovacie údaje.The training process will begin by sampling and normalizing your historical data and splitting your dataset into two new entities Purchase Intent Prediction Training Data and Purchase Intent Prediction Testing Data.

V závislosti od veľkosti množiny údajov môže proces trénovania trvať od niekoľkých minút až po čas trénovania vybratý na predchádzajúcej obrazovke.Depending on the size of the dataset, the training process can take anywhere from a few minutes to the training time selected at the previous screen. V tomto momente si môžete model pozrieť na karte Modely strojového učenia toku údajov.At this point, you can see the model in the Machine learning models tab of the dataflow. Stav Pripravený udáva, že model bol zaradený do frontu na trénovanie alebo je trénovaný.The Ready status indicates that the model has been queued for training or is under training.

Môžete potvrdiť, že model je trénovaný a overený prostredníctvom stavu toku údajov.You can confirm that the model is being trained and validated through the status of the dataflow. Zobrazí sa to ako priebeh obnovenia údajov na karte Toky údajov v pracovnom priestore.This appears as a data refresh in progress in the Dataflows tab of the workspace.

Pripravený na trénovanie

Po dokončení trénovania modelu tok údajov zobrazí aktualizovaný čas obnovenia.Once the model training is completed, the dataflow displays an updated refresh time. Môžete potvrdiť, že model je trénovaný, prechodom na kartu Modely strojového učenia v toku údajov.You can confirm that the model is trained, by navigating to the Machine learning models tab in the dataflow. Model, ktorý ste vytvorili, by mal zobrazovať stav ako Trénovanýčas Naposledy trénované by mal teraz byť aktualizovaný.The model you created should show status as Trained and the Last Trained time should now be updated.

Naposledy trénované:

Skontrolovanie zostavy overenia modeluReview the model validation report

Ak chcete skontrolovať zostavu overenia modelu, na karte Modely strojového učenia vyberte v stĺpci Akcie pre príslušný model tlačidlo Zobraziť zostavu trénovania.To review the model validation report, in the Machine learning models tab, select the View training report button in the Actions column for the model. Táto zostava popisuje pravdepodobnú výkonnosť vášho modelu strojového učenia.This report describes how your machine learning model is likely to perform.

Na stránke Výkon modelu v zostave vyberte položku hlavné prediktory, čím sa zobrazia hlavné prediktory pre model.In the Model Performance page of the report, select See top predictors to view the top predictors for your model. Výberom niektorého z prediktorov môžete zistiť priradenie distribúcie výsledkov k tomuto prediktoru.You can select one of the predictors to see how the outcome distribution is associated with that predictor.

Výkon modelu

Môžete použiť rýchly filter Prahová hodnota pravdepodobnosti na strane Výkon modelu a preskúmať jeho vplyv na presnosť a úplnosť modelu.You can use the Probability Threshold slicer on the Model Performance page to examine its influence on the Precision and Recall for the model.

Prahová hodnota pravdepodobnosti

Ostatné strany zostavy popisujú štatistické metriky výkonu pre model.The other pages of the report describe the statistical performance metrics for the model.

Zostava obsahuje aj stranu Podrobnosti trénovania, ktorá popisuje rôzne iterácie, ktoré boli spustené, spôsob extrahovania funkcií zo vstupov a hyperparametre pre použitý finálny model.The report also includes a Training Details page that describes the different iterations that were run, how features were extracted from the inputs, and the hyperparameters for the final model used.

Použitie modelu na entitu toku údajovApply the model to a dataflow entity

Výberom tlačidla Použiť model v hornej časti zostavy vyvolajte tento model.Select the Apply model button at the top of the report to invoke this model. V dialógovom okne Použiť môžete zadať cieľovú entitu, ktorá obsahuje zdrojové údaje, na ktoré sa má model použiť.In the Apply dialog, you can specify the target entity that has the source data to which the model should be applied.

Použiť model

Po zobrazení výzvy musíte obnoviť tok údajov, ak chcete ukážku výsledkov modelu.When prompted, you must Refresh the dataflow to preview the results of your model.

Použitím modelu sa vytvoria dve nové entity s príponou – obohatená <názov_modelu> a – obohatená <názov_modelu> – vysvetlenia.Applying the model will create two new entities, with the suffix enriched <model_name> and enriched <model_name> explanations. V našom prípade sa použitím modelu na entitu Online návštevníci vytvorí entita Online návštevníci – obohatená Predpoveď zámeru nákupu, ktorá obsahuje predpovedaný výstup z modelu, a entita Online návštevníci – obohatená Predpoveď zámeru nákupu – vysvetlenia, ktorá obsahuje najvýznamnejšie vplyvy podľa záznamov pre predpoveď.In our case, applying the model to the Online Visitors entity will create Online Visitors enriched Purchase Intent Prediction which includes the predicted output from the model, and Online Visitors enriched Purchase Intent Prediction explanations which contains top record-specific influencers for the prediction.

Pri použití modelu Binárna predpoveď sa pridajú štyri stĺpce s predpovedaným výsledkom, skóre pravdepodobnosti, najvýznamnejšími vplyvmi podľa záznamov a indexom vysvetlení, v každom prípade s predponou zadaného názvu stĺpca.Applying a Binary Prediction model adds four columns with predicted outcome, probability score, the top record-specific influencers for the prediction, and explanation index each prefixed with the column name specified.

Tri stĺpce vo výsledku

Po dokončení obnovenia toku údajov môžete výberom entity Online návštevníci – obohatená Predpoveď zámeru nákupu zobraziť výsledky.Once the dataflow refresh is completed, you can select the Online Visitors enriched Purchase Intent Prediction entity to view the results.

Zobrazenie výsledkov

Môžete tiež vyvolať akýkoľvek model automatizovaného strojového učenia v pracovnom priestore priamo v editore Power Query v svojom toku údajov.You can also invoke any AutoML model in the workspace, directly from the Power Query Editor in your dataflow. Ak chcete pristupovať k modelom automatizovaného strojového učenia, stlačte tlačidlo Upraviť pre entitu, ktorú chcete obohatiť prehľadmi zo svojho modelu automatizovaného strojového učenia, ako je to znázornené na nasledujúcom obrázku.To access the AutoML models, select the Edit button for the entity that you want to enrich with insights from your AutoML model, as shown in the following image.

Úprava entity

Výberom tlačidla Upraviť sa otvorí editor Power Query pre entity vo vašom toku údajov.Selecting the Edit button opens the Power Query Editor for the entities in your dataflow. Na páse s nástrojmi vyberte tlačidlo Prehľady UI.Select the AI Insights button in the ribbon.

Prehľady UI

V ponuke navigačnej tably vyberte priečinok Modely strojového učenia služby Power BI.Select the Power BI Machine Learning Models folder from the nav pane menu. Všetky modely automatizovaného strojového učenia, ku ktorým máte prístup, sú uvedené ako funkcie služby Power Query.All the AutoML models to which you have access are listed here as Power Query functions. Vstupné parametre pre model automatizovaného strojového učenia sú tiež automaticky namapované ako parametre zodpovedajúcej funkcie Power Query.Also, the input parameters for the AutoML model are automatically mapped as parameters of the corresponding Power Query function. Všimnite si, že automatické mapovanie parametrov sa uskutoční iba v prípade, ak je názov a typ údajov parametra rovnaký.Note that automatic mapping of parameters happens only if the name and data type of the parameter is the same.

Model automatizovaného strojového učenia môžete vyvolať určením ktoréhokoľvek stĺpca vybratej entity ako vstupu z rozbaľovacieho zoznamu.To invoke an AutoML model, you can specify any of the selected entity's columns as an input from the drop-down. Môžete tiež zadať konštantnú hodnotu, ktorá sa má použiť ako vstup, a to tak, že prepnete ikonu stĺpca na ľavej strane dialógového okna vstupu.You can also specify a constant value to be used as an input by toggling the column icon to the left of the input dialog.

Prehliadač funkcie PQO

Výberom položky Použiť zobrazíte ukážku výstupu modelov automatizovaného strojového učenia vo forme nových stĺpcov v tabuľke entít.Select Apply to view the preview of the AutoML model's output as a new columns in the entity table. Vyvolanie modelu sa zobrazí aj ako uplatnený krok pre dotaz.You will also see the model invocation as an applied step for the query.

Zobrazenie výsledkov

Keď uložíte tok údajov, model sa automaticky vyvolá po obnovení toku údajov, a to v prípade akýchkoľvek nových alebo aktualizovaných riadkov v tabuľke entít.Once you save your dataflow, the model is automatically invoked when the dataflow is refreshed, for any new or updated rows in the entity table.

Použitie bodovaného výstupu z modelu v zostave Power BIUsing the scored output from the model in a Power BI report

Ak chcete použiť bodovaný výstup z modelu strojového učenia, môžete sa pripojiť k svojmu toku údajov z aplikácie Power BI Desktop pomocou konektora Toky údajov.To use the scored output from your machine learning model you can connect to your dataflow from the Power BI desktop, using the Dataflows connector. Entita Online návštevníci – obohatená Predpoveď zámeru nákupu sa teraz dá použiť na zahrnutie predpovedí z vášho modelu v zostavách Power BI.The Online Visitors enriched Purchase Intent Prediction entity can now be used to incorporate the predictions from your model in Power BI reports.

Ďalšie krokyNext steps

V tomto kurze ste vytvorili a použili model binárnych predpovedí v službe Power BI pomocou týchto krokov:In this tutorial, you created and applied a binary prediction model in Power BI using these steps:

  • Vytvorenie toku údajov so vstupnými údajmiCreate a dataflow with the input data
  • Vytvorenie a trénovanie modelu strojového učeniaCreate and train a machine learning model
  • Skontrolovanie zostavy overenia modeluReview the model validation report
  • Použitie modelu na entitu toku údajovApply the model to a dataflow entity
  • Použitie bodovaného výstupu z modelu v zostave Power BIUsing the scored output from the model in a Power BI report

Ďalšie informácie o automatizácii strojového učenia v službe Power BI nájdete v téme Automatizované strojové učenie v službe Power BI.For more information about Machine Learning automation in Power BI, see Automated Machine Learning in Power BI.