Automatizované strojové učenie v službe Power BIAutomated Machine Learning in Power BI

Automatizované strojové učenie pre toky údajov umožňuje podnikovým analytikom trénovať, overovať a vyvolávať modely strojového učenia priamo v službe Power BI.Automated machine learning (AutoML) for dataflows enables business analysts to train, validate, and invoke Machine Learning (ML) models directly in Power BI. Disponuje jednoduchým prostredím na vytvorenie nového modelu strojového učenia, v ktorom analytici môžu používať svoje toky údajov na zadávanie vstupných údajov na trénovanie modelu.It includes a simple experience for creating a new ML model where analysts can use their dataflows to specify the input data for training the model. Služba automaticky extrahuje najrelevantnejšie funkcie, vyberá vhodný algoritmus a ladí a overuje model strojového učenia.The service automatically extracts the most relevant features, selects an appropriate algorithm, and tunes and validates the ML model. Power BI po natrénovaní modelu automaticky vygeneruje zostavu výkonu s výsledkami overenia.After a model is trained, Power BI automatically generates a performance report that includes the results of the validation. Model je potom možné vyvolať v rámci akýchkoľvek nových alebo aktualizovaných údajov v toku údajov.The model can then be invoked on any new or updated data within the dataflow.

Obrazovka so strojovým učením

Automatizované strojové učenie je k dispozícii iba pre toky údajov hosťované v kapacitách Premium a Embedded služby Power BI.Automated machine learning is available for dataflows that are hosted on Power BI Premium and Embedded capacities only.

Práca s automatizovaným strojovým učenímWorking with AutoML

Toky údajov služby Power BI ponúkajú samoobslužnú prípravu údajov pre big data.Power BI dataflows offers self-serve data prep for big data. Automatizované strojové učenie je integrované do tokov údajov a umožňuje vám využiť svoju prípravu údajov na vytváranie modelov strojového učenia priamo v službe Power BI.AutoML is integrated into dataflows and enables you to leverage your data prep effort for building machine learning models, right within Power BI.

Automatizované strojové učenie v službe Power BI umožňuje analytikom údajov používať toky údajov na vytváranie modelov strojového učenia v zjednodušenom prostredí, na čo im stačia skúsenosti so službou Power BI.AutoML in Power BI enables data analysts to use dataflows to build machine learning models with a simplified experience, using just Power BI skills. Väčšina dátovej vedy, ktorá umožňuje vytváranie modelov strojového učenia, je automatizovaná službou Power BI.Most of the data science behind the creation of the ML models is automated by Power BI. K dispozícii je ochrana, ktorá zabezpečuje, že vytvorený model má dobrú kvalitu, a sprehľadňuje proces, ktorý sa na vytvorenie modelu strojového učenia používa.It has guardrails to ensure that the model produced has good quality and provides visibility into the process used to create your ML model.

Automatizácia strojového podporuje vytváranie binárnych predpovedí a klasifikácií a regresných modelov pre toky údajov.AutoML supports the creation of Binary Prediction, Classification, and Regression Models for dataflows. Ide o typy techník strojového učenia pod dohľadom, čo znamená, že sa učia zo známych výsledkov minulých pozorovaní, aby mohli predpovedať výsledky ďalších pozorovaní.These are types of supervised machine learning techniques, which means that they learn from the known outcomes of past observations to predict the outcomes of other observations. Vstupnou množinou údajov na trénovanie modelu automatizovaného strojového učenia je množina záznamov označených známymi výsledkami.The input dataset for training an AutoML model is a set of records that are labeled with the known outcomes.

Automatizované strojové učenie v službe Power BI integruje automatizované strojové učenie zo služby Strojové učenie platformy Microsoft Azure, čím vám umožňuje vytvárať modely strojového učenia.AutoML in Power BI integrates automated ML from Azure Machine Learning to create your ML models. Používanie automatizovaného strojového učenia v službe Power BI však predplatné služby Azure nevyžaduje.However, you don't need an Azure subscription to use AutoML in Power BI. Proces trénovania a hosťovania modelov strojového učenia je v plnej miere spravované službou Power BI.The process of training and hosting the ML models is managed entirely by the Power BI service.

Automatizované strojové učenie po natrénovaní modelu strojového učenia automaticky vygeneruje zostavu služby Power BI, ktorá vám priblíži predpokladaný výkon vášho modelu strojového učenia.After an ML model is trained, AutoML automatically generates a Power BI report that explains the likely performance of your ML model. Automatizované strojové učenie zdôrazňuje zrozumiteľnosť tým, že medzi vstupmi, ktoré ovplyvňujú predpovede vrátené vaším modelom, zvýrazňuje kľúčové vplyvy.AutoML emphasizes explainability by highlighting the key influencers among your inputs that influence the predictions returned by your model. Zostava obsahuje aj kľúčové metriky pre model.The report also includes key metrics for the model.

Ostatné strany vygenerovanej zostavy zobrazujú štatistický súhrn modelu a podrobnosti trénovania.Other pages of the generated report show the statistical summary of the model and the training details. Štatistický súhrn je užitočný pre používateľov, ktorí chcú vidieť štandardné mierky pre výkon modelu v rámci dátovej vedy.The statistical summary is of interest to users who would like to see the standard data science measures of model performance. Podrobnosti trénovania prinášajú súhrn všetkých iterácií, ktorých spustenie bolo potrebné na vytvorenie vášho modelu, spolu so súvisiacimi parametrami modelovania.The training details summarize all the iterations that were run to create your model, with the associated modeling parameters. Tiež popisuje, ako sa každý vstup použil na vytvorenie modelu strojového učenia.It also describes how each input was used to create the ML model.

Potom môžete svoj model strojového učenia použiť na údaje na výpočet skóre.You can then apply your ML model to your data for scoring. Po obnovení toku údajov sa údaje aktualizujú o predpovede z modelu strojového učenia.When the dataflow is refreshed, your data is updated with predictions from your ML model. Power BI ponúka aj individuálne vysvetlenie každej konkrétnej predpovede, ktorú model strojového učenia poskytne.Power BI also includes an individualized explanation for each specific prediction that the ML model produces.

Vytvorenie modelu strojového učeniaCreating a machine learning model

Táto sekcia sa venuje vytváraniu modelu automatizovaného strojového učenia.This section describes how to create an AutoML model.

Príprava údajov na tvorbu modelu strojového učeniaData prep for creating an ML model

Ak chcete v službe Power BI vytvoriť model strojového učenia, najskôr musíte vytvoriť tok údajov pre údaje obsahujúce informácie o historických výsledkoch, ktoré sa použijú na trénovanie modelu strojového učenia.To create a machine learning model in Power BI, you must first create a dataflow for the data containing the historical outcome information, which is used for training the ML model. V prípade podnikových metrík, ktoré môžu byť významnými prediktormi výsledkov, ktoré sa pokúšate predvídať, by ste tiež mali pridať vypočítané stĺpce.You should also add calculated columns for any business metrics that may be strong predictors for the outcome you're trying to predict. Podrobnosti o konfigurácii toku údajov nájdete v téme Samoobslužná príprava údajov v službe Power BI.For details on configuring your dataflow, see Self-service data prep in Power BI.

Automatizované strojové učenie má špecifické požiadavky na údaje na trénovanie modelu strojového učenia.AutoML has specific data requirements for training a machine learning model. Tieto požiadavky sú popísané v sekcii nižšie, pričom sa týkajú príslušných typov modelov.These requirements are described in sections below, based on respective model types.

Konfigurácia vstupov modelu strojového učeniaConfiguring the ML model inputs

Ak chcete vytvoriť model automatizovaného strojového učenia, vyberte ikonu strojového učenia zo stĺpca Akcie entity toku údajov a potom vyberte položku Pridať model strojového učenia.To create an AutoML model, select the ML icon in the Actions column of the dataflow entity, and select Add a machine learning model.

Pridanie modelu strojového učenia

Spustí sa zjednodušené prostredie so sprievodcom, ktorý vás prevedie procesom vytvorenia modelu strojového učenia.A simplified experience is launched, consisting of a wizard that guides you through the process of creating the ML model. Sprievodca zahŕňa nasledujúce jednoduché kroky.The wizard includes the following simple steps.

1. Vyberte entitu s historickými údajmi a pole výsledku, pre ktoré chcete vytvoriť predpoveď.1. Select the entity with the historical data, and the outcome field for which you want a prediction

Pole výsledku identifikuje atribút označenia na trénovanie modelu strojového učenia, ako môžete vidieť na nasledujúcom obrázku.The outcome field identifies the label attribute for training the ML model, shown in the following image.

Výber údajov historických výsledkov

2. Vyberte typ modelu.2. Choose a model type

Keď zadáte pole výsledku, automatizované strojové učenie zanalyzuje údaje označenia, aby mohlo odporučiť najpravdepodobnejší typ modelu strojového učenia, ktorý možno natrénovať.When you specify the outcome field, AutoML analyzes the label data to recommend the most likely ML model type that can be trained. Kliknutím na položku Vybrať iný model môžete vybrať iný typ modelu, ako je to zobrazené nižšie.You can pick a different model type as shown below by clicking on “Select a different model”.

Výber modelu

Poznámka

Vybraté údaje nemusia podporovať niektoré typy modelov. Preto nebudú aktívne.Some model types may not be supported for the data that you have selected and hence would be disabled. V príklade uvedenom vyššie je deaktivovaný model Regresia, pretože je ako pole výsledku vybratý textový stĺpec.In the above example, Regression is disabled, as a text column is selected as outcome field.

3. Vyberte vstupy, ktoré má model používať ako prediktívne signály.3. Select the inputs you want the model to use as predictive signals

Automatizované strojové učenie analyzuje vzorku z vybratej entity, vďaka čomu môže navrhovať vstupy, ktoré možno použiť na trénovanie modelu strojového učenia.AutoML analyzes a sample of the selected entity to suggest the inputs that can be used for training the ML model. Vedľa polí, ktoré nie sú vybraté, sa zobrazia vysvetlenia.Explanations would be provided next to fields that are not selected. Ak má určité pole príliš veľa odlišných hodnôt, iba jednu hodnotu alebo nízku či vysokú koreláciu s výstupným poľom, nebude odporúčané.If a particular field has too many distinct values or only one value, or low or high correlation with the output field, it would not be recommended.

Vstupy, ktoré závisia od poľa výsledku (alebo od poľa označenia), by sa nemali používať na trénovanie modelu strojového učenia, pretože ovplyvnia jeho výkon.Any inputs that are dependent on the outcome field (or the label field) should not be used for training the ML model, since they will affect its performance. Tieto polia budú označené ako „podozrivo vysoká korelácia s výstupným poľom“.Such fields would be flagged as having “suspiciously high correlation with output field”. Použitie týchto polí v údajoch na trénovanie povedie k použitiu nesprávnych označení. Model bude totiž vykazovať pri overovaní alebo testovaní údajov dobrý výkon, no tento výkon nebude zodpovedať výkonu pri použití modelu na vytvorenie skóre.Introducing these fields into the training data causes label leakage, where the model performs well on the validation or test data but cannot match that performance when used in production for scoring. Použitie nesprávnych označení by mohlo spôsobovať problémy pri modeloch automatizovaného strojového učenia, kedy by bol výkon trénovaného modelu až príliš dobrý a nezodpovedal by realite.Label leakage could be a possible concern in AutoML models, when training model performance is too good to be true.

Odporúčanie tejto funkcie ja založené na vzorke údajov, preto by ste mali skontrolovať použité vstupy.This feature recommendation is based on a sample of a data, so you should review the inputs used. Výbery môžete zmeniť tak, aby obsahovali len polia, ktoré má model preskúmať.You have the option to change the selections to include only the fields you want the model to study. Môžete vybrať aj všetky polia. Stačí, ak začiarknete políčko vedľa názvu entity.You can also select all the fields by selecting the checkbox next to the entity name.

Prispôsobiť vstupné polia

4. Pomenujte svoj model a uložte konfiguráciu.4. Name your model and save your configuration

V poslednom kroku môžete model pomenovať a vybrať položku Uložiť a trénovať, čím sa spustí trénovanie modelu strojového učenia.In the final step, you can name the model and select Save and train which begins training the ML model. Môžete sa rozhodnúť skrátiť čas trénovania, aby ste mohli pozrieť rýchle výsledky, alebo zvýšiť čas venovaný tréningu, aby ste získali čo najlepší model.You can choose to reduce the training time to see quick results or increase the amount of time spent in training to get the best model.

Pomenovanie modelu

Trénovanie modelu strojového učeniaML model training

Trénovanie modelov automatizovaného strojového učenia je súčasťou obnovenia toku údajov.Training of AutoML models is a part of the dataflow refresh. Automatizované strojové učenie najskôr pripraví vaše údaje na trénovanie.AutoML first prepares your data for training. Potom rozdelí poskytnuté historické údaje na trénovacie a testovacie množiny údajov.AutoML splits the historical data you provide into training and testing datasets. Testovacia množina údajov predstavuje množinu podržania, ktorá sa používa na overenie výkonu modelu po trénovaní.The test dataset is a holdout set that is used for validating the model performance after training. V rámci toku údajov majú podobu trénovacích a testovacích entít.These are realized as Training and Testing entities in the dataflow. Automatizované strojové učenie používa na overenie modelu krížové overenie.AutoML uses cross-validation for the model validation.

Potom prebehne analýza všetkých vstupných polí a použije sa prisudzovanie, ktoré nahradí všetky chýbajúce hodnoty náhradnými hodnotami.Next, each input field is analyzed and imputation is applied, which replaces any missing values with substituted values. Automatizované strojové učenie používa niekoľko stratégií prisudzovania.A couple of different imputation strategies are used by AutoML. V prípade atribútov vstupov, ktoré sa považujú za numerické funkcie, sa na prisudzovanie použije priemer hodnôt stĺpcov.For input attributes treated as numeric features, the mean of the column values is used for imputation. V prípade atribútov vstupov, ktoré sa považujú za funkcie kategórií, použije automatizované strojové učenie na prisudzovanie modus hodnôt stĺpcov.For input attributes treated as categorical features, AutoML uses the mode of the column values for imputation. Priemer a modus hodnôt použitých na prisudzovanie sa vypočítajú na základe rámca automatizovaného strojového učenia v trénovacej množine údajov podradenej vzorky.The mean and mode of values used for imputation are calculated by the AutoML framework on the subsampled training dataset.

Na vaše údaje sa potom použije podľa potreby vzorkovanie a normalizácia.Then, sampling and normalization are applied to your data as required. V prípade klasifikačných modelov použije automatizované strojové učenie na vstupné údaje stratifikované vzorkovanie a vyváži jednotlivé triedy, aby mali všetky rovnaký počet riadkov.For classification models, AutoML runs the input data through stratified sampling and balances the classes to ensure the row counts are equal for all.

Automatizované strojové učenie uplatňuje niekoľko transformácií na každé vybraté vstupné pole založené na jeho type údajov a štatistických vlastnostiach.AutoML applies several transformations on each selected input field based on its data type, and its statistical properties. Dané transformácie používa na extrakciu funkcií, ktoré sa použijú pri trénovaní modelu strojového učenia.AutoML uses these transformations to extract features for use in training your ML model.

Proces trénovania modelov automatizovaného strojového učenia pozostáva až z 50 iterácií s rôznymi algoritmami modelovania a nastaveniami hyperparametrov, vďaka čomu dokáže nájsť model s najvyšším výkonom.The training process for AutoML models consists of up to 50 iterations with different modeling algorithms and hyperparameter settings to find the model with the best performance. Ak automatizované strojové učenie spozoruje, že nedochádza k zlepšeniu výkonu, môže sa trénovanie skončiť skôr s menším počtom iterácií.Training can end early with lesser iterations if AutoML notices that there is no performance improvement being observed. Výkon daných modelov sa hodnotí overením pomocou testovacej množiny údajov podržania.The performance of each of these models is assessed by validation with the holdout test dataset. Automatizované strojové učenie v rámci tohto kroku vytvorí niekoľko kanálov na trénovanie a overovanie týchto iterácií.During this training step, AutoML creates several pipelines for training and validation of these iterations. Proces hodnotenia výkonu modelov môže v závislosti od veľkosti množiny údajov a dostupných zdrojov vyhradenej kapacity trvať od niekoľkých minút až po niekoľko hodín. Trvanie ovplyvňuje aj čas tréningu nakonfigurovaný v sprievodcovi.The process of assessing the performance of the models can take time, anywhere from several minutes to a couple of hours up-to the training time configured in the wizard, depending on the size of your dataset and the dedicated capacity resources available.

V niektorých prípadoch môže konečný vygenerovaný model využiť súhrnné učenie, v rámci ktorého sa na dosiahnutie lepšieho výkonu pri predpovedaní používajú viaceré modely.In some cases, the final model generated may use ensemble learning, where multiple models are used to deliver better predictive performance.

Zrozumiteľnosť modelu automatizovaného strojového učeniaAutoML model explainability

Automatizované strojové učenie po natrénovaní modelu zanalyzuje vzťah medzi vstupnými funkciami a výstupom modelu.After the model has been trained, AutoML analyzes the relationship between the input features and the model output. Zhodnotí veľkosť zmeny vo výstupe modelu pre testovaciu množinu údajov podržania každej vstupnej funkcie.It assesses the magnitude of change to the model output for the holdout test dataset for each input feature. Je to známe ako dôležitosť funkcie.This is known as the feature importance. Dochádza k tomu v rámci obnovenia po dokončení tréningu.This happens as a part of the refresh once training is complete. Obnovenie preto môže trvať dlhšie ako čas tréningu nakonfigurovaný v sprievodcovi.Hence your refresh may take longer than the training time configured in the wizard.

Dôležitosť funkcie

Zostava modelu automatizovaného strojového učeniaAutoML model report

Automatizované strojové učenie vygeneruje zostavu služby Power BI, ktorá zosumarizuje výkon modelu dosiahnutý počas overovania spolu s globálnou dôležitosťou funkcie.AutoML generates a Power BI report that summarizes the performance of the model during validation, along with the global feature importance. Táto zostava bude k dispozícii na karte Model strojového učenia po úspešnom obnovení toku údajov.This report can be accessed from the Machine Learning Model tab once the dataflow refresh is successful. Zostava prináša súhrn výsledkov z použitia modelu strojového učenia na testovacie údaje podržania a porovnáva predpovede so známymi výsledkami.The report summarizes the results from applying the ML model to the holdout test data and comparing the predictions with the known outcome values.

Zostavu modelu si môžete zobraziť, aby ste lepšie pochopili jeho výkon.You can review the model report to understand its performance. Tiež môžete overiť, či sú kľúčové vplyvy modelu v súlade s podnikateľskými prehľadmi o známych výsledkoch.You can also validate that the key influencers of the model align with the business insights about the known outcomes.

Grafy a mierky použité na popísanie výkonu modelu v zostave závisia od typu modelu.The charts and measures used to describe the model performance in the report depend on the model type. Týmto výkonnostným grafom a mierkam sa budeme bližšie venovať v nasledujúcich sekciách.These performance charts and measures are described in the following sections.

Ďalšie strany zostavy môžu štatistické merania modelu popisovať z pohľadu dátovej vedy.Additional pages in the report may describe statistical measures about the model from a data science perspective. Napríklad zostava binárnej predpovede obsahuje graf zisku a krivku ROC modelu.For instance, the Binary Prediction report includes a gain chart and the ROC curve for the model.

V zostavách sa tiež nachádza strana s podrobnosťami trénovania, ktorá obsahuje popis spôsobu, akým bol model natrénovaný, a graf popisujúci výkon modelu pri každom spustení iterácií.The reports also include a Training Details page that includes a description of how the model was trained, and a chart describing the model performance over each of the iterations run.

Podrobnosti trénovania

V ďalšej časti tejto stránky sa nachádza popis zaznamenaného typu vstupného poľa a metóda prisudzovania, ktorá bola použitá na vyplnenie chýbajúcich hodnôt.Another section on this page describes the detected type of the input field and imputation method used for filling missing values. Obsahuje aj parametre použité v konečnom modeli.It also includes the parameters used by the final model.

Ďalšie informácie pre model

Ak vytvorený model využíva súhrnné učenie, stránka s podrobnosťami trénovania obsahuje aj graf s váhou jednotlivých zložkových modelov v súhrne a parametre modelu.If the model produced uses ensemble learning, then the Training Details page also includes a chart showing the weight of each constituent model in the ensemble, as well as its parameters.

Váha v súhrne

Použitie modelu automatizovaného strojového učeniaApplying the AutoML model

Ak ste spokojní s výkonom vytvoreného modelu strojového učenia, môžete ho použiť na nové alebo aktualizované údaje v rámci obnovovania toku údajov.If you're satisfied with the performance of the ML model created, you can apply it to new or updated data when your dataflow is refreshed. Môžete tak urobiť v zostave modelu výberom tlačidla Použiť v pravom hornom rohu alebo tlačidla Použiť model strojového učenia v rámci akcií na karte Modely strojového učenia.You can do this from the model report, by selecting the Apply button in the top-right corner or the Apply ML Model button under actions in the Machine Learning Models tab.

Ak chcete použiť model strojového učenia, musíte zadať názov entity, na ktorú sa má použiť, a predponu stĺpcov, ktoré sa majú do danej entity pridať, aby fungovali ako výstup modelu.To apply the ML model, you must specify the name of the entity to which it must be applied, and a prefix for the columns that will be added to this entity for the model output. Predvolenou predponou názvov stĺpcov je názov modelu.The default prefix for the column names is the model name. Funkcia Použiť môže obsahovať ďalšie parametre špecifické pre konkrétny typ modelu.The Apply function may include additional parameters specific to the model type.

Použitím modelu strojového učenia vytvoríte dve nové entity toku údajov, ktoré budú obsahovať predpovede a prispôsobené vysvetlenia jednotlivých riadkov, ktoré sú výsledkom skóre vo výstupnej entite.Applying the ML model creates two new dataflow entities which contains the predictions and individualized explanations for each row that it scores in the output entity. Ak napríklad model PurchaseIntent použijete na entitu OnlineShoppers, výstup vygeneruje entitu OnlineShoppers enriched PurchaseIntent (OnlineShoppers – obohatené o entitu PurchaseIntent) a OnlineShoppers enriched PurchaseIntent explanations (OnlineShoppers – obohatené o vysvetlenia PurchaseIntent).For instance, if you apply the PurchaseIntent model to the OnlineShoppers entity, the output will generate the OnlineShoppers enriched PurchaseIntent and OnlineShoppers enriched PurchaseIntent explanations entities. Pre každý riadok v obohatenej entite sa vysvetlenia rozdelia v entite obohatenej o vysvetlenia do viacerých radkov na základe vstupnej funkcie.For each row in the enriched entity, The Explanations is broken down into multiple rows in the enriched explanations entity based on the input feature. ExplanationIndex pomáha priraďovať riadky z entity obohatenej o vysvetlenia k riadku v obohatenej entite.An ExplanationIndex helps map the rows from the enriched explanations entity to the row in enriched entity.

Editor dotazov

Ľubovoľný model automatizovaného strojového učenia Power BI môžete použiť aj na entity v akomkoľvek toku údajov v rovnakom pracovnom priestore používajúcom Prehľady UI v prehliadači s funkciou PQO.You can also apply any Power BI AutoML model to entities in any dataflow in the same workspace using AI Insights in PQO function browser. Týmto spôsobom môžete použiť modely vytvorené inými osobami v tom istom pracovnom priestore bez toho, že by ste museli byť vlastníkom toku údajov v modeli.This way, you can use models created by others in the same workspace without necessarily being an owner of the dataflow that has the model. Power Query zistí všetky modely strojového učenia Power BI v pracovnom priestore a zobrazí ich ako dynamické funkcie Power Query.Power Query discovers all the Power BI ML models in the workspace and exposes them as dynamic Power Query functions. Tieto funkcie môžete vyvolať tak, že k nim získate prístup prostredníctvom pása s nástrojmi v Editore Power Query, alebo priamo vyvoláte funkciu M. You can invoke those functions by accessing them from the ribbon in Power Query Editor, or by invoking the M function directly.Táto funkcia je v súčasnosti podporovaná len pre toky údajov služby Power BI a pre Power Query Online v službe Power BI. This functionality is currently only supported for Power BI dataflows, and for Power Query Online in the Power BI service. Všimnite si, že postup sa výrazne líši od používania modelov strojového učenia v toku údajov s použitím sprievodcu automatizovaného strojového učenia.Note that this is very different from applying ML models within a dataflow using the AutoML wizard. Pomocou tejto metódy sa nevytvorí žiadna vysvetľujúca entita a ak nie ste vlastníkom toku údajov, nemôžete získať prístup k zostavám na trénovanie modelu ani model znova natrénovať.There is no explanations entity created using this method and unless you are the owner of the dataflow, you cannot access model training reports or retrain the model. Ak sa zdrojový model upraví (pridajú sa alebo sa odstránia vstupné polia) alebo ak sa tok údajov modelu alebo zdroja odstráni, tento závislý tok údajov sa preruší.If the source model is edited (adding or removing input fields) or, the model or source dataflow is deleted, then this dependent dataflow would break.

Použitie modelu pomocou prehliadača s funkciou PQO

Keď model použijete, automatizované strojové učenie vaše predpovede vždy po obnovení toku údajov aktualizuje.After you apply the model, AutoML always keeps your predictions up-to-date whenever the dataflow is refreshed.

Ak chcete prehľady a predpovede modelu strojového učenia použiť v zostave Power BI, môžete sa z aplikácie Power BI Desktop pripojiť k výstupnej entite pomocou konektora toku údajov.To use the insights and predictions from the ML model in a Power BI report, you can connect to the output entity from Power BI Desktop using the dataflows connector.

Modely binárnych predpovedíBinary Prediction Models

Modely binárnych predpovedí, oficiálne známe ako modely binárnej klasifikácie, sa používajú na rozdelenie množiny údajov do dvoch skupín.Binary Prediction models, more formally known as binary classification models, are used to classify a dataset into two groups. Používajú sa na predpovedanie udalostí, ktoré môžu mať binárny výsledok.They're used to predict events that can have a binary outcome. Napríklad na predpovedanie, či bude predajná príležitosť úspešná, či zákazník odíde, či bude faktúra zaplatená včas, či je transakcia podvodná a tak ďalej.For instance, whether a sales opportunity will convert, whether an account will churn, whether an invoice will be paid on time, whether a transaction is fraudulent, and so on.

Výstupom modelu binárnych predpovedí je skóre pravdepodobnosti, ktoré stanovuje mieru pravdepodobnosti, že sa dosiahne cieľový výsledok.The output of a Binary Prediction model is a probability score, which identifies the likelihood that the target outcome will be achieved.

Trénovanie modelu binárnych predpovedíTraining a Binary Prediction model

Požiadavky:Pre-requisites:

  • Každá trieda výsledkov vyžaduje minimálne 20 riadkov historických údajov.A minimum of 20 rows of historical data is required for each class of outcomes

Vytváranie modelu binárnych predpovedí pozostáva z rovnakých krokov ako tvorba ostatných modelov automatizovaného strojového učenia, ktorá je popísaná v časti Konfigurácia vstupov modelu strojového učenia vyššie.The process of creation for a Binary Prediction model follows the same steps as other AutoML models, described in the section Configuring the ML model inputs above. Jediný rozdiel je v kroku výberu modelu, kde môžete vybrať hodnotu cieľového výsledku, ktorá vás najviac zaujíma.The only difference is in the “Choose a model” step where you can select the target outcome value that you’re most interested in. Môžete tiež zadať popisné označenia výsledkov, ktoré sa majú použiť v automaticky generovanej zostave sumarizujúcej výsledky overenia modelu.You can also provide friendly labels for the outcomes to be used in the automatically generated report that will summarize the results of the model validation.

Sprievodca binárnymi predpoveďami

Zostava modelu binárnych predpovedíBinary Prediction model report

Výstupom modelu binárnych predpovedí je pravdepodobnosť, že záznam dosiahne cieľový výsledok.The Binary Prediction model produces as an output a probability that a record will achieve the target outcome. Zostava obsahuje rýchly filter pre prahovú hodnotu pravdepodobnosti, ktorý ovplyvňuje spôsob, akým sa bude interpretovať skóre nad prahom pravdepodobnosti a pod ním.The report includes a slicer for the probability threshold, which influences how the scores above and below the probability threshold are interpreted.

Zostava definuje výkon modelu ako skutočne pozitívny, falošne pozitívny, skutočne negatívny a falošne negatívny.The report describes the performance of the model in terms of True Positives, False Positives, True Negatives, and False Negatives. Skutočne pozitívne a skutočne negatívne výsledky sú správne predpovedané výsledky dvoch tried v údajoch výsledkov.True Positives and True Negatives are correctly predicted outcomes for the two classes in the outcome data. Falošne pozitívne sú záznamy, pri ktorých sa predpovedalo, že budú mať cieľový výsledok, ale nestalo sa tak.False Positives are records that were predicted to have Target outcome but actually did not. Falošne negatívne sú zase záznamy, ktoré mali cieľový výsledok, no podľa predpovede ho nemali mať.Conversely, False Negatives are records that had Target outcome but were predicted as not having it.

Mierky, ako napríklad presnosť a úplnosť, popisujú vplyv prahovej hodnoty pravdepodobnosti na predpokladané výsledky.Measures, such as Precision and Recall, describe the effect of the probability threshold on the predicted outcomes. Rýchly filter prahovej hodnoty pravdepodobnosti môžete použiť na výber prahovej hodnoty, ktorá dosiahne vyvážený kompromis medzi presnosťou a úplnosťou.You can use the probability threshold slicer to select a threshold that achieves a balanced compromise between Precision and Recall.

Ukážka presnosti

Zostava obsahuje aj nástroj na analýzu nákladov a prínosov. Ten pomáha identifikovať podmnožinu populácie, na ktorú sa treba zamerať, aby sa dosiahol najvyšší zisk.The report also includes a Cost-Benefit analysis tool to help identify the subset of the population that should be targeted to yield the highest profit. Analýza nákladov a prínosov sa na základe odhadovaných jednotkových nákladov zacielenia a jednotkových prínosov z dosiahnutého cieľového výsledku pokúsi maximalizovať zisk.Given an estimated unit cost of targeting and a unit benefit from achieving a target outcome, Cost-Benefit analysis attempts to maximize profit. Tento nástroj môžete použiť na stanovenie prahu pravdepodobnosti na základe maximálneho bodu v grafe, aby ste dosiahli maximálny zisk.You can use this tool to pick your probability threshold based on the maximum point in the graph to maximize profit. Graf môžete použiť aj na výpočet zisku alebo nákladov pre prah pravdepodobnosti, ktorý ste si vybrali.You can also use the graph to compute the profit or cost for your choice of probability threshold.

Náklady a prínosy

Stránka zostavy presnosti zostavy modelu obsahuje graf kumulatívnych ziskov a krivku ROC modelu.The Accuracy Report page of the model report includes the Cumulative Gains chart and the ROC curve for the model. Ide o štatistické merania výkonu modelu.These are statistical measures of model performance. Zostavy zahŕňajú popisy zobrazených grafov.The reports include descriptions of the charts shown.

Obrazovka zostavy presnosti

Použitie modelu binárnych predpovedíApplying a Binary Prediction model

Ak chcete použiť model binárnych predpovedí, musíte zadať entitu s údajmi, na ktoré chcete predpovede z modelu strojového učenia použiť.To apply a Binary Prediction model, you must specify the entity with the data to which you want to apply the predictions from the ML model. Medzi ďalšie parametre patrí predpona názvu výstupného stĺpca a prahová hodnota pravdepodobnosti na klasifikáciu predpokladaných výsledkov.Other parameters include the output column name prefix and the probability threshold for classifying the predicted outcome.

Vstupy predpovede

Po použití modelu binárnych predpovedí sa do obohatenej výstupnej entity pridajú štyri výstupné stĺpce: Outcome, PredictionScore, PredictionExplanation a ExplanationIndex.When a Binary Prediction model is applied, it adds four output columns to the enriched output entity: Outcome, PredictionScore, PredictionExplanation, and ExplanationIndex. K názvom stĺpcov v entite sa po použití modelu pridá určitá predpona.The column names in the entity have the prefix specified when the model is applied.

Stĺpec PredictionScore vyjadruje percentuálnu pravdepodobnosť toho, že sa dosiahne cieľový výsledok.PredictionScore is a percentage probability, which identifies the likelihood that the target outcome will be achieved.

Stĺpec Outcome obsahuje označenie predpokladaného výsledku.The Outcome column contains the predicted outcome label. Pri záznamoch s pravdepodobnosťami, ktoré presahujú prahovú hodnotu, je pravdepodobné, že cieľový výsledok dosiahnu.Records with probabilities exceeding the threshold are predicted as likely to achieve the target outcome and are labeled as True. Pri záznamoch, ktoré sa nachádzajú pod prahovou hodnotou, je nepravdepodobné, že výsledok dosiahnu. Sú označené ako False.Records below the threshold are predicted as unlikely to achieve the outcome and are labeled as False.

Stĺpec PredictionExplanation obsahuje vysvetlenie predpovede s konkrétnym vplyvom, ktorý vstupné funkcie mali na stĺpec PredictionScore.The PredictionExplanation column contains an explanation with the specific influence that the input features had on the PredictionScore.

Modely klasifikácieClassification models

Modely klasifikácie sa používajú na rozdelenie množiny údajov do viacerých skupín alebo tried.Classification models are used to classify a dataset into multiple groups or classes. Používajú sa na predpovedanie udalostí, ktoré môžu mať jeden z viacerých možných výsledkov.They're used to predict events that can have one of the multiple possible outcomes. Napríklad na predpovedanie, či bude mať zákazník veľmi vysokú, vysokú, strednú alebo nízku hodnotu životnosti, či je predvolené riziko vysoké, stredné, nízke alebo veľmi nízke a tak ďalej.For instance, whether a customer is likely to have a very high, high, medium, or low Lifetime Value, whether the risk of default is High, Moderate, Low, or Very Low; and so on.

Výstupom modelu klasifikácie je skóre pravdepodobnosti, ktoré stanovuje mieru pravdepodobnosti, že záznam splní kritériá danej triedy.The output of a Classification model is a probability score, which identifies the likelihood that a record will achieve the criteria for a given class.

Trénovanie modelu klasifikácieTraining a Classification model

Vstupná entita s vašimi údajmi na trénovanie modelu klasifikácie musí ako pole výsledku obsahovať reťazec alebo celočíselné pole, ktoré identifikuje predchádzajúce známe výsledky.The input entity containing your training data for a Classification model must have a string or whole number field as the outcome field, which identifies the past known outcomes.

Požiadavky:Pre-requisites:

  • Každá trieda výsledkov vyžaduje minimálne 20 riadkov historických údajov.A minimum of 20 rows of historical data is required for each class of outcomes

Vytváranie modelu klasifikácie pozostáva z rovnakých krokov ako tvorba ostatných modelov automatizovaného strojového učenia, ktorá je popísaná v časti Konfigurácia vstupov modelu strojového učenia vyššie.The process of creation for a Classification model follows the same steps as other AutoML models, described in the section Configuring the ML model inputs above.

Zostava modelu klasifikácieClassification model report

Zostavu modelu klasifikácie je možné vytvoriť tak, že model strojového učenia použijete na testovacie údaje podržania a predpokladanú triedu záznamu porovnáte so skutočnou známou triedou.The Classification model report is produced by applying the ML model to the holdout test data and comparing the predicted class for a record with the actual known class.

Zostava modelu obsahuje graf, ktorý obsahuje rozpis správne a nesprávne klasifikovaných záznamov každej známej triedy.The model report includes a chart that includes the breakdown of the correctly and incorrectly classified records for each known class.

Zostava modelu

Ďalšia hĺbková analýza špecifická pre jednotlivé triedy umožňuje analyzovať spôsob, akým sa predpovede pre známu triedu distribuujú.A further class-specific drilldown enables an analysis of how the predictions for a known class are distributed. Zobrazujú sa ďalšie triedy, pri ktorých je pravdepodobné, že sa záznamy tejto známej triedy klasifikujú nesprávne.This shows the other classes in which records of that known class are likely to be misclassified.

Vysvetlenie modelu v zostave zahŕňa aj top prediktory pre jednotlivé triedy.The model explanation in the report also includes the top predictors for each class.

Zostava modelu klasifikácie obsahuje aj stránku s podrobnosťami trénovania, ktorá sa podobá na stránky pre iné typy modelov, ako sa uvádza v časti Zostava modelu automatizovaného strojového učenia v tomto článku.The Classification model report also includes a Training Details page similar to the pages for other model types, as described in the section AutoML model report earlier in this article.

Použitie modelu klasifikácieApplying a classification model

Ak chcete použiť model klasifikácie strojového učenia, musíte k entite pridať vstupné údaje a predponu názvu výstupného stĺpca.To apply a Classification ML model, you must specify the entity with the input data and the output column name prefix.

Po použití modelu klasifikácie sa do obohatenej výstupnej entity pridá päť výstupných stĺpcov. ClassificationScore, ClassificationResult, ClassificationExplanation, ClassProbabilities a ExplanationIndex.When a Classification model is applied, it adds five output columns to the enriched output entity: ClassificationScore, ClassificationResult, ClassificationExplanation, ClassProbabilities, and ExplanationIndex. K názvom stĺpcov v entite sa po použití modelu pridá určitá predpona.The column names in the entity have the prefix specified when the model is applied.

Stĺpec ClassProbabilities obsahuje zoznam skóre pravdepodobnosti záznamu pre všetky možné triedy.The ClassProbabilities column contains the list of probability scores for the record for each possible class.

Stĺpec ClassificationScore stanovuje mieru pravdepodobnosti, že záznam splní kritériá danej triedy.The ClassificationScore is the percentage probability, which identifies the likelihood that a record will achieve the criteria for a given class.

Stĺpec ClassificationResult obsahuje triedu, ktorá má najväčšiu šancu byť predpovedaná pre záznam.The ClassificationResult column contains the most likely predicted class for the record.

Stĺpec ClassificationExplanation obsahuje vysvetlenie s konkrétnym vplyvom, ktorý vstupné funkcie mali na stĺpec ClassificationScore.The ClassificationExplanation column contains an explanation with the specific influence that the input features had on the ClassificationScore.

Regresné modelyRegression models

Regresné modely sa používajú na predpovedanie numerickej hodnoty.Regression models are used to predict a numeric value. Príklad: pravdepodobné výnosy z predajného obchodu, hodnota životnosti zákazníka, suma faktúry v stave pohľadávky, ktorá bude pravdepodobne vyplatená, dátum zaplatenia faktúry a podobne.For instance: the revenue likely to be realized from a sales deal, the lifetime value of an account, the amount of a receivable invoice that is likely to be paid, the date on which an invoice may be paid, and so on.

Výstupom regresného modelu je predpovedaná hodnota.The output of a Regression model is the predicted value.

Trénovanie regresného modeluTraining a Regression model

Vstupná entita s údajmi na trénovanie regresného modelu musí ako pole výsledku obsahovať číselné pole, ktoré identifikuje známe hodnoty výsledkov.The input entity containing the training data for a Regression model must have a numeric field as the outcome field, which identifies the known outcome values.

Požiadavky:Pre-requisites:

  • Regresný model vyžaduje minimálne 100 riadkov historických údajov.A minimum of 100 rows of historical data is required for a Regression model

Vytvorenie regresného modelu pozostáva z rovnakých krokov ako tvorba ostatných modelov automatizovaného strojového učenia, ktorá je popísaná v časti Konfigurácia vstupov modelu strojového učenia vyššie.The process of creation for a Regression model follows the same steps as other AutoML models, described in the section Configuring the ML model inputs above.

Zostava regresného modeluRegression model report

Podobne ako ostatné zostavy modelov automatizovaného strojového učenia, tak aj regresná zostava je založená na výsledkoch z používania modelu na testovacích údajoch podržania.Like the other AutoML model reports, the Regression report is based on the results from applying the model to the holdout test data.

Zostava modelu obsahuje graf, ktorý porovnáva predpokladané hodnoty so skutočnou hodnotou.The model report includes a chart that compares the predicted values to the actual values. V tomto grafe vzdialenosť od diagonálnej čiary znázorňuje chybu v predpovedi.In this chart, the distance from the diagonal indicates the error in the prediction.

V grafe zostatkovej chybovosti je vyobrazené rozdelenie percentuálnej hodnoty priemernej chyby pre rôzne hodnoty v testovacej množine údajov podržania.The residual error chart shows the distribution of the percentage of average error for different values in the holdout test dataset. Vodorovná os predstavuje priemernú hodnotu skutočnej hodnoty skupiny a veľkosť bubliny zas predstavuje frekvenciu alebo počet hodnôt v danom rozsahu.The horizontal axis represents the mean of the actual value for the group, with the size of the bubble showing the frequency or count of values in that range. Zvislá os predstavuje priemernú zostatkovú chybu.The vertical axis is the average residual error.

Graf zostatkovej chybovosti

Zostava regresného modelu, rovnako ako zostavy iných typov modelov, obsahuje aj stránku s podrobnosťami trénovania, ako sa uvádza v časti Zostava modelu automatizovaného strojového učenia vyššie.The Regression model report also includes a Training Details page like the reports for other model types, as described in the section AutoML model report above.

Použitie regresného modeluApplying a regression model

Ak chcete použiť regresný model strojového učenia, musíte k entite pridať vstupné údaje a predponu názvu výstupného stĺpca.To apply a Regression ML model, you must specify the entity with the input data and the output column name prefix.

Použitie regresie

Po použití regresného modelu sa do obohatenej výstupnej entity pridajú tri výstupné stĺpce. RegressionResult, RegressionExplanation a ExplanationIndex.When a Regression model is applied, it adds three output columns to the enriched output entity: RegressionResult, RegressionExplanation, and ExplanationIndex. K názvom stĺpcov v entite sa po použití modelu pridá určitá predpona.The column names in the entity have the prefix specified when the model is applied.

Stĺpec RegressionResult obsahuje predpokladanú hodnotu záznamu vychádzajúcu zo vstupných polí.The RegressionResult column contains the predicted value for the record based on the input fields. Stĺpec RegressionExplanation obsahuje vysvetlenie predpovede s konkrétnym vplyvom, ktorý vstupné funkcie mali na stĺpec RegressionResult.The RegressionExplanation column contains an explanation with the specific influence that the input features had on the RegressionResult.

Ďalšie krokyNext steps

Tento článok poskytol prehľad automatizovaného strojového učenia pre toky údajov v službe Power BI.This article provided an overview of Automated Machine Learning for Dataflows in the Power BI service. Nasledujúce články môžu byť tiež užitočné.The following articles may also be useful.

Ďalšie informácie o tokoch údajov si môžete prečítať v týchto článkoch:For more information about dataflows, you can read these articles: