AI s toky datAI with dataflows

V tomto článku probereme způsoby použití umělé inteligence (AI) s toky dat.In this article we discuss ways you can use artificial intelligence (AI) with dataflows. Oblasti popsané v tomto článku:The areas described in this article are the following:

  • Cognitive ServicesCognitive Services
  • Automatizované strojové učeníAutomated Machine Learning
  • Integrace služby Azure Machine LearningAzure Machine Learning Integration

Cognitive Services v Power BICognitive Services in Power BI

S Cognitive Services v Power BI můžete používat různé algoritmy Azure Cognitive Services k obohacení dat při jejich samoobslužné přípravě pro toky dat.With Cognitive Services in Power BI, you can apply different algorithms from Azure Cognitive Services to enrich your data in the self-service data prep for Dataflows.

Dnes jsou podporované tyto služby: analýza mínění, extrakce klíčových frází, rozpoznávání jazyka a označování obrázků.The services that are supported today are Sentiment Analysis, Key Phrase Extraction, Language Detection, and Image Tagging. Transformace probíhají ve službě Power BI, a nevyžadují předplatné služeb Azure Cognitive Services.The transformations are executed on the Power BI Service and do not require an Azure Cognitive Services subscription. Tato funkce vyžaduje Power BI Premium.This feature requires Power BI Premium.

Povolení funkcí umělé inteligenceEnabling AI features

Služby Cognitive Services jsou podporované pro uzly kapacity Premium označené EM2, A2 nebo P1 a vyšší.Cognitive services are supported for Premium capacity nodes EM2, A2, or P1 and above. Z hlediska kapacity se ke spuštění Cognitive Services používá samostatná úloha AI.A separate AI workload on the capacity is used to run cognitive services. Po dobu veřejné verze Preview (do června 2019) byla tato úloha ve výchozím nastavení zakázaná.During public preview (prior to June 2019), this workload was disabled by default. Před použitím služeb Cognitive Services v Power BI je potřeba úlohu AI povolit na portálu pro správu v nastavení kapacity.Before using cognitive services in Power BI, the AI workload needs to be enabled in the capacity settings of the admin portal. Úlohu AI můžete zapnout v oddílu úloh a pak definovat maximální velikost paměti, kterou smí úloha využívat.You can turn on the AI workload in the workloads section, and define the maximum amount of memory you would like this workload to consume. Doporučený limit paměti je 20 %.The recommended memory limit is 20%. Při překročení limitu se dotaz zpomalí.Exceeding this limit causes the query to slow down.

Služby Cognitive Services v Power BI

Začínáme s Cognitive Services v Power BIGetting started with Cognitive Services in Power BI

Služby Cognitive Services jsou součástí samoobslužné přípravy dat pro toky dat.Cognitive Services transforms are part of the Self-Service Data Prep for dataflows. Pokud chcete obohatit data o Cognitive Services, začněte úpravou toku dat.To enrich your data with Cognitive Services, start by editing a dataflow.

Úprava toku dat

Na horním pásu karet editoru Power Query vyberte tlačítko Přehledy UI.Select the AI Insights button in the top ribbon of Power Query Editor.

Přehledy umělé inteligence v editoru Power Query

V rozevíracím okně vyberte funkci, kterou chcete použít, a data, která chcete transformovat.In the pop-up window, select the function you want to use and the data you want to transform. V tomto příkladu přiřadíme skóre zabarvení sloupci, ve kterém je text recenze.In this example, I'm scoring the sentiment of a column that contains review text.

Výběr funkce

Cultureinfo je volitelný vstup, který určuje jazyk textu.Cultureinfo is an optional input to specify the language of the text. V tomto poli se očekává kód ISO.This field is expecting an ISO code. Jako vstup pro Cultureinfo můžete použít sloupec nebo statické pole.You can use a column as input for Cultureinfo, or a static field. V tomto příkladu je v celém sloupci zadaná angličtina (en).In this example, the language is specified as English (en) for the whole column. Pokud pole necháte prázdné, Power BI před použitím funkce automaticky rozpozná jazyk.If you leave this field blank, Power BI automatically detects the language before applying the function. Potom vyberte Volat.Next, select Invoke.

Výběr možnosti Volat

Po volání funkce se výsledek přidá jako nový sloupec tabulky.After invoking the function, the result is added as a new column to the table. Také transformace se přidá jako použitý krok dotazu.The transformation is also added as an applied step in the query.

Vytvoření nového sloupce

Pokud funkce vrátí více výstupních polí, přidá se při volání funkce nový sloupec se záznamem několika výstupních polí.If the function returns multiple output fields, invoking the function adds a new column with a record of the multiple output fields.

K přidání jedné nebo obou hodnot do dat jako sloupců použijte možnost Rozbalit.Use the expand option to add one or both values as columns to your data.

Rozbalení sloupce

Dostupné funkceAvailable functions

V této části jsou popsané dostupné funkce Cognitive Services v Power BI.This section describes the available functions in Cognitive Services in Power BI.

Rozpoznání jazykaDetect Language

Funkce rozpoznávání jazyka vyhodnotí vstupní text a pro každé pole vrátí název jazyka a identifikátor ISO.The language detection function evaluates text input, and for each field, returns the language name and ISO identifier. Tato funkce je užitečná pro sloupce dat, ve kterých se shromažďuje libovolný text, u kterého není známý jazyk.This function is useful for data columns that collect arbitrary text, where language is unknown. Funkce očekává vstupní data v textovém formátu.The function expects data in text format as input.

Analýza textu dokáže rozpoznat až 120 jazyků.Text Analytics recognizes up to 120 languages. Další informace najdete v části o podporovaných jazycích.For more information, see supported languages.

Extrakce klíčových frázíExtract Key Phrases

Funkce extrakce klíčových frází vyhodnotí nestrukturovaný text a pro každé textové pole vrátí seznam klíčových frází.The Key Phrase Extraction function evaluates unstructured text, and for each text field, returns a list of key phrases. Funkce vyžaduje, aby jejím vstupem bylo textové pole. Přijímá také volitelný vstup pro CultureinfoThe function requires a text field as input, and accepts an optional input for Cultureinfo. (viz Začínáme v předchozí části tohoto článku).(See the Getting Started section earlier in this article).

Extrakce klíčových frází funguje lépe, když jí poskytnete větší bloky textu, se kterými pracuje.Key phrase extraction works best when you give it bigger chunks of text to work on. Je pravým opakem funkce Analýza mínění, která pracuje lépe s menšími bloky textu.This is opposite from sentiment analysis, which performs better on smaller blocks of text. Pokud chcete mít v obou operacích optimální výsledky, měli byste uvažovat o změně struktury vstupů.To get the best results from both operations, consider restructuring the inputs accordingly.

Skóre zabarveníScore Sentiment

Funkce Skóre zabarvení vyhodnotí textový vstup a vrátí ke každému dokumentu skóre citového zabarvení v rozsahu 0 (záporné) až 1 (kladné).The Score Sentiment function evaluates text input and returns a sentiment score for each document, ranging from 0 (negative) to 1 (positive). Tato funkce je užitečná, protože umožňuje zjistit kladné a záporné reakce na sociálních sítích, v zákaznických recenzích a na diskuzních fórech.This function is useful for detecting positive and negative sentiment in social media, customer reviews, and discussion forums.

Analýza textu používá ke generování skóre citového zabarvení (0 až 1) klasifikační algoritmus se strojovým učením.Text Analytics uses a machine learning classification algorithm to generate a sentiment score between 0 and 1. Pokud se skóre blíží 1, znamená to kladné zabarvení. Pokud se skóre blíží 0, znamená to záporné zabarvení.Scores closer to 1 indicate positive sentiment, scores closer to 0 indicate negative sentiment. Model byl předem trénovaný na rozsáhlém textu s přidruženým zabarvením.The model is pre-trained with an extensive body of text with sentiment associations. V současnosti nemůžete poskytovat vlastní trénovací data.Currently, it's not possible to provide your own training data. Model používá při analýze textu kombinované techniky, které zahrnují zpracování textu, analýzu částí řeči, umístění slov a slovní asociace.The model uses a combination of techniques during text analysis, including text processing, part-of-speech analysis, word placement, and word associations. Další informace o tomto algoritmu najdete v úvodu do analýzy textu.For more information about the algorithm, see Introducing Text Analytics.

Analýza mínění se provádí u celého vstupního pole na rozdíl od extrakce mínění z konkrétní entity v textu.Sentiment analysis is performed on the entire input field, as opposed to extracting sentiment for a particular entity in the text. Praxe se spíše přiklání k přesnosti skóre, která je větší, když dokumenty obsahují jednu nebo dvě věty místo velkého bloku textu.In practice, there's a tendency for scoring accuracy to improve when documents contain one or two sentences rather than a large block of text. Ve fázi hodnocení objektivity model určuje, jestli je vstupní pole jako celek objektivní nebo obsahuje zabarvení.During an objectivity assessment phase, the model determines whether an input field as a whole is objective or contains sentiment. Pokud je vstupní pole převážně objektivní, nepostupuje do fáze rozpoznání zabarvení. Výsledné skóre je 0,50 bez dalšího zpracování.An input field that is mostly objective does not progress to the sentiment detection phrase, resulting in a .50 score, with no further processing. U vstupních polí, která pokračují v kanálu, se v další fázi generují skóre nad nebo pod hodnotou 0,50 podle zjištěné míry zabarvení ve vstupním poli.For input fields continuing in the pipeline, the next phase generates a score above or below .50, depending on the degree of sentiment detected in the input field.

V současnosti analýza mínění podporuje angličtinu, němčinu, španělštinu a francouzštinu.Currently, Sentiment Analysis supports English, German, Spanish, and French. Další jazyky jsou ve verzi Preview.Other languages are in preview. Další informace najdete v části o podporovaných jazycích.For more information, see Supported languages.

Označování obrázkůTag Images

Funkce označování obrázků vrací značky na základě více než 2000 rozpoznatelných objektů, živých bytostí, scenérií a akcí.The Tag Images function returns tags based on more than 2,000 recognizable objects, living beings, scenery, and actions. Pokud nejsou značky jednoznačné nebo všeobecně známé, nabízí výstup „nápovědy“, které vysvětlují význam značky v kontextu známých skutečností.When tags are ambiguous or not common knowledge, the output provides 'hints' to clarify the meaning of the tag in context of a known setting. Značky nejsou uspořádané do taxonomií a neexistují u nich hierarchie dědičnosti.Tags are not organized as a taxonomy and no inheritance hierarchies exist. Shromážděné značky obsahu tvoří základ „popisu“ obrázku, který se zobrazí v čitelném jazyce formátovaném do celých vět.A collection of content tags forms the foundation for an image 'description' displayed as human readable language formatted in complete sentences.

Po načtení obrázku nebo zadání jeho adresy URL zpracuje algoritmus počítačového zpracování obrazu výstupní značky na základě identifikovaných objektů, živých bytostí a akcí.After uploading an image or specifying an image URL, Computer Vision algorithms output tags based on the objects, living beings, and actions identified in the image. Značky se neomezují jen na hlavní subjekt, jako je osoba v popředí, ale zahrnují také kompozici (vnitřní nebo venkovní), nábytek, nástroje, rostliny, zvířata, příslušenství, zařízení atd.Tagging is not limited to the main subject, such as a person in the foreground, but also includes the setting (indoor or outdoor), furniture, tools, plants, animals, accessories, gadgets, and so on.

Tato funkce vyžaduje jako vstup adresu URL obrázku nebo pole Base 64.This function requires an image URL or abase-64 field as input. Označování obrázků v tuto chvíli podporuje angličtinu, španělštinu, japonštinu, portugalštinu a zjednodušenou čínštinu.At this time, image tagging supports English, Spanish, Japanese, Portuguese, and Simplified Chinese. Další informace najdete v části o podporovaných jazycích.For more information, see Supported languages.

Automatizované strojové učení s využitím Power BIAutomated Machine Learning in Power BI

Automatizované strojové učení (AutoML) pro toky dat umožňuje podnikovým analytikům trénovat, ověřovat a používat modely strojového učení (ML) přímo v Power BI.Automated machine learning (AutoML) for dataflows enables business analysts to train, validate, and invoke Machine Learning (ML) models directly in Power BI. Zahrnuje jednoduché prostředí pro vytvoření nového modelu ML, ve kterém analytici mohou pomocí toků dat zadat vstupní data pro trénování modelu.It includes a simple experience for creating a new ML model where analysts can use their dataflows to specify the input data for training the model. Služba automaticky extrahuje nejrelevantnější funkce, vybere vhodný algoritmus a vyladí a ověří model ML.The service automatically extracts the most relevant features, selects an appropriate algorithm, and tunes and validates the ML model. Po vytrénování modelu Power BI automaticky vygeneruje sestavu výkonu, která obsahuje výsledky ověření.After a model is trained, Power BI automatically generates a performance report that includes the results of the validation. Model je možné potom zavolat u libovolných nových nebo aktualizovaných dat v rámci toku dat.The model can then be invoked on any new or updated data within the dataflow.

Obrazovka strojového učení

Automatizované strojové učení je k dispozici pro toky dat hostované pouze v kapacitách Power BI Premium a Embedded.Automated machine learning is available for dataflows that are hosted on Power BI Premium and Embedded capacities only.

Práce s AutoMLWorking with AutoML

Toky dat nabízí samoobslužnou přípravu dat pro velké objemy dat.Dataflows offer self-serve data prep for big data. AutoML je integrované do datových toků a umožňuje využít úsilí věnované přípravě dat pro vytvoření modelů strojového učení přímo v rámci Power BI.AutoML is integrated into dataflows and enables you to leverage your data prep effort for building machine learning models, right within Power BI.

AutoML v Power BI umožňuje datovým analytikům používat toky dat k vytvoření modelů strojového učení se zjednodušeným prostředím a jen pomocí Power BI.AutoML in Power BI enables data analysts to use dataflows to build machine learning models with a simplified experience, using just Power BI skills. Většina datových věd za vytvářením modelů ML je automatizovaná prostřednictvím Power BI.Most of the data science behind the creation of the ML models is automated by Power BI. Má ochranné prvky zajišťující, že vytvořený model je kvalitní a poskytuje přehled o procesu použitém k vytvoření modelu ML.It has guardrails to ensure that the model produced has good quality and provides visibility into the process used to create your ML model.

Pro toky dat AutoML podporuje vytváření binární předpovědi, klasifikace a regresních modelů.AutoML supports the creation of Binary Prediction, Classification, and Regression Models for dataflows. Jedná se o typy metod strojového učení pod dohledem, což znamená, že prostřednictvím učení ze známých výsledků minulých pozorování předpovídají výsledky dalších pozorování.These are types of supervised machine learning techniques, which means that they learn from the known outcomes of past observations to predict the outcomes of other observations. Vstupní datová sada pro trénování modelu AutoML je skupina záznamů, které jsou popsány pomocí známých výsledků.The input dataset for training an AutoML model is a set of records that are labeled with the known outcomes.

AutoML v Power BI integruje automatizované strojové učení služby Azure Machine Learning, abyste mohli vytvářet vlastní modely strojového učení.AutoML in Power BI integrates automated ML from Azure Machine Learning to create your ML models. K použití AutoML v Power BI ale nepotřebujete předplatné Azure.However, you don't need an Azure subscription to use AutoML in Power BI. Proces trénování a hostování modelů ML je plně pod správou služby Power BI.The process of training and hosting the ML models is managed entirely by the Power BI service.

Po vytrénování modelu ML služba AutoML automaticky vygeneruje sestavu Power BI, která vysvětluje pravděpodobný výkon modelu ML.After an ML model is trained, AutoML automatically generates a Power BI report that explains the likely performance of your ML model. AutoML zdůrazňuje schopnost vysvětlení pomocí zvýraznění klíčových vlivových faktorů ve vstupech, které ovlivňují předpověď vrácenou modelem.AutoML emphasizes explainability by highlighting the key influencers among your inputs that influence the predictions returned by your model. Sestava také obsahuje klíčové metriky modelu.The report also includes key metrics for the model.

Další stránky vygenerované sestavy zobrazují statistický souhrn modelu a podrobnosti trénování.Other pages of the generated report show the statistical summary of the model and the training details. Statistický souhrn je důležitý pro uživatele, kteří chtějí zobrazit standardní míry datové vědy výkonu modelu.The statistical summary is of interest to users who would like to see the standard data science measures of model performance. Podrobnosti trénování shrnují všechny iterace spuštěné za účelem vytvoření modelu spolu s přidruženými parametry modelování.The training details summarize all the iterations that were run to create your model, with the associated modeling parameters. Popisuje také, jak byly pro vytvoření modelu ML použity jednotlivé vstupy.It also describes how each input was used to create the ML model.

Potom můžete pomocí modelu ML u svých dat stanovit skóre.You can then apply your ML model to your data for scoring. Po aktualizaci toku dat se data aktualizují pomocí předpovědí z vašeho modelu ML.When the dataflow is refreshed, your data is updated with predictions from your ML model. Power BI také zahrnuje individualizované vysvětlení jednotlivých konkrétních předpovědí, které model ML vytvoří.Power BI also includes an individualized explanation for each specific prediction that the ML model produces.

Vytvoření modelu strojového učeníCreating a machine learning model

Tato část popisuje vytvoření modelu AutoML.This section describes how to create an AutoML model.

Příprava dat pro vytvoření modelu MLData prep for creating an ML model

Pokud chcete v Power BI vytvořit model strojového učení, musíte nejprve vytvořit tok dat pro data obsahující historické informace o výsledcích, které se použijí pro trénování modelu ML.To create a machine learning model in Power BI, you must first create a dataflow for the data containing the historical outcome information, which is used for training the ML model. Musíte také přidat počítané sloupce pro všechny obchodní metriky, které mohou sloužit jako silné předpovědi výsledku, který se snažíte předpovídat.You should also add calculated columns for any business metrics that may be strong predictors for the outcome you're trying to predict. Podrobnosti o konfiguraci toku dat najdete v tématu o konfiguraci a využití toku dat.For details on configuring your dataflow, see configure and consume a dataflow.

AutoML má pro trénování modelu strojového učení konkrétní požadavky na data.AutoML has specific data requirements for training a machine learning model. Požadavky jsou popsány v následujících částech podle příslušného typu modelu.These requirements are described in sections below, based on respective model types.

Konfigurace vstupů modelu MLConfiguring the ML model inputs

Pokud chcete vytvořit model AutoML, vyberte ikonu ML ve sloupci Akce entity toku dat a vyberte Přidat model strojového učení.To create an AutoML model, select the ML icon in the Actions column of the dataflow entity, and select Add a machine learning model.

Přidání modelu strojového učení

Spustí se zjednodušené prostředí s průvodcem, který vás provede procesem vytvoření modelu ML.A simplified experience is launched, consisting of a wizard that guides you through the process of creating the ML model. Průvodce zahrnuje následující jednoduché kroky.The wizard includes the following simple steps.

1. Výběr entity s historickými daty a pole výsledku, pro které chcete vytvořit předpověď1. Select the entity with the historical data, and the outcome field for which you want a prediction

Pole výsledku identifikuje atribut popisku pro trénování modelu ML, jak je znázorněno na následujícím obrázku.The outcome field identifies the label attribute for training the ML model, shown in the following image.

Výběr dat historických výsledků

2. Volba typu modelu2. Choose a model type

Když zadáte pole výsledku, AutoML analyzuje data popisku a doporučí nejpravděpodobnější typ modelu ML, který je možné trénovat.When you specify the outcome field, AutoML analyzes the label data to recommend the most likely ML model type that can be trained. Jak je znázorněno níže, můžete vybrat jiný typ modelu kliknutím na Vyberte jiný model.You can pick a different model type as shown below by clicking on “Select a different model”.

Výběr modelu

Poznámka

Některé typy modelů nemusí podporovat data, která jste vybrali, a proto nebudou dostupné.Some model types may not be supported for the data that you have selected and hence would be disabled. V předchozím příkladu je regrese zakázaná, protože jako pole výsledku je vybraný textový sloupec.In the above example, Regression is disabled, as a text column is selected as outcome field.

3. Výběr vstupů, které má model použít jako prediktivní signály3. Select the inputs you want the model to use as predictive signals

AutoML analyzuje vzorek vybrané entity a navrhne vstupy, které lze použít pro trénování modelu ML.AutoML analyzes a sample of the selected entity to suggest the inputs that can be used for training the ML model. Vedle polí, která nejsou vybraná, mohou být uvedena vysvětlení.Explanations would be provided next to fields that are not selected. Nedoporučuje se to v případech, kdy má určité pole příliš mnoho jedinečných hodnot nebo pouze jednu hodnotu nebo nízkou nebo vysokou korelaci s výstupním polem.If a particular field has too many distinct values or only one value, or low or high correlation with the output field, it would not be recommended.

Žádné vstupy, které závisí na poli výsledku (nebo poli popisku), nejsou vhodné pro trénování modelu ML, protože ovlivní jeho výkon.Any inputs that are dependent on the outcome field (or the label field) should not be used for training the ML model, since they will affect its performance. Taková pole by se označila, že mají podezřele vysokou korelaci s výstupním polem.Such fields would be flagged as having “suspiciously high correlation with output field”. Zavedení těchto polí do tréninkových dat vede k úniku informací z popisků, kdy je model úspěšný při ověřování nebo testování dat, ale tuto úspěšnost nedokáže prokázat při použití v produkčním prostředí při bodování.Introducing these fields into the training data causes label leakage, where the model performs well on the validation or test data but cannot match that performance when used in production for scoring. Únik informací z popisků může být jednou z příčin problémů v modelech AutoML, pokud je výkon trénovacího modelu příliš dobrý.Label leakage could be a possible concern in AutoML models, when training model performance is too good to be true.

Toto doporučení funkce je založeno na vzorku dat, takže byste měli zkontrolovat použité vstupy.This feature recommendation is based on a sample of a data, so you should review the inputs used. Máte možnost změnit výběr tak, aby obsahoval pouze pole, která má daný model studovat.You have the option to change the selections to include only the fields you want the model to study. Můžete také vybrat všechna pole zaškrtnutím políčka vedle názvu entity.You can also select all the fields by selecting the checkbox next to the entity name.

Přizpůsobit vstupní pole

4. Pojmenování modelu a uložení konfigurace4. Name your model and save your configuration

V posledním kroku můžete model pojmenovat a vybrat možnost Uložit a natrénovat, která začne trénování modelu ML.In the final step, you can name the model and select Save and train which begins training the ML model. Můžete si vybrat, že se má zkrátit doba trénování, aby se zobrazily rychlé výsledky, nebo prodloužit délku doby strávené trénováním, abyste získali nejlepší model.You can choose to reduce the training time to see quick results or increase the amount of time spent in training to get the best model.

Pojmenování modelu

Trénování modelu MLML model training

Trénování modelů ML tvoří součást aktualizace toku dat.Training of AutoML models is a part of the dataflow refresh. AutoML nejprve připraví data pro trénování.AutoML first prepares your data for training. AutoML rozdělí zadaná historická data na trénovací a testovací datovou sadu.AutoML splits the historical data you provide into training and testing datasets. Testovací datová sada je referenční sada, která slouží pro ověření výkonu modelu po trénování.The test dataset is a holdout set that is used for validating the model performance after training. Tyto sady lze v toku dat chápat jako trénovací a testovací entity.These are realized as Training and Testing entities in the dataflow. Pro ověření modelu AutoML také používá křížové ověření.AutoML uses cross-validation for the model validation.

Dále se analyzují jednotlivá vstupní pole a použije se imputace, která nahradí všechny chybějící hodnoty náhradními hodnotami.Next, each input field is analyzed and imputation is applied, which replaces any missing values with substituted values. AutoML používá několik různých strategií imputace.A couple of different imputation strategies are used by AutoML. V případě vstupních atributů, které se považují za číselné funkce, se pro imputaci používá střední hodnota hodnot sloupců.For input attributes treated as numeric features, the mean of the column values is used for imputation. V případě vstupních atributů, které se považují za kategorické funkce, se pro imputaci používá modus hodnot sloupců.For input attributes treated as categorical features, AutoML uses the mode of the column values for imputation. Střední hodnotu a modus hodnot používané pro imputaci vypočítává architektura AutoML z dílčích vzorků trénovací datové sady.The mean and mode of values used for imputation are calculated by the AutoML framework on the subsampled training dataset.

U dat se poté použije veškeré požadované vzorkování a normalizace.Then, sampling and normalization are applied to your data as required. U klasifikačních modelů AutoML protahuje vstupní data vrstveným vzorkováním a vyrovnává počet tříd, aby měly všechny stejný počet řádků.For classification models, AutoML runs the input data through stratified sampling and balances the classes to ensure the row counts are equal for all.

AutoML použije několik transformací pro každé vybrané vstupní pole na základě jeho datového typu a statistických vlastností.AutoML applies several transformations on each selected input field based on its data type, and its statistical properties. AutoML používá tyto transformace k extrahování funkcí pro použití při trénování modelu ML.AutoML uses these transformations to extract features for use in training your ML model.

Proces trénování modelů AutoML tvoří až 50 iterací s různými algoritmy modelování a nastavením hyperparametrů pro vyhledání modelu s nejlepším výkonem.The training process for AutoML models consists of up to 50 iterations with different modeling algorithms and hyperparameter settings to find the model with the best performance. Trénování může brzy skončit s menšími iteracemi, pokud AutoML zjistí, že nedochází ke zvýšení výkonu.Training can end early with lesser iterations if AutoML notices that there is no performance improvement being observed. Výkon jednotlivých modelů se posuzuje ověřením pomocí referenční testovací datové sady.The performance of each of these models is assessed by validation with the holdout test dataset. Při tomto kroku trénování AutoML vytvoří několik kanálů pro trénování a ověření těchto iterací.During this training step, AutoML creates several pipelines for training and validation of these iterations. Proces posouzení výkonu modelu může nějaký čas trvat – od několika minut, několik hodin až po dobu trénování nakonfigurovanou v průvodci – podle velikosti datové sady a dostupných prostředků vyhrazené kapacity.The process of assessing the performance of the models can take time, anywhere from several minutes to a couple of hours up-to the training time configured in the wizard, depending on the size of your dataset and the dedicated capacity resources available.

V některých případech může finální vygenerovaný model využít skupinového učení (ensemble), při kterém se získání lepšího výkonu předpovědi dosáhne pomocí více modelů.In some cases, the final model generated may use ensemble learning, where multiple models are used to deliver better predictive performance.

Vysvětlitelnost modelu AutoMLAutoML model explainability

Po vytrénování modelu AutoML analyzuje vztah mezi vstupními funkcemi a výstupem modelu.After the model has been trained, AutoML analyzes the relationship between the input features and the model output. Posoudí magnitudu změny ve výstupu modelu referenční testovací datové sady pro jednotlivé vstupní funkce.It assesses the magnitude of change to the model output for the holdout test dataset for each input feature. Tento proces se označuje jako důležitost funkce.This is known as the feature importance. K tomu dojde v rámci aktualizace po dokončení trénování.This happens as a part of the refresh once training is complete. Proto může aktualizace trvat delší dobu, než je doba trénování nakonfigurovaná v průvodci.Hence your refresh may take longer than the training time configured in the wizard.

Důležitost funkce

Sestava modelu AutoMLAutoML model report

AutoML vygeneruje sestavu Power BI, která shrnuje výkon modelu během ověření a globální důležitost funkce.AutoML generates a Power BI report that summarizes the performance of the model during validation, along with the global feature importance. Tato sestava je k dispozici na kartě modelu strojového učení po úspěšné aktualizaci toku dat.This report can be accessed from the Machine Learning Model tab once the dataflow refresh is successful. Sestava shrnuje výsledky použití modelu ML u referenčních testovacích sad a porovnání předpovědí se známými výslednými hodnotami.The report summarizes the results from applying the ML model to the holdout test data and comparing the predictions with the known outcome values.

Sestavu modelu můžete prozkoumat, abyste porozuměli jeho výkonu.You can review the model report to understand its performance. Můžete také ověřit, že klíčové vlivové faktory modelu odpovídají firemním přehledům známých výsledků.You can also validate that the key influencers of the model align with the business insights about the known outcomes.

Grafy a míry použité k popisu výkonu modelu v sestavě závisí na typu modelu.The charts and measures used to describe the model performance in the report depend on the model type. Tyto výkonnostní grafy a míry jsou popsány v následujících částech.These performance charts and measures are described in the following sections.

Další stránky sestavy mohou popisovat statistické míry týkající se modelu z pohledu datové vědy.Additional pages in the report may describe statistical measures about the model from a data science perspective. Sestava binární předpovědi například obsahuje graf zvýšení a křivku ROC modelu.For instance, the Binary Prediction report includes a gain chart and the ROC curve for the model.

Sestavy také obsahují stránku s podrobnostmi trénování, která popisuje způsob trénování modelu a graf popisující výkon modelu u jednotlivých spuštění iterací.The reports also include a Training Details page that includes a description of how the model was trained, and a chart describing the model performance over each of the iterations run.

Podrobnosti trénování

Další část na této stránce popisuje zjištěný typ vstupního pole a metody imputace použité k vyplňování chybějících hodnot.Another section on this page describes the detected type of the input field and imputation method used for filling missing values. Obsahuje také parametry použité finálním modelem.It also includes the parameters used by the final model.

Další informace o modelu

Pokud vytvořený model používá skupinové učení, na stránce s podrobnostmi trénování najdete také graf zobrazující váhu jednotlivých základních modelů ve skupině a jejich parametry.If the model produced uses ensemble learning, then the Training Details page also includes a chart showing the weight of each constituent model in the ensemble, as well as its parameters.

Váha ve skupině

Použití modelu AutoMLApplying the AutoML model

Pokud jste spokojeni s výkonem vytvořeného modelu ML, můžete ho použít u nových nebo aktualizovaných dat při aktualizaci toku dat.If you're satisfied with the performance of the ML model created, you can apply it to new or updated data when your dataflow is refreshed. To můžete provést ze sestavy modelu výběrem tlačítka Použít v pravém horním rohu nebo kliknutím na tlačítko Použijte model ML v části akcí na kartě Modely strojového učení.You can do this from the model report, by selecting the Apply button in the top-right corner or the Apply ML Model button under actions in the Machine Learning Models tab.

Pokud chcete použít model ML, musíte zadat název entity, u které se má použít, a předponu u sloupců, které se přidají do této entity výsledků modelu.To apply the ML model, you must specify the name of the entity to which it must be applied, and a prefix for the columns that will be added to this entity for the model output. Výchozí předpona názvů sloupců je název modelu.The default prefix for the column names is the model name. Funkce Použít může zahrnovat další parametry specifické pro typ modelu.The Apply function may include additional parameters specific to the model type.

Použití modelu ML vytvoří dvě nové entity toku dat, které obsahují předpovědi a konkrétní vysvětlení pro každý řádek, který se hodnotí ve výstupní entitě.Applying the ML model creates two new dataflow entities which contains the predictions and individualized explanations for each row that it scores in the output entity. Pokud například použijete model PurchaseIntent u entity OnlineShoppers, výstup vygeneruje entity OnlineShoppers enriched PurchaseIntent (OnlineShoppers – rozšířeno o entitu PurchaseIntent) a OnlineShoppers enriched PurchaseIntent explanations (OnlineShoppers – rozšířeno o vysvětlení PurchaseIntent).For instance, if you apply the PurchaseIntent model to the OnlineShoppers entity, the output will generate the OnlineShoppers enriched PurchaseIntent and OnlineShoppers enriched PurchaseIntent explanations entities. Pro každý řádek v rozšířené entitě je vysvětlení rozděleno na více řádků v entitě rozšířených vysvětlení na základě funkce vstupu.For each row in the enriched entity, The Explanations is broken down into multiple rows in the enriched explanations entity based on the input feature. Hodnota ExplanationIndex pomáhá mapovat řádky z entity rozšířeného vysvětlení na řádek v rozšířené entitě.An ExplanationIndex helps map the rows from the enriched explanations entity to the row in enriched entity.

Editor dotazů

Jakýkoli model Power BI AutoML můžete také použít u entit v libovolném toku dat ve stejném pracovním prostoru s použitím Přehledů AI v prohlížeči funkcí PQO.You can also apply any Power BI AutoML model to entities in any dataflow in the same workspace using AI Insights in PQO function browser. Tímto způsobem můžete použít modely vytvořené jinými uživateli ve stejném pracovním prostoru, aniž byste museli být vlastníkem toku dat, který má model.This way, you can use models created by others in the same workspace without necessarily being an owner of the dataflow that has the model. Power Query zjistí všechny modely Power BI ML v pracovním prostoru a zpřístupní je jako dynamické funkce Power Query.Power Query discovers all the Power BI ML models in the workspace and exposes them as dynamic Power Query functions. Tyto funkce můžete vyvolat z pásu karet v editoru Power Query nebo přímým vyvoláním funkce M. You can invoke those functions by accessing them from the ribbon in Power Query Editor, or by invoking the M function directly.Tato funkce je momentálně podporovaná jenom pro toky dat Power BI a pro Power Query Online ve službě Power BI. This functionality is currently only supported for Power BI dataflows, and for Power Query Online in the Power BI service. Všimněte si, se to velmi liší od použití modelů ML v rámci toku dat pomocí průvodce AutoML.Note that this is very different from applying ML models within a dataflow using the AutoML wizard. Při použití této metody se nevytvoří žádná entita vysvětlení, a pokud nejste vlastníkem toku dat, nemůžete získat přístup k sestavám o trénování modelu nebo model znovu trénovat.There is no explanations entity created using this method and unless you are the owner of the dataflow, you cannot access model training reports or retrain the model. Pokud dojde k úpravě zdrojového modelu (přidáním nebo odebráním vstupních polí) nebo k odstranění modelu nebo zdrojového toku dat, tak se tento závislý tok dat poruší.If the source model is edited (adding or removing input fields) or, the model or source dataflow is deleted, then this dependent dataflow would break.

Použití modelu pomocí prohlížeče funkcí PQO

Když použijete model, AutoML při každé aktualizaci toku dat aktualizuje i předpovědi.After you apply the model, AutoML always keeps your predictions up-to-date whenever the dataflow is refreshed.

Pokud chcete použít přehledy a předpovědi z modelu ML v sestavě Power BI, můžete se z Power BI Desktop připojit k výstupní entitě pomocí konektoru Toky dat.To use the insights and predictions from the ML model in a Power BI report, you can connect to the output entity from Power BI Desktop using the dataflows connector.

Binární prediktivní modelyBinary Prediction models

Modely binární předpovědi, které se oficiálně označují jako binární klasifikační modely, slouží ke klasifikaci datové sady do dvou skupin.Binary Prediction models, more formally known as binary classification models, are used to classify a dataset into two groups. Slouží k předpovídání událostí, které mají binární výsledek.They're used to predict events that can have a binary outcome. Například zda dojde ke konverzi prodejní příležitosti, zda zákazník odejde, zda bude faktura zaplacena včas, zda je transakce podvodná atd.For instance, whether a sales opportunity will convert, whether an account will churn, whether an invoice will be paid on time, whether a transaction is fraudulent, and so on.

Výsledek modelu binární předpovědi je skóre pravděpodobnosti, které identifikuje pravděpodobnost, že se dosáhne cílového výsledku.The output of a Binary Prediction model is a probability score, which identifies the likelihood that the target outcome will be achieved.

Trénování modelu binární předpovědiTraining a Binary Prediction model

Požadavky:Pre-requisites:

  • Pro každou třídu výsledků se vyžaduje minimálně 20 řádků historických dat.A minimum of 20 rows of historical data is required for each class of outcomes

Proces vytvoření modelu binární předpovědi se řídí stejným postupem jako u jiných modelů AutoML, který najdete v části Konfigurace vstupů modelů ML výše.The process of creation for a Binary Prediction model follows the same steps as other AutoML models, described in the section Configuring the ML model inputs above. Jediný rozdíl je v kroku volby modelu, kde můžete vybrat cílovou hodnotu výsledku, která vás nejvíc zajímá.The only difference is in the “Choose a model” step where you can select the target outcome value that you’re most interested in. Můžete také zadat smysluplnější popisky výsledků pro použití v automaticky generované sestavě, která shrne výsledky ověření modelu.You can also provide friendly labels for the outcomes to be used in the automatically generated report that will summarize the results of the model validation.

Průvodce binární předpovědí

Sestava modelu binární předpovědiBinary Prediction model report

Model binární předpovědi vytvoří jako výstup pravděpodobnost, že záznam dosáhne cílového výsledku.The Binary Prediction model produces as an output a probability that a record will achieve the target outcome. Sestava zahrnuje průřez pro prahovou hodnotu pravděpodobnosti, který ovlivňuje způsob interpretace skóre nad a pod prahovou hodnotou pravděpodobnosti.The report includes a slicer for the probability threshold, which influences how the scores above and below the probability threshold are interpreted.

Sestava popisuje výkon modelu z pohledu pravdivě pozitivních, falešně pozitivních, pravdivě negativních a falešně negativních výsledků.The report describes the performance of the model in terms of True Positives, False Positives, True Negatives, and False Negatives. Pravdivě pozitivní a pravdivě negativní výsledky jsou správně předpovězené výsledky dvou tříd ve výstupních datech.True Positives and True Negatives are correctly predicted outcomes for the two classes in the outcome data. Falešně pozitivní jsou záznamy, pro které byl předpovězen cílový výsledek, který ale ve skutečnosti neměly.False Positives are records that were predicted to have Target outcome but actually did not. Naopak falešně negativní jsou záznamy, které měly cílový výsledek, ale podle předpovědi ho mít neměly.Conversely, False Negatives are records that had Target outcome but were predicted as not having it.

Míry, jako jsou přesnost a úplnost, popisují účinek prahové hodnoty pravděpodobnosti na předpovězené výsledky.Measures, such as Precision and Recall, describe the effect of the probability threshold on the predicted outcomes. Průřez prahovou hodnotou pravděpodobnosti můžete použít k výběr prahové hodnoty, která dosahuje vyváženého kompromisu mezi přesností a úplností.You can use the probability threshold slicer to select a threshold that achieves a balanced compromise between Precision and Recall.

Náhled přesnosti

Sestava obsahuje také nástroj pro analýzu nákladů a přínosů, který vám usnadní identifikaci podmnožiny populace, která by měla být cílovou skupinou pro dosažení nejvyššího zisku.The report also includes a Cost-Benefit analysis tool to help identify the subset of the population that should be targeted to yield the highest profit. Analýza nákladů a přínosů se snaží maximalizovat zisk pomocí odhadovaných jednotkových nákladů na cílení a přínosů na jednotku při dosažení cílového výsledku.Given an estimated unit cost of targeting and a unit benefit from achieving a target outcome, Cost-Benefit analysis attempts to maximize profit. Pro maximalizaci zisku můžete tento nástroj použít k výběru prahové hodnoty pravděpodobnosti na základě vrcholu v grafu.You can use this tool to pick your probability threshold based on the maximum point in the graph to maximize profit. Graf můžete použít také k výpočtu zisku nebo nákladů pro zvolenou prahovou hodnotu pravděpodobnosti.You can also use the graph to compute the profit or cost for your choice of probability threshold.

Náklady a přínosy

Stránka se sestavou přesnosti v sestavě modelu zahrnuje graf kumulativního zvýšení a křivku ROC modelu.The Accuracy Report page of the model report includes the Cumulative Gains chart and the ROC curve for the model. Jedná se o statistické míry výkonu modelu.These are statistical measures of model performance. Sestavy obsahují popisy zobrazených grafů.The reports include descriptions of the charts shown.

Obrazovka se sestavou přesnosti

Použití modelu binární předpovědiApplying a Binary Prediction model

Pokud chcete použít model binární předpovědi, musíte zadat entitu s daty, u kterých chcete použít předpovědi z modelu ML.To apply a Binary Prediction model, you must specify the entity with the data to which you want to apply the predictions from the ML model. Mezi další parametry patří předpona názvu výstupního sloupce a prahová hodnota pravděpodobnosti pro klasifikaci předpovězeného výsledku.Other parameters include the output column name prefix and the probability threshold for classifying the predicted outcome.

Vstupy předpovědi

Při použití modelu binární předpovědi se do rozšířené výstupní entity přidají čtyři výstupní sloupce: Outcome, PredictionScore, PredictionExplanation a ExplanationIndex.When a Binary Prediction model is applied, it adds four output columns to the enriched output entity: Outcome, PredictionScore, PredictionExplanation, and ExplanationIndex. Názvy sloupců v entitě mají předponu, kterou jste zadali při použití modelu.The column names in the entity have the prefix specified when the model is applied.

PredictionScore je procento pravděpodobnosti, že se dosáhne cílového výsledku.PredictionScore is a percentage probability, which identifies the likelihood that the target outcome will be achieved.

Sloupec Outcome obsahuje popisek předpovězeného výsledku.The Outcome column contains the predicted outcome label. Předpokládá se, že záznamy s pravděpodobnostmi, které přesahují prahovou hodnotu, dosáhnou cílového výsledku a jsou označeny jako True.Records with probabilities exceeding the threshold are predicted as likely to achieve the target outcome and are labeled as True. Záznamy s nižší než prahovou hodnotou jsou předpovězeny jako nepravděpodobné k dosažení výsledku a jsou označeny jako False.Records below the threshold are predicted as unlikely to achieve the outcome and are labeled as False.

Sloupec PredictionExplanation obsahuje vysvětlení s konkrétním vlivem, které vstupní funkce měly na sloupec PredictionScore.The PredictionExplanation column contains an explanation with the specific influence that the input features had on the PredictionScore.

Modely klasifikaceClassification models

Klasifikační modely slouží k rozdělení datové sady do více skupin nebo tříd.Classification models are used to classify a dataset into multiple groups or classes. Slouží k předpovídání událostí, které mohou mít jeden z více možných výsledků.They're used to predict events that can have one of the multiple possible outcomes. Například zda zákazník bude pravděpodobně mít velmi vysokou, vysokou, střední nebo nízkou životnost nebo zda je výchozí riziko vysoké, střední, nízké nebo velmi nízké.For instance, whether a customer is likely to have a very high, high, medium, or low Lifetime Value, whether the risk of default is High, Moderate, Low, or Very Low; and so on.

Výstupem z klasifikačního modelu je skóre pravděpodobnosti, které označuje pravděpodobnost, že záznam dosáhne kritérií stanovených pro danou třídu.The output of a Classification model is a probability score, which identifies the likelihood that a record will achieve the criteria for a given class.

Trénování klasifikačního modeluTraining a Classification model

Vstupní entita obsahující trénovací data pro klasifikační model musí jako pole výsledku obsahovat pole s řetězcem nebo celočíselnou hodnotou, které identifikuje minulé známé výsledky.The input entity containing your training data for a Classification model must have a string or whole number field as the outcome field, which identifies the past known outcomes.

Požadavky:Pre-requisites:

  • Pro každou třídu výsledků se vyžaduje minimálně 20 řádků historických dat.A minimum of 20 rows of historical data is required for each class of outcomes

Proces vytvoření klasifikačního modelu se řídí stejným postupem jako u jiných modelů AutoML, který najdete v části Konfigurace vstupů modelů ML výše.The process of creation for a Classification model follows the same steps as other AutoML models, described in the section Configuring the ML model inputs above.

Sestava klasifikačního modeluClassification model report

Sestava klasifikačního modelu se vytvoří na základě použití modelu ML u referenčních testovacích dat a porovnání předpovězené třídy záznamu se skutečnou známou třídou.The Classification model report is produced by applying the ML model to the holdout test data and comparing the predicted class for a record with the actual known class.

Součástí sestavy modelu je graf, který obsahuje rozpis správně a nesprávně klasifikovaných záznamů pro každou známou třídu.The model report includes a chart that includes the breakdown of the correctly and incorrectly classified records for each known class.

Sestava modelu

Další podrobnosti specifické pro třídu umožňují provádět analýzu způsobu distribuce předpovědí pro známou třídu.A further class-specific drilldown enables an analysis of how the predictions for a known class are distributed. Zobrazuje i další třídy, ve kterých jsou záznamy dané známé třídy pravděpodobně klasifikovány nesprávně.This shows the other classes in which records of that known class are likely to be misclassified.

Vysvětlení modelu v sestavě také zahrnuje nejlepší předpovědi pro každou třídu.The model explanation in the report also includes the top predictors for each class.

Sestava klasifikačního modelu také obsahuje stránku s podrobnostmi trénování stejně jako stránky ostatních typů modelu, jak je popsáno v části Sestava modelu AutoML dříve v tomto článku.The Classification model report also includes a Training Details page similar to the pages for other model types, as described in the section AutoML model report earlier in this article.

Použití klasifikačního modeluApplying a classification model

Pokud chcete použít klasifikační model ML, musíte zadat entitu se vstupními daty a předponou názvu výstupního sloupce.To apply a Classification ML model, you must specify the entity with the input data and the output column name prefix.

Při použití klasifikačního modelu se do rozšířené výstupní entity přidá pět výstupních sloupců: ClassificationScore, ClassificationResult, ClassificationExplanation, ClassProbabilities a ExplanationIndex.When a Classification model is applied, it adds five output columns to the enriched output entity: ClassificationScore, ClassificationResult, ClassificationExplanation, ClassProbabilities, and ExplanationIndex. Názvy sloupců v entitě mají předponu, kterou jste zadali při použití modelu.The column names in the entity have the prefix specified when the model is applied.

Sloupec ClassProbabilities obsahuje seznam skóre pravděpodobnosti záznamu pro každou možnou třídu.The ClassProbabilities column contains the list of probability scores for the record for each possible class.

ClassificationScore je procento pravděpodobnosti, že záznam dosáhne kritérií stanovených pro danou třídu.The ClassificationScore is the percentage probability, which identifies the likelihood that a record will achieve the criteria for a given class.

Sloupec ClassificationResult obsahuje nejpravděpodobněji předpovězenou třídu daného záznamu.The ClassificationResult column contains the most likely predicted class for the record.

Sloupec ClassificationExplanation obsahuje vysvětlení s konkrétním vlivem, které vstupní funkce měly na sloupec ClassificationScore.The ClassificationExplanation column contains an explanation with the specific influence that the input features had on the ClassificationScore.

Regresní modelyRegression models

Regresní modely slouží k předpovídání číselné hodnoty.Regression models are used to predict a numeric value. Například to může být výnos, který pravděpodobně vzejde z uzavřeného prodeje, životnost zákazníka, částka pohledávkové faktury, která bude pravděpodobně uhrazena, datum pravděpodobné úhrady faktury atd.For instance: the revenue likely to be realized from a sales deal, the lifetime value of an account, the amount of a receivable invoice that is likely to be paid, the date on which an invoice may be paid, and so on.

Výstupem regresního modelu je předpovězená hodnota.The output of a Regression model is the predicted value.

Trénování regresního modeluTraining a Regression model

Vstupní entita obsahující trénovací data pro regresní model musí jako pole výsledku obsahovat číselné pole, které identifikuje známé hodnoty výsledku.The input entity containing the training data for a Regression model must have a numeric field as the outcome field, which identifies the known outcome values.

Požadavky:Pre-requisites:

  • Pro regresní model se vyžaduje minimálně 100 řádků historických dat.A minimum of 100 rows of historical data is required for a Regression model

Proces vytvoření regresního modelu se řídí stejným postupem jako u jiných modelů AutoML, který najdete v části Konfigurace vstupů modelů ML výše.The process of creation for a Regression model follows the same steps as other AutoML models, described in the section Configuring the ML model inputs above.

Sestava regresního modeluRegression model report

Stejně jako jiné sestavy modelů AutoML je i sestava regresního modelu založena na výsledcích použití modelu u referenčních testovacích dat.Like the other AutoML model reports, the Regression report is based on the results from applying the model to the holdout test data.

Sestava modelu obsahuje graf, který porovnává předpovězené hodnoty se skutečnými hodnotami.The model report includes a chart that compares the predicted values to the actual values. V tomto grafu vzdálenost od diagonály označuje chybu v předpovědi.In this chart, the distance from the diagonal indicates the error in the prediction.

Graf zbytkových chyb zobrazuje distribuci procenta průměrné chyby pro různé hodnoty v referenční testovací datové sadě.The residual error chart shows the distribution of the percentage of average error for different values in the holdout test dataset. Vodorovná osa představuje průměr skutečné hodnoty skupiny; velikost bubliny zobrazuje frekvenci nebo počet chyb v daném rozsahu.The horizontal axis represents the mean of the actual value for the group, with the size of the bubble showing the frequency or count of values in that range. Svislá osa je průměrná zbytková chyba.The vertical axis is the average residual error.

Graf zbytkových chyb

Sestava regresního modelu také obsahuje stránku s podrobnostmi trénování stejně jako sestavy ostatních typů modelu, jak je popsáno v části Sestava modelu AutoML výše.The Regression model report also includes a Training Details page like the reports for other model types, as described in the section AutoML model report above.

Použití regresního modeluApplying a regression model

Pokud chcete použít regresní model ML, musíte zadat entitu se vstupními daty a předponou názvu výstupního sloupce.To apply a Regression ML model, you must specify the entity with the input data and the output column name prefix.

Použití regrese

Při použití regresního modelu se do rozšířené výstupní entity přidají tři výstupní sloupce: RegressionResult, RegressionExplanation a ExplanationIndex.When a Regression model is applied, it adds three output columns to the enriched output entity: RegressionResult, RegressionExplanation, and ExplanationIndex. Názvy sloupců v entitě mají předponu, kterou jste zadali při použití modelu.The column names in the entity have the prefix specified when the model is applied.

Sloupec RegressionResult obsahuje předpovězenou hodnotu záznamu na základě vstupních polí.The RegressionResult column contains the predicted value for the record based on the input fields. Sloupec RegressionExplanation obsahuje vysvětlení s konkrétním vlivem, které vstupní funkce měly na sloupec RegressionResult.The RegressionExplanation column contains an explanation with the specific influence that the input features had on the RegressionResult.

Integrace služby Azure Machine Learning do Power BIAzure Machine Learning integration in Power BI

Velké množství organizací používá modely strojového učení k získání lepších přehledů a prognóz týkajících se jejich podnikání.Numerous organizations use Machine Learning models for better insights and predictions about their business. Možnost vizualizovat a vyvolat přehledy z těchto modelů ve vašich sestavách a řídicích panelech či dalších analýzách pomáhá předávat tyto přehledy firemním uživatelům, kteří je potřebují nejvíce.The ability to visualize and invoke insights from these models, in your reports and dashboards and other analytics, can help disseminate these insights to the business users who need it the most. V Power BI teď můžete jednoduše integrovat přehledy z modelů hostovaných ve službě Azure Machine Learning jednoduchými gesty spočívajícími v ukázání a kliknutí na položku.Power BI now makes it simple to incorporate the insights from models hosted on Azure Machine Learning, using straightforward point-and-click gestures.

Aby mohla být tato funkce využita, datový specialista jednoduše udělí analytikovi BI přístup k modelu Azure ML pomocí webu Azure Portal.To use this capability, a data scientist can simply grant access to the Azure ML model to the BI analyst using the Azure portal. Na začátku každé relace pak doplněk Power Query zjistí všechny modely Azure ML, ke kterým má uživatel přístup, a zpřístupní je jako dynamické funkce Power Query.Then, at the start of each session, Power Query discovers all the Azure ML models to which the user has access and exposes them as dynamic Power Query functions. Uživatel pak může tyto funkce vyvolat z pásu karet v editoru Power Query nebo tak, že vyvolá přímo funkci M.The user can then invoke those functions by accessing them from the ribbon in Power Query Editor, or by invoking the M function directly. Za účelem dosažení lepšího výkonu také Power BI automaticky vytváří dávky ze žádostí o přístup při vyvolání modelu Azure ML pro sadu řádků.Power BI also automatically batches the access requests when invoking the Azure ML model for a set of rows to achieve better performance.

Tato funkce se momentálně podporuje pouze pro toky dat Power BI a pro Power Query online ve službě Power BI.This functionality is currently only supported for Power BI dataflows, and for Power Query online in the Power BI service.

Další informace o tocích dat najdete v tématu Úvod do toků dat a samoobslužné přípravy dat.To learn more about dataflows, see Introduction to dataflows and self-service data prep.

Pokud chcete získat další informace o Azure Machine Learning, podívejte se na:To learn more about Azure Machine Learning, please see:

Poznámka

K použití integrované služby Azure Machine Learning potřebujete předplatné Power BI Premium.A Power BI Premium subscription is required to use Azure Machine learning integration.

Udělení přístupu k modelu Azure ML uživateli Power BIGranting access to the Azure ML model to a Power BI user

Aby uživatel mohl získat přístup k modelu Azure ML z Power BI, musí mít přístup ke čtení pro předplatné Azure.To access an Azure ML model from Power BI, the user must have Read access to the Azure subscription. Dále musí být splněny všechny tyto podmínky:In addition:

  • Pro modely Machine Learning Studia (klasického) se vyžaduje přístup pro čtení do webové služby Machine Learning Studio (klasické).For Machine Learning Studio (classic) models, Read access to Machine Learning Studio (classic) web service
  • Pro modely Machine Learning se vyžaduje přístup pro čtení do pracovního prostoru služby Machine Learning.For Machine Learning models, Read access to the Machine Learning workspace

Postup uvedený v tomto článku popisuje, jak uživateli Power BI udělit přístup k modelu hostovanému ve službě Azure ML, aby k tomuto modelu mohl přistupovat jako k funkci Power Query.The steps in this article describe how to grant a Power BI user access to a model hosted on the Azure ML service, so they can access this model as a Power Query function. Další podrobnosti najdete v tématu týkajícím se správy přístupu pomocí RBAC a webu Azure Portal.For further details, please see Manage access using RBAC and the Azure portal.

  1. Přihlaste se k portálu Azure Portal.Sign in to the Azure portal.

  2. Přejděte na stránku Předplatná.Go to the Subscriptions page. Stránku Předplatná můžete najít pomocí seznamu Všechny služby v nabídce navigačního podokna na webu Azure Portal.You can find the Subscriptions page through the All Services list in the nav pane menu of the Azure portal.

    Stránka předplatných Azure Azure subscriptions page

  3. Vyberte své předplatné.Select your subscription.

    Výběr předplatného Select your subscription

  4. Vyberte Řízení přístupu (IAM) a pak vyberte tlačítko Přidat.Select Access Control (IAM), and then select the Add button.

    Řízení přístupu (IAM) Access control AIM

  5. Jako roli vyberte roli Čtenář.Select Reader as the Role. Vyberte uživatele Power BI, kterému chcete udělit přístup k modelu Azure ML.Select the Power BI user to whom you wish to grant access to the Azure ML model.

    Výběr role Čtenář Select Reader as the role

  6. Vyberte Uložit.Select Save.

  7. Pokud chcete uživateli udělit přístup Čtenář pro konkrétní webovou službu Machine Learning Studio (klasické) nebo pracovní prostor Machine Learning hostující model, opakujte kroky tři až šest.Repeat steps three through six to grant Reader access to the user for the specific Machine Learning Studio (classic) web service, or the Machine Learning workspace hosting the model.

Zjišťování schématu pro modely služby Machine LearningSchema discovery for Machine Learning models

Datoví specialisté používají k vývoji a nasazení modelů strojového učení pro Machine Learning především jazyk Python.Data scientists primarily use Python to develop, and even deploy, their machine learning models for Machine Learning. Machine Learning Studio (klasické) pomáhá automatizovat úlohy spočívající ve vytvoření souboru schématu modelu. V případě služby Machine Learning ale musí datový specialista ke generování souboru schématu použít výslovně Python.Unlike the Machine Learning Studio (classic), which helps automate the task of creating a schema file for the model, in the case of Machine Learning, the data scientist must explicitly generate the schema file using Python.

Tento soubor schématu musí být součástí nasazené webové služby pro modely Machine Learning.This schema file must be included in the deployed web service for Machine Learning models. Kvůli automatickému vygenerování schématu pro webovou službu musíte do vstupního skriptu pro nasazený model zadat vzorek vstupu/výstupu.To automatically generate the schema for web service, you must provide a sample of the input/output in the entry script for the deployed model. Přečtěte si prosím pododdíl věnovaný (volitelnému) automatickému vygenerování schématu Swagger v dokumentaci k nasazení modelů pomocí služby Azure Machine Learning.Please see the subsection on (Optional) Automatic Swagger schema generation in the Deploy models with the Azure Machine Learning service documentation. Tento odkaz obsahuje ukázkový vstupní skript s příkazy pro vygenerování schématu.The link includes the example entry script with the statements for the schema generation.

Konkrétně funkce @input_schema a @output_schema v tomto vstupním skriptu odkazují na formáty vzorku vstupu a výstupu v proměnných input_sample a output_sample a tyto vzorky se během vývoje používají k vygenerování specifikace OpenAPI (Swagger) pro webovou službu.Specifically, the @input_schema and @output_schema functions in the entry script reference the input and output sample formats in the input_sample and output_sample variables, and use these samples to generate an OpenAPI (Swagger) specification for the web service during deployment.

Tyto pokyny pro generování schématu pomocí aktualizace vstupního skriptu se musí použít také u modelů vytvořených pomocí automatizovaných experimentů strojového učení, které využívají sadu Azure Machine Learning SDK.These instructions for schema generation by updating the entry script must also be applied to models created using automated machine learning experiments using the Azure Machine Learning SDK.

Poznámka

Modely vytvořené ve vizuálním rozhraní služby Azure Machine Learning v současnosti nepodporují generování schémat, ale budou ho podporovat v následujících verzích.Models created using the Azure Machine Learning visual interface do not currently support schema generation, but will in subsequent releases.

Vyvolání modelu Azure ML v Power BIInvoking the Azure ML model in Power BI

Jakýkoli model Azure ML, ke kterému vám byl udělen přístup, můžete vyvolat přímo z editoru Power Query ve vašem toku dat.You can invoke any Azure ML model to which you have been granted access, directly from the Power Query Editor in your dataflow. Pokud chcete získat přístup k modelům Azure ML, vyberte tlačítko Upravit pro entitu, kterou chcete rozšířit o přehledy z modelu Azure ML, jak je znázorněno na následujícím obrázku.To access the Azure ML models, select the Edit button for the entity that you want to enrich with insights from your Azure ML model, as shown in the following image.

Služba Power BI – úprava entity Power BI service - edit the entity

Výběrem tlačítka Upravit se otevře editor Power Query pro entity ve vašem toku dat.Selecting the Edit button opens the Power Query Editor for the entities in your dataflow.

Editor Power Query Power Query Editor

Na pásu karet vyberte tlačítko Přehledy AI a pak v nabídce navigačního podokna vyberte složku Modely Azure Machine Learningu.Select the AI Insights button in the ribbon, and then select the Azure Machine Learning Models folder from the nav pane menu. Všechny modely Azure ML, ke kterým máte přístup, jsou zde uvedeny jako funkce Power Query.All the Azure ML models to which you have access are listed here as Power Query functions. Vstupní parametry pro model Azure ML se také automaticky mapují jako parametry odpovídající funkce Power Query.Also, the input parameters for the Azure ML model are automatically mapped as parameters of the corresponding Power Query function.

K vyvolání modelu Azure ML můžete jako vstup z rozevíracího seznamu určit libovolný sloupec vybrané entity.To invoke an Azure ML model, you can specify any of the selected entity's columns as an input from the drop-down. Dále můžete určit konstantní hodnotu, která se má použít jako vstup, přepnutím ikony sloupce vlevo od vstupního dialogového okna.You can also specify a constant value to be used as an input by toggling the column icon to the left of the input dialog.

výběr sloupce select the column

Výběrem možnosti Volat si zobrazte náhled výstupu modelu Azure ML jako nový sloupec v tabulce entity.Select Invoke to view the preview of the Azure ML model's output as a new column in the entity table. Volání modelu se také zobrazí jako použitý krok dotazu.You will also see the model invocation as an applied step for the query.

Výběr možnosti Volat Select invoke

Pokud model vrátí více výstupních parametrů, seskupí se dohromady jako záznam ve výstupním sloupci.If the model returns multiple output parameters, they are grouped together as a record in the output column. Sloupec můžete rozbalit a vytvořit jednotlivé výstupní parametry v samostatných sloupcích.You can expand the column to produce individual output parameters in separate columns.

rozbalení sloupce expand the column

Jakmile tok dat uložíte, model se automaticky vyvolá při aktualizaci toku dat pro jakékoli nové nebo aktualizované řádky v tabulce entity.Once you save your dataflow, the model is automatically invoked when the dataflow is refreshed, for any new or updated rows in the entity table.

Další krokyNext steps

Tento článek poskytuje přehled automatizovaného strojového učení pro toky dat ve službě Power BI.This article provided an overview of Automated Machine Learning for Dataflows in the Power BI service. Hodit se vám můžou i následující články.The following articles may also be useful.

Další informace o tocích dat a Power BI najdete v následujících článcích:The following articles provide more information about dataflows and Power BI: