Umelá inteligencia s tokmi údajov

V tomto článku uvádzame spôsoby, ako možno používať umelú inteligenciu (AI) s tokmi údajov. V tomto článku sú popísané nasledujúce oblasti:

  • Cognitive Services
  • Automatizované strojové učenie
  • Integrácia strojového učenia platformy Azure

Kognitívne služby v Power BI

So službami Cognitive Services v Power BI môžete použiť rôzne algoritmy služby Azure Cognitive Services na obohatenie svojich údajov pri samoobslužnej príprave údajov pre toky údajov.

Služby, ktoré sú dnes podporované, sú Analýza nálady, Extrakcia kľúčovej frázy, Zisťovanie jazyka a Označovanie obrázkov. Transformácie sa vykonávajú v službe Power BI Service a nevyžadujú predplatné služieb Azure Cognitive Services. Táto funkcia vyžaduje Power BI Premium.

Povolenie funkcií AI

Kognitívne služby sú podporované pre uzly kapacity Premium EM2, A2 alebo P1 a vyššie. Kognitívne služby sú tiež k dispozícii s licenciou Premium na používateľa (PPU). Na spustenie kognitívnych služieb sa používa samostatné vyťaženie AI na kapacite. Pred použitím kognitívnych služieb v Power BI je potrebné povoliť AI vyťaženie v nastaveniach kapacity portálu na správu. AI vyťaženie môžete zapnúť v sekcii pracovného vyťaženia a zadefinovať maximálny rozsah pamäte, ktorý chcete, aby toto vyťaženie využívalo. Odporúčaný limit pamäte je 20 %. Prekročenie tohto limitu spôsobí spomalenie dotazu.

Kognitívne služby v Power BI

Začíname so službami Cognitive Services v Power BI

Transformácie v Cognitive Services sú súčasťou samoobslužnej prípravy údajov pre toky údajov. Ak chcete obohatiť svoje údaje so službami Cognitive Services, začnite s úpravou toku údajov.

Úprava toku údajov

Vyberte tlačidlo Prehľady AI na hornom páse s nástrojmi editora Power Query.

Prehľady AI v editore Power Query

V kontextovom okne vyberte funkciu, ktorú chcete použiť, a údaje, ktoré chcete transformovať. V tomto príklade hodnotím náladu stĺpca, ktorý obsahuje text recenzie.

Vyberte funkciu

Cultureinfo je voliteľný vstup na špecifikovanie jazyka textu. Tento stĺpec očakáva kód ISO. Stĺpec môžete použiť ako vstup pre Cultureinfo alebo statický stĺpec. V tomto príklade je pre celý stĺpec jazyk zadaný ako angličtina (en). Ak ponecháte tento stĺpec prázdny, power BI pred použitím funkcie automaticky rozpozná jazyk. V ďalšom kroku vyberte položku Vyvolať.

vyberte položku Vyvolať

Po vyvolaní funkcie sa výsledok pridá ako nový stĺpec do tabuľky. Transformácia sa tiež pridá ako uplatnený krok v dotaze.

Vytvorí sa nový stĺpec

Ak funkcia vráti viacero výstupných stĺpcov, vyvolanie funkcie pridá nový stĺpec s riadkom viacerých výstupných stĺpcov.

Pomocou možnosti rozbalenia pridajte k svojim údajom jednu alebo obe hodnoty ako stĺpce.

Rozbaľte stĺpec

Dostupné funkcie

Táto časť popisuje dostupné funkcie v službe Cognitive Services v Power BI.

Zistenie jazyka

Funkcia detekcie jazyka vyhodnotí vstup textu a pre každý stĺpec vráti názov jazyka a identifikátor ISO. Táto funkcia je užitočná pre stĺpce údajov, ktoré zhromažďujú ľubovoľný text, kde je jazyk neznámy. Funkcia očakáva, že na vstupe budú údaje v textovom formáte.

Analýza textu dokáže rozlíšiť až 120 jazykov. Ďalšie informácie nájdete v téme podporované jazyky.

Extrahovanie kľúčových fráz

Funkcia Extrakcia kľúčových fráz vyhodnotí neštruktúrovaný text a pre každý textový stĺpec vráti zoznam kľúčových fráz. Funkcia vyžaduje textový stĺpec ako vstup a prijíma voliteľný vstup pre Cultureinfo. (Pozri časť Začíname vyššie v tomto článku).

Extrakcia kľúčovej frázy funguje najlepšie, keď jej dodáte väčšie kusy textu, s ktorými môže pracovať. Toto je opačný prípad v porovnaní s analýzou nálady, ktorá lepšie funguje na menších blokoch textu. Ak chcete získať najlepšie výsledky z oboch operácií, zvážte zodpovedajúcim spôsobom zmeniť štruktúru vstupov.

Citové skóre

Funkcia Citové skóre vyhodnotí vstup textu a vráti citové skóre pre každý dokument v rozmedzí od 0 (negatívne) až 1 (pozitívne). Táto funkcia je užitočná na zisťovanie pozitívnej a negatívnej nálady v sociálnych sieťach, recenziách zákazníkov a diskusných fórach.

Analýza textu používa klasifikačný algoritmus strojového učenia na generovanie citového skóre od 0 po 1. Skóre bližšie k hodnote 1 označuje pozitívnu náladu a skóre bližšie k hodnote 0 označuje negatívnu náladu. Model má vopred naučené rozsiahle množstvo textu, v ktorom sú spojitosti s náladami. V súčasnosti nie je možné poskytnúť vlastné údaje na učenie. Model používa počas analýzy textu kombináciu techník vrátane spracovania textu, analýzy častí reči, umiestnenia slov a spojitosti medzi slovami. Ďalšie informácie o algoritme nájdete v téme Predstavujeme analýzu textu.

Analýza sentimentu sa vykonáva na celom vstupnom stĺpci, na rozdiel od extrakcie sentimentu pre konkrétnu tabuľku v texte. V praxi existuje tendencia pre zlepšenie presnosti hodnotenia, ak dokumenty obsahujú jednu alebo dve vety a nie veľký blok textu. Počas fázy posudzovania objektivity model určuje, či je vstupný stĺpec ako celok objektívny alebo obsahuje sentiment. Vstupný stĺpec, ktorý je väčšinou objektívny, neprechová k fráze detekcie sentimentu, čo vedie k skóre .50 bez ďalšieho spracovania. V prípade vstupných stĺpcov, ktoré pokračujú v potrubí, ďalšia fáza generuje skóre nad alebo pod .50 v závislosti od stupňa sentimentu zisteného vo vstupnom stĺpci.

V súčasnosti funkcia Analýza nálady podporuje angličtinu, nemčinu, španielčinu a francúzštinu. Ostatné jazyky sú v režime ukážky. Ďalšie informácie nájdete v téme Podporované jazyky.

Označovanie obrázkov

Funkcia Označovanie obrázkov vráti značky na základe viac ako 2 000 rozpoznateľných objektov, živých bytostí, scenérií a akcií. Ak sú značky nejednoznačné alebo nie sú všeobecne známe, výstup poskytuje „tipy“ na objasnenie významu značky v kontexte známeho prostredia. Značky nie sú usporiadané ako taxonómia a neexistujú žiadne hierarchie dedenia. Kolekcia obsahových značiek vytvára základ pre „popis“ obrázka zobrazeného ako ľudsky čitateľný jazyk vo formáte celých viet.

Po nahraní obrázka alebo zadaní URL adresy obrázka vykonajú algoritmy Computer Vision výstup značiek na základe objektov, živých bytostí a akcií identifikovaných na obrázku. Označovanie nie je obmedzené na hlavný predmet, ako je napríklad osoba v popredí, ale obsahuje aj prostredie (vnútorné alebo vonkajšie), nábytok, nástroje, rastliny, zvieratá, príslušenstvo, zariadenia a podobne.

Táto funkcia vyžaduje ako vstup adresu URL obrázka alebo stĺpec abase-64. V súčasnosti označovanie obrázkov podporuje angličtinu, španielčinu, japončinu, portugalčinu a zjednodušenú čínštinu. Ďalšie informácie nájdete v téme Podporované jazyky.

Automatizované strojové učenie v službe Power BI

Automatizované strojové učenie pre toky údajov umožňuje podnikovým analytikom trénovať, overovať a vyvolávať modely strojového učenia priamo v službe Power BI. Disponuje jednoduchým prostredím na vytvorenie nového modelu strojového učenia, v ktorom analytici môžu používať svoje toky údajov na zadávanie vstupných údajov na trénovanie modelu. Služba automaticky extrahuje najrelevantnejšie funkcie, vyberá vhodný algoritmus a ladí a overuje model strojového učenia. Power BI po natrénovaní modelu automaticky vygeneruje zostavu výkonu s výsledkami overenia. Model je potom možné vyvolať v rámci akýchkoľvek nových alebo aktualizovaných údajov v toku údajov.

Obrazovka so strojovým učením

Automatizované strojové učenie je k dispozícii iba pre toky údajov hosťované v kapacitách Premium a Embedded služby Power BI.

Práca s automatizovaným strojovým učením

Toky údajov služby Power BI ponúkajú samoobslužnú prípravu údajov pre veľké objemy údajov. Automatizované strojové učenie je integrované do tokov údajov a umožňuje vám využiť svoju prípravu údajov na vytváranie modelov strojového učenia priamo v službe Power BI.

Automatizované strojové učenie v službe Power BI umožňuje analytikom údajov používať toky údajov na vytváranie modelov strojového učenia v zjednodušenom prostredí, na čo im stačia skúsenosti so službou Power BI. Väčšina dátovej vedy, ktorá umožňuje vytváranie modelov strojového učenia, je automatizovaná službou Power BI. K dispozícii je ochrana, ktorá zabezpečuje, že vytvorený model má dobrú kvalitu, a sprehľadňuje proces, ktorý sa na vytvorenie modelu strojového učenia používa.

Automatizácia strojového podporuje vytváranie binárnych predpovedí a klasifikácií a regresných modelov pre toky údajov. Ide o typy techník strojového učenia pod dohľadom, čo znamená, že sa učia zo známych výsledkov minulých pozorovaní, aby mohli predpovedať výsledky ďalších pozorovaní. Vstupná množina údajov na trénovanie modelu automatickéhoml je množina riadkov označených známymi výsledkami.

Automatizované strojové učenie v službe Power BI integruje automatizované strojové učenie zo služby Strojové učenie platformy Microsoft Azure, čím vám umožňuje vytvárať modely strojového učenia. Používanie automatizovaného strojového učenia v službe Power BI však predplatné služby Azure nevyžaduje. Proces trénovania a hosťovania modelov strojového učenia je v plnej miere spravované službou Power BI.

Automatizované strojové učenie po natrénovaní modelu strojového učenia automaticky vygeneruje zostavu služby Power BI, ktorá vám priblíži predpokladaný výkon vášho modelu strojového učenia. Automatizované strojové učenie zdôrazňuje zrozumiteľnosť tým, že medzi vstupmi, ktoré ovplyvňujú predpovede vrátené vaším modelom, zvýrazňuje kľúčové vplyvy. Zostava obsahuje aj kľúčové metriky pre model.

Ostatné strany vygenerovanej zostavy zobrazujú štatistický súhrn modelu a podrobnosti trénovania. Štatistický súhrn je užitočný pre používateľov, ktorí chcú vidieť štandardné mierky pre výkon modelu v rámci dátovej vedy. Podrobnosti trénovania prinášajú súhrn všetkých iterácií, ktorých spustenie bolo potrebné na vytvorenie vášho modelu, spolu so súvisiacimi parametrami modelovania. Tiež popisuje, ako sa každý vstup použil na vytvorenie modelu strojového učenia.

Potom môžete svoj model strojového učenia použiť na údaje na výpočet skóre. Po obnovení toku údajov sa údaje aktualizujú o predpovede z modelu strojového učenia. Power BI ponúka aj individuálne vysvetlenie každej konkrétnej predpovede, ktorú model strojového učenia poskytne.

Vytvorenie modelu strojového učenia

Táto sekcia sa venuje vytváraniu modelu automatizovaného strojového učenia.

Príprava údajov na tvorbu modelu strojového učenia

Ak chcete v službe Power BI vytvoriť model strojového učenia, najskôr musíte vytvoriť tok údajov pre údaje obsahujúce informácie o historických výsledkoch, ktoré sa použijú na trénovanie modelu strojového učenia. V prípade podnikových metrík, ktoré môžu byť významnými prediktormi výsledkov, ktoré sa pokúšate predvídať, by ste tiež mali pridať vypočítané stĺpce. Podrobnosti o konfigurácii tokov údajov nájdete v téme Konfigurácia a používanie tokov údajov.

Automatizované strojové učenie má špecifické požiadavky na údaje na trénovanie modelu strojového učenia. Tieto požiadavky sú popísané v sekcii nižšie, pričom sa týkajú príslušných typov modelov.

Konfigurácia vstupov modelu strojového učenia

Ak chcete vytvoriť model automatického strojového učenia, vyberte ikonu strojového učenia zo stĺpca Akcie tabuľky toku údajov a potom vyberte položku Pridať model strojového učenia.

Pridanie modelu strojového učenia

Spustí sa zjednodušené prostredie so sprievodcom, ktorý vás prevedie procesom vytvorenia modelu strojového učenia. Sprievodca zahŕňa nasledujúce jednoduché kroky.

1. Vyberte tabuľku s historickými údajmi a stĺpec výsledkov, pre ktoré chcete vytvoriť predpoveď.

Stĺpec výsledku identifikuje atribút označenia na trénovaie modelu mlku, ako môžete znázornené na nasledujúcom obrázku.

Výber údajov historických výsledkov

2. Vyberte typ modelu.

Keď zadáte stĺpec výsledku, automatickyml zanalyzuje údaje označenia, aby mohlo odporučiť najpravdepodobnejší typ modelu mlku, ktorý možno na trénovať. Kliknutím na položku Vybrať iný model môžete vybrať iný typ modelu, ako je to zobrazené nižšie.

Výber modelu

Poznámka

Vybraté údaje nemusia podporovať niektoré typy modelov. Preto nebudú aktívne. V príklade uvedenom vyššie je deaktivovaný regresia, pretože je ako stĺpec výsledku vybratý textový stĺpec.

3. Vyberte vstupy, ktoré má model používať ako prediktívne signály.

Potom analyzuje vzorku vybratej tabuľky, z ktorých sa navrhne vstupy, ktoré možno použiť na trénovanie modelu mlku. Vedľa stĺpcov, ktoré nie sú vybraté, sa poskytujú vysvetlenia. Ak má konkrétny stĺpec príliš veľa odlišných hodnôt alebo len jednu hodnotu alebo nízku alebo vysokú koreláciu s výstupným stĺpcom, neodporúča sa.

Vstupy, ktoré závisia od stĺpca výsledku (alebo stĺpca označenia), by sa nemali používať na trénovaie modelu mlku, pretože ovplyvnia jeho výkon. Tieto stĺpce budú označené ako "podozrivo vysoká korelácia s výstupným stĺpcom". Použitie týchto stĺpcov v údajoch na trénovanie spôsobí použitie označenia. Model bude mať pri overovaní alebo testovaní údajov veľmi výkon, no tento výkon sa nemôže zhodovať s výkonom pri použití modelu na bodovanie. Použitie nesprávnych označení by mohlo spôsobovať problémy pri modeloch automatizovaného strojového učenia, kedy by bol výkon trénovaného modelu až príliš dobrý a nezodpovedal by realite.

Odporúčanie tejto funkcie ja založené na vzorke údajov, preto by ste mali skontrolovať použité vstupy. Výbery môžete zmeniť tak, aby zahŕňali iba stĺpce, ktoré má model študovať. Môžete tiež vybrať všetky stĺpce tak, že začiarknete políčko vedľa názvu tabuľky.

Prispôsobenie vstupných stĺpcov

4. Pomenujte svoj model a uložte konfiguráciu.

V poslednom kroku môžete model pomenovať a vybrať položku Uložiť a trénovať, čím sa spustí trénovanie modelu strojového učenia. Môžete sa rozhodnúť skrátiť čas trénovania, aby ste mohli pozrieť rýchle výsledky, alebo zvýšiť čas venovaný tréningu, aby ste získali čo najlepší model.

Pomenovanie modelu

Trénovanie modelu strojového učenia

Trénovanie modelov automatizovaného strojového učenia je súčasťou obnovenia toku údajov. Automatizované strojové učenie najskôr pripraví vaše údaje na trénovanie. Potom rozdelí poskytnuté historické údaje na trénovacie a testovacie množiny údajov. Testovacia množina údajov predstavuje množinu podržania, ktorá sa používa na overenie výkonu modelu po trénovaní. V rámci toku údajov majú názov Trénovanie a testovanie tabuliek. Automatizované strojové učenie používa na overenie modelu krížové overenie.

Potom sa analyzuje každý vstupný stĺpec a použije sa prisudenie, ktoré nahradí všetky chýbajúce hodnoty náhradnými hodnotami. Automatizované strojové učenie používa niekoľko stratégií prisudzovania. V prípade atribútov vstupov, ktoré sa považujú za numerické funkcie, sa na prisudzovanie použije priemer hodnôt stĺpcov. V prípade atribútov vstupov, ktoré sa považujú za funkcie kategórií, použije automatizované strojové učenie na prisudzovanie modus hodnôt stĺpcov. Priemer a modus hodnôt použitých na prisudzovanie sa vypočítajú na základe rámca automatizovaného strojového učenia v trénovacej množine údajov podradenej vzorky.

Na vaše údaje sa potom použije podľa potreby vzorkovanie a normalizácia. V prípade klasifikačných modelov použije automatizované strojové učenie na vstupné údaje stratifikované vzorkovanie a vyváži jednotlivé triedy, aby mali všetky rovnaký počet riadkov.

Potom použije niekoľko transformácií na každý vybratý vstupný stĺpec založený na jeho type údajov a štatistických vlastnostiach. Dané transformácie používa na extrakciu funkcií, ktoré sa použijú pri trénovaní modelu strojového učenia.

Proces trénovania modelov automatizovaného strojového učenia pozostáva až z 50 iterácií s rôznymi algoritmami modelovania a nastaveniami hyperparametrov, vďaka čomu dokáže nájsť model s najvyšším výkonom. Ak automatizované strojové učenie spozoruje, že nedochádza k zlepšeniu výkonu, môže sa trénovanie skončiť skôr s menším počtom iterácií. Výkon daných modelov sa hodnotí overením pomocou testovacej množiny údajov podržania. Automatizované strojové učenie v rámci tohto kroku vytvorí niekoľko kanálov na trénovanie a overovanie týchto iterácií. Proces hodnotenia výkonu modelov môže v závislosti od veľkosti množiny údajov a dostupných zdrojov kapacity trvať od niekoľkých minút až po niekoľko hodín. Trvanie ovplyvňuje aj čas tréningu nakonfigurovaný v sprievodcovi.

V niektorých prípadoch môže konečný vygenerovaný model využiť súhrnné učenie, v rámci ktorého sa na dosiahnutie lepšieho výkonu pri predpovedaní používajú viaceré modely.

Zrozumiteľnosť modelu automatizovaného strojového učenia

Automatizované strojové učenie po natrénovaní modelu zanalyzuje vzťah medzi vstupnými funkciami a výstupom modelu. Zhodnotí veľkosť zmeny vo výstupe modelu pre testovaciu množinu údajov podržania každej vstupnej funkcie. Je to známe ako dôležitosť funkcie. Dochádza k tomu v rámci obnovenia po dokončení tréningu. Obnovenie preto môže trvať dlhšie ako čas tréningu nakonfigurovaný v sprievodcovi.

Dôležitosť funkcie

Zostava modelu automatizovaného strojového učenia

Automatizované strojové učenie vygeneruje zostavu služby Power BI, ktorá zosumarizuje výkon modelu dosiahnutý počas overovania spolu s globálnou dôležitosťou funkcie. Táto zostava bude k dispozícii na karte Model strojového učenia po úspešnom obnovení toku údajov. Zostava prináša súhrn výsledkov z použitia modelu strojového učenia na testovacie údaje podržania a porovnáva predpovede so známymi výsledkami.

Zostavu modelu si môžete zobraziť, aby ste lepšie pochopili jeho výkon. Tiež môžete overiť, či sú kľúčové vplyvy modelu v súlade s podnikateľskými prehľadmi o známych výsledkoch.

Grafy a mierky použité na popísanie výkonu modelu v zostave závisia od typu modelu. Týmto výkonnostným grafom a mierkam sa budeme bližšie venovať v nasledujúcich sekciách.

Ďalšie strany zostavy môžu štatistické merania modelu popisovať z pohľadu dátovej vedy. Napríklad zostava binárnej predpovede obsahuje graf zisku a krivku ROC modelu.

V zostavách sa tiež nachádza strana s podrobnosťami trénovania, ktorá obsahuje popis spôsobu, akým bol model natrénovaný, a graf popisujúci výkon modelu pri každom spustení iterácií.

Podrobnosti trénovania

V ďalšej časti tejto stránky sa nachádza popis zisteného typu vstupného stĺpca a metóda prisudenia, ktorá bola použitá na vyplnenie chýbajúcich hodnôt. Obsahuje aj parametre použité v konečnom modeli.

Ďalšie informácie pre model

Ak vytvorený model využíva súhrnné učenie, stránka s podrobnosťami trénovania obsahuje aj graf s váhou jednotlivých zložkových modelov v súhrne a parametre modelu.

Váha v súhrne

Použitie modelu automatizovaného strojového učenia

Ak ste spokojní s výkonom vytvoreného modelu strojového učenia, môžete ho použiť na nové alebo aktualizované údaje v rámci obnovovania toku údajov. Môžete tak urobiť v zostave modelu výberom tlačidla Použiť v pravom hornom rohu alebo tlačidla Použiť model strojového učenia v rámci akcií na karte Modely strojového učenia.

Ak chcete použiť model mlku, musíte zadať názov tabuľky, na ktorú sa má použiť, a predponu stĺpcov, ktoré sa majú do tejto tabuľky pridať, aby výstup modelu. Predvolenou predponou názvov stĺpcov je názov modelu. Funkcia Použiť môže obsahovať ďalšie parametre špecifické pre konkrétny typ modelu.

Použitím modelu mlieku sa vytvoria dve nové tabuľky toku údajov, ktoré budú obsahovať predpovede a prispôsobené vysvetlenia jednotlivých riadkov, ktoré sú skóre vo výstupnej tabuľke. Ak napríklad model PurchaseIntent použijete na tabuľku OnlineShoppers, výstup vygeneruje tabuľky OnlineShoppers enriched PurchaseIntent (OnlineShoppers – obohatené o entus PurchaseIntent) a OnlineShoppers enriched PurchaseIntent explanations (OnlineShoppers – obohatené o vysvetlenia PurchaseIntent). Pre každý riadok v obohatenej tabuľke sa vysvetlenia členia v tabuľke obohatenej o vysvetlenia do viacerých riadkov na základe vstupnej funkcie. ExplanationIndex pomáha mapovať riadky z tabuľky obohatenej o vysvetlenia k riadku v obohatenej tabuľke.

Editor dotazov

Ľubovoľný model automatickéhoml služby Power BI môžete použiť aj na tabuľky v akomkoľvek toku údajov v tom istom pracovnom priestore pomocou konektora AI Prehľady prehliadači s funkciou PQO. Týmto spôsobom môžete použiť modely vytvorené inými osobami v tom istom pracovnom priestore bez toho, že by ste museli byť vlastníkom toku údajov v modeli. Power Query zistí všetky modely strojového učenia Power BI v pracovnom priestore a zobrazí ich ako dynamické funkcie Power Query.  Tieto funkcie môžete vyvolať tak, že k nim získate prístup prostredníctvom pása s nástrojmi v Editore Power Query, alebo priamo vyvoláte funkciu M. Táto funkcia je v súčasnosti podporovaná len pre toky údajov služby Power BI a pre Power Query Online v službe Power BI. Všimnite si, že postup sa výrazne líši od používania modelov strojového učenia v toku údajov s použitím sprievodcu automatizovaného strojového učenia. Pomocou tejto metódy sa nevytvorí žiadna tabuľka s vysvetlením a ak nie ste vlastníkom toku údajov, nemôžete získať prístup k zostavam na trénovanie modelu ani model znova natrénovať. Ak sa zdrojový model upraví (pridajú sa alebo sa odstránia vstupné stĺpce) alebo ak sa tok údajov modelu alebo zdroja odstráni, tento závislý tok údajov sa preruší.

Použitie modelu pomocou prehliadača s funkciou PQO

Keď model použijete, automatizované strojové učenie vaše predpovede vždy po obnovení toku údajov aktualizuje.

Ak chcete prehľady a predpovede modelu mlieku použiť v zostave Power BI, môžete sa z aplikácie pripojiť k výstupnej tabuľke Power BI Desktop pomocou konektora toku údajov.

Modely binárnych predpovedí

Modely binárnych predpovedí, oficiálne známe ako modely binárnej klasifikácie, sa používajú na rozdelenie množiny údajov do dvoch skupín. Používajú sa na predpovedanie udalostí, ktoré môžu mať binárny výsledok. Napríklad na predpovedanie, či bude predajná príležitosť úspešná, či zákazník odíde, či bude faktúra zaplatená včas, či je transakcia podvodná a tak ďalej.

Výstupom modelu binárnych predpovedí je skóre pravdepodobnosti, ktoré stanovuje mieru pravdepodobnosti, že sa dosiahne cieľový výsledok.

Trénovanie modelu binárnych predpovedí

Požiadavky:

  • Každá trieda výsledkov vyžaduje minimálne 20 riadkov historických údajov.

Vytváranie modelu binárnych predpovedí pozostáva z rovnakých krokov ako tvorba ostatných modelov automatizovaného strojového učenia, ktorá je popísaná v časti Konfigurácia vstupov modelu strojového učenia vyššie. Jediný rozdiel je v kroku výberu modelu, kde môžete vybrať hodnotu cieľového výsledku, ktorá vás najviac zaujíma. Môžete tiež zadať popisné označenia výsledkov, ktoré sa majú použiť v automaticky generovanej zostave sumarizujúcej výsledky overenia modelu.

Sprievodca binárnymi predpoveďami

Zostava modelu binárnych predpovedí

Výstupom modelu binárnych predpovedí je pravdepodobnosť, že riadok dosiahne cieľový výsledok. Zostava obsahuje rýchly filter pre prahovú hodnotu pravdepodobnosti, ktorý ovplyvňuje spôsob, akým sa bude interpretovať skóre nad prahom pravdepodobnosti a pod ním.

Zostava definuje výkon modelu ako skutočne pozitívny, falošne pozitívny, skutočne negatívny a falošne negatívny. Skutočne pozitívne a skutočne negatívne výsledky sú správne predpovedané výsledky dvoch tried v údajoch výsledkov. Falošne pozitívne sú riadky, pri ktorých sa predpovedal, že majú cieľový výsledok, ale v skutočnosti neboli. Falošne negatívne sú naopak riadky, ktoré mali cieľový výsledok, no podľa predpovede ho nemali mať.

Mierky, ako napríklad presnosť a úplnosť, popisujú vplyv prahovej hodnoty pravdepodobnosti na predpokladané výsledky. Rýchly filter prahovej hodnoty pravdepodobnosti môžete použiť na výber prahovej hodnoty, ktorá dosiahne vyvážený kompromis medzi presnosťou a úplnosťou.

Ukážka presnosti

Zostava obsahuje aj nástroj na analýzu nákladov a prínosov. Ten pomáha identifikovať podmnožinu populácie, na ktorú sa treba zamerať, aby sa dosiahol najvyšší zisk. Analýza nákladov a prínosov sa na základe odhadovaných jednotkových nákladov zacielenia a jednotkových prínosov z dosiahnutého cieľového výsledku pokúsi maximalizovať zisk. Tento nástroj môžete použiť na stanovenie prahu pravdepodobnosti na základe maximálneho bodu v grafe, aby ste dosiahli maximálny zisk. Graf môžete použiť aj na výpočet zisku alebo nákladov pre prah pravdepodobnosti, ktorý ste si vybrali.

Náklady a prínosy

Stránka zostavy presnosti zostavy modelu obsahuje graf kumulatívnych ziskov a krivku ROC modelu. Ide o štatistické merania výkonu modelu. Zostavy zahŕňajú popisy zobrazených grafov.

Obrazovka zostavy presnosti

Použitie modelu binárnych predpovedí

Ak chcete použiť model binárnych predpovedí, musíte zadať tabuľku s údajmi, na ktoré chcete predpovede z modelu mldáte použiť. Medzi ďalšie parametre patrí predpona názvu výstupného stĺpca a prahová hodnota pravdepodobnosti na klasifikáciu predpokladaných výsledkov.

Vstupy predpovede

Po použití modelu binárnych predpovedí sa do obohatenej výstupnej tabuľky pridajú štyri výstupné stĺpce: Outcome, PredictionScore, PredictionExplanation a ExplanationIndex. K názvom stĺpcov v tabuľke sa po použití modelu môže špecifikovať predpona.

Stĺpec PredictionScore vyjadruje percentuálnu pravdepodobnosť toho, že sa dosiahne cieľový výsledok.

Stĺpec Outcome obsahuje označenie predpokladaného výsledku. Pri záznamoch s pravdepodobnosťami, ktoré presahujú prahovú hodnotu, je pravdepodobné, že cieľový výsledok dosiahnu. Pri záznamoch, ktoré sa nachádzajú pod prahovou hodnotou, je nepravdepodobné, že výsledok dosiahnu. Sú označené ako False.

Stĺpec PredictionExplanation obsahuje vysvetlenie predpovede s konkrétnym vplyvom, ktorý vstupné funkcie mali na stĺpec PredictionScore.

Modely klasifikácie

Modely klasifikácie sa používajú na rozdelenie množiny údajov do viacerých skupín alebo tried. Používajú sa na predpovedanie udalostí, ktoré môžu mať jeden z viacerých možných výsledkov. Napríklad na predpovedanie, či bude mať zákazník veľmi vysokú, vysokú, strednú alebo nízku hodnotu životnosti, či je predvolené riziko vysoké, stredné, nízke alebo veľmi nízke a tak ďalej.

Výstupom modelu klasifikácie je skóre pravdepodobnosti, ktoré stanovuje pravdepodobnosť, že riadok dosiahne kritériá danej triedy.

Trénovanie modelu klasifikácie

Vstupná tabuľka s vašimi trénova údajmi modelu klasifikácie musí ako stĺpec výsledkov obsahovať reťazec alebo stĺpec s celým číslom, ktorý identifikuje predchádzajúce známe výsledky.

Požiadavky:

  • Každá trieda výsledkov vyžaduje minimálne 20 riadkov historických údajov.

Vytváranie modelu klasifikácie pozostáva z rovnakých krokov ako tvorba ostatných modelov automatizovaného strojového učenia, ktorá je popísaná v časti Konfigurácia vstupov modelu strojového učenia vyššie.

Zostava modelu klasifikácie

Zostavu modelu klasifikácie je možné vytvoriť tak, že model mldáte na testovacie údaje podrženia a predpokladanú triedu riadka porovnáte so skutočnou známou triedou.

Zostava modelu obsahuje graf, ktorý obsahuje rozpis správne a nesprávne klasifikovaných riadkov každej známej triedy.

Zostava modelu

Ďalšia akcia detailov špecifická pre jednotlivé triedy umožňuje analýzu spôsobu, akým sa predpovede pre známu triedu distribuujú. Zobrazujú sa ďalšie triedy, pri ktorých je pravdepodobné, že sa riadky tejto známej triedy klasifikujú nesprávne.

Vysvetlenie modelu v zostave zahŕňa aj top prediktory pre jednotlivé triedy.

Zostava modelu klasifikácie obsahuje aj stránku s podrobnosťami trénovania, ktorá sa podobá na stránky pre iné typy modelov, ako sa uvádza v časti Zostava modelu automatizovaného strojového učenia v tomto článku.

Použitie modelu klasifikácie

Ak chcete použiť model klasifikácie mlku, musíte tabuľku zadať so vstupnými údajmi a predponou názvu výstupného stĺpca.

Po použití modelu klasifikácie sa do obohatenej výstupnej tabuľky pridá päť výstupných stĺpcov: ClassificationScore, ClassificationResult, ClassificationExplanation, ClassProbabilities a ExplanationIndex. K názvom stĺpcov v tabuľke sa po použití modelu môže špecifikovať predpona.

Stĺpec ClassProbabilities obsahuje zoznam skóre pravdepodobnosti riadka pre všetky možné triedy.

Stĺpec ClassificationScore stanovuje pravdepodobnosť, že riadok spĺňa kritériá danej triedy.

Stĺpec ClassificationResult obsahuje triedu, ktorá má s najväčšou pravdepodobnosťou predpovedanú pre riadok.

Stĺpec ClassificationExplanation obsahuje vysvetlenie s konkrétnym vplyvom, ktorý vstupné funkcie mali na stĺpec ClassificationScore.

Regresné modely

Regresné modely sa používajú na predpovedanie numerickej hodnoty. Príklad: pravdepodobné výnosy z predajného obchodu, hodnota životnosti zákazníka, suma faktúry v stave pohľadávky, ktorá bude pravdepodobne vyplatená, dátum zaplatenia faktúry a podobne.

Výstupom regresného modelu je predpovedaná hodnota.

Trénovanie regresného modelu

Vstupná tabuľka s trénovacími údajmi regresového modelu musí ako stĺpec výsledku obsahovať číselný stĺpec, ktorý identifikuje známe hodnoty výsledkov.

Požiadavky:

  • Regresný model vyžaduje minimálne 100 riadkov historických údajov.

Vytvorenie regresného modelu pozostáva z rovnakých krokov ako tvorba ostatných modelov automatizovaného strojového učenia, ktorá je popísaná v časti Konfigurácia vstupov modelu strojového učenia vyššie.

Zostava regresného modelu

Podobne ako ostatné zostavy modelov automatizovaného strojového učenia, tak aj regresná zostava je založená na výsledkoch z používania modelu na testovacích údajoch podržania.

Zostava modelu obsahuje graf, ktorý porovnáva predpokladané hodnoty so skutočnou hodnotou. V tomto grafe vzdialenosť od diagonálnej čiary znázorňuje chybu v predpovedi.

V grafe zostatkovej chybovosti je vyobrazené rozdelenie percentuálnej hodnoty priemernej chyby pre rôzne hodnoty v testovacej množine údajov podržania. Vodorovná os predstavuje priemernú hodnotu skutočnej hodnoty skupiny a veľkosť bubliny zas predstavuje frekvenciu alebo počet hodnôt v danom rozsahu. Zvislá os predstavuje priemernú zostatkovú chybu.

Graf zostatkovej chybovosti

Zostava regresného modelu, rovnako ako zostavy iných typov modelov, obsahuje aj stránku s podrobnosťami trénovania, ako sa uvádza v časti Zostava modelu automatizovaného strojového učenia vyššie.

Použitie regresného modelu

Ak chcete použiť regresný model mlku, musíte k tabuľke pridať vstupné údaje a predponu názvu výstupného stĺpca.

Použitie regresie

Po použití regresného modelu sa do obohatenej výstupnej tabuľky pridajú tri výstupné stĺpce: RegressionResult, RegressionExplanation a ExplanationIndex. K názvom stĺpcov v tabuľke sa po použití modelu môže špecifikovať predpona.

Stĺpec RegressionResult obsahuje predpokladanú hodnotu riadka vychádzajúcu zo vstupných stĺpcov. Stĺpec RegressionExplanation obsahuje vysvetlenie predpovede s konkrétnym vplyvom, ktorý vstupné funkcie mali na stĺpec RegressionResult.

Integrácia strojového učenia platformy Azure v službe Power BI

Mnohé organizácie používajú modely strojového učenia na vylepšenie prehľadov a predpovedí týkajúcich sa ich podnikania. Možnosť vizualizácie a vyvolania prehľadov z týchto modelov v zostavách, tabuliach a iných analýzach môže pomôcť so šírením týchto prehľadov podnikovým používateľom, ktorí ich potrebujú najviac. Power BI odteraz umožňuje pomocou jednoduchých gest typu „ukázať a kliknúť“ zahrnúť prehľady z modelov hosťovaných v službe strojového učenia platformy Microsoft Azure.

Ak chcete používať túto funkciu, odborník v oblasti údajov môže analytikovi služby Power BI jednoducho poskytnúť prístup k modelu strojového učenia platformy Azure prostredníctvom portálu Azure. Potom na začiatku každej relácie služba Power Query zistí všetky modely strojového učenia platformy Microsoft Azure, ku ktorým má používateľ prístup, a zobrazí ich ako dynamické funkcie služby Power Query. Používateľ môže vyvolať dané funkcie tak, že k nim pristúpi na páse s nástrojmi v editore Power Query alebo priamym vyvolaním funkcie strojového učenia. Pri vyvolávaní modelu strojového učenia platformy Microsoft Azure služba Power BI automaticky dávkuje požiadavky na prístup pre množinu riadkov na dosiahnutie lepšieho výkonu.

Táto funkcia je v súčasnosti podporovaná len pre toky údajov služby Power BI a pre online službu Power Query v službe Power BI.

Ďalšie informácie o tokoch údajov nájdete v téme Úvodné informácie o tokoch údajov a samoobslužná príprava údajov.

Ďalšie informácie o strojovom učení platformy Microsoft Azure:

Poskytnutie prístupu k modelu strojového učenia platformy Microsoft Azure používateľovi služby Power BI

Na prístup k modelu strojového učenia platformy Microsoft Azure zo služby Power BI musí mať používateľ prístup na čítanie k predplatnému služby Azure. Ďalej musí mať:

  • Prístup na čítanie k webovej službe Machine Learning Studio (classic) na prístup k modelom Machine Learning Studio (classic)
  • Prístup na čítanie k pracovnému priestoru strojového učenia na prístup k modelom strojového učenia

Kroky v tomto článku popisujú poskytnutie prístupu používateľovi služby Power BI k modelu hosťovanému v službe strojového učenia platformy Microsoft Azure, aby mohol pristupovať k tomuto modelu ako k funkcii Power Query. Ďalšie podrobnosti nájdete v téme Spravovanie prístupu pomocou roly RBAC a portálu Microsoft Azure.

  1. Prihláste sa na portál Azure.

  2. Prejdite na stránku Predplatné. Stránku Predplatné môžete nájsť pomocou zoznamu Všetky služby na navigačnej table portálu Microsoft Azure.

    Stránka predplatného služby Azure

  3. Vyberte svoje predplatné.

    Vyberte predplatné

  4. Vyberte položku Riadenie prístupu (IAM) a potom stlačte tlačidlo Pridať.

    Kontrola prístupu IAM

  5. Ako rolu vyberte možnosť Čitateľ. Vyberte používateľa služby Power BI, ktorému chcete poskytnúť prístup k modelu strojového učenia platformy Microsoft Azure.

    Vyberte rolu Čitateľ

  6. Vyberte položku Uložiť.

  7. Zopakujte kroky tri až šesť a poskytnite používateľovi prístup čitateľa ku konkrétnej webovej službe Machine Learning Studio (classic) alebo k pracovnému priestoru strojového učenia hosťujúcemu model.

Zisťovanie schémy modelov strojového učenia

Vedci pracujúci s údajmi používajú na vývoj, a dokonca nasadenie modelov strojového učenia pre službu strojového učenia predovšetkým jazyk Python. Na rozdiel od služby Machine Learning Studio (classic), ktorá pomáha automatizovať úlohu vytvorenia súboru schémy pre model, v prípade služby strojového učenia musia vedci pracujúci s údajmi výslovne vygenerovať súbor schémy pomocou jazyka Python.

Tento súbor schémy musí byť súčasťou nasadenej webovej služby pre modely strojového učenia. Ak chcete automaticky vygenerovať schému pre webovú službu, treba zadať vzorku vstupu/výstupu do vstupného skriptu nasadzovaného modelu. Pozrite si podsekciu venovanú generovaniu schémy (voliteľnej) automatickej architektúry Swagger v dokumentácii k službe Strojové učenie platformy Azure v časti Nasadenie modelov. Prepojenie obsahuje príklad vstupného skriptu s príkazmi na generovanie schémy.

Konkrétne funkcie @input_schema a @output_schema vo vstupnom skripte odkazujú na vzorové formáty vstupu a výstupu v premenných input_sample a output_sample. Tieto vzory sa používajú na vygenerovanie špecifikácie OpenAPI (Swagger) pre webovú službu počas procesu nasadenia.

Tieto pokyny na generovanie schémy aktualizáciou vstupného skriptu treba použiť aj na modely vytvorené pomocou pokusov s automatizovaným strojovým učením prostredníctvom súpravy SDK strojového učenia platformy Azure.

Poznámka

Modely vytvorené pomocou grafického používateľského rozhrania služby strojového učenia platformy Microsoft Azure v súčasnosti nepodporujú generovanie schémy, v nadchádzajúcich vydaniach však už budú.

Vyvolanie modelu strojového učenia platformy Microsoft Azure v službe Power BI

Akýkoľvek model strojového učenia platformy Microsoft Azure, ku ktorému ste získali prístup, môžete vyvolať priamo z editora Power Query v toku údajov. Ak chcete pristupovať k modelom mlieku Platformy Microsoft Azure, stlačte tlačidlo Upraviť pri tabuľke, ktorú chcete obohatiť prehľadmi z modelu virtuálneho počítača platformy Microsoft Azure, ako je to znázornené na nasledujúcom obrázku.

služba Power BI – úprava tabuľky

Výberom tlačidla Upraviť sa Power Query Editor tabuliek vo vašom toku údajov.

Editor Power Query

Vyberte tlačidlo Prehľady UI na páse s nástrojmi a potom vyberte na navigačnej table priečinok Modely strojového učenia platformy Azure. Všetky modely strojového učenia platformy Microsoft Azure, ku ktorým máte prístup, sú uvedené ako funkcie služby Power Query. Vstupné parametre pre model strojového učenia platformy Microsoft Azure sú taktiež automaticky mapované ako parametre zodpovedajúcej funkcie Power Query.

Model virtuálneho počítača platformy Azure môžete vyvolať zadaním ľubovoľného stĺpca vybratej tabuľky ako vstupu z rozbaľovacieho zoznamu. Môžete tiež zadať konštantnú hodnotu, ktorá sa má použiť ako vstup, a to tak, že prepnete ikonu stĺpca na ľavej strane dialógového okna vstupu.

Vyberte stĺpec

Vyberte položku Vyvolať na zobrazenie ukážky výstupu modelu mld. platformy Azure vo formáte nového stĺpca v tabuľke. Vyvolanie modelu sa zobrazí aj ako uplatnený krok pre dotaz.

Vyberte položku Vyvolať

Ak model vracia viacero výstupných parametrov, zoskupia sa v rámci riadka vo výstupnom stĺpci. Stĺpec môžete rozšíriť, aby sa vytvorili jednotlivé výstupné parametre v samostatných stĺpcoch.

Rozbaliť stĺpec

Keď uložíte tok údajov, model sa automaticky vyvolá po obnovení toku údajov, a to v prípade akýchkoľvek nových alebo aktualizovaných riadkov v tabuľke tabuľky.

##Obmedzenia

  • Prehľady AI (modely Cognitive Services a Azure ML) nie sú podporované v počítačoch s nastavením overovania serverom proxy.
  • Modely AzureML nie sú podporované pre hosťovských používateľov.

Ďalšie kroky

Tento článok poskytol prehľad automatizovaného strojového učenia pre toky údajov v službe Power BI. Nasledujúce články môžu byť tiež užitočné.

V nasledujúcich článkoch nájdete ďalšie informácie o tokoch údajov a službe Power BI: