AI med dataflöden
I den här artikeln diskuterar vi hur du kan använda artificiell intelligens (AI) med dataflöden. De områden som beskrivs i artikeln är följande:
- Cognitive Services
- Automatiserad maskininlärning
- Integrering av Azure Machine Learning
Cognitive Services i Power BI
Med Cognitive Services i Power BI kan du använda olika algoritmer från Azure Cognitive Services för att utöka dina data i självbetjäningsdataförberedelser för dataflöden.
De tjänster som stöds i dag är Attitydanalys, Extrahering av diskussionsämne, Språkidentifiering och Bildtaggning. Omvandlingarna utförs i Power BI-tjänsten och kräver inte en Azure Cognitive Services-prenumeration. Den här funktionen kräver Power BI Premium.
Aktivera AI-funktioner
Cognitive Services stöds för noder för Premium-kapacitet EM2, A2 eller P1 och senare. Cognitive Services är också tillgängliga med en PPU-licens (Premium Per User). En separat AI-arbetsbelastning på kapaciteten används för att köra Cognitive Services. Innan du använder Cognitive Services i Power BI, måste AI-arbetsbelastningar vara aktiverade i kapacitetsinställningarma i administratörsportalen. Du kan aktivera AI-arbetsbelastningen i avsnittet arbetsbelastningar och definiera den maximala mängden minne som den här arbetsbelastningen ska använda. Den rekommenderade minnesstorleksgränsen är 20 %. Om den här gränsen överskrids kommer frågan att bli långsammare.

Komma igång med Cognitive Services i Power BI
Cognitive Services-omvandlingar är en del av Självbetjänad dataförberedelse för dataflöden. För att utöka dina data med Cognitive Services, börja med att redigera ett dataflöde.

Välj knappen AI-insikter i övre menyfliksområdet i Power Query Editor.

I popup-fönstret väljer du den funktion som du vill använda och de data som du vill omvandla. I det här exemplet bedömer jag sentiment i en kolumn som innehåller granskningstext.

CultureInfo är en valfri inmatning för att ange textens språk. Den här kolumnen förväntar sig en ISO-kod. Du kan använda en kolumn som indata för Cultureinfo eller en statisk kolumn. I det här exemplet anges språket som engelska (en) för hela kolumnen. Om du lämnar den här kolumnen tom identifierar Power BI automatiskt språket innan du tillämpar funktionen. Välj sedan Anropa.

När du anropar funktionen läggs resultatet till som en ny kolumn i tabellen. Omvandlingen läggs också till som ett tillämpat steg i frågan.

Om funktionen returnerar flera utdatakolumner lägger funktionen till en ny kolumn med en rad med flera utdatakolumner.
Använd alternativet Expandera för att lägga till ett eller båda värdena som kolumner till dina data.

Tillgängliga funktioner
Det här avsnittet beskriver de tillgängliga funktionerna i Cognitive Services i Power BI.
Identifiera språk
Funktionen för språkidentifiering utvärderar textindata och returnerar språknamnet och ISO-identifieraren för varje kolumn. Den här funktionen är användbar för datakolumner som samlar in godtycklig text där språket är okänt. Funktionen förväntar sig data i textformat som indata.
Textanalys kan identifiera upp till 120 språk. Mer information finns i språk som stöds.
Extrahering av diskussionsämne
Funktionen Extrahering av nyckelfraser utvärderar ostrukturerad text och returnerar för varje textkolumn en lista med nyckelfraser. Funktionen kräver en textkolumn som indata och accepterar en valfri indata för Cultureinfo. (Se Kom igång tidigare i den här artikeln.)
Extrahering av diskussionsämne fungerar bäst när du har större mängder text att arbeta med. Det här är tvärtemot attitydanalys som presterar bäst på mindre block med text. För att få bästa resultat från båda åtgärderna kan du överväga omstrukturering av indata på lämpligt sätt.
Bedöma sentiment
Funktionen Bedöma sentiment utvärderar textinmatning och returnerar ett sentimentpoäng för varje dokument som sträcker sig från 0 (negativt) till 1 (positivt). Det här är användbart för att upptäcka positiva och negativa attityder i sociala medier, kundrecensioner och diskussionsforum.
Textanalys använder en klassificeringsalgoritm för maskininlärning för att generera ett sentimentpoäng mellan 0 och 1. Poäng närmare 1 anger positiv attityd, poäng närmare 0 indikerar negativ attityd. Modellen har tränats i förväg med en omfattande textmassa med attitydassociationer. Det är för närvarande inte möjligt att ange dina egna träningsdata. Modellen använder en kombination av metoder under textanalys, inklusive textbehandling, en del av tal-analys, ordplacering och ordassociationer. Läs mer om algoritmen i Introduktion till textanalys.
Attitydanalys utförs på hela indatakolumnen, i stället för att extrahera sentiment för en viss tabell i texten. I praktiken är det en tendens för att bedöma precision för att förbättra när dokumenten innehåller en eller två meningar i stället för ett stort textblock. Under en utvärderingsfas för objektivitet avgör modellen om en indatakolumn som helhet är objektiv eller innehåller attityd. En indatakolumn som huvudsakligen är objektiv går inte vidare till attitydidentifieringsfrasen, vilket resulterar i en .50-poäng, utan ytterligare bearbetning. För indatakolumner som fortsätter i pipelinen genererar nästa fas en poäng över eller under .50, beroende på graden av attityd som identifieras i indatakolumnen.
Attitydanalys stöder för närvarande, engelska, tyska, spanska och franska. Andra språk finns i förhandsversionen. Mer information finns i språk som stöds.
Tagga bilder
Funktionen Tagga bilder returnerar taggar som baseras på fler än 2 000 identifierbara objekt, levande varelser, landskap och åtgärder. När taggar är tvetydigt eller inte är allmän kända, ges ”tips” för att förtydliga taggen i kontexten av en känd miljö. Taggar är inte ordnade som en taxonomi och inga arvshierarkier finns. En samling innehållstaggar utgör grunden för en ”bildbeskrivning” som visas som språk som kan läsas av människor som är formaterade i fullständiga meningar.
När du laddar upp en bild eller anger en bild-URL, matar algoritmer för Visuellt innehåll ut taggar baserade på objekt, levande varelser och åtgärder som identifierats i bilden. Taggar är inte begränsat till huvudsubjektet, till exempel en person i förgrunden, utan innehåller även omgivningen (inom- eller utomhus), möbler, verktyg, anläggningar, djur, tillbehör, prylar och så vidare.
Den här funktionen kräver en bild-URL eller en abase-64-kolumn som indata. För tillfället har bildtaggning stöd för engelska, spanska, japanska, portugisiska och kinesiska (förenklad). Mer information finns i språk som stöds.
Automatiserad maskininlärning i Power BI
Med Automatiserad maskininlärning (AutoML) för dataflöden kan affärsanalytiker träna upp, validera och anropa ML-modeller direkt i Power BI. Det innehåller en enkel upplevelse för skapande av en ny ML-modell (maskininlärningsmodell) där analytiker kan använda sina dataflöden för att ange indata för träning av modellen. Tjänsten extraherar automatiskt de mest relevanta egenskaperna, väljer en lämplig algoritm samt justerar och validerar ML-modellen. När en modell har tränats upp genererar Power BI automatiskt en prestandarapport med resultatet av valideringen. Modellen kan sedan anropas på alla nya eller uppdaterade data i dataflödet.

Automatiserad maskininlärning är endast tillgängligt för dataflöden som värdhanteras på Power BI Premium och inbäddade kapaciteter.
Arbeta med AutoML
I dataflöden finns dataförberedelse med självbetjäning för stordata. AutoML är integrerat i dataflödena så att du kan använda dina dataförberedelser när du skapar maskininlärningsmodeller direkt i Power BI.
AutoML i Power BI gör att dataanalytiker kan använda dataflöden till att skapa maskininlärningsmodeller med en förenklad upplevelse där endast kunskap om Power BI behövs. Det mesta av data science-arbetet bakom skapandet av ML-modeller är automatiserat i Power BI. Tjänsten har vägledningar så att modellen som produceras ska ha god kvalitet, och du har insyn i processen som används till att skapa din ML-modell.
Med AutoML kan du skapa binär förutsägelse, klassificering och regressionsmodeller för dataflöden. Det här är olika tekniker för övervakad maskininlärning, vilket innebär att de använder kända resultat av tidigare observationer till att förutsäga resultatet av nya observationer. Indatauppsättningen för träning av en AutoML-modell är en uppsättning rader som är märkta med kända resultat.
AutoML i Power BI integrerar automatiserad maskininlärning från Azure Machine Learning för att skapa dina ML-modeller. Du behöver dock ingen Azure-prenumeration för att använda AutoML i Power BI. Processen med att träna och värdhantera ML-modeller hanteras helt av Power BI-tjänsten.
När en maskininlärningsmodell har tränats genererar AutoML automatiskt en Power BI-rapport som förklarar ML-modellens sannolika prestanda. Tydligheten är viktig i AutoML, så de faktorer i dina indata som är viktigast för att ta fram förutsägelser i modellen lyfts fram. Rapporten innehåller även nyckelmått för modellen.
På andra sidor i den genererade rapporten finns en statistisk sammanfattning av modellen och träningsinformationen. Den statistiska sammanfattningen är intressant för användare som vill se vanliga data science-mått för modellens prestanda. Träningsinformationen sammanfattar alla iterationer som kördes för att skapa modellen samt associerade modelleringsparametrar. Den beskriver även hur alla indata användes för att skapa ML-modellen.
Du kan sedan tillämpa ML-modellen på dina data för poängsättning. När dataflödet uppdateras så uppdateras även dina data med förutsägelser från ML-modellen. Power BI ger även en individualiserad förklaring för varje specifik förutsägelse som ML-modellen skapar.
Skapa en maskininlärningsmodell
I det här avsnittet beskrivs hur du skapar en AutoML-modell.
Förbereda data för skapandet av en ML-modell
För att skapa en maskininlärningsmodell i Power BI måste du först skapa ett dataflöde för dina data med informationen om historiska utfall, som används till att träna upp ML-modellen. Du bör även lägga till beräknade kolumner för eventuella affärsmått som kan vara starka förutsägande faktorer för det resultat du försöker förutsäga. Mer information om hur du konfigurerar ditt dataflöde finns i Konfigurera och använda ett dataflöde.
AutoML har specifika datakrav för träning av en maskininlärningsmodell. Dessa krav beskrivs i avsnitten nedan baserat på respektive modelltyp.
Konfigurera ML-modellens indata
Om du vill skapa en AutoML-modell väljer du ML-ikonen i kolumnen Åtgärder i dataflödestabellen och väljer Lägg till en maskininlärningsmodell.

En förenklad upplevelse startas med en guide som vägleder dig genom processen för att skapa ML-modellen. Guiden innehåller följande enkla steg.
1. Välj tabellen med historiska data och den resultatkolumn som du vill ha en förutsägelse för
Resultatkolumnen identifierar etikettattributet för träning av ML-modellen, som visas i följande bild.

2. Välj en modelltyp
När du anger resultatkolumnen analyserar AutoML etikettdata för att rekommendera den mest sannolika ML-modelltypen som kan tränas. Du kan välja en annan modelltyp genom att klicka på ”Välj en annan modell”.

Anteckning
Vissa modelltyper stöds kanske inte för de data du har valt, och då är de inaktiverade. I exemplet ovan är Regression inaktiverat eftersom en textkolumn väljs som resultatkolumn.
3. Välj de indata du vill att modellen ska använda som förutsägelsesignaler
AutoML analyserar ett exempel på den valda tabellen för att föreslå de indata som kan användas för att träna ML-modellen. Förklaringar tillhandahålls bredvid kolumner som inte är markerade. Om en viss kolumn har för många distinkta värden eller bara ett värde, eller låg eller hög korrelation med utdatakolumnen, rekommenderas det inte.
Indata som är beroende av resultatkolumnen (eller etikettkolumnen) bör inte användas för träning av ML-modellen, eftersom de påverkar dess prestanda. Sådana kolumner flaggas som "misstänkt hög korrelation med utdatakolumnen". Introduktionen av dessa kolumner i träningsdata orsakar etikettläckage, där modellen presterar bra på validerings- eller testdata, men inte kan matcha den prestandan när den används i produktion för bedömning. Etikettläckage kan vara ett problem i AutoML-modeller när resultatet av modellträningen ser lite för bra ut för att vara sant.
Den här egenskapsrekommendationen baseras på ett urval av data, så du bör granska vilka indata som har använts. Du har möjlighet att ändra valen så att de endast innehåller de kolumner som du vill att modellen ska studera. Du kan också markera alla kolumner genom att markera kryssrutan bredvid tabellnamnet.

4. Namnge modellen och spara konfigurationen
I det sista steget namnger du modellen och väljer Spara. Då startar inträningen av ML-modellen. Du kan välja att minska inlärningstiden om du vill få resultat snabbare, eller att öka tiden för att få fram bästa möjliga modell.

Träning av ML-modell
Träning av AutoML-modeller är en del av dataflödesuppdateringen. AutoML förbereder först dina data för träning. AutoML delar in de historiska data du anger i datamängder för träning respektive testning. Datamängden för testning är en uppsättning reserverade data som används för validering av modellens prestanda efter träningen. Dessa realiseras som tabeller för träning och testning i dataflödet. AutoML använder korsvalidering för validering av modellen.
Därefter analyseras varje indatakolumn och imputation tillämpas, vilket ersätter saknade värden med ersatta värden. AutoML använder några olika imputeringsstrategier. För indataattribut som hanteras som numeriska egenskaper används medelvärdet av kolumnvärdena för imputering. För indataattribut som hanteras som kategoriska egenskaper använder AutoML kolumnvärdenas läge för imputering. AutoML-ramverket beräknar de medelvärden och lägen som används för imputering baserat på ett urval av datamängden som används för inträning.
Sedan tillämpas sampling och normalisering på dina data efter behov. För klassificeringsmodeller kör AutoML indata genom stratifierad sampling och balanserar klasserna så att antalet rader är lika för alla.
AutoML tillämpar flera transformeringar på varje vald indatakolumn baserat på dess datatyp och dess statistiska egenskaper. AutoML använder dessa transformeringar för att extrahera egenskaper som används vid träning av ML-modellen.
Träningsprocessen för AutoML-modeller består av upp till 50 iterationer med olika modelleringsalgoritmer och inställningar för hyperparametrar i syfte att hitta den modell som har bäst prestanda. Inträningen kan avslutas tidigt med färre iterationer om AutoML upptäcker att modellens prestanda inte förbättras. Prestanda för var och en av dessa modeller utvärderas genom validering med testdatamängden med reserverade data. Under det här träningssteget skapar AutoML flera pipelines för träning och validering av dessa iterationer. Processen för att utvärdera modellernas prestanda kan ta tid, från några minuter till flera timmar och upp till tiden som anges i guiden, beroende på datauppsättningens storlek och mängden tillgängliga kapacitetsresurser.
I vissa fall kan den slutliga modell som genereras använda ensembleinlärning, där flera modeller används för att ge bättre förutsägelseprestanda.
Förklarbarhet för AutoML-modell
När modellen har tränats analyserar AutoML relationen mellan indataegenskaperna och modellens utdata. Tjänsten utvärderar hur mycket modellens utdata måste ändras för testdatamängden med reserverade data för varje indataegenskap. Detta kallas egenskapsprioritet. Detta inträffar som en del av uppdateringen när inträningen är klar. Uppdateringen kan därför ta längre tid än den tid för inträning som är konfigurerad i guiden.

AutoML-modellrapport
AutoML genererar en Power BI-rapport som sammanfattar modellens prestanda under valideringen samt den globala egenskapsprioriteten. Du kan komma åt den här rapporten på fliken Maskininlärningsmodell när dataflödet har uppdaterats. Rapporten sammanfattar resultatet från tillämpningen av ML-modellen på reserverade testdata och jämför förutsägelserna med de kända utfallsvärdena.
Du kan granska modellrapporten för att förstå dess prestanda. Du kan även kontrollera att modellens främsta influerare överensstämmer med affärsinsikterna om de kända utfallen.
De diagram och mått som används för att beskriva modellens prestanda i rapporten beror på modelltypen. Dessa prestandadiagram och mått beskrivs i följande avsnitt.
Ytterligare sidor i rapporten kan beskriva statistiska mått för modellen utifrån ett dataforskningsperspektiv. Till exempel innehåller rapporten om binär förutsägelse ett ökningsdiagram och ROC-kurvan för modellen.
Rapporterna innehåller även sidan Träningsinformation där du kan se hur modellen tränats upp, och ett diagram som beskriver modellens prestanda för varje iterationskörning.

Ett annat avsnitt på den här sidan beskriver den identifierade typen av indatakolumn och imputationsmetoden som används för att fylla saknade värden. Det innehåller även de parametrar som användes av den slutliga modellen.

Om den modell som skapades använder ensembleinlärning så finns även ett avsnitt på sidan Träningsinformation som visar vikten för varje konstituerande modell i ensemblen samt dess parametrar.

Tillämpa AutoML-modellen
Om du är nöjd med prestandan hos den ML-modell som skapades kan du tillämpa den på nya eller uppdaterade data när ditt dataflöde uppdateras. Det här kan du göra från modellrapporten genom att välja knappen Tillämpa uppe till höger, eller knappen Tillämpa ML-modell under åtgärderna på fliken Maskininlärningsmodeller.
Om du vill tillämpa ML-modellen måste du ange namnet på den tabell som den måste tillämpas på och ett prefix för de kolumner som ska läggas till i den här tabellen för modellutdata. Standardprefixet för kolumnnamnen är modellnamnet. Funktionen Tillämpa kan innehålla ytterligare parametrar som är specifika för modelltypen.
När du tillämpar ML-modellen skapas två nya dataflödestabeller som innehåller förutsägelser och individualiserade förklaringar för varje rad som den poängsätter i utdatatabellen. Om du till exempel tillämpar modellen PurchaseIntent på tabellen OnlineShoppers genererar utdata tabellerna OnlineShoppers enriched PurchaseIntent och OnlineShoppers enriched PurchaseIntent explanations . För varje rad i den berikade tabellen delas Förklaringarna upp i flera rader i tabellen med berikade förklaringar baserat på indatafunktionen. Ett ExplanationIndex hjälper till att mappa raderna från tabellen med berikade förklaringar till raden i berikad tabell.

Du kan också använda valfri Power BI AutoML-modell för tabeller i alla dataflöden på samma arbetsyta med hjälp av Alla insikter i PQO-funktionswebbläsaren. På så sätt kan du använda modeller som skapats av andra på samma arbetsyta utan att nödvändigtvis vara ägare till det dataflöde som rymmer modellen. Power Query identifierar alla Power BI ML-modeller på arbetsytan och exponerar dem som dynamiska Power Query-funktioner. Du kan sedan anropa dessa funktioner genom att öppna dem i menyfliksområdet i Power Query-redigeraren, eller genom att anropa M-funktionen direkt. Den här funktionen stöds för närvarande endast för Power BI-dataflöden och för Power Query Online i Power BI-tjänsten. Observera att detta skiljer sig från att använda ML-modeller i ett dataflöde med hjälp av AutoML-guiden. Det finns ingen förklaringstabell som skapats med den här metoden och om du inte är ägare till dataflödet kan du inte komma åt modellträningsrapporter eller träna om modellen. Om källmodellen redigeras (lägger till eller tar bort indatakolumner) eller om modellen eller källdataflödet tas bort, bryts det här beroende dataflödet.

När du tillämpar modellen håller AutoML alltid dina förutsägelser uppdaterade när dataflödet uppdateras.
Om du vill använda insikter och förutsägelser från ML-modellen i en Power BI-rapport kan du ansluta till utdatatabellen från Power BI Desktop med hjälp av anslutningsappen för dataflöden.
Modeller för binär förutsägelse
Modeller för binär förutsägelse, som mer formellt kallas modeller för binär klassificering, används för att klassificera en datamängd i två grupper. De används till att förutse händelser som kan ha ett binärt utfall. Några exempel kan vara om en affärsmöjlighet realiseras, ett konto faller bort, en faktura betalas i tid eller en transaktion är bedräglig.
Utdata från en modell för binär förutsägelse är en sannolikhetspoäng som identifierar sannolikheten för det önskade utfallet.
Träna en modell för binär förutsägelse
Förutsättningar:
- Minst 20 rader med historiska data krävs för varje klass av utfall
Processen för att skapa en modell för binär förutsägelse inbegriper samma steg som andra AutoML-modeller, vilket beskrivs i avsnittet Konfigurera ML-modellens indata ovan. Den enda skillnaden är i steget ”Välj en modell” där du kan välja det utfallsvärde du är mest intresserad av. Du kan också ange användarvänliga etiketter för de utfall som ska användas i den automatiskt genererade rapport där resultatet av modellens validering sammanfattas.

Rapport för modell för binär förutsägelse
Modellen för binär förutsägelse ger som utdata en sannolikhet att en rad uppnår målresultatet. Rapporten innehåller ett utsnitt för sannolikhetströskeln som påverkar hur poäng över och under sannolikhetströskeln tolkas.
Rapporten beskriver modellens prestanda med avseende på sanna positiva, falska positiva, sanna negativa och falska negativa värden. Sanna positiva och sanna negativa värden är korrekt förutsagda utfall för de två klasserna i utfallsdata. Falska positiva identifieringar är rader som förutsades ha målresultat men som faktiskt inte gjorde det. Omvänt är falska negativa rader som hade målresultat men som förutsades inte ha det.
Mått såsom precision och träffsäkerhet beskriver effekten av sannolikhetströskeln på förutsagda utfall. Du kan använda utsnittet för sannolikhetströskel för att välja ett tröskelvärde som ger en balanserad avvägning mellan precision och träffsäkerhet.

Rapporten innehåller också ett verktyg för kostnads-nyttoanalys som hjälper dig att identifiera vilken delmängd av befolkningen du ska rikta in dig mot för att ge största möjliga vinst. I analysen används en uppskattad enhetskostnad för inriktningen och en enhetsnytta för det önskade utfallet, och syftet är att maximera vinsten. Du kan använda det här verktyget till att välja tröskelvärde för sannolikheten baserat på maxpunkten i vinstmaximeringsdiagrammet. Du kan också använda diagrammet till att beräkna vinsten eller kostnaden för valet av tröskelvärde för sannolikheten.

Sidan Noggrannhetsrapport i modellrapporten innehåller diagrammet Kumulativa ökningar samt modellens ROC-kurva. Det här är statistiska mått för modellens prestanda. Rapporterna innehåller beskrivningar av de diagram som visas.

Tillämpa en modell för binär förutsägelse
Om du vill använda en modell för binär förutsägelse måste du ange tabellen med de data som du vill tillämpa förutsägelserna från ML-modellen på. Andra parametrar är namnprefixet för utdatakolumnen sant sannolikhetströskeln för klassificering av det förväntade utfallet.

När en modell för binär förutsägelse tillämpas läggs fyra utdatakolumner till i den berikade utdatatabellen: Outcome, PredictionScore, PredictionExplanation och ExplanationIndex. Kolumnnamnen i tabellen har det prefix som anges när modellen tillämpas.
PredictionScore är en sannolikhet i procent för att det önskade utfallet uppnås.
Kolumnen Outcome innehåller märkningen för det förutsagda utfallet. Poster med en sannolikhet som överstiger tröskelvärdet förutsägs troligen uppnå utfallet och får därmed märkningen True. Poster under tröskelvärdet förutsägs troligen inte nå utfallet och får märkningen False.
Kolumnen PredictionExplanation innehåller en förklaring av den specifika påverkan som indataegenskaperna hade på PredictionScore.
Klassificeringsmodeller
Klassificeringsmodeller används för att klassificera en datamängd i flera grupper eller klasser. De används till att förutsäga händelser som kan ha ett av flera möjliga utfall. Några exempel är om en kund troligtvis har ett mycket högt, högt, medelhögt eller lågt livslängdsvärde, huruvida risken för inställda betalningar är hög, medelhög, låg eller mycket låg och så vidare.
Utdata från en klassificeringsmodell är en sannolikhetspoäng som identifierar sannolikheten för att en rad uppnår kriterierna för en viss klass.
Träna en klassificeringsmodell
Indatatabellen som innehåller dina träningsdata för en klassificeringsmodell måste ha en sträng eller heltalskolumn som resultatkolumn, som identifierar tidigare kända resultat.
Förutsättningar:
- Minst 20 rader med historiska data krävs för varje klass av utfall
Processen för att skapa en klassificeringsmodell inbegriper samma steg som andra AutoML-modeller, vilket beskrivs i avsnittet Konfigurera ML-modellens indata ovan.
Rapport för klassificeringsmodell
Rapporten klassificeringsmodell skapas genom att ML-modellen tillämpas på holdout-testdata och den förutsagda klassen jämförs för en rad med den faktiska kända klassen.
Modellrapporten innehåller ett diagram som innehåller uppdelningen av korrekt och felaktigt klassificerade rader för varje känd klass.

En ytterligare klassspecifik åtgärd för ökad detaljnivå möjliggör en analys av hur förutsägelserna för en känd klass distribueras. Detta visar de andra klasserna där rader i den kända klassen sannolikt kommer att felklassificeras.
Modellförklaringen i rapporten innehåller även de främsta förutsägande faktorerna för varje klass.
Rapporten för klassificeringsmodell innehåller även en sida med träningsinformation som liknar sidorna för andra modelltyper, enligt beskrivningen i avsnittet AutoML-modellrapport tidigare i den här artikeln.
Tillämpa en klassificeringsmodell
Om du vill använda en ML-modell för klassificering måste du ange tabellen med indata och namnprefixet för utdatakolumnen.
När en klassificeringsmodell tillämpas lägger den till fem utdatakolumner i den berikade utdatatabellen: ClassificationScore, ClassificationResult, ClassificationExplanation, ClassProbabilities och ExplanationIndex. Kolumnnamnen i tabellen har det prefix som anges när modellen tillämpas.
Kolumnen ClassProbabilities innehåller listan med sannolikhetspoäng för raden för varje möjlig klass.
ClassificationScore är sannolikheten i procent, vilket identifierar sannolikheten för att en rad uppnår kriterierna för en viss klass.
Kolumnen ClassificationResult innehåller den mest sannolika förutsagda klassen för raden.
Kolumnen ClassificationExplanation innehåller en förklaring av den specifika påverkan som indataegenskaperna hade på ClassificationScore.
Regressionsmodeller
Regressionsmodeller används till att förutsäga ett numeriskt värde. Några exempel är den troliga intäkten från en försäljning, livslängdsvärdet för ett konto, hur mycket av en betalbar faktura som sannolikt kommer att betalas, det datum då en faktura kan betalas och så vidare.
Utdata från regressionsmodell är det förutsagda värdet.
Träna en regressionsmodell
Indatatabellen som innehåller träningsdata för en regressionsmodell måste ha en numerisk kolumn som resultatkolumn, som identifierar de kända utfallsvärdena.
Förutsättningar:
- Minst 100 rader med historiska data krävs för en regressionsmodell
Processen för att skapa en regressionsmodell inbegriper samma steg som andra AutoML-modeller, vilket beskrivs i avsnittet Konfigurera ML-modellens indata ovan.
Regressionsmodellrapport
Liksom andra AutoML-modellrapporter baseras regressionsrapporten på resultatet av tillämpningen av modellen på reserverade testdata.
Modellrapporten innehåller ett diagram som jämför de förutsagda värdena med de faktiska värdena. I det här diagrammet indikerar avståndet från diagonalen felet i förutsägelsen.
Diagrammet över återstående fel visar distributionen av procentandelen genomsnittligt fel för olika värden i testdatamängden med reserverade data. Den vågräta axeln representerar medelvärdet av det faktiska värdet för gruppen, och storleken på bubblan visar frekvensen eller antalet värden i det intervallet. Den lodräta axeln är det genomsnittliga återstående felet.

Rapporten för regressionsmodell innehåller även en sida med träningsinformation likt sidorna för andra modelltyper, enligt beskrivningen i avsnittet AutoML-modellrapport ovan.
Tillämpa en regressionsmodell
Om du vill använda en ML-modell för regression måste du ange tabellen med indata och prefixet för utdatakolumnens namn.

När en Regression-modell tillämpas lägger den till tre utdatakolumner i den berikade utdatatabellen: RegressionResult, RegressionExplanation och ExplanationIndex. Kolumnnamnen i tabellen har prefixet angivet när modellen tillämpas.
Kolumnen RegressionResult innehåller det förutsagda värdet för raden baserat på indatakolumnerna. Kolumnen RegressionExplanation innehåller en förklaring av den specifika påverkan som indataegenskaperna hade på RegressionResult.
Azure Machine Learning-integrering i Power BI
Många organisationer använder Machine Learning-modeller för bättre insikter och förutsägelser om verksamheten. Möjligheten att visualisera och anropa insikter från dessa modeller i dina rapporter och instrumentpaneler och andra analyser kan hjälpa att sprida dessa insikter till företagsanvändare som behöver dem som mest. Power BI gör nu det enkelt att införliva insikter från modeller som hanteras i Azure Machine Learning med hjälp av enkla peka och klicka-åtgärder.
Om du vill använda den här funktionen kan en datatekniker bevilja åtkomst till Azure ML-modellen till den BI-analytikern som använder Azure Portal. I början av varje session identifierar Power Query sedan alla Azure ML-modeller som användaren har åtkomst till och visar dem som dynamiska Power Query-funktioner. Användaren kan sedan anropa dessa funktioner genom att öppna dem i menyfliksområdet i Power Query Editor eller genom att aktivera funktionen M direkt. Power BI slår automatiskt ihop åtkomstbegäranden då Azure ML-modellen anropas för en uppsättning rader för att få bättre prestanda.
Den här funktionen stöds för närvarande endast för Power BI-dataflöden och Power Query online i Power BI-tjänsten.
Mer information om dataflöden finns i Introduktion till dataflöden och dataförberedelser med självbetjäning.
Om du vill veta mer om Azure Machine Learning kan du läsa:
- Översikt: Vad är Azure Machine Learning?
- Snabbstarter och självstudier för Azure Machine Learning: Dokumentation om Azure Machine Learning
Bevilja åtkomst till Azure ML-modellen till en Power BI-användare
För att få åtkomst till en Azure ML-modell från Power BI måste användaren ha läsbehörighet till Azure-prenumerationen och Machine Learning-arbetsytan.
Stegen i den här artikeln beskriver hur du ger en Power BI-användaråtkomst till en modell som finns i Azure ML-tjänsten så att de kan komma åt den här modellen som en Power Query-funktion. Mer information finns i Hantera åtkomst med RBAC och Azure Portal.
Logga in på Azure-portalen.
Gå till sidan Prenumerationer. Du hittar sidan Prenumerationer i listan Alla tjänster i navigeringsfönstrets meny i Azure-portalen.
Välj din prenumeration.
Välj Åtkomstkontroll (IAM) , och välj sedan knappen Lägg till.
Välj Läsare som rollen. Välj den Power BI-användare som du vill bevilja åtkomst till Azure ML-modellen för.
Välj Spara.
Upprepa steg tre till sex för att ge läsare åtkomst till användaren för den specifika Machine Learning-arbetsyta som är värd för modellen.
Identifiering av schema för Machine Learning-modeller
Dataforskare använder i första hand Python för att utveckla och distribuera även sina maskininlärningsmodeller för Machine Learning. Dataexperten måste uttryckligen generera schemafilen med Hjälp av Python.
Den här schemafilen måste inkluderas i den distribuerade webbtjänsten för Machine Learning-modeller. För att automatiskt generera schemat för webbtjänsten måste du ange ett exempel på indata/utdata i inmatningsskriptet för den distribuerade modellen. Se underavsnittet i tjänstdokumentationen om (Valfritt) Automatisk generering av Swagger-schema för distribution av modeller med Azure Machine Learning. Länken innehåller exempelinmatningsskriptet med instruktionerna för schemagenerering.
Mer specifikt refererar funktionerna @input_schema och @output_schema i postskriptet till indata- och utdataexempelformaten i variablerna input_sample och output_sample och använder dessa exempel för att generera en OpenAPI-specifikation (Swagger) för webbtjänsten under distributionen.
Dessa instruktioner för schemagenerering genom uppdatering av inmatningsskriptet måste även tillämpas på de modeller som skapas med hjälp av automatiserade maskininlärningsexperiment via Azure Machine Learning SDK.
Anteckning
Modeller som skapats med hjälp av det visuella gränssnittet i Azure Machine Learning stöder för närvarande inte schemagenerering, men kommer att göra det i senare versioner.
Anropa Azure ML-modellen i Power BI
Du kan anropa alla Azure ML-modeller som du har beviljats åtkomst till direkt från Power Query-redigeraren i ditt dataflöde. Om du vill komma åt Azure ML-modellerna väljer du knappen Redigera för den tabell som du vill utöka med insikter från din Azure ML-modell, som du ser i följande bild.
Om du väljer knappen Redigera öppnas Power Query-redigeraren för tabellerna i dataflödet.
Välj knappen Alla insikter i menyfliksområdet och välj sedan mappen Azure Machine Learning-modeller i navigeringsfönstrets meny. Alla Azure ML-modeller som du har åtkomst till visas här som Power Query-funktioner. Dessutom mappas automatiskt indataparametrarna för Azure ML-modellen som parametrar för motsvarande Power Query-funktion.
Om du vill anropa en Azure ML-modell kan du ange någon av den valda tabellens kolumner som indata från listrutan. Du kan också ange ett konstant värde som ska användas som indata genom att klicka på kolumnikonen till vänster om dialogrutan Indata.
Välj Anropa för att visa förhandsversionen av Azure ML-modellens utdata som en ny kolumn i tabelltabellen. Du kan även se modellanropet som ett tillämpat steg för frågan.
Om modellen returnerar flera utdataparametrar grupperas de tillsammans som en rad i utdatakolumnen. Du kan expandera kolumnen för att skapa enskilda utdataparametrar i separata kolumner.
När du har sparat dataflödet anropas modellen automatiskt när dataflödet uppdateras för nya eller uppdaterade rader i tabelltabellen.
Överväganden och begränsningar
- AI-insikter (Cognitive Services- och Azure ML-modeller) stöds inte på datorer med konfiguration av proxyautentisering.
- AzureML-modeller stöds inte för gästanvändare.
- Det finns några kända problem med att använda Gateway med AutoML och Cognitive Services. Om du behöver använda en gateway rekommenderar vi att du skapar ett dataflöde som importerar nödvändiga data via gatewayen först. Skapa sedan ett annat dataflöde som refererar till det första dataflödet för att skapa eller tillämpa dessa modeller och AI-funktioner.
Nästa steg
Den här artikeln visade en översikt av automatiserad maskininlärning för dataflöden i Power BI-tjänsten. Följande artiklar kan också vara användbara.
- Självstudie: Skapa en maskininlärningsmodell i Power BI
- Självstudie: Använda Cognitive Services i Power BI
- Självstudie: Använda Azure Machine Learning-modeller i Power BI
Följande artiklar innehåller mer information om dataflöden och Power BI:








