Selvstudium: Byg en model til maskinel indlæring i Power BI

Vigtigt

Oprettelse af AutoML-modeller (Power BI Automated Machine Learning) til dataflow v1 er udgået og er ikke længere tilgængelig. Kunderne opfordres til at overføre din løsning til funktionen AutoML i Microsoft Fabric. Du kan få flere oplysninger i udfasningsmeddelelsen.

I dette selvstudium bruger du automatiseret maskinel indlæring til at oprette og anvende en binær forudsigelsesmodel i Power BI. Du opretter et Power BI-dataflow og bruger de objekter, du definerer i dataflowet, til at oplære og validere en model til maskinel indlæring direkte i Power BI. Du kan derefter bruge denne model til at score nye data og generere forudsigelser.

Først skal du oprette en binær forudsigelsesmodel til maskinel indlæring for at forudsige onlinehandlendes købshensigt baseret på et sæt af deres onlinesessionsattributter. Du bruger en benchmark-semantisk model til maskinel indlæring til denne øvelse. Når du har oplært en model, genererer Power BI automatisk en valideringsrapport, der forklarer modelresultaterne. Du kan derefter gennemse valideringsrapporten og anvende modellen på dine data for at få point.

Dette selvstudium består af følgende trin:

  • Opret et dataflow med inputdataene.
  • Opret og oplær en model til maskinel indlæring.
  • Gennemse modelvalideringsrapporten.
  • Anvend modellen på et dataflowobjekt.
  • Brug outputtet med score fra modellen i en Power BI-rapport.

Opret et dataflow med inputdataene

Opret et dataflow med inputdata ved at følge disse trin.

Hent data

Det første trin i oprettelsen af et dataflow er at have dine datakilder klar. I dette tilfælde bruger du en semantisk model til maskinel indlæring fra et sæt onlinesessioner, hvoraf nogle kulminer i et køb. Den semantiske model indeholder et sæt attributter for disse sessioner, som du bruger til at oplære din model.

Du kan downloade den semantiske model fra UC Irvine-webstedet eller ved at downloade online_shoppers_intention.csv. Senere i dette selvstudium opretter du forbindelse til den semantiske model ved at angive dens URL-adresse.

Opret tabellerne

Hvis du vil oprette objekterne i dit dataflow, skal du logge på Power BI-tjeneste og navigere til et arbejdsområde.

  1. Hvis du ikke har et arbejdsområde, kan du oprette et ved at vælge Arbejdsområder i navigationsruden til venstre i Power BI og vælge Opret et arbejdsområde. Angiv et arbejdsområdenavn i panelet Opret et arbejdsområde , og vælg Gem.

    Skærmbillede af, hvordan du opretter et arbejdsområde.

  2. Vælg Ny øverst i det nye arbejdsområde, og vælg derefter Dataflow.

    Skærmbillede af, hvordan du opretter et dataflow.

  3. Vælg Tilføj nye tabeller for at starte en Power Query-editor i browseren.

    Skærmbillede af valg af Tilføj nye tabeller.

  4. På skærmbilledet Vælg datakilde skal du vælge Tekst/CSV som datakilde.

    Skærmbillede af valg af Tekst/CSV i Vælg datakilde.

  5. På siden Forbind til en datakilde skal du indsætte følgende link til den online_shoppers_intention.csv fil i feltet Filsti eller URL-adresse og derefter vælge Næste.

    https://raw.githubusercontent.com/santoshc1/PowerBI-AI-samples/master/Tutorial_AutomatedML/online_shoppers_intention.csv

    Skærmbillede, der viser indsættelse i filstien.

  6. I Power Query-editor vises et eksempel på dataene fra CSV-filen. Hvis du vil foretage ændringer i dataene, før du indlæser dem, skal du vælge Transformér data.

    Skærmbillede af valg af Transformér data på skærmen Eksempelfildata.

  7. Power Query udleder automatisk kolonnernes datatyper. Du kan ændre datatyperne ved at vælge ikonet for attributtype øverst i kolonneoverskrifterne. Ret typen af kolonnen Revenue til True/False.

    Du kan omdøbe forespørgslen til et mere brugervenligt navn ved at ændre værdien i feltet Navn i ruden til højre. Skift forespørgselsnavnet til Online-besøgende.

    Skærmbillede af ændring af forespørgselsnavnet og datatypen for kolonnen Revenue.

  8. Vælg Gem & luk, angiv et navn til dataflowet i dialogboksen, og vælg derefter Gem.

    Skærmbillede af lagring af dataflowet.

Opret og oplær en model til maskinel indlæring

Sådan tilføjer du en model til maskinel indlæring:

  1. Vælg ikonet Anvend ML-modellisten Handlinger for den tabel, der indeholder dine oplæringsdata og mærkatoplysninger, og vælg derefter Tilføj en model til maskinel indlæring.

    Skærmbillede, der viser tilføjelse af en model til maskinel indlæring.

  2. Det første trin til at oprette din model til maskinel indlæring er at identificere de historiske data, herunder det resultatfelt, du vil forudsige. Modellen oprettes ved at lære af disse data. I dette tilfælde vil du forudsige, om besøgende vil foretage et køb eller ej. Det resultat, du vil forudsige, er i feltet Indtægt . Vælg Revenue som kolonneværdien Outcome, og vælg derefter Næste.

    Skærmbillede, der viser valg af et historisk datafelt.

  3. Derefter skal du vælge den type model til maskinel indlæring, der skal oprettes. Power BI analyserer værdierne i resultatfeltet, som du har identificeret, og foreslår de typer modeller til maskinel indlæring, som det kan oprette for at forudsige dette felt.

    Da du i dette tilfælde vil forudsige et binært resultat af, om en besøgende vil foretage et køb eller ej, anbefaler Power BI binær forudsigelse. Da du er interesseret i at forudsige besøgende, der skal foretage et køb, skal du vælge Sand under Vælg et målresultat. Du kan også angive forskellige mærkater, der skal bruges til resultaterne i den automatisk genererede rapport, der opsummerer resultaterne af modelvalideringen. Vælg derefter Næste.

    Skærmbillede, der viser skærmbilledet med binær forudsigelse.

  4. Power BI udfører en foreløbig scanning af et eksempel på dine data og foreslår input, der kan give mere nøjagtige forudsigelser. Hvis Power BI ikke anbefaler en kolonne, forklares det, hvorfor den ikke er ved siden af kolonnen. Du kan ændre valgene, så de kun indeholder de felter, som modellen skal undersøge, ved at markere eller fjerne markeringen i afkrydsningsfelterne ud for kolonnenavne. Vælg Næste for at acceptere input.

    Skærmbillede, der viser kolonnevalgene.

  5. I det sidste trin skal du navngive modellen Forudsigelse af købshensigt og vælge, hvor lang tid der skal bruges på oplæringen. Du kan reducere oplæringstiden for at se hurtige resultater eller øge tiden for at få den bedste model. Vælg derefter Gem og oplær for at starte oplæringen af modellen.

    Skærmbillede, der viser navngivning af modellen og valg af oplæringstid.

Hvis du får vist en fejl, der ligner legitimationsoplysningerne, som ikke blev fundet for datakilden, skal du opdatere dine legitimationsoplysninger, så Power BI kan score dataene. Hvis du vil opdatere dine legitimationsoplysninger, skal du vælge Flere indstillinger ... på overskriftslinjen og derefter vælge Indstillinger> Indstillinger.

Skærmbillede, der viser valg af Indstillinger.

Vælg dit dataflow under Dataflow, udvid Legitimationsoplysninger for datakilde, og vælg derefter Rediger legitimationsoplysninger.

Skærmbillede, der viser redigering af legitimationsoplysninger for dataflow.

Spor oplæringsstatus

Oplæringsprocessen starter med at prøve og normalisere dine historiske data og opdele din semantiske model i to nye enheder: Oplæringsdata for købshensigtsforudsigelse og Testdata for forudsigelse af købshensigt.

Afhængigt af størrelsen på den semantiske model kan oplæringsprocessen tage alt fra et par minutter op til den oplæringstid, du har valgt. Du kan bekræfte, at modellen oplæres og valideres via status for dataflowet. Status vises som en igangværende dataopdatering under fanen Semantiske modeller + dataflow i arbejdsområdet.

Skærmbillede, der viser modellen under oplæring.

Du kan se modellen under fanen Modeller til maskinel indlæring i dataflowet. Status angiver, om modellen er sat i kø til oplæring, er under oplæring eller oplæres. Når modeltræningen er fuldført, viser dataflowet en opdateret senest oplært tid og statussen Oplært.

Skærmbillede, der viser statussen Oplært og Senest oplært tidspunkt.

Gennemse modelvalideringsrapporten

Hvis du vil gennemse modelvalideringsrapporten, skal du under fanen Modeller til maskinel indlæring vælge ikonet Vis oplæringsrapport under Handlinger. I denne rapport beskrives det, hvordan din model til maskinel indlæring sandsynligvis vil fungere.

På siden Modelydeevne i rapporten skal du vælge Se de øverste forudsigelser for at få vist de øverste forudsigelser for din model. Du kan vælge en af forudsigelserne for at se, hvordan resultatfordelingen er knyttet til den pågældende forudsigelse.

Skærmbillede, der viser siden Modelydeevne.

Du kan bruge udsnittet Sandsynlighedstærskelsiden Modelydeevne til at undersøge modellens præcision og genkaldelsesindflydelse på modellen.

Skærmbillede, der viser udsnittet Sandsynlighedstærskel.

De andre sider i rapporten beskriver modellens statistiske ydeevnemålepunkter.

Rapporten indeholder også en side med oplæringsoplysninger, der beskriver kørslen Iterations, hvordan funktioner blev udtrukket fra inputtet, og hyperparametrene for den anvendte endelige model.

Anvend modellen på et dataflowobjekt

Vælg knappen Anvend model øverst i rapporten for at aktivere denne model. I dialogboksen Anvend kan du angive det destinationsobjekt, der har kildedataene, som modellen skal anvendes på. Vælg derefter Gem og anvend.

Skærmbillede, der viser anvendelse af modellen.

Når du anvender modellen, oprettes der to nye tabeller med suffiksene forbedret <model_name> og forbedrede <model_name> forklaringer. I dette tilfælde opretter anvendelse af modellen på tabellen Online besøgende :

  • Onlinebesøgende forbedrede forudsigelse af købshensigt, som omfatter det forudsagte output fra modellen.
  • Onlinebesøgende forbedrede forklaringer af forudsigelse af købshensigt, som indeholder de vigtigste postspecifikke nøglefaktorer for forudsigelsen.

Anvendelse af den binære forudsigelsesmodel tilføjer fire kolonner: Outcome, PredictionScore, PredictionExplanation og ExplanationIndex, hver med præfikset Purchase intent prediction.

Skærmbillede, der viser de fire nye kolonner.

Når opdateringen af dataflowet er fuldført, kan du vælge tabellen Onlinebesøgende enriched Purchase intent prediction for at få vist resultaterne.

Skærmbillede, der viser visning af resultaterne i tabellen Onlinebesøgende beriget forudsigelse af købshensigt.

Du kan også aktivere en hvilken som helst automatiseret model til maskinel indlæring i arbejdsområdet direkte fra Power Query-editor i dit dataflow. Hvis du vil have adgang til de automatiserede modeller til maskinel indlæring, skal du vælge Rediger for den tabel, du vil forbedre med indsigt fra din automatiserede model til maskinel indlæring.

Skærmbillede, der viser, hvordan du vælger Rediger for tabellen.

I Power Query-editor skal du vælge AI-indsigter på båndet.

Skærmbillede, der viser valg af AI-indsigt.

På skærmen AI-indsigt skal du vælge mappen Power BI Machine Learning Models i navigationsruden. Listen viser alle de modeller til maskinel indlæring, du har adgang til som Funktioner i Power Query. Inputparametrene for modellen til maskinel indlæring tilknyttes automatisk som parametre for den tilsvarende Funktion i Power Query. Den automatiske parametertilknytning sker kun, hvis navnene og datatyperne for parameteren er de samme.

Hvis du vil aktivere en model til maskinel indlæring, kan du vælge en af kolonnerne for den valgte model som input på rullelisten. Du kan også angive en konstantværdi, der skal bruges som input, ved at slå kolonneikonet til ud for inputlinjen.

Skærmbillede, der viser Power Query-funktionsbrowseren.

Vælg Anvend for at få vist eksemplet på outputtet af modellen til maskinel indlæring som nye kolonner i tabellen. Du kan også se aktiveringen af modellen under Anvendte trin for forespørgslen.

Skærmbillede, der viser visning af eksempelresultater i Power Query-editor.

Når du har gemt dit dataflow, aktiverer modellen automatisk, når dataflowet opdateres, for nye eller opdaterede rækker i objekttabellen.

Brug af det scorede output fra modellen i en Power BI-rapport

Hvis du vil bruge resultatet med score fra din model til maskinel indlæring, kan du oprette forbindelse til dit dataflow fra Power BI Desktop ved hjælp af dataflowconnectoren. Du kan nu bruge tabellen Onlinebesøgende med forbedret forudsigelse af købshensigt til at inkorporere forudsigelserne fra din model i Power BI-rapporter.

Begrænsninger

Der er nogle kendte problemer med at bruge gateways med automatiseret maskinel indlæring. Hvis du har brug for at bruge en gateway, er det bedst at oprette et dataflow, der importerer de nødvendige data via gatewayen først. Opret derefter et andet dataflow, der refererer til det første dataflow for at oprette eller anvende disse modeller.

Hvis dit AI-arbejde med dataflow mislykkes, skal du muligvis aktivere Kombiner hurtigt, når du bruger kunstig intelligens med dataflow. Når du har importeret tabellen, og før du begynder at tilføje AI-funktioner, skal du vælge Indstillinger på båndet Hjem, og i det vindue, der vises, skal du markere afkrydsningsfeltet ud for Tillad kombination af data fra flere kilder for at aktivere funktionen og derefter vælge OK for at gemme dit valg. Derefter kan du føje AI-funktioner til dit dataflow.

I dette selvstudium har du oprettet og anvendt en binær forudsigelsesmodel i Power BI ved at udføre disse trin:

  • Oprettede et dataflow med inputdataene.
  • Oprettede og oplærte en model til maskinel indlæring.
  • Gennemset modelvalideringsrapporten.
  • Anvendte modellen på et dataflowobjekt.
  • Lært, hvordan du bruger det scorede output fra modellen i en Power BI-rapport.

Du kan få flere oplysninger om automatisering af maskinel indlæring i Power BI under Automatiseret maskinel indlæring i Power BI.