Del via


Power BI-bruksscenarioer: Selvbetjent dataforberedelse

Merk

Denne artikkelen er en del av planleggingsserien for power BI-implementering av artikler. Denne serien fokuserer hovedsakelig på Power BI-opplevelsen i Microsoft Fabric. Hvis du vil ha en innføring i serien, kan du se Planlegging av Power BI-implementering.

Dataforberedelse (noen ganger kalt ETL, som er et akronym for Extract, Transform og Load) innebærer ofte en betydelig mengde arbeid avhengig av kvaliteten og strukturen til kildedata. Det selvbetjente dataforberedelsesbruksscenarioet fokuserer på gjenbruk av dataforberedelsesaktiviteter av forretningsanalytikere. Den oppnår dette målet om gjenbruk ved å flytte dataforberedelsesarbeidet fra Power Query (i individuelle Power BI Desktop-filer) til Power Query Online (ved hjelp av en Power BI-dataflyt). Sentraliseringen av logikken bidrar til å oppnå en enkelt kilde til sannheten og reduserer innsatsnivået som kreves av andre innholdsopprettere.

Dataflyter opprettes ved hjelp av Power Query Online i ett av flere verktøy: Power Bi-tjeneste, Power Apps eller Dynamics 365 Customer Insights. En dataflyt opprettet i Power BI kalles en analytisk dataflyt. Dataflyter som er opprettet i Power Apps, kan enten være én av to typer: standard eller analytisk. Dette scenarioet dekker bare bruk av en Power BI-dataflyt som er opprettet og administrert i Power Bi-tjeneste.

Merk

Det selvbetjente dataforberedelsesscenarioet er ett av de selvbetjente BI-scenariene. Hvis du vil ha en fullstendig liste over selvbetjente scenarioer, kan du se artikkelen om bruksscenarioer i Power BI.

For kortfattethet dekkes ikke noen aspekter som er beskrevet i emnet innholdssamarbeid og leveringsscenarioer i denne artikkelen. Hvis du vil ha fullstendig dekning, kan du lese disse artiklene først.

Scenariodiagram

Diagrammet nedenfor viser en oversikt på høyt nivå over de vanligste brukerhandlingene og Power BI-komponentene som støtter selvbetjent dataforberedelse. Hovedfokuset er å opprette en dataflyt i Power Query Online som blir en datakilde for flere semantiske modeller (tidligere kjent som datasett). Målet er at mange semantiske modeller skal dra nytte av dataforberedelsen som gjøres én gang av dataflyten.

Diagrammet viser selvbetjent dataforberedelse, som handler om dataflyter for sentralisering av datarensing og transformasjonsarbeid. Elementer i diagrammet er beskrevet i tabellen nedenfor.

Tips

Vi oppfordrer deg til å laste ned scenariodiagrammet hvis du vil bygge det inn i presentasjonen, dokumentasjonen eller blogginnlegget, eller skrive det ut som en veggplakat. Fordi det er et SVG-bilde (Scalable Vector Graphics), kan du skalere det opp eller ned uten tap av kvalitet.

Scenariodiagrammet viser følgende brukerhandlinger, verktøy og funksjoner:

Vare Beskrivelse
Element 1. Dataflytoppretteren utvikler en samling tabeller i en Power BI-dataflyt. For en dataflyt som er ment for gjenbruk, er det vanlig (men ikke nødvendig) at oppretteren tilhører et sentralisert team som støtter brukere på tvers av organisasjonsgrenser (for eksempel IT, enterprise BI eller Center of Excellence).
Element 2. Dataflyten kobler til data fra én eller flere datakilder.
Element 3. Noen datakilder kan kreve en lokal datagateway eller VNet-gateway for dataoppdatering, for eksempel de som befinner seg i et privat organisasjonsnettverk. Disse gatewayene brukes både for redigering av dataflyten i Power Query Online, som er en nettbasert versjon av Power Query, og oppdatering av dataflyten.
Element 4. Dataflyter utvikles ved hjelp av Power Query Online. Det velkjente Power Query-grensesnittet i Power Query Online gjør overgangen fra Power BI Desktop enkel.
Element 5. Dataflyten lagres som et element i et arbeidsområde som er dedikert til lagring og sikring av dataflyter. Det kreves en tidsplan for oppdatering av dataflyt for å holde dataene oppdaterte (ikke avbildet i scenariodiagrammet).
Element 6. Dataflyten kan brukes på nytt som en datakilde av innholdsopprettere, og av andre semantiske modeller som kan ligge i forskjellige arbeidsområder.
Element 7. Den semantiske modelloppretteren utvikler en ny datamodell ved hjelp av Power BI Desktop. Den semantiske modelloppretteren kan bruke de fullstendige funksjonene i Power Query i Power BI Desktop. De kan eventuelt bruke andre spørringstrinn for ytterligere å transformere dataflytdataene eller slå sammen dataflytutdataene.
Element 8. Når du er klar, publiserer den semantiske modelloppretteren Power BI Desktop-filen (PBIX) som inneholder datamodellen til Power Bi-tjeneste. Oppdatering for den semantiske modellen administreres separat fra dataflyten (ikke avbildet i scenariodiagrammet).
Element 9. Andre selvbetjente semantiske modellopprettere kan opprette nye datamodeller i Power BI Desktop ved hjelp av dataflyten som datakilde.
Element 10. I administrasjonsportalen kan Power BI-administratorer konfigurere Azure-tilkoblinger til å lagre dataflytdata i Azure Data Lake Storage Gen2 -kontoen (ADLS Gen2). Innstillinger inkludere å tilordne en lagringskonto på leiernivå og aktivere lagringstillatelser på arbeidsområdenivå.
Element 11. Power BI-administratorer administrerer innstillinger i administrasjonsportalen.
Element 12. Som standard lagrer dataflyter data ved hjelp av intern lagring som administreres av Power Bi-tjeneste. Datautdata fra dataflyten kan eventuelt lagres i organisasjonens ADLS Gen2-konto . Denne typen lagringsplass kalles noen ganger bring your own data lake. Fordelen med å lagre dataflytdata i datasjøen er at de kan nås og brukes av andre BI-verktøy.
Element 13. Dataflytdata i ADLS Gen2 lagres i en Power BI-spesifikk beholder kjent som filsystem. I denne beholderen finnes det en mappe for hvert arbeidsområde. En undermappe opprettes for hver dataflyt, så vel som for hver tabell. Power BI genererer et øyeblikksbilde hver gang dataflytdataene oppdateres. Øyeblikksbilder er selvbeskrivende, bestående av metadata og datafiler.
Element 14. Azure-administratorer administrerer tillatelser for organisasjonens ADLS Gen2-konto.
Element 15. Power BI-administratorer overvåker og overvåker aktiviteten i Power Bi-tjeneste.

Tips

Vi anbefaler at du også ser gjennom det avanserte bruksscenarioet for dataforberedelser . Det bygger på konsepter introdusert i dette scenariet.

Viktige punkter

Nedenfor finner du noen viktige punkter for å fremheve selvbetjent dataforberedelsesscenario.

Dataflyt

En dataflyt består av en samling tabeller (også kalt enheter). Alt arbeid for å opprette en dataflyt gjøres i Power Query Online. Du kan opprette dataflyter i flere produkter, inkludert Power Apps, Dynamics 365 Customer Insights og Power BI.

Merk

Du kan ikke opprette dataflyter i et personlig arbeidsområde i Power Bi-tjeneste.

Støtte semantiske modellopprettere

Scenariodiagrammet viser bruk av en Power BI-dataflyt for å gi klargjorte data til andre selvbetjente semantiske modellopprettere.

Merk

Semantisk modell bruker dataflyten som datakilde. En rapport kan ikke koble direkte til en dataflyt.

Her er noen fordeler ved å bruke Power BI-dataflyter:

  • Semantiske modellopprettere bruker det samme kjente Power Query-grensesnittet som finnes i Power BI Desktop.
  • Dataforberedelse og datatransformasjonslogikk definert av en dataflyt kan brukes på nytt mange ganger fordi den er sentralisert.
  • Når det gjøres endringer i dataforberedelseslogikken i dataflyten, kan det hende den ikke krever oppdatering av avhengige datamodeller. Hvis du fjerner eller gir nytt navn til kolonner eller endrer kolonnedatatyper, må du oppdatere avhengige datamodeller.
  • Forhåndsforberedte data kan enkelt gjøres tilgjengelig for Power BI-semantiske modellopprettere. Gjenbruk er spesielt nyttig for vanlige tabeller – spesielt dimensjonstabeller, for eksempel dato, kunde og produkt.
  • Innsatsnivået som kreves av semantiske modellopprettere, reduseres fordi dataforberedelsesarbeidet er koblet fra datamodelleringsarbeidet.
  • Færre semantiske modellopprettere trenger direkte tilgang til kildesystemer. Kildesystemer kan være komplekse for spørring og kan kreve spesialiserte tilgangstillatelser.
  • Antall oppdateringer som kjøres på kildesystemer, reduseres fordi semantisk modell oppdaterer koble til dataflyter, og ikke til kildesystemene som dataflyter trekker ut data fra.
  • Dataflytdata representerer et øyeblikksbilde i tid, og fremmer konsekvens når de brukes av mange semantiske modeller.
  • Dekoding av dataforberedelseslogikk i dataflyter kan bidra til å forbedre semantisk modelloppdatering. Hvis en oppdatering av dataflyt mislykkes, oppdateres semantiske modeller ved hjelp av den siste vellykkede dataflytoppdateringen.

Tips

Opprett dataflyttabeller ved å bruke utformingsprinsipper for stjerneskjema . En utforming av stjerneskjema er godt egnet til å opprette semantiske Modeller for Power BI. Begrens også dataflytutdataene for å bruke egendefinerte navn og bruke bestemte datatyper. Disse teknikkene fremmer konsistens i avhengige semantiske modeller og bidrar til å redusere mengden arbeid som semantiske modellopprettere må gjøre.

Fleksibilitet for semantisk modelloppretter

Når en semantisk modelloppretter kobler til en dataflyt i Power BI Desktop, er ikke oppretteren begrenset til å bruke nøyaktig dataflytutdata. De har fortsatt den fullstendige funksjonaliteten til Power Query som er tilgjengelig for dem. Denne funksjonaliteten er nyttig hvis ytterligere dataforberedelsesarbeid kreves, eller dataene krever ytterligere transformasjon.

Avanserte funksjoner for dataflyt

Det finnes mange utformingsteknikker, mønstre og anbefalte fremgangsmåter for dataflyter som kan ta dem fra selvbetjent til bedriftsklar. Dataflyter i et arbeidsområde som har lisensmodusen satt til Premium per bruker, Premium-kapasitet eller Fabric-kapasitet, kan dra nytte av avanserte funksjoner.

Viktig

Til tider refererer denne artikkelen til Power BI Premium eller dets kapasitetsabonnementer (P SKU-er). Vær oppmerksom på at Microsoft for øyeblikket konsoliderer kjøpsalternativer og trekker tilbake Power BI Premium per kapasitet sKU-er. Nye og eksisterende kunder bør vurdere å kjøpe Fabric-kapasitetsabonnementer (F SKU-er) i stedet.

Hvis du vil ha mer informasjon, kan du se Viktige oppdateringer som kommer til Power BI Premium-lisensiering og vanlige spørsmål om Power BI Premium.

Merk

En av de avanserte funksjonene er trinnvis oppdatering for dataflyter. Selv om trinnvis oppdatering for semantiske modeller er en Power BI Pro-funksjon, er trinnvis oppdatering for dataflyter en Premium-funksjon.

Hvis du vil lære mer om avanserte funksjoner for dataflyt, kan du se det avanserte bruksscenarioet for klargjøring av data.

Oppdatering av dataflyt og semantisk modell

Som tidligere nevnt er en dataflyt en datakilde for semantiske modeller. I de fleste tilfeller er flere tidsplaner for dataoppdatering involvert: én for dataflyten og én for hver semantiske modell. Alternativt er det mulig å bruke DirectQuery fra den semantiske modellen til dataflyten, som er en Premium-funksjon (ikke avbildet i scenariodiagrammet).

Azure Data Lake Storage Gen2

I Microsoft Azure er en ADLS Gen2-konto en bestemt type Azure Storage-konto som har hierarkisk navneområde aktivert. ADLS Gen2 har ytelses-, administrasjons- og sikkerhetsfordeler for driftsanalysearbeidsbelastninger. Som standard bruker Power BI-dataflyter intern lagring, som er en innebygd data lake-konto som administreres av Power Bi-tjeneste. Organisasjoner kan eventuelt ta med sin egen datainnsjø ved å koble til organisasjonens ADLS Gen2-konto.

Her er noen fordeler ved å bruke organisasjonens data lake-konto:

  • Dataene som er lagret av en Power BI-dataflyt, kan (eventuelt) åpnes fra datasjøen av andre brukere eller prosesser. Det er nyttig når gjenbruk av dataflyt skjer utover Power BI. Dataene kan for eksempel åpnes av Azure Data Factory.
  • Dataene i datasjøen kan (eventuelt) administreres av andre verktøy eller systemer. I dette tilfellet kan Power BI bruke dataene i stedet for å administrere dem (ikke avbildet i scenariodiagrammet).

Lagringsplass på leiernivå

Azure-tilkoblingsdelen i administrasjonsportalen inneholder en innstilling for å konfigurere en tilkobling til en ADLS Gen2-konto. Hvis du konfigurerer denne innstillingen, kan du ta med din egen datainnsjø. Når du er konfigurert, kan du angi arbeidsområder til å bruke denne data lake-kontoen.

Viktig

Angivelse av Azure-tilkoblinger betyr ikke at alle dataflyter i Power BI-leieren lagres i denne kontoen som standard. Hvis du vil bruke en eksplisitt lagringskonto (i stedet for intern lagringsplass), må hvert arbeidsområde være spesielt tilkoblet.

Det er viktig å angi Azure-tilkoblinger for arbeidsområdet før du oppretter dataflyter i arbeidsområdet. Den samme Azure-lagringskontoen brukes for semantiske sikkerhetskopier for Power BI-semantiske modeller.

Lagring på arbeidsområdenivå

En Power BI-administrator kan konfigurere en innstilling for å tillate lagringstillatelser på arbeidsområdenivå (i delen Azure-tilkoblinger i administrasjonsportalen). Når denne innstillingen er aktivert, kan administratorer av arbeidsområdet bruke en annen lagringskonto enn den som er definert på leiernivå. Aktivering av denne innstillingen er spesielt nyttig for desentraliserte forretningsenheter som administrerer sin egen datainnsjø i Azure.

Merk

Lagringstillatelsen på arbeidsområdenivå i administrasjonsportalen gjelder for alle arbeidsområder i Power BI-leieren.

Common Data Model-format

Dataene i en ADLS Gen2-konto lagres i CDM-strukturen (Common Data Model). CDM-strukturen er et metadataformat som dikterer hvordan det selvbeskrevne skjemaet, i tillegg til dataene, lagres. CDM-strukturen muliggjør semantisk konsekvens i et format som er standardisert for deling av data på tvers av mange programmer (ikke avbildet i scenariodiagrammet).

Publiser til separate arbeidsområder

Det er flere fordeler med å publisere en dataflyt til et arbeidsområde som er atskilt fra der de avhengige semantiske modellene er lagret. En fordel er klarhet i hvem som er ansvarlig for å administrere hvilke typer innhold (hvis du har forskjellige personer som håndterer ulike ansvarsområder). En annen fordel er at bestemte arbeidsområdetillatelser kan tilordnes for hver type innhold.

Merk

Du kan ikke opprette dataflyter i et personlig arbeidsområde i Power Bi-tjeneste.

Det avanserte dataforberedelsesbruksscenarioet beskriver hvordan du konfigurerer flere arbeidsområder for å gi bedre fleksibilitet når du støtter selvbetjente opprettere på bedriftsnivå.

Konfigurasjon av gateway

Vanligvis kreves en lokal datagateway for å koble til datakilder som befinner seg i et privat organisasjonsnettverk eller et virtuelt nettverk.

En datagateway kreves når:

  • Redigere en dataflyt i Power Query Online som kobler til private organisasjonsdata.
  • Oppdaterer en dataflyt som kobler til private organisasjonsdata.

Tips

Dataflyter krever en sentralisert datagateway i standardmodus. En gateway i personlig modus støttes ikke når du arbeider med dataflyter.

Systemtilsyn

Aktivitetsloggen registrerer brukeraktiviteter som forekommer i Power Bi-tjeneste. Power BI-administratorer kan bruke aktivitetsloggdataene som samles inn til å utføre overvåking for å hjelpe dem med å forstå bruksmønstre og innføring. Aktivitetsloggen er også verdifull for å støtte styringsarbeid, sikkerhetsrevisjoner og samsvarskrav. Med et selvbetjent dataforberedelsesscenario er det spesielt nyttig å spore bruk av dataflyter.

I den neste artikkelen i serien kan du lære mer om det avanserte bruksscenarioet for dataforberedelse .