Konfiguration af dataflowlager til brug af Azure Data Lake Gen 2

Data, der bruges sammen med Power BI, gemmes som standard i et internt lager, der leveres af Power BI. Med integrationen af dataflow og Azure Data Lake Storage Gen 2 (ADLS Gen2) kan du gemme dine dataflow på din organisations Azure Data Lake Storage Gen2-konto. det giver dig mulighed for at "bruge dit eget lager" til at Power BI dataflows og oprette en forbindelse på lejer-eller arbejdsområde niveau.

Årsager til at bruge ADLS gen 2-arbejdsområdet eller lejer forbindelse

når du har knyttet din data flow, konfigurerer og gemmer Power BI en reference, så du nu kan læse og skrive data til din egen ADLS Gen 2. Power BI gemmer dataene i CDM-formatet, der henter metadata om dine data ud over de faktiske data, der genereres af data flow. Dette låser op for mange effektive funktioner og gør det muligt for dine data og de tilknyttede metadata i CDM-format til nu at håndtere udvidelsesmuligheder, automatisering, overvågning og sikkerhedskopierings scenarier. Ved at gøre disse data tilgængelige og offentligt tilgængelige i dit eget miljø gør det det muligt for dig at demokratisk indsigten og de data, der er oprettet i organisationen. Det gør det også muligt for dig at oprette flere løsninger, der enten er tilknyttet CDM (f. eks. brugerdefinerede programmer og løsninger i Power platform, Azure og dem, der er tilgængelige via partner-og ISV-økosystemer) eller blot kan læse en CSV-fil. Dine data teknikere, data eksperter og analytikere kan nu arbejde med, bruge og genbruge et fælles sæt data, der er overvåget i ADLS gen 2.

Der er to måder at konfigurere, hvilket ADLS gen 2-lager du skal bruge: du kan bruge en lejer tildelt ADLS-konto, eller du kan hente din egen ADLS gen 2-butik på et arbejdsområde niveau.

Forudsætninger

  • Hvis du vil hente din egen ADLS gen 2-konto, skal du have ejertilladelse på Lagerkonto laget. Tilladelser til ressourcegruppen eller abonnements niveauet vil ikke virke. Hvis du er administrator, skal du stadig tildele dig selv ejertilladelse. understøtter i øjeblikket ikke ADLS Gen2 Storage konti bag en firewall.

  • Lagerkontoen skal oprettes med det hierarkiske navneområde aktiveret.

  • lagerkontoen skal oprettes i samme Azure Active Directory lejer som Power BI lejer.

  • TLS (Transport Layer Security) version 1,2 (eller nyere) kræves for at sikre dine slutpunkter. Webbrowsere og andre klientprogrammer, der bruger TLS-versioner, der er ældre end TLS 1,2, kan ikke oprette forbindelse.

  • Vedhæftning af et data flow med ADLS gen 2 bag multi-Factor Authentication (MFA) understøttes ikke.

  • Til sidst kan du oprette forbindelse til alle ADLS gen 2 fra administrations portalen, men hvis du opretter forbindelse direkte til et arbejdsområde, skal du først sikre, at der ikke er nogen dataflows i arbejdsområdet, før du opretter forbindelse.

i følgende tabel beskrives tilladelserne for ADLS og for Power BI, der kræves til ADLS Gen 2 og Power BI:

Handling ADLS tilladelser Minimum Power BI tilladelser
Forbind ADLS Gen 2 til Power BI lejer Ejer Power BI administrator
Forbind ADLS gen 2 til arbejdsområde Ejer Administration af arbejdsområde
opret Power BI dataflows, og skriv tilbage til tilsluttet ADLS-konto Ikke tilgængelig Bidragyder til arbejdsområde
forbrug Power BI data flow Ikke tilgængelig Arbejdsområdelæsere

Oprettelse af forbindelse til en Azure Data Lake gen 2 på et arbejdsområde niveau

Gå til et arbejdsområde, der ikke har nogen dataflows. Vælg Indstillinger for arbejdsområde. Vælg fanen Azure Connections, og vælg derefter afsnittet Lager.

Opret forbindelse til Azure

Indstillingen Brug standardforbindelse til Azure er synlig, hvis administratoren allerede har konfigureret en lejer tildelt ADLS gen 2-konto. Du har to muligheder:

  • Brug den lejer konfigurerede ADLS gen 2-konto ved at vælge feltet Brug standard Azure-forbindelsen, eller
  • vælg Forbind til Azure for at pege på en ny Azure Storage konto.

når du vælger Forbind til Azure, henter Power BI en liste over Azure-abonnementer, som du har adgang til. Udfyld rullelisten, og vælg et gyldigt Azure-abonnement, en gyldig ressourcegruppe og en Lagerkonto, hvor den hierarkiske indstilling af navneområdet er aktiveret, hvilket er ADLS Gen2s flaget.

abonnementsdetaljer

Når du har valgt, skal du vælge Gem , så har du nu oprettet forbindelse til arbejdsområdet med din egen ADLS Gen2-konto. Power BI konfigurerer automatisk lagerkontoen med de påkrævede tilladelser, og konfigurerer det Power BI-filsystem, hvor dataene skal skrives. På dette tidspunkt skrives alle dataflowdata i dette arbejdsområde direkte til dette filsystem, som kan bruges sammen med andre Azure-tjenester, så der oprettes en enkelt kilde til alle dine organisations- eller afdelingsdata.

Om konfiguration

Konfiguration af Azure-forbindelser er en valgfri indstilling med yderligere egenskaber, der også kan angives:

  • Lager på lejerniveau, hvor du kan angive en standardværdi og/eller
  • Lager på arbejdsområder, hvor du kan angive forbindelsen pr. arbejdsområde

Du kan vælge at konfigurere lager på lejerniveau, hvis du kun vil bruge en central data sø, eller hvis det skal være standardindstillingen. Vi starter ikke automatisk med at bruge standarden for at tillade fleksibilitet i din konfiguration, så du har fleksibilitet til at konfigurere de arbejdsområder, der bruger denne forbindelse, efterhånden som du får vist tilpasning. Hvis du konfigurerer en lejer tildelt ADLS gen 2-konto, skal du stadig konfigurere hvert enkelt arbejdsområde for at bruge denne standardindstilling.

Du kan også vælge at konfigurere lager tilladelser til arbejdsområder som en separat indstilling, hvilket giver en komplet fleksibilitet til at angive en bestemt ADLS gen 2-konto i et arbejdsområde.

Hvis du vil opsummere, hvis lager tilladelser på lejerniveau og lager på arbejdsområde er tilladt, kan arbejdsområde administratorer vælge at bruge standard ADLS-forbindelsen eller vælge at konfigurere en anden Lagerkonto, der er adskilt fra standardindstillingen. Hvis lejer lageret ikke er angivet, kan arbejdsområde administratorer vælge at konfigurere ADLS-konti på et arbejdsområde efter basis. Og endelig er det ikke tilladt at bruge lager på lejerniveau, og lager på arbejdsområder er ikke tilladt, og derefter kan arbejdsområde administratorer vælge at konfigurere deres dataflows til at bruge denne forbindelse.

Forstå strukturen og formatet for forbindelser til ADLS gen 2-arbejdsområder

I ADLS gen 2-lagerkontoen gemmes alle dataflows i objektbeholderen powerbi i filsystemet.

Strukturen af powerbi -objektbeholderen ser ud på følgende måde: <workspace name>/<dataflow name>/model.json <workspace name>/<dataflow name>/model.json.snapshots/<all snapshots>

den placering, hvor dataflows store-data i mappehierarkiet for ADLS Gen 2, bestemmes af, om arbejdsområdet er placeret i delt kapacitet eller Premium kapacitet. Filstrukturen efter opdatering for hver Kapacitetstype vises i nedenstående tabel.

Premium-kapacitet Delt kapacitet
<workspace name>/<dataflow name>/<table name>/<tablesnapshots> <workspace name>/<dataflow name>/<table name>/<tablesnapshots>

Nedenfor kan du finde et eksempel ved hjælp af tabellen Orders i eksemplet Northwind OData.

Eksempel på Northwind, der viser tabellen orders

I billedet ovenfor:

  • Modellen. JSON er den nyeste version af data flow.
  • Model. JSON. Snapshots er alle tidligere versioner af data flow. Dette er nyttigt, hvis du har brug for en tidligere miks eller trinvise indstillinger.
  • table.snapshots.csv er de data, du har fået fra en opdatering. Dette er nyttigt i forbindelse med trinvise opdateringer og også for delte opdateringer, hvor en bruger kører i et problem med timeout for opdatering, på grund af datastørrelsen. De kan se det seneste snapshot for at se, hvor mange data der er i CSV-filen.

Vi skriver kun til denne Lagerkonto og sletter ikke data i øjeblikket. Det betyder, at selvom fjernelse ikke slettes fra ADLS-kontoen, så gemmes alle de ovennævnte filer stadig.

Bemærk

En model. JSON-fil kan referere til en anden model. JSON, der er en anden data flow i det samme arbejdsområde eller i et data flow i et andet arbejdsområde. Det eneste tidspunkt, hvor en model. JSON refererer til en table.snapshot.csv for at få en trinvis opdatering.

Udvidelse til forbindelser til ADLS gen 2-arbejdsområder

hvis du opretter forbindelse mellem ADLS Gen 2 og Power BI, kan du gøre det på arbejdsområdet eller på lejerniveau. Sørg for, at du har det rette adgangsniveau. Få mere at vide i forudsætninger.

Lagerstrukturen overholder det almindelige data model format. få mere at vide om lagerstrukturen og CDM ved at besøge hvad er lagerstrukturen for analyse dataflows og Common Data Model og Azure Data Lake Storage Gen2.

Når korrekt er konfigureret, er dataene og metadataene i dit kontrolelement. Der er en række programmer, der er opmærksomme på CDM, og dataene kan forlænges ved hjælp af Azure, PowerApps og PowerAutomate, og det kan være en tredjeparts økosystem enten ved at overholde formatet eller ved at læse de rå data.

Fjernelse af Azure Data Lake Gen 2 fra et arbejdsområde eller en lejer

Hvis du vil fjerne en forbindelse på et arbejdsområdeniveau, skal du først sikre dig, at alle dataflow i arbejdsområdet er slettet. Når alle dataflow er fjernet, skal du vælge Afbryd forbindelsen i indstillingerne for arbejdsområdet. Det samme gælder for en lejer, men du skal først sikre dig, at forbindelsen mellem alle arbejdsområder og lejerlagerkontoen også er afbrudt, før du kan afbryde forbindelsen på lejerniveau.

Disabling Azure Data Lake Gen 2

Under Dataflow i Administrationsportal kan du deaktivere adgangen for brugere, så de ikke kan bruge denne funktion, og forhindre arbejdsområdeadministratorer i at medbringe deres eget Azure Storage.

Tilbagedan fra Azure Data Lake Gen 2

Når dataflowlageret er konfigureret til at bruge Azure Data Lake Gen 2, er det ikke muligt automatisk at gendanne det. Processen, der skal vende tilbage Power BI administreret lager, er manuel.

Hvis du vil gendanne den overførsel, du har foretaget til Gen 2, skal du slette dine dataflows og genoprette dem i det samme arbejdsområde. Da vi derefter ikke sletter data fra ADLS Gen 2, skal du gå til selve ressourcen og rydde op i dataene. Dette omfatter følgende trin.

  1. Eksportér en kopi af dataflowet fra Power BI. Du kan også kopiere filen model.json. Filen model.json er gemt i ADLS.

  2. Slet dataflow.

  3. Fraach ADLS.

  4. Genskab dataflowene ved hjælp af Importér. Bemærk, at data for trinvis opdatering (hvis det er relevant) skal slettes før import. Det kan du gøre ved at slette de relevante partitioner i filen model.json.

  5. Konfigurer politikker for opdatering/genskabelse af trinvis opdatering.

Oprettelse af forbindelse til dataene ved hjælp af ADLS Gen 2-connectoren

I dette dokument beskrives ADLS Gen 2-dataflowforbindelser og ikke forbindelsen Power BI ADLS Gen 2. Arbejde med ADLS Gen 2-connectoren er et separat, muligvis additivt scenarie. ADLS-connectoren bruger blot ADLS som datakilde. Det betyder, at brugen af PQO til at forespørge på disse data ikke behøver at være i CDM-format, men det kan være et hvilket som helst dataformat, kunden ønsker. Få mere at vide om dette scenarie ved at gå til Analysér data i Azure Data Lake Storage Gen2 ved hjælp af Power BI.

Næste trin

Du kan finde flere oplysninger om dataflow og Power BI i følgende artikler: