Gegevensstroomopslag configureren voor gebruik van Azure Data Lake Gen 2

Gegevens die worden gebruikt met Power BI, worden standaard opgeslagen in de interne opslag die wordt geleverd door Power BI. Met de integratie van gegevensstromen en Azure Data Lake Storage Gen 2 (ADLS Gen2) kunt u uw gegevensstromen opslaan in het Azure Data Lake Storage Gen 2-account van uw organisatie. Hierdoor kunt u uw eigen opslag gebruiken om gegevensstromen Power BI maken en een verbinding tot stand brengen op tenant- of werkruimteniveau.

Redenen om de ADLS Gen 2-werkruimte of tenantverbinding te gebruiken

Nadat u uw gegevensstroom hebt gekoppeld, Power BI configureren en opslaan van een verwijzing, zodat u nu gegevens kunt lezen en schrijven naar uw eigen ADLS Gen 2. Power BI slaat de gegevens op in de CDM-indeling, waarmee metagegevens over uw gegevens worden vastgemaakt naast de werkelijke gegevens die door de gegevensstroom zelf worden gegenereerd. Hierdoor worden veel krachtige mogelijkheden ontgrendeld en kunnen uw gegevens en de bijbehorende metagegevens in CDM-indeling nu worden gebruikt voor scenario's voor extensibility, automatisering, bewaking en back-up. Door deze gegevens beschikbaar en algemeen toegankelijk te maken in uw eigen omgeving, kunt u de inzichten en gegevens die binnen de organisatie zijn gemaakt democratiseren. Het biedt u ook de mogelijkheid om meer oplossingen te maken die CDM-bewust zijn (zoals aangepaste toepassingen en oplossingen in Power Platform, Azure en oplossingen die beschikbaar zijn via partner- en ISV-ecosystemen) of gewoon een CSV kunnen lezen. Uw data engineers, gegevenswetenschappers en analisten kunnen nu werken met, gebruiken en hergebruiken van een gemeenschappelijke set gegevens die is gecureerd in ADLS Gen 2.

Er zijn twee manieren om te configureren welke ADLS Gen 2-opslag moet worden gebruikt: u kunt een door een tenant toegewezen ADLS Gen 2-account gebruiken of u kunt uw eigen ADLS Gen 2-opslag gebruiken op werkruimteniveau.

Vereisten

  • Als u uw eigen ADLS Gen 2-account wilt gebruiken, moet u eigenaarsmachtigingen hebben op de laag van het opslagaccount. Machtigingen op het niveau van de resourcegroep of het abonnement werken niet. Als u een beheerder bent, moet u nog steeds eigenaarsmachtigingen aan uzelf toewijzen. Momenteel wordt geen ondersteuning ADLS Gen2 Storage accounts achter een firewall.

  • Het opslagaccount moet worden gemaakt met de hiërarchische naamruimte (HNS) ingeschakeld.

  • Het opslagaccount moet worden gemaakt in dezelfde Azure Active Directory tenant als de Power BI tenant.

  • TLS (Transport Layer Security) versie 1.2 (of hoger) is vereist om uw eindpunten te beveiligen. Webbrowsers en andere clienttoepassingen die gebruikmaken van TLS-versies die lager zijn dan TLS 1.2, kunnen geen verbinding maken.

  • Het koppelen van een gegevensstroom met ADLS Gen 2 achter Multi-Factor Authentication (MFA) wordt niet ondersteund.

  • Ten slotte kunt u vanuit de beheerportal verbinding maken met ADLS Gen 2, maar als u rechtstreeks verbinding maakt met een werkruimte, moet u er eerst voor zorgen dat er geen gegevensstromen in de werkruimte zijn voordat u verbinding maakt.

In de volgende tabel worden de machtigingen voor ADLS en Power BI vereist voor ADLS Gen 2 en Power BI:

Actie ADLS-machtigingen Minimale Power BI machtigingen
Verbinding maken ADLS Gen 2 naar Power BI tenant Eigenaar Power BI beheerder
Verbinding maken ADLS Gen 2 naar werkruimte Eigenaar Werkruimtebeheerder
Gegevensstromen Power BI terugschrijven naar het verbonden ADLS-account Niet van toepassing Werkruimtebijdrager
Een Power BI gebruiken Niet van toepassing Werkruimteviewer

Verbinding maken met Een Azure Data Lake Gen 2 op werkruimteniveau

Navigeer naar een werkruimte die geen gegevensstromen heeft. Selecteer Werkruimte-instellingen. Selecteer het tabblad Azure-verbindingen en selecteer vervolgens de sectie Opslag.

Verbinding maken met Azure

De optie Standaard Azure-verbinding gebruiken is zichtbaar als de beheerder al een adls Gen 2-account aan een tenant heeft geconfigureerd. U hebt hiervoor twee opties:

  • Gebruik het door de tenant geconfigureerde ADLS Gen 2-account door het selectievakje Use the default Azure connection (De standaard Azure-verbinding gebruiken) te selecteren, of
  • Selecteer Verbinding maken Azure om naar een nieuw account Azure Storage wijzen.

Wanneer u Verbinding maken azure selecteert, Power BI een lijst met Azure-abonnementen waarvoor u toegang hebt opgehaald. Vul de vervolgkeuzen in en selecteer een geldig Azure-abonnement, een resourcegroep en een opslagaccount waarvoor de optie hiërarchische naamruimte is ingeschakeld. Dit is de ADLS Gen2 vlag.

abonnementsdetails

Als u de optie Opslaan hebt geselecteerd, hebt u de werkruimte nu verbonden met uw eigen ADLS Gen2 account. Power BI configureert het opslagaccount automatisch met de vereiste machtigingen en stelt het Power BI in waar de gegevens worden geschreven. Op dit punt worden de gegevens van elke gegevensstroom binnen deze werkruimte rechtstreeks naar dit bestandssysteem geschreven, dat kan worden gebruikt met andere Azure-services, zodat u één bron voor al uw organisatie- of afdelingsgegevens hebt.

Informatie over configuratie

Het configureren van Azure-verbindingen is een optionele instelling met aanvullende eigenschappen die optioneel kan worden ingesteld:

  • Opslag op tenantniveau, waarmee u een standaardinstelling kunt instellen, en/of
  • Opslag op werkruimteniveau, waarmee u de verbinding per werkruimte kunt opgeven

U kunt eventueel opslag op tenantniveau configureren als u alleen een gecentraliseerde data lake wilt gebruiken of als u wilt dat dit de standaardoptie is. We gaan niet automatisch de standaardinstelling gebruiken om flexibiliteit in uw configuratie toe te staan, dus u hebt de flexibiliteit om de werkruimten te configureren die naar eigen goedheid gebruikmaken van deze verbinding. Als u een adls Gen2-account configureert dat is toegewezen aan een tenant, moet u nog steeds elke werkruimte configureren voor het gebruik van deze standaardoptie.

U kunt eventueel opslagmachtigingen op werkruimteniveau configureren als een afzonderlijke optie, die volledige flexibiliteit biedt om een specifiek ADLS Gen 2-account in te stellen op werkruimtebasis.

Samengevat: als opslagmachtigingen op tenant- en werkruimteniveau zijn toegestaan, kunnen werkruimtebeheerders eventueel de standaard ADLS-verbinding gebruiken of ervoor kiezen om een ander opslagaccount te configureren dat los staat van de standaardinstelling. Als tenantopslag niet is ingesteld, kunnen werkruimtebeheerders adls-accounts op werkruimtebasis desgewenst configureren. Als ten slotte opslag op tenantniveau is geselecteerd en opslag op werkruimteniveau niet is toegestaan, kunnen werkruimtebeheerders eventueel hun gegevensstromen configureren om deze verbinding te gebruiken.

Informatie over de structuur en indeling voor ADLS Gen 2-werkruimteverbindingen

In het ADLS Gen 2-opslagaccount worden alle gegevensstromen opgeslagen in de powerbi-container van het bestandssysteem.

De structuur van de PowerBI-container ziet er als volgende uit: <workspace name>/<dataflow name>/model.json <workspace name>/<dataflow name>/model.json.snapshots/<all snapshots>

De locatie waar gegevensstromen gegevens opslaan in de maphiërarchie voor ADLS Gen 2 wordt bepaald door of de werkruimte zich in een gedeelde capaciteit of Premium bevindt. De bestandsstructuur na het vernieuwen voor elk capaciteitstype wordt weergegeven in de onderstaande tabel.

Premium-capaciteit Gedeelde capaciteit
<workspace name>/<dataflow name>/<table name>/<tablesnapshots> <workspace name>/<dataflow name>/<table name>/<tablesnapshots>

Hieronder vindt u een voorbeeld met behulp van de tabel Orders van het Odata-voorbeeld Northwind.

Het Northwind-voorbeeld met de tabel Orders

In de bovenstaande afbeelding:

  • Model.json is de meest recente versie van de gegevensstroom.
  • De model.json.snapshots zijn allemaal eerdere versies van de gegevensstroom. Dit is handig als u een eerdere versie van mashup of incrementele instellingen nodig hebt.
  • De table.snapshots.csv zijn de gegevens die u hebt verzameld na een vernieuwing. Dit is handig voor incrementele vernieuwingen en ook voor gedeelde vernieuwingen waarbij een gebruiker een time-outprobleem bij vernieuwen heeft vanwege de gegevensgrootte. Ze kunnen de meest recente momentopname bekijken om te zien hoeveel gegevens er in het CSV-bestand staan.

We schrijven alleen naar dit opslagaccount en verwijderen momenteel geen gegevens. Dit betekent dat zelfs na het loskoppelen we niet verwijderen uit het ADLS-account, zodat alle bovenstaande bestanden nog steeds worden opgeslagen.

Notitie

Een model.json-bestand kan verwijzen naar een ander model.json dat een andere gegevensstroom is in dezelfde werkruimte of in een gegevensstroom in een andere werkruimte. De enige keer dat een model.json naar een table.snapshot.csv verwijst, is voor incrementeel vernieuwen.

Extensibility for ADLS Gen 2 workspace connections (Uitvoegbaarheid voor ADLS Gen 2-werkruimteverbindingen)

Als u ADLS Gen 2 verbindt met Power BI, kunt u dit doen op het niveau van de werkruimte of tenant. Zorg ervoor dat u het juiste toegangsniveau hebt. Meer informatie in Vereisten.

De opslagstructuur voldoet aan de Common Data Model indeling. Meer informatie over de opslagstructuur en CDM vindt u in Wat is de opslagstructuur voor analytische gegevensstromen en Common Data Model en Azure Data Lake Storage Gen2.

Zodra de configuratie goed is uitgevoerd, zijn de gegevens en metagegevens in uw beheer. Een aantal toepassingen is op de hoogte van het CDM en de gegevens kunnen worden uitgebreid met behulp van Azure, PowerApps en PowerAutomate, evenals ecosystemen van derden door te voldoen aan de indeling of door de onbewerkte gegevens te lezen.

De verbinding van Azure Data Lake Gen 2 met een werkruimte of tenant verbreken

Als u een verbinding wilt verwijderen op een werkruimteniveau, moet u er eerst voor zorgen dat alle gegevensstromen in de werkruimte zijn verwijderd. Zodra alle gegevensstromen zijn verwijderd, selecteert u Verbinding verbreken in de werkruimte-instellingen. Hetzelfde geldt voor een tenant, maar u moet er eerst voor zorgen dat de verbinding van alle werkruimten met het tenantopslagaccount ook is verbroken voordat u de verbinding kunt verbreken op een tenantniveau.

Azure Data Lake Gen 2 uitschakelen

In de Beheerportal kunt u deze functie onder Gegevensstromen uitschakelen zodat gebruikers er geen toegang toe hebben, en kunt u de optie uitschakelen dat werkruimtebeheerders hun eigen Azure Storage-account gebruiken.

Terugdraaien van Azure Data Lake Gen 2

Zodra de gegevensstroomopslag is geconfigureerd voor het gebruik van Azure Data Lake Gen 2, is er geen manier om automatisch terug te keren. Het proces om terug te keren naar Power BI beheerde opslag is handmatig.

Als u de migratie naar Gen 2 wilt terugdraaien, moet u uw gegevensstromen verwijderen en deze opnieuw maken in dezelfde werkruimte. Omdat we geen gegevens uit ADLS Gen 2 verwijderen, gaat u naar de resource zelf en schoont u gegevens op. Hiervoor moeten de volgende stappen worden doorlopen.

  1. Exporteert een kopie van de gegevensstroom uit Power BI. Of kopieer het bestand model.json. Het bestand model.json wordt opgeslagen in ADLS.

  2. Verwijder de gegevensstromen.

  3. Ontkoppel ADLS.

  4. Maak de gegevensstromen opnieuw met behulp van importeren. Houd er rekening mee dat incrementele vernieuwingsgegevens (indien van toepassing) vóór het importeren moeten worden verwijderd. U kunt dit doen door de relevante partities in het bestand model.json te verwijderen.

  5. Beleid voor vernieuwen/incrementeel vernieuwen opnieuw maken configureren.

Verbinding maken met de gegevens met behulp van de ADLS Gen 2-connector

Het bereik van dit document beschrijft verbindingen van ADLS Gen 2-gegevensstromen en niet de Power BI ADLS Gen 2-connector. Werken met de ADLS Gen 2-connector is een afzonderlijk, mogelijk additief scenario. De ADLS-connector gebruikt gewoon ADLS als gegevensbron. Dit betekent dat het gebruik van PQO om query's uit te voeren op die gegevens niet de CDM-indeling hoeft te hebben, maar de gegevensindeling kan zijn die de klant wil. Voor meer informatie over dit scenario gaat u naar Gegevens analyseren in Azure Data Lake Storage Gen2 met behulp van Power BI.

Volgende stappen

De volgende artikelen bieden meer informatie over gegevensstromen en Power BI: