Best practices voor het hergebruiken van gegevensstromen in omgevingen en werkruimten

In dit artikel wordt een verzameling best practices besproken voor het effectief en efficiënt hergebruiken van gegevensstromen. Lees dit artikel om ontwerpval en mogelijke prestatieproblemen te voorkomen bij het ontwikkelen van gegevensstromen voor hergebruik.

Gegevensstromen voor gegevenstransformatie scheiden van faserings-/extractiegegevensstromen

Als een gegevensstroom alle acties uitvoert, is het moeilijk om de entiteiten opnieuw te gebruiken in andere gegevensstromen of voor andere doeleinden. De beste gegevensstromen om opnieuw te gebruiken zijn de gegevensstromen die slechts enkele acties uitvoeren. Het maken van gegevensstromen die zijn gespecialiseerd in één specifieke taak is een van de beste manieren om ze opnieuw te gebruiken. Als u een set gegevensstromen hebt die u gebruikt als faseringsgegevensstromen, is de enige actie het extraheren van gegevens zoals ze zijn uit het bronsysteem. Deze gegevensstromen kunnen opnieuw worden gebruikt in meerdere andere gegevensstromen.

Als u gegevenstransformatiegegevensstromen hebt, kunt u deze opsplitsen in gegevensstromen die algemene transformaties doen. Elke gegevensstroom kan slechts enkele acties uitvoeren. Deze paar acties per gegevensstroom zorgen ervoor dat de uitvoer van die gegevensstroom opnieuw kan worden gebruikt door andere gegevensstromen.

Gegevensstroom die slechts enkele acties uitvoeren.

Afbeelding met gegevens die worden geëxtraheerd uit een gegevensbron naar faseringsgegevensstromen, waarbij de entiteiten worden opgeslagen in Dataverse- of Azure Data Lake-opslag, waarna de gegevens worden verplaatst naar transformatiegegevensstromen waar de gegevens worden getransformeerd en geconverteerd naar de datawarehouse-structuur, waarna de gegevens worden geladen in een Power BI-gegevensset.

Meerdere werkruimten gebruiken

Elke werkruimte (of omgeving) is alleen beschikbaar voor leden van die werkruimte. Als u al uw gegevensstromen in één werkruimte bouwt, minimaliseert u het hergebruik van uw gegevensstromen. U kunt enkele algemene werkruimten hebben voor gegevensstromen die bedrijfsbrede entiteiten verwerken. U kunt ook een werkruimte hebben voor gegevensstromen voor het verwerken van entiteiten in meerdere afdelingen. En u kunt ook enkele werkruimten hebben voor gegevensstromen die alleen in specifieke afdelingen kunnen worden gebruikt.

Afbeelding met afzonderlijke werkruimten.

De juiste toegangsniveaus voor werkruimten instellen

Als u toegang wilt verlenen tot gegevensstromen in andere werkruimten om de uitvoer van een gegevensstroom in een werkruimte te gebruiken, hoeft u ze alleen toegang te geven tot De werkruimte weergeven. Ga voor meer informatie over andere rollen in Power BI werkruimte naar Rollen in de nieuwe werkruimten.

Toegang tot de werkruimte.

Goedkeuring voor de gegevensstroom in Power BI

Er kunnen veel gegevensstromen worden gemaakt in een tenantorganisatie en het kan lastig zijn voor de gebruikers om te weten welke gegevensstroom het meest betrouwbaar is. Auteurs van een gegevensstroom, of degenen die bewerkingstoegang tot de gegevensstroom hebben, kunnen de gegevensstroom op drie niveaus onderschrijven: geen goedkeuring, gepromoveerd of gecertificeerd.

Deze goedkeuringsniveaus helpen gebruikers om betrouwbare gegevensstromen gemakkelijker en sneller te vinden. De gegevensstroom met een hoger goedkeuringsniveau wordt eerst weergegeven. De Power BI kan de mogelijkheid om gegevensstromen te onderschrijven aan het gecertificeerde niveau delegeren aan andere personen. Meer informatie: Goedkeuring - Promotie en certificering van Power BI inhoud

Goedkeuring voor gegevensstromen.

Entiteiten in meerdere gegevensstromen scheiden

U kunt meerdere entiteiten in één gegevensstroom hebben. Een van de redenen waarom u entiteiten in meerdere gegevensstromen zou kunnen splitsen, is wat u eerder in dit artikel hebt geleerd over het scheiden van de gegevensstromen voor gegevensingestie en gegevenstransformatie. Een andere goede reden om entiteiten in meerdere gegevensstromen te plaatsen, is wanneer u een ander vernieuwingsschema wilt dan andere tabellen.

In het voorbeeld in de volgende afbeelding moet de tabel Sales om de vier uur worden vernieuwd. De datumtabel hoeft slechts één keer per dag te worden vernieuwd om de huidige datumrecord bijgewerkt te houden. En een tabel voor producttoewijzing hoeft slechts één keer per week te worden vernieuwd. Als u al deze tabellen in één gegevensstroom hebt, hebt u slechts één vernieuwingsoptie voor alle tabellen. Als u deze tabellen echter opsplitst in meerdere gegevensstromen, kunt u het vernieuwen van elke gegevensstroom afzonderlijk plannen.

Gegevensstromen met verschillende schema's voor het vernieuwen.

Goede tabelkandidaten voor gegevensstroomentiteiten

Wanneer u oplossingen ontwikkelt met behulp Power Query in de bureaubladhulpprogramma's, kunt u zich de vraag stellen: Welke van deze tabellen zijn goede kandidaten om naar een gegevensstroom te worden verplaatst? De beste tabellen die naar de gegevensstroom moeten worden verplaatst, zijn tabellen die moeten worden gebruikt in meer dan één oplossing, of meer dan één omgeving of service. De tabel Date in de volgende afbeelding moet bijvoorbeeld worden gebruikt in twee afzonderlijke Power BI bestanden. In plaats van die tabel in elk bestand te dupliceren, kunt u de tabel in een gegevensstroom bouwen als een entiteit en deze opnieuw gebruiken in Power BI bestanden.

Gedeelde tabel die wordt gebruikt in een gegevensstroom.