Premium-functies van gegevensstromenPremium features of dataflows

Gegevensstromen worden ondersteund voor Power BI Pro- en Power BI Premium-gebruikers.Dataflows are supported for Power BI Pro and Power BI Premium users. Sommige functies zijn alleen beschikbaar met een Power BI Premium-abonnement.Some features are only available with a Power BI Premium subscription. In dit artikel worden de Premium-functies en de toepassingen ervan beschreven.This article describes and details the Premium-only features and their uses.

De volgende functies zijn alleen beschikbaar met Power BI Premium:The following features are available only with Power BI Premium:

  • Verbeterde berekeningsengineEnhanced compute engine
  • Direct QueryDirect Query
  • Berekende entiteitenComputed entities
  • Gekoppelde entiteitenLinked Entities
  • Incrementeel vernieuwenIncremental refresh

Deze functies worden allemaal gedetailleerd beschreven in de volgende secties.The following sections described each of these features in detail.

De verbeterde berekeningsengineThe enhanced compute engine

Dankzij de verbeterde berekeningsengine in Power BI kunnen Power BI Premium-abonnees hun capaciteit gebruiken om het gebruik van gegevensstromen te optimaliseren.The enhanced compute engine in Power BI enables Power BI Premium subscribers to use their capacity to optimize the use of dataflows. Het gebruik van de verbeterde berekeningsengine biedt de volgende voordelen:Using the enhanced compute engine provides the following advantages:

  • De vernieuwingstijd verkorten die nodig is voor langlopende ETL-stappen over berekende entiteiten, zoals samenvoegen, onderscheiden, filteren, en groeperen opDrastically reduces the refresh time required for long-running ETL steps over computed entities, such as performing joins, distinct, filters, and group by
  • DirectQuery-query's uitvoeren op entiteitenPerform DirectQuery queries over entities

De standaardinstelling voor de verbeterde berekeningsengine is Uit.By default, the enhanced compute engine is On. Als de verbeterde berekeningsengine niet is ingeschakeld, kunt u de volgende paragraaf raadplegen, waarin u instructies en antwoorden op veelgestelde vragen vindt.If the enhanced compute engine is not on, enabling the enhanced compute engine is described in the next section, along with answers to common questions.

De verbeterde berekeningsengine gebruikenUsing the enhanced compute engine

De verbeterde berekeningsengine wordt ingeschakeld op de pagina capaciteitsinstellingen in Power BI-service in de sectie gegevensstromen.The enhanced compute engine is enabled from the Capacity Settings page in the Power BI service, in the dataflows section. Standaard is de verbeterde berekeningsengine Uit.By default, the enhanced compute engine is Off. Als u de verbeterde berekeningsengine wilt inschakelen, schakelt u de wisselknop naar Aan, zoals weergegeven in de volgende afbeelding, en slaat u de instellingen op.To enable the enhanced compute engine, switch the toggle to On as shown in the following image, and save your settings.

De verbeterde berekeningsengine inschakelen

Belangrijk

De verbeterde berekeningsengine werkt alleen voor Power BI-capaciteiten van A3 en groter.The enhanced compute engine works only for Power BI capacities of A3 and larger.

Wanneer de verbeterde berekeningsengine is ingeschakeld, keert u terug naar gegevensstromen en ziet u een prestatieverbetering in een berekende entiteit die complexe bewerkingen uitvoert, zoals samenvoegen of groeperen op voor gegevensstromen die zijn gemaakt van bestaande gekoppelde entiteiten met dezelfde capaciteit.Once the enhanced compute engine is on, return to dataflows and you should see a performance improvement in any computed entity that performs complex operations, such as joins or group by operations for dataflows created from existing linked entities on the same capacity.

Als u optimaal gebruik wilt maken van de berekeningsengine, splitst u de ETL-fase op de volgende manier op in twee afzonderlijke gegevensstromen:To make best use of the compute engine, split the ETL stage into two separate dataflows, in the following way:

  • Gegevensstroom 1: deze gegevensstroom mag alleen alle vereiste gegevens uit een gegevensbron opnemen en in gegevensstroom 2 plaatsen.Dataflow 1 - this dataflow should only be ingesting all of the required from a data source, and placing it into dataflow 2.
  • Gegevensstroom 2: voer alle ETL-bewerkingen in deze tweede gegevensstroom uit, maar zorg ervoor dat u verwijst naar gegevensstroom 1, die dezelfde capaciteit moet hebben.Dataflow 2 - perform all ETL operations in this second dataflow, but ensure you're referencing Dataflow 1, which should be on the same capacity. Zorg er ook voor dat u bewerkingen uitvoert die eerst kunnen worden gevouwen (filteren, groeperen op, onderscheiden, samenvoegen), voordat u een andere bewerking uitvoert, om ervoor te zorgen dat de berekeningsengine wordt gebruikt.Also ensure you perform operations that can fold (filter, group by, distinct, join) first, before any other operation, to ensure the compute engine is utilized.

Veelgestelde vragen en antwoordenCommon questions and answers

Vraag: Ik heb de verbeterde berekeningsengine ingeschakeld, maar mijn vernieuwingen zijn trager.Question: I've enabled the enhanced compute engine, but my refreshes are slower. Hoe kan dat?Why?

Antwoord: Als u de verbeterde berekeningsengine inschakelt, zijn er twee mogelijke verklaringen die kunnen leiden tot tragere vernieuwingstijden:Answer: If you enable the enhanced compute engine, there are two possible explanations that could lead to slower refresh times:

  • Wanneer de verbeterde berekeningsengine is ingeschakeld, is er geheugen vereist om deze goed te laten functioneren.When the enhanced compute engine is enabled, it requires some memory to function properly. Het geheugen dat beschikbaar is om een vernieuwing uit te voeren, wordt zo gereduceerd, waardoor de kans toeneemt dat de bewerking voor vernieuwen in de wachtrij wordt geplaatst, wat op zijn beurt het aantal gegevensstromen vermindert die tegelijkertijd kunnen worden vernieuwd.As such, memory available to perform a refresh is reduced and therefore increases the likelihood of refreshes to be queued, which in turn reduces the number of dataflows that can refresh concurrently. Als u dit wilt verhelpen, vergroot u het geheugen dat is toegewezen voor gegevensstromen om ervoor te zorgen dat het beschikbare geheugen voor gelijktijdige gegevensstroomvernieuwingen hetzelfde blijft.To address this, when enabling enhanced compute, increase the memory assigned for dataflows to ensure the memory available for concurrent dataflow refreshes remains the same.

  • Een andere reden voor het vertraagde vernieuwingsproces is dat de berekeningsengine alleen op bestaande entiteiten werkt.Another reason you may encounter slower refreshes is that the compute engine only works on top of existing entities. Als uw gegevensstroom verwijst naar een gegevensbron die geen gegevensstroom is, ziet u geen verbetering.If your dataflow references a data source that's not a dataflow, you won't see an improvement. Er zal geen prestatieverhoging zijn, aangezien in sommige big data-scenario's de eerste inlezing van een gegevensbron langzamer zou zijn omdat de gegevens moeten worden doorgegeven aan de verbeterde berekeningsengine.There will be no performance increase, since in some big data scenarios, the initial read from a data source would be slower because the data needs to be passed to the enhanced compute engine.

Vraag: Ik zie de verbeterde berekeningsengine niet schakelen.Question: I cannot see the enhanced compute engine toggle. Hoe kan dat?Why?

Antwoord: De verbeterde berekeningsengine wordt in fasen naar regio's over de hele wereld uitgebracht.Answer: The enhanced compute engine is being released in stages to regions around the world. We verwachten dat tegen het eind van 2020 alle regio's worden ondersteund.We anticipate all regions will supported by the end of 2020.

Vraag: Wat zijn de ondersteunde gegevenstypen voor de berekeningsengine?Question: What are the supported data types for the compute engine?

Antwoord: De verbeterde berekeningsengine en gegevensstromen ondersteunen momenteel de volgende gegevenstypen.Answer: The enhanced compute engine and dataflows currently support the following data types. Als u voor uw gegevensstroom niet een van de volgende gegevenstypen gebruikt, treedt er een fout op tijdens het vernieuwen:If your dataflow doesn't use one of the following data types, an error occurs during refresh:

  • Datum/tijdDate/Time
  • Decimaal getalDecimal Number
  • TekstText
  • Geheel getalWhole number
  • Datum/tijd/zoneDate/Time/Zone
  • Waar/onwaarTrue/False
  • DatumDate
  • TijdTime

DirectQuery gebruiken met gegevensstromen in Power BI (preview)Use DirectQuery with dataflows in Power BI (preview)

U kunt DirectQuery gebruiken om rechtstreeks verbinding te maken met gegevensstromen en tegelijkertijd verbinding maken met uw gegevensstroom zonder dat u de gegevens erin hoeft te importeren.You can use DirectQuery to connect directly to dataflows, and thereby connect directly to your dataflow without having to import its data.

Door DirectQuery met gegevensstromen te gebruiken, worden de volgende verbeteringen aangebracht aan uw Power BI- en gegevensstroomprocessen:Using DirectQuery with dataflows enables the following enhancements to your Power BI and dataflows processes:

  • Vermijd het gebruik van afzonderlijke vernieuwingsschema's: DirectQuery maakt rechtstreeks verbinding met een gegevensstroom, waardoor het niet meer nodig is om een geïmporteerde gegevensset te maken.Avoid separate refresh schedules - DirectQuery connects directly to a dataflow, removing the need to create an imported dataset. Als zodanig betekent het dat als u DirectQuery met uw gegevensstromen gebruikt, u niet langer afzonderlijke vernieuwingsschema's nodig hebt voor de gegevensstroom en de gegevensset om er zeker van te zijn dat uw gegevens worden gesynchroniseerd.As such, using DirectQuery with your dataflows means you no longer need separate refresh schedules for the dataflow and the dataset to ensure your data is synchronized.

  • Filteren van gegevens: DirectQuery is handig als u wilt werken met een gefilterde weergave van gegevens in een gegevensstroom.Filtering data - DirectQuery is useful for working on a filtered view of data inside a dataflow. Als u gegevens wilt filteren en u wilt werken met een kleinere subset van de gegevens in uw gegevensstroom, kunt u DirectQuery (en de berekeningsengine) gebruiken om gegevensstroomgegevens te filteren en te werken met de gefilterde subset die u nodig hebt.If you want to filter data, and thereby work with a smaller subset of the data in your dataflow, you can use DirectQuery (and the compute engine) to filter dataflow data and work with the filtered subset you need.

DirectQuery gebruiken voor gegevensstromenUsing DirectQuery for dataflows

Het gebruik van DirectQuery met gegevensstromen is een preview-functie die beschikbaar is vanaf de versie van Power BI Desktop die in mei 2020 wordt uitgebracht.Using DirectQuery with dataflows is a preview feature available beginning with the May 2020 version of Power BI Desktop.

Er zijn ook vereisten voor het gebruik van DirectQuery met gegevensstromen:There are also prerequisites for using DirectQuery with dataflows:

  • Uw gegevensstroom moet zich in een werkruimte bevinden waarvoor Power BI Premium is ingeschakeldYour dataflow must reside within a Power BI Premium enabled workspace
  • De berekeningsengine moet zijn ingeschakeldThe compute engine must be turned on

DirectQuery inschakelen voor gegevensstromenEnable DirectQuery for dataflows

De status van de verbeterde berekeningsengine moet Geoptimaliseerd zijn, om uw gegevensstroom beschikbaar te kunnen maken voor toegang door DirectQuery.To ensure your dataflow is available for DirectQuery access, the enhanced compute engine must be in its optimized state. Stel de nieuwe optie Instellingen voor de verbeterde berekeningsengine in op Aan, als u DirectQuery wilt inschakelen voor gegevensstromen.To enable DirectQuery for dataflows, set the new Enhanced compute engine settings option to On. In de volgende afbeelding ziet u de instelling die juist is geselecteerd.The following image shows the setting properly selected.

Gedetailleerde controle voor DirectQuery

Zodra u deze instelling hebt toegepast, moet u de gegevensstroom vernieuwen om de optimalisatie van kracht te laten worden.Once you've applied that setting, refresh the dataflow for the optimization to take effect.

Overwegingen en beperkingen voor DirectQueryConsiderations and limitations for DirectQuery

Er zijn enkele bekende beperkingen met betrekking tot DirectQuery en gegevensstromen:There are a few known limitations with DirectQuery and dataflows:

  • Tijdens de previewperiode van deze functie, krijgen sommige klanten mogelijk te maken met time-outs of prestatieproblemen als ze DirectQuery met gegevensstromen gebruiken.During the preview period of this feature, some customers may experience timeouts or performance issues when using DirectQuery with dataflows. Tijdens deze previewperiode krijgen deze problemen de nodige aandacht.Such issues are being actively addressed during this preview period.

  • Samengestelde/gemengde modellen met import- en DirectQuery-gegevensbronnen worden momenteel niet ondersteund.Composite/mixed models that have import and DirectQuery data sources are currently not supported.

  • Grote gegevensstromen kunnen time-outproblemen hebben bij het weergeven van visualisaties.Large dataflows may have trouble with timeout issues when viewing visualizations. Voor grote gegevensstromen met time-outproblemen moet de Import-modus worden gebruikt.Large dataflows that run into trouble with timeout issues should use Import mode.

  • Onder de instellingen voor de gegevensbron geeft de gegevensstroomconnector ongeldige referenties weer als u DirectQuery gebruikt.Under data source settings, the dataflow connector will show invalid credentials if you are using DirectQuery. Dit heeft geen invloed op het gedrag en de gegevensset werkt goed.This does not affect the behavior, and the dataset will work properly.

Berekende entiteitenComputed entities

U kunt berekeningen in de opslag uitvoeren wanneer u gegevensstromen gebruikt met een Power BI Premium-abonnement.You can perform in-storage computations when using dataflows with a Power BI Premium subscription. Hierdoor kunt u berekeningen uitvoeren in bestaande gegevensstromen, en worden er resultaten geretourneerd die u in staat stellen om u te focussen op het maken en analyseren van rapporten.This lets you perform calculations on your existing dataflows, and return results that enable you to focus on report creation and analytics.

Berekende entiteit

Als u berekeningen in de opslag wilt uitvoeren, moet u eerst de gegevensstroom maken en gegevens verplaatsen naar deze Power BI-gegevensstroomopslag.To perform in-storage computations, you first must create the dataflow and bring data into that Power BI dataflow storage. Zodra u een gegevensstroom hebt die gegevens bevat, kunt u berekende entiteiten maken. Dit zijn entiteiten waarmee berekeningen in de opslag worden uitgevoerd.Once you have a dataflow that contains data, you can create computed entities, which are entities that perform in-storage computations.

Overwegingen en beperkingen van berekende entiteitenConsiderations and limitations of computed entities

  • Als u werkt met gegevensstromen die zijn gemaakt in het Azure Data Lake Storage Gen2-account van een organisatie, werken gekoppelde en berekende entiteiten alleen goed als de entiteiten zich in hetzelfde opslagaccount bevinden.When working with dataflows created in an organization's Azure Data Lake Storage Gen2 account, linked entities and computed entities only work properly when the entities reside in the same storage account.

Als best practice bij het uitvoeren van berekeningen op gegevens die worden samengevoegd door on-premises- en cloudgegevens, maakt u een nieuwe gegevensstroom voor elke bron (één voor on-premises en één voor de cloud) en maakt u vervolgens een derde gegevensstroom om deze twee gegevensbronnen samen te voegen of te berekenen.As a best practice, when doing computations on data joined by on-premises and cloud data, create a new dataflow for each source (one for on-premises and one for cloud) and then create a third dataflow to merge/compute over these two data sources.

Gekoppelde entiteitenLinked entities

U kunt verwijzen naar bestaande gegevensstromen bij gebruik met een Power BI Premium-abonnement, waarmee u een berekening kunt uitvoeren op deze entiteiten met behulp van berekende entiteiten of u kunt een 'enkele bron van waarheid'-tabel maken die u opnieuw kunt gebruiken in meerdere gegevensstromen.You can reference existing dataflows when using with a Power BI Premium subscription, which lets you either perform calculation on these entities using computed entities or allows you to create a "single source of the truth" table that you can reuse within multiple dataflows.

Incrementeel vernieuwenIncremental refresh

Gegevensstromen kunnen worden ingesteld om incrementeel te vernieuwen om te voorkomen dat alle gegevens bij elke vernieuwing moeten worden opgehaald.Dataflows can be set to refresh incrementally to avoid having to pull all the data on every refresh. Als u dit wilt doen, selecteert u de gegevensstroom en selecteert u vervolgens het pictogram voor incrementeel vernieuwen.To do so, select the dataflow then select the incremental refresh icon.

Incrementeel vernieuwen

Bij het instellen van incrementele vernieuwing worden er parameters aan de gegevensstroom toegevoegd om het datumbereik te specificeren.Setting incremental refresh adds parameters to the dataflow to specify the date range. Zie het artikel Incrementeel vernieuwen voor gedetailleerde informatie over het instellen van incrementele vernieuwing.For detailed information on how to set up incremental refresh, see the incremental refresh article.

Overwegingen voor wanneer incrementeel vernieuwen niet moet worden ingesteldConsiderations for when not to set incremental refresh

Stel in de volgende situaties een gegevensstroom niet in op incrementeel vernieuwen:Do not set a dataflow to incremental refresh in the following situations:

  • Voor gekoppelde entiteiten moet incrementeel vernieuwen niet worden gebruikt als deze naar een gegevensstroom verwijzen.Linked entities should not use incremental refresh if they reference a dataflow. Gegevensstromen bieden geen ondersteuning voor het vouwen van query's (zelfs niet als DirectQuery is ingeschakeld voor de entiteit).Dataflows does not support query folding (even if the entity is DirectQuery enabled).
  • Voor gegevenssets die naar gegevensstromen verwijzen, moet incrementeel vernieuwen niet worden gebruikt.Datasets referencing dataflows should not use incremental refresh. Vernieuwingen naar gegevensstromen zouden over het algemeen goed moeten presteren.Refreshes to dataflows should generally perform well. Als de vernieuwingen langer duren dan verwacht, kunt u overwegen de berekeningsengine en/of de modus DirectQuery te gebruiken.If the refreshes take longer than expected, consider using the compute engine and or DirectQuery mode.

Volgende stappenNext steps

De volgende artikelen bieden meer informatie over gegevensstromen en Power BI:The following articles provide more information about dataflows and Power BI: