Premiumfunktionen von DataflowsPremium features of dataflows

Dataflows werden für Power BI Pro- und Power BI Premium-Benutzer unterstützt.Dataflows are supported for Power BI Pro and Power BI Premium users. Einige Features sind nur in Verbindung mit einem Power BI Premium-Abonnement verfügbar.Some features are only available with a Power BI Premium subscription. In diesem Artikel werden nur die Premium-Features und deren Verwendungszwecke beschrieben.This article describes and details the Premium-only features and their uses.

Die folgenden Features sind nur mit Power BI Premium verfügbar:The following features are available only with Power BI Premium:

  • erweiterte Compute-EngineEnhanced compute engine
  • Direkte AbfrageDirect Query
  • berechnete EntitätenComputed entities
  • verknüpfte EntitätenLinked Entities
  • Inkrementelle AktualisierungIncremental refresh

In den folgenden Abschnitten werden diese Features ausführlich beschrieben.The following sections described each of these features in detail.

Erweiterte Compute-EngineThe enhanced compute engine

Die verbesserte Compute-Engine in Power BI ermöglicht Power BI Premium-Abonnenten, ihre Kapazität zum Optimieren der Verwendung von Dataflows zu nutzen.The enhanced compute engine in Power BI enables Power BI Premium subscribers to use their capacity to optimize the use of dataflows. Die Verwendung der erweiterten Compute-Engine bietet folgende Vorteile:Using the enhanced compute engine provides the following advantages:

  • Reduziert drastisch die Aktualisierungszeit, die für ETL-Schritte mit langer Ausführungszeit über berechnete Entitäten benötigt wird, z. B. die Durchführung von joins, distinct, filters und group by.Drastically reduces the refresh time required for long-running ETL steps over computed entities, such as performing joins, distinct, filters, and group by
  • Durchführen von DirectQuery-Abfragen über EntitätenPerform DirectQuery queries over entities

Standardmäßig lautet der Status der erweiterten Compute-Engine On (Ein).By default, the enhanced compute engine is On. Wenn die erweiterte Compute-Engine nicht aktiviert ist, finden Sie im nächsten Abschnitt neben den Antworten auf häufig gestellte Fragen auch Informationen zur Aktivierung der erweiterten Compute-Engine.If the enhanced compute engine is not on, enabling the enhanced compute engine is described in the next section, along with answers to common questions.

Verwenden der erweiterten Compute-EngineUsing the enhanced compute engine

Die erweiterte Compute-Engine wird über die Seite Kapazitätseinstellungen im Power BI-Dienst im Abschnitt Dataflows aktiviert.The enhanced compute engine is enabled from the Capacity Settings page in the Power BI service, in the dataflows section. Standardmäßig ist die erweiterte Compute-Engine Aus.By default, the enhanced compute engine is Off. Sie können die erweiterte Compute-Engine aktivieren, indem Sie den Schalter wie in der folgenden Abbildung gezeigt auf On (Ein) festlegen und Ihre Einstellungen speichern.To enable the enhanced compute engine, switch the toggle to On as shown in the following image, and save your settings.

Aktivieren der erweiterten Compute-Engine

Wichtig

Die erweiterte Compute-Engine funktioniert nur für die Power BI-Kapazitäten A3 und höher.The enhanced compute engine works only for Power BI capacities of A3 and larger.

Nachdem Sie die erweiterte Compute-Engine aktiviert haben, sollten Sie eine Leistungsverbesserung in jeder berechneten Entität sehen, die komplexe Operationen ausführt, wenn Sie zu den Dataflows zurückgehen, z. B. joins- oder group by-Operationen für Dataflows, die aus bestehenden verknüpften Entitäten für dieselbe Kapazität erstellt wurden.Once the enhanced compute engine is on, return to dataflows and you should see a performance improvement in any computed entity that performs complex operations, such as joins or group by operations for dataflows created from existing linked entities on the same capacity.

Zur optimalen Nutzung der Compute-Engine sollten Sie die ETL-Phase wie folgt in zwei getrennte Dataflows unterteilen:To make best use of the compute engine, split the ETL stage into two separate dataflows, in the following way:

  • Dataflow 1 – Dieser Dataflow sollte nur alle erforderlichen Daten von einer Datenquelle aufnehmen und in den Dataflow 2 stellen.Dataflow 1 - this dataflow should only be ingesting all of the required from a data source, and placing it into dataflow 2.
  • Dataflow 2 – Führen Sie alle ETL-Operationen in diesem zweiten Dataflow durch, aber stellen Sie sicher, dass Sie auf Dataflow 1 verweisen, der dieselbe Kapazität aufweisen sollte.Dataflow 2 - perform all ETL operations in this second dataflow, but ensure you're referencing Dataflow 1, which should be on the same capacity. Vergewissern Sie sich auch, dass Sie faltbare Operationen (filter, group by, distinct, join) zuerst durchführen, bevor Sie eine andere Operation durchführen, um sicherzustellen, dass die Compute-Engine verwendet wird.Also ensure you perform operations that can fold (filter, group by, distinct, join) first, before any other operation, to ensure the compute engine is utilized.

Häufig gestellte Fragen und AntwortenCommon questions and answers

Frage: Ich habe die erweiterte Compute-Engine aktiviert, aber meine Aktualisierungen sind langsamer.Question: I've enabled the enhanced compute engine, but my refreshes are slower. Warum?Why?

Antwort: Wenn Sie die erweiterte Compute-Engine aktivieren, gibt es zwei mögliche Erklärungen, die zu langsameren Aktualisierungszeiten führen könnten:Answer: If you enable the enhanced compute engine, there are two possible explanations that could lead to slower refresh times:

  • Wenn die erweiterte Compute-Engine aktiviert ist, benötigt sie etwas Speicher, um ordnungsgemäß zu funktionieren.When the enhanced compute engine is enabled, it requires some memory to function properly. Daher wird der für die Durchführung einer Aktualisierung verfügbare Arbeitsspeicher reduziert und somit die Wahrscheinlichkeit erhöht, dass Aktualisierungen in eine Warteschlange gestellt werden, was wiederum die Anzahl der Dataflows reduziert, die gleichzeitig aktualisiert werden können.As such, memory available to perform a refresh is reduced and therefore increases the likelihood of refreshes to be queued, which in turn reduces the number of dataflows that can refresh concurrently. Um dem entgegenzuwirken, sollten Sie bei der Aktivierung des erweiterten Compute den für Dataflows zugewiesenen Speicher erhöhen, um sicherzustellen, dass der für gleichzeitige Aktualisierungen des Dataflows verfügbare Speicher gleich bleibt.To address this, when enabling enhanced compute, increase the memory assigned for dataflows to ensure the memory available for concurrent dataflow refreshes remains the same.

  • Ein weiterer Grund für möglicherweise langsamere Aktualisierungen kann darin liegen, dass die Compute-Engine nur auf Grundlage von bereits vorhandenen Entitäten funktioniert.Another reason you may encounter slower refreshes is that the compute engine only works on top of existing entities. Wenn Ihr Dataflow auf eine Datenquelle verweist, bei der es sich nicht um einen Dataflow handelt, werden Sie keine Verbesserung feststellen.If your dataflow references a data source that's not a dataflow, you won't see an improvement. Es gibt keine Leistungssteigerung, da in einigen Big Data-Szenarien das anfängliche Lesen von einer Datenquelle langsamer wäre, da die Daten an die erweiterte Compute-Engine übergeben werden müssen.There will be no performance increase, since in some big data scenarios, the initial read from a data source would be slower because the data needs to be passed to the enhanced compute engine.

Frage: Ich kann den Umschalter der erweiterten Compute-Engine nicht sehen.Question: I cannot see the enhanced compute engine toggle. Warum?Why?

Antwort: Die erweiterte Compute-Engine wird schrittweise in Regionen auf der ganzen Welt eingeführt.Answer: The enhanced compute engine is being released in stages to regions around the world. Wir gehen davon aus, dass bis Ende 2020 alle Regionen unterstützt werden.We anticipate all regions will supported by the end of 2020.

Frage: Welche Datentypen werden von der Compute-Engine unterstützt?Question: What are the supported data types for the compute engine?

Antwort: Die erweiterte Compute-Engine und Dataflows unterstützen derzeit die folgenden Datentypen.Answer: The enhanced compute engine and dataflows currently support the following data types. Wenn Ihr Dataflow nicht einen der folgenden Datentypen verwendet, tritt beim Aktualisieren ein Fehler auf:If your dataflow doesn't use one of the following data types, an error occurs during refresh:

  • Datum/UhrzeitDate/Time
  • DezimalzahlDecimal Number
  • TextText
  • Ganze ZahlWhole number
  • Datum/Uhrzeit/ZoneDate/Time/Zone
  • TRUE/FALSETrue/False
  • DatumDate
  • ZeitTime

Verwenden von DirectQuery mit Dataflows in Power BI (Vorschau)Use DirectQuery with dataflows in Power BI (preview)

Sie können DirectQuery verwenden, um eine direkte Verbindung mit Dataflows und daher auch mit Ihrem Dataflow herzustellen, ohne die Daten importieren zu müssen.You can use DirectQuery to connect directly to dataflows, and thereby connect directly to your dataflow without having to import its data.

Die Verwendung von DirectQuery mit Dataflows ermöglicht die folgenden Verbesserungen an den Power BI- und Dataflowprozessen:Using DirectQuery with dataflows enables the following enhancements to your Power BI and dataflows processes:

  • Vermeiden separater Aktualisierungszeitpläne: DirectQuery stellt eine direkte Verbindung mit einem Dataflow her, weshalb kein importiertes Dataset erstellt werden muss.Avoid separate refresh schedules - DirectQuery connects directly to a dataflow, removing the need to create an imported dataset. Die Verwendung von DirectQuery mit Ihren Dataflows hat zur Folge, dass Sie keine separaten Aktualisierungszeitpläne für den Dataflow und das Dataset benötigen, um sicherzustellen, dass die Daten synchronisiert werden.As such, using DirectQuery with your dataflows means you no longer need separate refresh schedules for the dataflow and the dataset to ensure your data is synchronized.

  • Filtern von Daten: DirectQuery ist nützlich für das Arbeiten an einer gefilterten Ansicht von Daten in einem Dataflow.Filtering data - DirectQuery is useful for working on a filtered view of data inside a dataflow. Wenn Sie Daten filtern und infolgedessen nur einen kleineren Teil der Daten in Ihrem Dataflow verwenden möchten, können Sie DirectQuery (und die Compute-Engine) verwenden, um Dataflowdaten zu filtern und mit der benötigten gefilterten Teilmenge zu arbeiten.If you want to filter data, and thereby work with a smaller subset of the data in your dataflow, you can use DirectQuery (and the compute engine) to filter dataflow data and work with the filtered subset you need.

Verwenden von DirectQuery für DataflowsUsing DirectQuery for dataflows

Die Verwendung von DirectQuery mit Dataflows ist eine Previewfunktion, die ab der Power BI Desktop-Version von Mai 2020 verfügbar ist.Using DirectQuery with dataflows is a preview feature available beginning with the May 2020 version of Power BI Desktop.

Für die Verwendung von DirectQuery mit Dataflows gibt es einige Voraussetzungen:There are also prerequisites for using DirectQuery with dataflows:

  • Der Dataflow muss sich in einem Arbeitsbereich befinden, der für Power BI Premium aktiviert ist.Your dataflow must reside within a Power BI Premium enabled workspace
  • Die Compute-Engine muss aktiviert sein.The compute engine must be turned on

Aktivieren von DirectQuery für DataflowsEnable DirectQuery for dataflows

Die erweiterte Compute-Engine muss sich im optimierten Zustand befinden, um sicherzustellen, dass Ihr Dataflow für den DirectQuery-Zugriff verfügbar ist.To ensure your dataflow is available for DirectQuery access, the enhanced compute engine must be in its optimized state. Legen Sie die neue Option Erweiterte Compute-Engine-Einstellungen auf Ein fest, um DirectQuery für Dataflows zu aktivieren.To enable DirectQuery for dataflows, set the new Enhanced compute engine settings option to On. In der folgenden Abbildung wird die Einstellung ordnungsgemäß aktiviert.The following image shows the setting properly selected.

Genaue Steuerungsmöglichkeiten für DirectQuery

Nachdem Sie diese Einstellung angewendet haben, aktualisieren Sie den Dataflow, damit die Optimierung wirksam wird.Once you've applied that setting, refresh the dataflow for the optimization to take effect.

Überlegungen und Einschränkungen zu DirectQueryConsiderations and limitations for DirectQuery

Es gibt einige bekannte Einschränkungen im Zusammenhang mit DirectQuery und Dataflows:There are a few known limitations with DirectQuery and dataflows:

  • Während der Vorschauphase dieses Features können bei einigen Kunden möglicherweise Timeouts oder Leistungsprobleme auftreten, wenn sie DirectQuery mit Dataflows verwenden.During the preview period of this feature, some customers may experience timeouts or performance issues when using DirectQuery with dataflows. Diese Probleme werden während des Zeitraums der Vorschauphase aktiv behandelt.Such issues are being actively addressed during this preview period.

  • Zusammengesetzte/gemischte Modelle, die über Import- und DirectQuery-Datenquellen verfügen, werden derzeit nicht unterstützt.Composite/mixed models that have import and DirectQuery data sources are currently not supported.

  • Bei großen Datenflüssen treten möglicherweise Timeoutprobleme bei Visualisierungen auf.Large dataflows may have trouble with timeout issues when viewing visualizations. Für große Dataflows, die Timeoutprobleme verursachen, sollte der Importmodus verwendet werden.Large dataflows that run into trouble with timeout issues should use Import mode.

  • In den Datenquelleneinstellungen zeigt der Datenflussconnector ungültige Anmeldeinformationen an, wenn Sie DirectQuery verwenden.Under data source settings, the dataflow connector will show invalid credentials if you are using DirectQuery. Dies wirkt sich nicht auf das Verhalten aus, und das Dataset funktioniert ordnungsgemäß.This does not affect the behavior, and the dataset will work properly.

berechnete EntitätenComputed entities

Sie haben die Möglichkeit, Berechnungen im Speicher auszuführen, wenn Sie Dataflows mit einem Power BI Premium-Abonnement verwenden.You can perform in-storage computations when using dataflows with a Power BI Premium subscription. So können Sie Berechnungen mit Ihren vorhandenen Dataflows ausführen und Ergebnisse zurückgeben, mit denen Sie sich auf die Berichtserstellung und Analysen konzentrieren können.This lets you perform calculations on your existing dataflows, and return results that enable you to focus on report creation and analytics.

Berechnete Entität

Um Berechnungen im Speicher auszuführen, müssen Sie zunächst den Dataflow erstellen und Daten in diesem Power BI-Dataflowspeicher aufnehmen.To perform in-storage computations, you first must create the dataflow and bring data into that Power BI dataflow storage. Wenn Sie einen Dataflow haben, der Daten enthält, können Sie Berechnete Entitäten erstellen. Dabei handelt es sich um Entitäten, die Berechnungen innerhalb des Speichers ausführen.Once you have a dataflow that contains data, you can create computed entities, which are entities that perform in-storage computations.

Überlegungen zu und Einschränkungen von berechneten EntitätenConsiderations and limitations of computed entities

  • Wenn Sie mit Dataflows arbeiten, die im Azure Data Lake Storage Gen2-Konto einer Organisation erstellt wurden, funktionieren verknüpfte und berechnete Entitäten nur ordnungsgemäß, wenn sich diese im selben Speicherkonto befinden.When working with dataflows created in an organization's Azure Data Lake Storage Gen2 account, linked entities and computed entities only work properly when the entities reside in the same storage account.

Es hat sich bei der Berechnung von Daten, die auf lokaler Ebene und in der Cloud verknüpft sind, bewährt, einen neuen Dataflow für jede Quelle zu erstellen (einen für lokale Daten und einen für Clouddaten) und einen dritten Dataflow zu erstellen, um diese beiden Datenquellen zusammenzuführen bzw. Berechnungen für diese durchzuführen.As a best practice, when doing computations on data joined by on-premises and cloud data, create a new dataflow for each source (one for on-premises and one for cloud) and then create a third dataflow to merge/compute over these two data sources.

Verknüpfte EntitätenLinked entities

Sie können auf vorhandene Dataflows verweisen, wenn Sie ein Power BI Premium-Abonnement verwenden. Dadurch können Sie entweder mithilfe berechneter Entitäten eine Berechnung für diese Entitäten ausführen oder eine Single-Source-of-Truth-Tabelle erstellen, die Sie in mehreren Dataflows wiederverwenden können.You can reference existing dataflows when using with a Power BI Premium subscription, which lets you either perform calculation on these entities using computed entities or allows you to create a "single source of the truth" table that you can reuse within multiple dataflows.

Inkrementelle AktualisierungIncremental refresh

Für Dataflows können inkrementelle Aktualisierungen eingerichtet werden, um zu vermeiden, dass alle Daten bei jeder Aktualisierung abgerufen werden müssen.Dataflows can be set to refresh incrementally to avoid having to pull all the data on every refresh. Wählen Sie hierzu den Dataflow aus, und klicken Sie dann auf das Symbol „Inkrementelle Aktualisierung“.To do so, select the dataflow then select the incremental refresh icon.

Inkrementelle Aktualisierung

Wenn Sie inkrementelle Aktualisierungen einrichten, werden Parameter zum Dataflow hinzugefügt, um den Datumsbereich festzulegen.Setting incremental refresh adds parameters to the dataflow to specify the date range. Ausführliche Informationen zum Einrichten von inkrementellen Aktualisierungen finden Sie im Artikel Inkrementelle Aktualisierung.For detailed information on how to set up incremental refresh, see the incremental refresh article.

Situationen, in denen sich inkrementelle Aktualisierungen nicht anbietenConsiderations for when not to set incremental refresh

Legen Sie in den folgenden Situationen keine inkrementellen Aktualisierungen für Dataflows fest:Do not set a dataflow to incremental refresh in the following situations:

  • Für verknüpfte Entitäten sollten keine inkrementellen Aktualisierungen verwendet werden, wenn sie auf einen Dataflow verweisen.Linked entities should not use incremental refresh if they reference a dataflow. Dataflows unterstützen kein Query Folding (auch nicht, wenn DirectQuery für die Entität aktiviert ist).Dataflows does not support query folding (even if the entity is DirectQuery enabled).
  • Für Datasets, die auf Dataflows verweisen, sollten keine inkrementellen Aktualisierungen verwendet werden.Datasets referencing dataflows should not use incremental refresh. Aktualisierungen von Dataflows sollten generell gut funktionieren.Refreshes to dataflows should generally perform well. Wenn die Aktualisierungen länger dauern als erwartet, empfiehlt es sich, die Compute-Engine und/oder den DirectQuery-Modus zu verwenden.If the refreshes take longer than expected, consider using the compute engine and or DirectQuery mode.

Nächste SchritteNext steps

In den folgenden Artikeln finden Sie weitere Informationen zu Dataflows und Power BI:The following articles provide more information about dataflows and Power BI: