Premiumfunktionen von Dataflows

Dataflows werden für Power BI Pro- oder Premium pro Benutzer (PPU)und Power BI Premium-Benutzer unterstützt. Einige Features sind nur mit einem Power BI Premium-Abonnement verfügbar (d. h. einer Premium-Kapazität oder Premium pro Benutzer-Lizenz (PPU)). In diesem Artikel werden nur die Premium pro Benutzer (PPU) und Premium-Features und deren Verwendungszwecke beschrieben.

Die folgenden Features sind nur bei Power BI Premium (PPU-Abonnement oder Abonnement mit Premium-Kapazität) verfügbar:

  • erweiterte Compute-Engine
  • Direkte Abfrage
  • berechnete Entitäten
  • verknüpfte Entitäten
  • Inkrementelle Aktualisierung

In den folgenden Abschnitten werden diese Features ausführlich beschrieben.

Erweiterte Compute-Engine

Die verbesserte Compute-Engine in Power BI ermöglicht Power BI Premium-Abonnenten, ihre Kapazität zum Optimieren der Verwendung von Dataflows zu nutzen. Die Verwendung der erweiterten Compute-Engine bietet folgende Vorteile:

  • Reduziert drastisch die Aktualisierungszeit, die für ETL-Schritte mit langer Ausführungszeit über berechnete Entitäten benötigt wird, z. B. die Durchführung von joins, distinct, filters und group by.
  • Durchführen von DirectQuery-Abfragen über Entitäten

Hinweis

  • Die Validierungs-und Aktualisierungsprozesse informieren Datenflüsse des Modell Schemas. Wenn Sie das Schema der Tabellen selbst festlegen möchten, verwenden Sie den powerquery-Editor, und legen Sie Datentyp fest.
  • Dieses Feature ist für alle Power BI-Cluster mit Ausnahme von WABI-INDIA-CENTRAL-A-PRIMARY verfügbar.

Aktivieren des erweiterten Computemoduls

Wichtig

Das erweiterte Computemodul funktioniert nur für A3 oder größere Power BI Kapazitäten.

In Premium Gen2 wird das erweiterte Computemodul für jeden Datenfluss einzeln festgelegt. Es gibt drei Konfigurationen, aus denen Sie wählen können:

  • Disabled

  • Optimiert (Standard) – Das erweiterte Computemodul ist deaktiviert. Es wird automatisch aktiviert, wenn der Datenfluss mit einem anderen Datenfluss verbunden ist.

  • Ein

Gehen Sie wie folgt vor, um die Standardeinstellung zu ändern und das erweiterte Computemodul zu aktivieren:

  1. Wählen Sie in Ihrem Arbeitsbereich neben dem Datenfluss, für den Sie die Einstellungen ändern möchten, weitere Optionen aus.

  2. Wählen Sie im Menü "Weitere Optionen" des Datenflusses Einstellungen aus.

    Screenshot of a dataflows more options menu with the settings setting highlighted.

  3. Erweitern Sie die Einstellungen des erweiterten Computemoduls.

    Screenshot of a dataflows settings page with the enhanced compute engine settings setting highlighted.

  4. Wählen Sie in den Einstellungen des erweiterten Computemoduls"Ein " aus, und wählen Sie dann " Übernehmen" aus.

    Screenshot of the enhanced compute engine settings with the on selection turned on and the apply button highlighted.

Verwenden der erweiterten Compute-Engine

Nachdem Sie die erweiterte Compute-Engine aktiviert haben, kehren Sie zu dataflows zurück. Hier sollten Sie eine Leistungsverbesserung in jeder berechneten Tabelle feststellen können, die komplexe Operationen ausführt, z. B. joins- oder group by-Operationen für Dataflows, die aus bestehenden verknüpften Entitäten für dieselbe Kapazität erstellt wurden.

Zur optimalen Nutzung der Compute-Engine sollten Sie die ETL-Phase wie folgt in zwei getrennte Dataflows unterteilen:

  • Dataflow 1 – Dieser Dataflow sollte nur alle erforderlichen Daten von einer Datenquelle aufnehmen und in den Dataflow 2 stellen.
  • Dataflow 2 – Führen Sie alle ETL-Operationen in diesem zweiten Dataflow durch, aber stellen Sie sicher, dass Sie auf Dataflow 1 verweisen, der dieselbe Kapazität aufweisen sollte. Vergewissern Sie sich auch, dass Sie faltbare Operationen (filter, group by, distinct, join) zuerst durchführen, bevor Sie eine andere Operation durchführen, um sicherzustellen, dass die Compute-Engine verwendet wird.

Häufig gestellte Fragen und Antworten

Frage: Ich habe die erweiterte Compute-Engine aktiviert, aber meine Aktualisierungen sind langsamer. Warum?

Antwort: Wenn Sie die erweiterte Compute-Engine aktivieren, gibt es zwei mögliche Erklärungen, die zu langsameren Aktualisierungszeiten führen könnten:

  • Wenn die erweiterte Compute-Engine aktiviert ist, benötigt sie etwas Speicher, um ordnungsgemäß zu funktionieren. Daher wird der für die Durchführung einer Aktualisierung verfügbare Arbeitsspeicher reduziert und somit die Wahrscheinlichkeit erhöht, dass Aktualisierungen in eine Warteschlange gestellt werden, was wiederum die Anzahl der Dataflows reduziert, die gleichzeitig aktualisiert werden können. Um dem entgegenzuwirken, sollten Sie bei der Aktivierung des erweiterten Compute den für Dataflows zugewiesenen Speicher erhöhen, um sicherzustellen, dass der für gleichzeitige Aktualisierungen des Dataflows verfügbare Speicher gleich bleibt.

  • Ein weiterer Grund für möglicherweise langsamere Aktualisierungen kann darin liegen, dass die Compute-Engine nur auf Grundlage von bereits vorhandenen Entitäten funktioniert. Wenn Ihr Dataflow auf eine Datenquelle verweist, bei der es sich nicht um einen Dataflow handelt, werden Sie keine Verbesserung feststellen. Es gibt keine Leistungssteigerung, da in einigen Big Data-Szenarien das anfängliche Lesen von einer Datenquelle langsamer wäre, da die Daten an die erweiterte Compute-Engine übergeben werden müssen.

Frage: Ich kann den Umschalter der erweiterten Compute-Engine nicht sehen. Warum?

Antwort: Die erweiterte Compute-Engine wird schrittweise in Regionen auf der ganzen Welt eingeführt, aber ist noch nicht in jeder Region verfügbar.

Frage: Welche Datentypen werden von der Compute-Engine unterstützt?

Antwort: Die erweiterte Compute-Engine und Dataflows unterstützen derzeit die folgenden Datentypen. Wenn Ihr Dataflow nicht einen der folgenden Datentypen verwendet, tritt beim Aktualisieren ein Fehler auf:

  • Datum/Uhrzeit
  • Dezimalzahl
  • Text
  • Ganze Zahl
  • Datum/Uhrzeit/Zone
  • TRUE/FALSE
  • Datum
  • Zeit

Verwenden von DirectQuery mit Dataflows in Power BI

Sie können DirectQuery verwenden, um eine direkte Verbindung mit Dataflows und daher auch mit Ihrem Dataflow herzustellen, ohne die Daten importieren zu müssen.

Die Verwendung von DirectQuery mit Dataflows ermöglicht die folgenden Verbesserungen an den Power BI- und Dataflowprozessen:

  • Vermeiden separater Aktualisierungszeitpläne: DirectQuery stellt eine direkte Verbindung mit einem Dataflow her, weshalb kein importiertes Dataset erstellt werden muss. Die Verwendung von DirectQuery mit Ihren Dataflows hat zur Folge, dass Sie keine separaten Aktualisierungszeitpläne für den Dataflow und das Dataset benötigen, um sicherzustellen, dass die Daten synchronisiert werden.

  • Filtern von Daten: DirectQuery ist nützlich für das Arbeiten an einer gefilterten Ansicht von Daten in einem Dataflow. Wenn Sie Daten filtern und infolgedessen nur einen kleineren Teil der Daten in Ihrem Dataflow verwenden möchten, können Sie DirectQuery (und die Compute-Engine) verwenden, um Dataflowdaten zu filtern und mit der benötigten gefilterten Teilmenge zu arbeiten.

Verwenden von DirectQuery für Dataflows

Die Verwendung von DirectQuery mit Dataflows ist in Power BI Desktop möglich.

Für die Verwendung von DirectQuery mit Dataflows gibt es einige Voraussetzungen:

  • Der Dataflow muss sich in einem Arbeitsbereich befinden, der für Power BI Premium aktiviert ist.
  • Die Compute-Engine muss aktiviert sein.

Weitere Informationen zu DirectQuery mit Dataflows finden Sie im Artikel Verwendung von DirectQuery mit Dataflows.

Aktivieren von DirectQuery für Dataflows

Die erweiterte Compute-Engine muss sich im optimierten Zustand befinden, um sicherzustellen, dass Ihr Dataflow für den DirectQuery-Zugriff verfügbar ist. Legen Sie die neue Option Erweiterte Compute-Engine-Einstellungen auf Ein fest, um DirectQuery für Dataflows zu aktivieren. In der folgenden Abbildung wird die Einstellung ordnungsgemäß aktiviert.

Granular control for direct query

Nachdem Sie diese Einstellung angewendet haben, aktualisieren Sie den Dataflow, damit die Optimierung wirksam wird.

Überlegungen und Einschränkungen zu DirectQuery

Es gibt einige bekannte Einschränkungen im Zusammenhang mit DirectQuery und Dataflows:

  • Zusammengesetzte/gemischte Modelle, die über Import- und DirectQuery-Datenquellen verfügen, werden derzeit nicht unterstützt.

  • Bei großen Datenflüssen treten möglicherweise Timeoutprobleme bei Visualisierungen auf. Für große Dataflows, die Timeoutprobleme verursachen, sollte der Importmodus verwendet werden.

  • In den Datenquelleneinstellungen zeigt der Datenflussconnector ungültige Anmeldeinformationen an, wenn Sie DirectQuery verwenden. Dies wirkt sich nicht auf das Verhalten aus, und das Dataset funktioniert ordnungsgemäß.

berechnete Entitäten

Sie haben die Möglichkeit, Berechnungen im Speicher auszuführen, wenn Sie Dataflows mit einem Power BI Premium-Abonnement verwenden. So können Sie Berechnungen mit Ihren vorhandenen Dataflows ausführen und Ergebnisse zurückgeben, mit denen Sie sich auf die Berichtserstellung und Analysen konzentrieren können.

Computed table

Um Berechnungen im Speicher auszuführen, müssen Sie zunächst den Dataflow erstellen und Daten in diesem Power BI-Dataflowspeicher aufnehmen. Wenn Sie einen Dataflow haben, der Daten enthält, können Sie Berechnete Entitäten erstellen. Dabei handelt es sich um Entitäten, die Berechnungen innerhalb des Speichers ausführen.

Überlegungen zu und Einschränkungen von berechneten Entitäten

  • Wenn Sie mit Dataflows arbeiten, die im Azure Data Lake Storage Gen2-Konto einer Organisation erstellt wurden, funktionieren verknüpfte und berechnete Entitäten nur ordnungsgemäß, wenn sich diese im selben Speicherkonto befinden.

Es hat sich bei der Berechnung von Daten, die auf lokaler Ebene und in der Cloud verknüpft sind, bewährt, einen neuen Dataflow für jede Quelle zu erstellen (einen für lokale Daten und einen für Clouddaten) und einen dritten Dataflow zu erstellen, um diese beiden Datenquellen zusammenzuführen bzw. Berechnungen für diese durchzuführen.

Verknüpfte Entitäten

Sie können auf vorhandene Dataflows verweisen, wenn Sie ein Power BI Premium-Abonnement verwenden. Dadurch können Sie entweder mithilfe berechneter Entitäten eine Berechnung für diese Entitäten ausführen oder eine Single-Source-of-Truth-Tabelle erstellen, die Sie in mehreren Dataflows wiederverwenden können.

Inkrementelle Aktualisierung

Für Dataflows können inkrementelle Aktualisierungen eingerichtet werden, um zu vermeiden, dass alle Daten bei jeder Aktualisierung abgerufen werden müssen. Wählen Sie hierzu den Dataflow aus, und klicken Sie dann auf das Symbol „Inkrementelle Aktualisierung“.

Incremental refresh

Wenn Sie inkrementelle Aktualisierungen einrichten, werden Parameter zum Dataflow hinzugefügt, um den Datumsbereich festzulegen. Ausführliche Informationen zum Einrichten von inkrementellen Aktualisierungen finden Sie im Artikel Inkrementelle Aktualisierung.

Situationen, in denen sich inkrementelle Aktualisierungen nicht anbieten

Legen Sie in den folgenden Situationen keine inkrementellen Aktualisierungen für Dataflows fest:

  • Für verknüpfte Entitäten sollten keine inkrementellen Aktualisierungen verwendet werden, wenn sie auf einen Dataflow verweisen.

Nächste Schritte

In den folgenden Artikeln finden Sie weitere Informationen zu Dataflows und Power BI: