Auswertung der Kapazitätsauslastung in Premium Gen2

Tipp

In diesem Artikel wird erklärt, wie Sie Ihre Gen2-Kapazitätsauslastung auswerten. Es werden Konzepte wie Überladung und Autoskalierung behandelt. Sie können auch das Erklärungsvideo ansehen, das einige der in diesem Artikel beschriebenen Gen2-Features veranschaulicht.

Für das Erzwingen von Einschränkungen für den CPU-Durchsatz wertet Power BI den Durchsatz Ihrer Premium Gen2-Kapazität fortlaufend aus,

und zwar alle 30 Sekunden. Hierzu wartet Power BI, bis Vorgänge abgeschlossen sind, sammelt die Angaben zur Ausführungsdauer auf den CPUs der physischen Knoten im gemeinsam genutzten Pool, aggregiert diese dann für alle Vorgänge in Ihrer Kapazität in 30-sekündigen CPU-Intervallen und vergleicht schließlich die Ergebnisse mit dem von Ihrer erworbenen Kapazität unterstützten Durchsatz.

Die folgende Abbildung veranschaulicht, wie Premium Gen2 Abfragen auswertet und abschließt.

Diagramm, das Premium Gen2 beim Auswerten und Verarbeiten von Abfragen zeigt

Hier ein Beispiel: Ein P1-Abonnement mit vier Back-End-V-Kernen kann 120 Sekunden (4 × 30 Sekunden = 120) Ausführungszeit auf V-Kernen unterstützen, auch CPU-Zeit genannt.

Die Aggregation ist komplex. Hierfür werden spezielle Algorithmen für verschiedene Workloads und für verschiedene Arten von Vorgängen verwendet, wie in den folgenden Punkten beschrieben:

  • Langsam ausgeführte Vorgänge, z. B. die Aktualisierung von Datasets und Dataflows, werden als Hintergrundvorgänge angesehen, da sie in der Regel im Hintergrund ausgeführt werden und Benutzer sie nicht aktiv überwachen oder ansehen. Hintergrundvorgänge dauern lang, und ihr Abschluss erfordert eine hohe CPU-Leistung während dieses langwierigen Prozesses. Power BI verteilt die CPU-Kosten von Hintergrundvorgängen auf einen Zeitraum von 24 Stunden, um zu verhindern, dass die maximale Ressourcennutzung für Kapazitäten erreicht wird, weil zu viele Aktualisierungen gleichzeitig ausgeführt werden. Dadurch können Power BI Premium Gen2-Abonnenten so viele Hintergrundvorgänge ausführen, wie ihre erworbene Kapazitäts-SKU zulässt, und werden im Gegensatz zur ursprünglichen Premium-Generation nicht eingeschränkt.

  • Schnelle Vorgänge wie Abfragen und das Laden von Berichten werden als interaktive Vorgänge angesehen. Die für das Abschließen dieser Vorgänge erforderliche CPU-Zeit wird aggregiert, um die Anzahl der nach dem Abschluss betroffenen 30-Sekunden-Zeitfenster zu minimieren.

Planung von Hintergrundvorgängen in Premium Gen2

Aktualisierungen werden auf Premium Gen2-Kapazitäten zum geplanten Zeitpunkt oder ungefähr zu diesem Zeitpunkt ausgeführt, unabhängig davon, wie viele andere Hintergrundvorgänge für denselben Zeitpunkt geplant sind. Datasets und Dataflows, die aktualisiert werden, werden auf einem physischen Verarbeitungsknoten platziert, der über ausreichend Arbeitsspeicher verfügt, um sie zu laden und anschließend mit dem Aktualisierungsvorgang zu beginnen.

Beim Verarbeiten der Aktualisierung verbrauchen Datasets möglicherweise mehr Arbeitsspeicher, um den Aktualisierungsvorgang abzuschließen. Die Aktualisierungs-Engine stellt sicher, dass kein Artefakt die von der Basis-SKU zugelassene Arbeitsspeichermenge überschreiten kann (z. B. 25 GB bei einem P1-Abonnement oder 50 GB bei einem P2-Abonnement).

Erzwingen von Kapazitätsgrößenlimits beim Anzeigen von Berichten

Premium Gen2 wertet die Auslastung aus, indem die Auslastungsdaten alle 30 Sekunden aggregiert werden. Jede Auswertung besteht aus zwei verschiedenen Aggregationen:

  • Interaktive Auslastung
  • Hintergrundauslastung

Für die interaktive Auslastung werden alle interaktiven Vorgänge ausgewertet, die am Ende des 30-sekündigen Auswertungszeitraums (oder kurz davor) abgeschlossen wurden.

Für die Hintergrundauslastung werden alle Hintergrundvorgänge ausgewertet, die in den letzten 24 Stunden abgeschlossen wurden. Hierbei verursacht jeder Hintergrundvorgang nur 1/2880 seiner gesamten CPU-Kosten, denn es gibt im Laufe von 24 Stunden jeweils 2880 Auswertungszeiträume.

Jede Kapazität besteht aus der gleichen Anzahl von Front-End- und Back-End-V-Kernen. Die CPU-Zeit, die in Auslastungsdaten gemessen wird, spiegelt die Auslastung der Back-End-V-Kerne wider, auf deren Grundlage die Autoskalierung gesteuert wird. Die Auslastung der Front-End-V-Kerne wird nicht nachverfolgt, und Front-End-V-Kerne können nicht in Back-End-V-Kerne umgewandelt werden.

Wenn Sie über ein P1-Abonnement mit vier Back-End-V-Kernen verfügen, beträgt das Kontingent für jeden Auswertungszeitraum 120 Sekunden (4 × 30 = 120 Sekunden) hinsichtlich der CPU-Auslastung. Wenn die Summe der interaktiven Auslastungen und Hintergrundauslastungen das gesamte Kontingent an Back-End-V-Kernen in Ihrer Kapazität überschreitet und Sie die automatische Skalierung nicht optional aktiviert haben, überschreitet die Auslastung für Ihre Gen2-Kapazität Ihre verfügbaren Ressourcen, also Ihren Kapazitätsschwellenwert. Die folgende Abbildung veranschaulicht diese Bedingung, die als Überladung bezeichnet wird, wenn die automatische Skalierung nicht aktiviert ist.

Diagramm, das die Überladungsbedingung in der Premium Gen2-Kapazität zeigt

Wenn die automatische Skalierung optional aktiviert ist und die Summe aus interaktiver Auslastung und Hintergrundauslastung das gesamte Kontingent der Back-End-V-Kerne in Ihrer Kapazität überschreitet, wird Ihre Kapazität für die nächsten 24 Stunden automatisch um einen V-Kern skaliert (erhöht).

In der folgenden Abbildung wird gezeigt, wie die Autoskalierung funktioniert.

Diagramm, das den automatischen Skalierungsvorgang Premium Gen2-Kapazität zeigt

Die Autoskalierung wertet die Auslastung immer basierend auf der aktuellen Größe Ihrer Kapazität aus. Wenn die Kapazität also bereits durch Autoskalierung um einen V-Kern vergrößert wurde, wird dieser V-Kern gleichmäßig zu 50 % auf die Front-End-Auslastung und zu 50 % auf die Back-End-Auslastung angerechnet. Das bedeutet, dass die maximale Kapazität nun (120 + 0,5 × 30 =) 135 Sekunden hinsichtlich der CPU-Zeit in einem Auswertungszeitraum beträgt.

Die Autoskalierung stellt immer sicher, dass kein einzelner interaktiver Vorgang Ihre gesamte Kapazität nutzen kann, und es müssen mindestens zwei Vorgänge pro Auswertungszeitraum ausgeführt werden, damit die Autoskalierung initiiert wird.

Verwenden von Premium Gen2 ohne Autoskalierung

Wenn die Auslastung einer Kapazität bei über 100 % der Ressourcen liegt und keine Autoskalierung initiiert werden kann, weil diese deaktiviert oder der Höchstwert für die V-Kerne bereits erreicht ist, wird die Kapazität vorübergehend in den Modus Interactive Request Delay (Verzögerung von interaktiven Anforderungen) versetzt. Im Modus Interactive Request Delay (Verzögerung von interaktiven Anforderungen) wird jede interaktive Anforderung (z. B. das Laden von Berichten oder die Visualinteraktion) verzögert zur Ausführung an die Engine gesendet.

Die Kapazität bleibt im Modus Interactive Request Delay (Verzögerung von interaktiven Anforderungen), wenn bei der vorherigen Auswertung eine Ressourcenauslastung von mehr als 100 Prozent festgestellt wurde.

Konfigurieren der automatischen Skalierung

Um die Autoskalierung für eine Power BI Premium Gen2-Kapazität zu konfigurieren, befolgen Sie die Anweisungen unter Verwenden der Autoskalierung mit Power BI Premium.

Nächste Schritte

Weitere Fragen? Stellen Sie Ihre Frage in der Power BI-Community.