Auswertung der Kapazitätsauslastung in Premium

Artikel
11/26/2023

Tipp

In diesem Artikel wird erklärt, wie Sie Ihre Premium-Kapazitätsauslastung auswerten. Es werden Konzepte wie Überladung und Autoskalierung behandelt. Sie können sich auch diese Videos ansehen, in denen einige der in diesem Artikel beschriebenen Premium-Features veranschaulicht werden.

Power BI wertet den Durchsatz Ihrer Premium-Kapazität fortlaufend aus, um Beschränkungen des CPU-Durchsatzes durchzusetzen.

und zwar alle 30 Sekunden. Hierzu wartet Power BI, bis Vorgänge abgeschlossen sind, sammelt die Angaben zur Ausführungsdauer auf den CPUs der physischen Knoten im gemeinsam genutzten Pool, aggregiert diese dann für alle Vorgänge in Ihrer Kapazität in 30-sekündigen CPU-Intervallen und vergleicht schließlich die Ergebnisse mit dem von Ihrer erworbenen Kapazität unterstützten Durchsatz.

Die folgende Abbildung veranschaulicht, wie Premium Abfragen auswertet und ausführt.

Hier ein Beispiel: Ein P1-Abonnement mit acht virtuellen Kernen kann $8\times{30}=240$ Sekunden Ausführungszeit (auch CPU-Zeit genannt) auf virtuellen Kernen unterstützen.

Die Aggregation ist komplex. Hierfür werden spezielle Algorithmen für verschiedene Workloads und für verschiedene Arten von Vorgängen verwendet, wie in den folgenden Punkten beschrieben:

Langsam ausgeführte Vorgänge, z. B. die Aktualisierung von Semantikmodellen und Dataflows, werden als Hintergrundvorgänge betrachtet, da sie in der Regel im Hintergrund ausgeführt und nicht von Benutzer*innen aktiv überwacht oder angezeigt werden. Hintergrundvorgänge dauern lang, und ihr Abschluss erfordert eine hohe CPU-Leistung während dieses langwierigen Prozesses. Power BI verteilt die CPU-Kosten von Hintergrundvorgängen auf einen Zeitraum von 24 Stunden, um zu verhindern, dass die maximale Ressourcennutzung für Kapazitäten erreicht wird, weil zu viele Aktualisierungen gleichzeitig ausgeführt werden. Dadurch können Power BI Premium-Abonnenten so viele Hintergrundvorgänge ausführen, wie ihre erworbene Kapazitäts-SKU zulässt.
Schnelle Vorgänge wie Abfragen und das Laden von Berichten werden als interaktive Vorgänge angesehen. Die für das Abschließen dieser Vorgänge erforderliche CPU-Zeit wird aggregiert, um die Anzahl der nach dem Abschluss betroffenen 30-Sekunden-Zeitfenster zu minimieren.

Planung von Hintergrundvorgängen in Premium

Aktualisierungen werden auf Premium-Kapazitäten zum geplanten Zeitpunkt oder ungefähr zu diesem Zeitpunkt ausgeführt, unabhängig davon, wie viele andere Hintergrundvorgänge für denselben Zeitpunkt geplant sind. Semantikmodelle und Dataflows werden für die Aktualisierung auf einem physischen Verarbeitungsknoten platziert, der über ausreichend Arbeitsspeicher verfügt, um sie zu laden und anschließend mit dem Aktualisierungsvorgang zu beginnen.

Beim Verarbeiten der Aktualisierung verbrauchen Semantikmodelle möglicherweise mehr Arbeitsspeicher, um den Aktualisierungsvorgang abzuschließen. Die Aktualisierungs-Engine stellt sicher, dass kein Element die von der Basis-SKU zugelassene Arbeitsspeichermenge überschreiten kann (z. B. 25 GB bei einem P1-Abonnement oder 50 GB bei einem P2-Abonnement).

Erzwingen von Kapazitätsgrößenlimits beim Anzeigen von Berichten

Power BI Premium wertet die Auslastung aus, indem die Auslastungsdaten alle 30 Sekunden aggregiert werden. Jede Auswertung besteht aus zwei verschiedenen Aggregationen:

Interaktive Auslastung
Hintergrundauslastung

Für die interaktive Auslastung werden alle interaktiven Vorgänge ausgewertet, die am Ende des 30-sekündigen Auswertungszeitraums (oder kurz davor) abgeschlossen wurden.

Für die Hintergrundauslastung werden alle Hintergrundvorgänge ausgewertet, die in den letzten 24 Stunden abgeschlossen wurden. Hierbei verursacht jeder Hintergrundvorgang nur 1/2880 seiner gesamten CPU-Kosten, denn es gibt im Laufe von 24 Stunden jeweils 2880 Auswertungszeiträume.

Jede Kapazität besteht aus einer definierten Anzahl von virtuellen Kernen. Die in Auslastungsdaten gemessene CPU-Zeit gibt die Auslastung der virtuellen Kerne wieder, durch die die Autoskalierung gesteuert wird.

Wenn Sie über ein P1-Abonnement mit acht virtuellen Kernen verfügen, beträgt das Kontingent für jeden Auswertungszeitraum $8\times{30}=240$ Sekunden hinsichtlich der CPU-Auslastung. Wenn die Summe der interaktiven Auslastungen und Hintergrundauslastungen das gesamte Kontingent an virtuellen Kernen in Ihrer Kapazität überschreitet und Sie die automatische Skalierung nicht optional aktiviert haben, überschreitet die Auslastung für Ihre Premium-Kapazität Ihre verfügbaren Ressourcen, also Ihren Kapazitätsschwellenwert. Die folgende Abbildung veranschaulicht diese Bedingung, die als Überladung bezeichnet wird, wenn die automatische Skalierung nicht aktiviert ist.

Wenn die automatische Skalierung optional aktiviert ist und Ihre CPU-Auslastungen das gesamte Kontingent der Back-End-V-Kerne in Ihrer Kapazität überschreitet, wird Ihre Kapazität für die nächsten 24 Stunden automatisch um einen virtuellen Kern skaliert (erhöht).

In der folgenden Abbildung wird gezeigt, wie die Autoskalierung funktioniert.

Bei der Autoskalierung wird immer die aktuelle Kapazitätsgröße betrachtet, um zu bewerten, wie viel Sie nutzen. Bei der automatischen Skalierung wird Ihrer Kapazität ein virtueller Kern hinzugefügt. Wenn Sie also eine P1-SKU mit acht virtuellen Kernen verwenden, beträgt Ihre maximale Kapazität jetzt 270 Sekunden ($8\times{30}+1\times{30}$) CPU-Zeit in einem Bewertungszyklus.

Die Autoskalierung stellt immer sicher, dass kein einzelner interaktiver Vorgang Ihre gesamte Kapazität nutzen kann, und es müssen mindestens zwei Vorgänge pro Auswertungszeitraum ausgeführt werden, damit die Autoskalierung initiiert wird.

Verwenden von Premium ohne Autoskalierung

Wenn die Auslastung einer Kapazität bei über 100 % der Ressourcen liegt und keine Autoskalierung initiiert werden kann, weil diese deaktiviert oder der Höchstwert für die V-Kerne bereits erreicht ist, wird die Kapazität vorübergehend in den Modus Interactive Request Delay (Verzögerung von interaktiven Anforderungen) versetzt. Im Modus Interactive Request Delay (Verzögerung von interaktiven Anforderungen) wird jede interaktive Anforderung (z. B. das Laden von Berichten oder die Visualinteraktion) verzögert zur Ausführung an die Engine gesendet.

Die Kapazität bleibt im Modus Interactive Request Delay (Verzögerung von interaktiven Anforderungen), wenn bei der vorherigen Auswertung eine Ressourcenauslastung von mehr als 100 Prozent festgestellt wurde.

Konfigurieren der automatischen Skalierung

Um die Autoskalierung für eine Power BI Premium-Kapazität zu konfigurieren, befolgen Sie die Anweisungen unter Verwenden der Autoskalierung mit Power BI Premium.

Was ist Power BI Premium?

Power BI Premium-Architektur

Verwenden der Autoskalierung mit Power BI Premium

Power BI Premium – Häufig gestellte Fragen

FAQ zur Power BI Premium-Einzelbenutzerlizenz (Vorschau)

Hinzufügen oder Ändern von Azure-Abonnementadministratoren

Weitere Fragen? Stellen Sie Ihre Frage in der Power BI-Community.