Große Datasets in Power BI Premium

Power BI-Datasets können Daten für eine optimierte Abfrageleistung in einem stark komprimierten In-Memory-Cache speichern. Dadurch wird eine schnelle Benutzerinteraktion ermöglicht. Mit Premium-Kapazitäten können große Datasets, die den Standardgrenzwert überschreiten, mit der Einstellung Großes Datasetspeicherformat ermöglicht werden. Wenn diese Option aktiviert ist, wird die Größe des Datasets vom Administrator durch die Premium-Kapazitätsgröße oder die maximale Größe beschränkt.

Große Datasets können für alle Premium-P-SKUs sowie eingebettete A-SKUs und mit Premium pro Benutzer (PPU) aktiviert werden. Die Größenbeschränkung für große Datasets in Premium ist vergleichbar mit Azure Analysis Services in Bezug auf die Größenbeschränkungen von Datenmodellen.

Abgesehen davon, dass die Speicherformateinstellung für große Datasets erforderlich ist, damit Datasets auf über 10 GB anwachsen können, bietet sie auch noch weitere Vorteile. Wenn Sie auf XMLA-Endpunkten basierende Tools für Datasetschreibvorgänge verwenden möchten, sollten Sie die Einstellung unbedingt auch für Datasets aktivieren, die Sie nicht unbedingt als große Datasets bezeichnen würden. Wenn diese Einstellung aktiviert ist, kann das Speicherformat für große Datasets die Leistung von XMLA-Schreibvorgängen verbessern.

Große Datasets im Dienst wirken sich nicht auf die Uploadgröße des Power BI Desktop-Modells aus, die weiterhin auf 10 GB beschränkt ist. Stattdessen können Datasets im Dienst bei einer Aktualisierung diesen Grenzwert überschreiten.

Wichtig

Power BI Premium unterstützt große Datasets. Aktivieren Sie die Option Großes Datasetspeicherformat, um Datasets in Power BI Premium zu verwenden, die den Standardgrenzwert überschreiten.

Aktivieren großer Datasets

In diesem Schritt wird beschrieben, wie Sie große Datasets für ein neues Modell aktivieren, das im Dienst veröffentlicht wurde. Bei bereits bestehenden Datasets ist nur Schritt 3 erforderlich.

  1. Erstellen Sie ein Modell in Power BI Desktop. Falls das Dataset größer wird und immer mehr Arbeitsspeicher belegt, achten Sie darauf, eine inkrementelle Aktualisierung zu konfigurieren.

  2. Veröffentlichen Sie das Modell als Dataset im Dienst.

  3. Gehen Sie im Dienst zu „DataSet“ > Einstellungen, erweitern Sie Großes Datasetspeicherformat, stellen Sie den Schieberegler auf Ein, indem Sie darauf klicken, und klicken Sie auf Anwenden.

    Schieberegler zum Aktivieren großer Datasets

  4. Starten Sie eine Aktualisierung, um historische Daten basierend auf der Richtlinie für die inkrementelle Aktualisierung zu laden. Bei der ersten Aktualisierung kann das Laden der historischen Daten einige Zeit in Anspruch nehmen. Nachfolgende Aktualisierungen sollten je nach Ihrer Richtlinie für die inkrementelle Aktualisierung schneller erfolgen.

Festlegen des Standardspeicherformats

Für alle neuen Datasets, die in einem Arbeitsbereich einer Premium-Kapazität erstellt wurden, kann das Speicherformat für große Datasets standardmäßig aktiviert werden.

  1. Klicken Sie im Arbeitsbereich auf Einstellungen > Premium.

  2. Klicken Sie unter Default storage format (Standardspeicherformat) auf Großes Datasetspeicherformat und dann auf Speichern.

    Aktivieren des Standardspeicherformats

Aktivieren mithilfe von PowerShell

Das Speicherformat für große Datasets kann ebenfalls mithilfe von PowerShell aktiviert werden. Zum Ausführen der PowerShell-Cmdlets benötigen Sie Berechtigungen als Kapazitäts- und Arbeitsbereichadministrator.

  1. Suchen Sie die Dataset-ID (GUID). Die ID finden Sie auf der Registerkarte Datasets des Arbeitsbereichs unter den Dataseteinstellungen in der URL.

    Dataset-GUID

  2. Installieren Sie in der Eingabeaufforderung für den PowerShell-Administrator das Modul MicrosoftPowerBIMgmt.

    Install-Module -Name MicrosoftPowerBIMgmt
    
  3. Führen Sie die folgenden Cmdlets aus, um sich anzumelden und den Speichermodus des Datasets zu überprüfen.

    Login-PowerBIServiceAccount
    
    (Get-PowerBIDataset -Scope Organization -Id <Dataset ID> -Include actualStorage).ActualStorage
    

    Es sollte die folgende Antwort ausgegeben werden. Als Speichermodus ist „ABF“ (Analysis Services-Sicherungsdatei) ausgewählt. Das ist die Standardeinstellung.

    Id                   StorageMode
    
    --                   -----------
    
    <Dataset ID>         Abf
    
  4. Führen Sie die folgenden Cmdlets aus, um den Speichermodus festzulegen. Die Konvertierung in Files Premium kann einige Sekunden in Anspruch nehmen.

    Set-PowerBIDataset -Id <Dataset ID> -TargetStorageMode PremiumFiles
    
    (Get-PowerBIDataset -Scope Organization -Id <Dataset ID> -Include actualStorage).ActualStorage
    

    Es sollte die folgende Antwort ausgegeben werden. Der Speichermodus ist jetzt auf Files Premium festgelegt.

    Id                   StorageMode
    
    --                   -----------
    
    <Dataset ID>         PremiumFiles
    

Sie können den Status der Dataset-Konvertierungen in und aus Files Premium mithilfe des Get-PowerBIWorkspaceMigrationStatus-Cmdlets überprüfen.

Entfernen von Datasets

Power BI verwendet die dynamische Speicherverwaltung, um inaktive Datasets aus dem Arbeitsspeicher zu entfernen. Power BI entfernt Datasets, sodass zur Bearbeitung von Benutzeranfragen andere Datasets geladen werden können. Durch die dynamische Speicherverwaltung ist es möglich, dass die Summe der Datasetgrößen erheblich größer als der für die Kapazität verfügbare Arbeitsspeicher sein kann, ein einzelnes Dataset muss jedoch in den Arbeitsspeicher passen. Weitere Informationen zur dynamischen Speicherverwaltung finden Sie unter Funktionsweise von Kapazitäten.

Sie sollten berücksichtigen, welche Auswirkung die Entfernung auf große Modelle hat. Obwohl das Dataset relativ schnell geladen wird, kann es für die Benutzer zu einer spürbaren Verzögerung kommen, wenn sie darauf warten müssen, dass große entfernte Datasets neu geladen werden. Aus diesem Grund ist das Feature für große Modelle in seiner jetzigen Form in erster Linie für Kapazitäten vorgesehen, die für Enterprise BI-Anforderungen dediziert sind, und nicht für solche, die mit Self-Service-BI-Anforderungen kombiniert sind. Bei Kapazitäten, die für Enterprise BI-Anforderungen dediziert sind, kommt es wesentlich seltener vor, dass Datasets entfernt werden und neu geladen werden müssen. Kapazitäten für Self-Service-BI können andererseits viele kleine Datasets enthalten, die häufiger in den oder aus dem Arbeitsspeicher geladen werden.

Überprüfen der Datasetgröße

Nach dem Laden historischer Daten können Sie SSMS über den XMLA-Endpunkt verwenden, um die geschätzte Datasetgröße im Fenster „Modelleigenschaften“ zu überprüfen.

Geschätzte Datasetgröße

Sie können die Größe des Datasets ebenfalls überprüfen, indem Sie die folgenden DMV-Abfragen aus SSMS ausführen. Wenn Sie die Spalten DICTIONARY_SIZE und USED_SIZE aus der Ausgabe addieren, erhalten Sie die Datasetgröße in Bytes.

SELECT * FROM SYSTEMRESTRICTSCHEMA
($System.DISCOVER_STORAGE_TABLE_COLUMNS,
 [DATABASE_NAME] = '<Dataset Name>') //Sum DICTIONARY_SIZE (bytes)

SELECT * FROM SYSTEMRESTRICTSCHEMA
($System.DISCOVER_STORAGE_TABLE_COLUMN_SEGMENTS,
 [DATABASE_NAME] = '<Dataset Name>') //Sum USED_SIZE (bytes)

Standardsegmentgröße

Für Datasets, die das Speicherformat für große Datasets verwenden, legt Power BI die Standardsegmentgröße automatisch auf 8 Millionen Zeilen fest, um für große Tabellen ein gutes Gleichgewicht zwischen den Arbeitsspeicheranforderungen und der Abfrageleistung zu erreichen. Dies ist die gleiche Segmentgröße wie in Azure Analysis Services. Die Verwendung einer identischen Segmentgröße hilft dabei, vergleichbare Leistungsmerkmale bei der Migration eines großen Datenmodells von Azure Analysis Services zu Power BI sicherzustellen.

Überlegungen und Einschränkungen

Berücksichtigen Sie bei der Verwendung großer Datasets die folgenden Einschränkungen:

  • Neue Arbeitsbereiche sind erforderlich: Große Datasets funktionieren nur mit neuen Arbeitsbereichen.

  • Herunterladen von Dateien in Power BI Desktop: Wenn ein Dataset in Files Premium gespeichert wird, tritt beim Herunterladen als PBIX-Datei ein Fehler auf.

  • Unterstützte Regionen: Große Datasets werden in allen Azure-Regionen unterstützt, die Azure Files-Premium-Speicher unterstützen. Weitere Informationen finden Sie unter Verfügbare Produkte nach Region und in der Tabelle im nachfolgenden Abschnitt.

  • Festlegen der maximalen Größe des Datasets: Die maximale Größe des Datasets kann von Administratoren festgelegt werden. Der maximale Wert kann von 0,1 GB bis zur maximalen Kapazität der SKU festgelegt werden.

  • Pushdatasets: Pushdatasets unterstützen das Speicherformat für große Datasets nicht.

  • Sie können große Datasets nicht mithilfe der REST-API aktivieren.

Regionale Verfügbarkeit

Große Datasets in Power BI sind nur in bestimmten Azure-Regionen verfügbar, die Azure Files-Premium-Speicher unterstützen.

In der folgenden Liste sind Regionen aufgeführt, in denen große Datasets in Power BI verfügbar sind. In Regionen, die nicht in der folgenden Liste enthalten sind, werden große Modelle nicht unterstützt:

Azure-Region Abkürzung der Azure-Region
Australien (Osten) australiaeast
Australien, Südosten australiasoutheast
Kanada, Osten canadaeast
Kanada, Mitte canadacentral
Indien, Mitte centralindia
USA (Mitte) centralus
Asien, Osten eastasia
East US eastus
USA (Ost) 2 eastus2
Japan, Osten japaneast
Japan, Westen japanwest
Korea, Mitte koreacentral
Korea, Süden koreasouth
USA Nord Mitte northcentralus
Nordeuropa northeurope
USA Süd Mitte southcentralus
Asien, Südosten southeastasia
UK, Süden uksouth
UK, Westen ukwest
Europa, Westen westeurope
Indien, Westen westindia
USA (Westen) westus
USA, Westen 2 westus2

Nächste Schritte

Über die folgenden Links können Sie auf nützliche Informationen für die Arbeit mit großen Modellen zugreifen:

Power BI hat Power BI Premium Gen2 als Vorschauangebot eingeführt, das die Nutzung von Power BI Premium wie folgt verbessert:

  • Leistung
  • Einzelbenutzerlizenz
  • höhere Skalierbarkeit
  • verbesserte Metriken
  • Automatische Skalierung
  • reduzierter Verwaltungsaufwand

Weitere Informationen zu Power BI Premium Gen2 finden Sie unter Power BI Premium Generation 2.