Tutorial: Strukturieren und Kombinieren von Daten in Power BI Desktop

Mit Power BI Desktop können Sie verschiedenste Arten von Datenquellen verknüpfen und die Daten dann basierend auf Ihren Anforderungen strukturieren. So können Sie visuelle Berichte erstellen und mit anderen Benutzern gemeinsam nutzen. Das Strukturieren von Daten ist mit einem Transformieren der Daten gleichzusetzen. Sie können beispielsweise Spalten oder Tabellen umbenennen, Text in Zahlen umwandeln, Zeilen entfernen, die erste Zeile als Überschrift festlegen usw. Beim Kombinieren von Daten werden mehrere Datenquellen verknüpft, gemäß Anforderungen geformt und dann in einer einzelnen Abfrage konsolidiert.

In diesem Tutorial lernen Sie Folgendes:

  • Strukturieren von Daten mit dem Power Query-Editor.
  • Verbindungsherstellung mit verschiedenen Datenquellen
  • Kombinieren dieser Datenquellen und Erstellen eines Datenmodells zur Verwendung in Berichten

Dieses Tutorial veranschaulicht, wie Sie eine Abfrage mit Power BI Desktop strukturieren können. Hierbei werden insbesondere die gängigsten Aufgaben hervorgehoben. Die hier verwendete Abfrage (und auch der gesamte Erstellungsvorgang) ist im Handbuch Erste Schritte mit Power BI-Desktop ausführlicher beschrieben.

Der Power Query-Editor in Power BI Desktop verwendet die Kontextmenüs (Rechtsklick) und das Menüband Transformieren. Die meisten der Optionen, die im Menüband verfügbar sind, können auch durch einen Rechtsklick auf ein Element (z. B. eine Spalte) und Auswahl einer Option aus dem daraufhin angezeigten Menü aufgerufen werden.

Strukturieren von Daten

Um Daten im Power Query-Editor zu formen, stellen Sie dem Power Query-Editor Schrittanweisungen bereit, um das Laden von Daten und deren Darstellung im Power Query-Editor anzupassen. Die ursprüngliche Datenquelle bleibt davon unberührt. Angepasst bzw. strukturiert wird nur diese spezifische Ansicht der Daten.

Die Schritte, die Sie angeben (z. B. Umbenennen einer Tabelle, Transformieren eines Datentyps oder Löschen einer Spalte), werden vom Power Query-Editor aufgezeichnet. Bei jeder Verbindung dieser Abfrage mit der Datenquelle führt Power Query-Editor diese Schritte aus, damit die Daten dann in der gewünschten strukturierten Ansicht angezeigt werden. Dieser Vorgang wird immer dann ausgeführt, wenn Sie den Power Query-Editor in Power BI Desktop verwenden, oder wenn ein Benutzer auf die freigegebene Abfrage zugreift (z. B. im Power BI-Dienst). Diese Schritte werden der Reihe nach im Bereich Abfrageeinstellungen unter ANGEWENDETE SCHRITTE aufgezeichnet. In diesem Artikel werden diese Schritte im Einzelnen erläutert.

Screenshot of Power Query Editor with the Query Settings pane and Applied steps list.

  1. Importieren Sie die Daten aus einer Webquelle. Wählen Sie das Dropdownliste Daten abrufen und dann Web aus.

    Screenshot of Power Query Editor with the Get data menu and Web source selected.

  2. Fügen Sie diese URL in das Dialogfeld Aus Web ein und wählen Sie OK aus.

    https://www.fool.com/research/best-states-to-retire
    

    Screenshot of Power Query Editor's From Web dialog with the source page's URL entered.

  3. Wählen Sie im Dialogfeld Navigator die Option Table 1 und dann Daten transformieren aus.

    Screenshot of Power Query Editor's Navigator dialog with HTML Table 1 selected and the Transform Data button highlighted.

Tipp

Einige Informationen in den Tabellen aus der vorherigen URL können sich gelegentlich ändern oder aktualisiert werden. Daher müssen Sie die Auswahl oder die Schritte in diesem Artikel möglicherweise entsprechend anpassen.

  1. Das Fenster Power Query-Editor wird geöffnet. Die bisher angewendeten Standardschritte werden im Bereich Abfrageeinstellungen unter ANGEWENDETE SCHRITTE angezeigt.

    • Quelle: Herstellen einer Verbindung mit der Website.
    • Extrahierte Tabelle aus HTML: Wählen Sie die Tabelle aus.
    • Höher gestufte Header: Ändern der obersten Datenzeile in Spaltenheader.
    • Geänderter Typ: Ändern der als Text importierten Spaltentypen in ihre abgeleiteten Typen.

    Screenshot of the Power Query Editor window with Query Settings highlighted.

  2. Ändern Sie den Tabellennamen von der Standardeinstellung Table 1 in Retirement Data und drücken Sie dann die EINGABETASTE.

    Screenshot of Power Query Editor showing how to edit a table name in Query Settings.

  3. Die vorhandenen Daten werden nach einer gewichteten Bewertung sortiert, wie auf der Quellwebseite unter Methodik beschrieben. Fügen Sie eine benutzerdefinierte Spalte hinzu, um einen anderen Score zu berechnen. Anschließend wird die Tabelle in dieser Spalte sortiert, um die Rangfolge des benutzerdefinierten Scores mit dem vorhandenen Rang zu vergleichen.

  4. Wählen Sie im Menüband Spalte hinzufügen die Option Benutzerdefinierte Spalte aus.

    Screenshot of Power Query Editor's Add Column ribbon with the Custom Column button highlighted.

  5. Geben Sie im Dialogfeld Benutzerdefinierte Spalte unter Name der neuen Spalte den Wert Neuer Score ein. Geben Sie für die Benutzerdefinierte Spaltenformel die folgenden Daten ein:

    ( [Quality of life] + [Housing cost] + [Healthcare cost and quality] + [Crime rate rate] + [#"Public health/COVID-19 response"] + [Sales taxes] + [#"Non-housing costs"] + [Weather] ) / 8
    
  6. Vergewissern Sie sich, dass die Statusmeldung Es wurden keine Syntaxfehler erkannt. angezeigt wird, und klicken Sie auf OK.

    Screenshot of Power Query Editor's Custom Column dialog showing the new column name, custom column formula, and no syntax errors.

  7. In den Abfrageeinstellungen zeigt die Liste ANGEWENDETE SCHRITTE nun den neuen hinzugefügten benutzerdefinierten Schritt an, der gerade definiert wurde.

    Screenshot of Power Query Editor's Query Settings pane showing the Applied Steps list with the actions so far.

Anpassen der Daten

Bevor Sie mit dieser Abfrage arbeiten, werden einige Änderungen zum Anpassen der Daten vorgenommen:

  • Anpassen der Rangfolgen durch Entfernen einer Spalte

    Angenommen, das Wetter spielt in den Ergebnissen keine Rolle. Das Entfernen dieser Spalte aus der Abfrage wirkt sich nicht auf die anderen Daten aus.

  • Alle Fehler beheben

    Da eine Spalte entfernt wurde, müssen die Berechnungen in der Spalte Neuer Score angepasst werden, indem ihre Formel geändert wird.

  • Sortieren der Daten

    Sortieren Sie die Daten basierend auf der Spalte Neuer Score und vergleichen Sie sie mit der vorhandenen Spalte Rang.

  • Ersetzen der Daten

    Es wird hervorgehoben, wie Sie einen bestimmten Wert ersetzen und einen angewendeten Schritt einfügen.

Diese Änderungen werden in den folgenden Schritten beschrieben.

  1. Um die Spalte Wetter zu entfernen, wählen Sie die Spalte und dann im Menüband die Registerkarte Start. Wählen Sie anschließend Spalten entfernen.

    Screenshot of Power Query Editor's Home menu with the Remove Columns button highlighted.

    Hinweis

    Die Werte Neuer Score haben sich aufgrund der Reihenfolge der Schritte nicht geändert. Power Query-Editor zeichnet die Schritte nacheinander, aber unabhängig voneinander auf. Um Aktionen in einer anderen Reihenfolge anzuwenden, können Sie jeden angewendeten Schritt nach oben oder unten verschieben.

  2. Klicken Sie mit der rechten Maustaste auf einen Schritt, um das Kontextmenü anzuzeigen.

    Screenshot of Power Query Editor's Applied Steps context menu.

  3. Verschieben Sie den letzten Schritt Entfernte Spalten an die Stelle direkt über den Schritt Hinzugefügte benutzerdefiniert Spalte.

    Screenshot of Power Query Editor's Applied Steps list with the Removed Columns step now moved above the Custom Column step.

  4. Wählen Sie den Schritt Hinzugefügte benutzerdefiniert Spalte aus.

    Beachten Sie, dass in der Spalte Neuer Score jetzt Fehler anstelle des berechneten Werts angezeigt wird.

    Screenshot of Power Query Editor and the New score column containing Error values.

    Es gibt mehrere Möglichkeiten, weitere Informationen zu jedem Fehler zu erhalten. Wenn Sie die Zelle auswählen, ohne auf das Wort Fehler zu klicken, zeigt der Power Query-Editor die Fehlerinformationen im unteren Fensterbereich an.

    Screenshot of Power Query Editor showing the New score column with Error details.

    Wenn Sie das Wort Fehler direkt auswählen, erstellt der Power Query-Editor im Bereich Abfrageeinstellungen unter Angewendete Schritte einen weiteren Schritt und zeigt die Informationen zu dem Fehler an. Da an keiner anderen Stelle Fehlerinformationen angezeigt werden müssen, wählen Sie Abbrechen.

  5. Um die Fehler zu beheben, sind zwei Änderungen erforderlich: Entfernen des Spaltennamens Wetter und Ändern des Divisors von 8 in 7. Sie können diese Änderungen auf zwei Arten vornehmen:

    1. Klicken Sie mit der rechten Maustaste auf den Schritt Benutzerdefinierte Spalte und wählen Sie Einstellungen bearbeiten aus. Dadurch wird das Dialogfeld Benutzerdefinierte Spalte angezeigt, das Sie zum Erstellen der Spalte Neuer Score verwendet haben. Bearbeiten Sie die Formel wie zuvor beschrieben, bis sie wie folgt aussieht:

      Screenshot of Power Query Editor's Custom Column dialog with formula errors fixed.

    2. Wählen Sie die Spalte Neuer Score aus und zeigen Sie dann die Datenformel der Spalte an, indem Sie das Kontrollkästchen Formelleiste auf der Registerkarte Ansicht aktivieren.

      Screenshot of Power Query Editor showing the New score column and its data formula with errors fixed.

      Bearbeiten Sie die Formel wie zuvor beschrieben, bis sie so aussieht, und drücken Sie dann die EINGABETASTE.

      = Table.AddColumn(#"Removed Columns", "New score", each ( [Quality of life] + [Housing cost] + [Healthcare cost and quality] + [Crime rate rate] + [#"Public health/COVID-19 response"] + [Sales taxes] + [#"Non-housing costs"] ) / 7)              
      

    Der Power Query-Editor ersetzt die Daten durch die überarbeiteten Werte, und der Schritt Hinzugefügte benutzerdefinierte Spalte wird ohne Fehler abgeschlossen.

    Hinweis

    Sie können auch die Option Fehler entfernen (im Menüband oder Kontextmenü) auswählen, mit der alle fehlerhafte Zeilen entfernt werden. In diesem Tutorial sollen jedoch alle Daten in der Tabelle erhalten bleiben.

  6. Sortieren Sie die Daten basierend auf der Spalte Neuer Score. Wählen Sie zunächst den zuletzt angewendeten Schritt Hinzugefügte benutzerdefinierte Spalte aus, um die neuesten Daten abzurufen. Wählen Sie anschließend über die Dropdownliste neben der Spaltenüberschrift Neuer Score die Option Absteigend sortieren aus.

    Screenshot of Power Query Editor showing the New score column with Sort Descending highlighted.

    Die Daten sind nun nach Neuer Score sortiert. Sie können einen angewendeten Schritt an beliebiger Stelle in der Liste auswählen und die Daten an diesem Punkt in der Reihenfolge weiter formen. Der Power Query-Editor fügt automatisch einen neuen Schritt direkt nach dem aktuell ausgewählten angewendeten Schritt ein.

  7. Wählen Sie in ANGEWENDETE SCHRITTE den Schritt aus, der der benutzerdefinierten Spalte vorangeht, also Entfernte Spalten. An dieser Stelle wird der Wert der Rangfolge Wohnkosten in Oregon ersetzt. Klicken Sie mit der rechten Maustaste auf die Zelle, die den Wert Wohnkosten für Oregon enthält, und wählen Sie Werte ersetzen aus. Beachten Sie auch die aktuelle Auswahl in Angewendeter Schritt.

    Screenshot of the Power Query Editor window showing the Housing cost column with the Replace Values right-click menu item highlighted.

  8. Wählen Sie Einfügen aus.

    Denn durch das Einfügen eines Schritts erinnert der Power Query-Editor daran, dass nachfolgende Schritte dazu führen können, dass die Abfrage abbricht.

    Screenshot of Power Query Editor's Insert Step verification dialog.

  9. Ändern Sie den Datenwert in 100.0.

    Der Power Query-Editor ersetzt die Daten für Oregon. Wenn Sie einen neuen angewendeten Schritt erstellen, benennt ihn der Power Query-Editor nach der jeweiligen Aktion, in diesem Fall Ersetzter Wert. Falls die Abfrage mehrere Schritte gleichen Namens enthält, fügt der Power Query-Editor eine aufsteigende Zahl an den Namen jedes nachfolgenden angewendeten Schritts an.

  10. Wählen Sie nun den letzten Schritt Sortierte Zeilen unter Angewendete Schritte aus.

    Beachten Sie, dass die Daten im Hinblick auf die neue Rangfolge von Oregon geändert wurden. Dies ist darauf zurückzuführen, dass wir den Schritt Ersetzter Wert an der richtigen Stelle eingefügt haben, nämlich vor dem Schritt Hinzugefügte benutzerdefiniert Spalte.

    Die Daten sind nun so strukturiert, dass sie unseren Anforderungen entsprechen. Jetzt stellen wir eine Verbindung zu einer anderen Datenquelle her und kombinieren die Daten.

Kombinieren von Daten

Die Daten zu verschiedenen Bundesstaaten sind interessant und nützlich für die Erstellung weiterer Analysen und Abfragen. Die meisten Daten zu Bundesstaaten verwenden jedoch ein zweistelliges Länderkürzel als Code für den Bundesstaat und nicht dessen vollen Namen. Wir müssen die Namen der Bundesstaaten in irgendeiner Weise mit den Kürzeln verknüpfen.

Es gibt eine andere öffentliche Datenquelle, die diese Zuordnung bereitstellt, aber sie erfordert einiges an Formgebung, bevor sie mit der Ruhesetzungstabelle verbunden werden kann. Führen Sie zum Formen der Daten die folgenden Schritte aus:

  1. Wählen Sie im Power Query-Editor über das Menüband Start den Befehl Neue Quelle > Web aus.

  2. Geben Sie die Adresse der Website für Abkürzungen von Bundesstaaten ein ( https://en.wikipedia.org/wiki/List_of_U.S._state_abbreviations ), und klicken Sie dann auf Verbinden.

    Der Navigator zeigt die Inhalte der Website an.

    Screenshot of Power Query Editor's Navigator page showing the Codes and abbreviations table selected.

  3. Wählen Sie Codes und Abkürzungen für US-Bundesstaaten, Bundesbezirke, Gebiete und andere Regionen aus.

    Tipp

    Es erfordert ein wenig Formgebung, diese Tabelle so zu strukturieren, dass sie nur die benötigten Daten enthält. Gibt es einen schnelleren oder einfacheren Weg, die folgenden Schritte auszuführen? Ja, Sie könnten eine Beziehung zwischen den beiden Tabellen erstellen und die Daten basierend auf dieser Beziehung strukturieren. Die folgenden Beispielschritte sind hilfreich zum Erlernen der Arbeit mit Tabellen. Beziehungen können Ihnen jedoch helfen, Daten aus mehreren Tabellen schnell zu verwenden.

Führen Sie zum Strukturieren der Daten diese Schritte aus:

  1. Entfernen Sie die oberste Zeile. Diese ist ein Ergebnis der Tabellenerstellung aus der Webseite und wird nicht gebraucht. Wählen Sie im Menüband auf der Registerkarte Start die Optionen Zeilen entfernen > Erste Zeilen entfernen aus.

    Screenshot of Power Query Editor highlighting the Remove Rows dropdown and the Remove Top Rows item.

    Das Dialogfeld Oberste Zeilen entfernen wird angezeigt. Geben Sie 1 Zeile zum Entfernen an.

  2. Stufen Sie die neue oberste Zeile mit Erste Zeile als Headers verwenden auf der Registerkarte Start oder auf der Registerkarte Transformieren im Menüband höher.

  3. Da die Tabelle Ruhesetzungsdaten keine Informationen für Washington DC oder Gebiete enthält, müssen wir sie aus unserer Liste herausfiltern. Wählen Sie im Dropdown-Menü der Spalte Name und Status von region_1 aus und deaktivieren Sie dann alle Kontrollkästchen mit Ausnahme von Bundesstaat.

    Screenshot of Power Query Editor showing a column filter with only the State value selected.

  4. Entfernen Sie alle nicht benötigten Spalten. Da nur die Zuordnung jedes Bundesstaates zu dessen offiziellen zweistelligen Länderkürzel (Name und Status der Region und ANSI-Spalten) erforderlich ist, können die anderen Spalten entfernt werden. Wählen Sie zunächst die Spalte Name und Status der Region aus, halten Sie dann die STRG-Taste gedrückt und wählen Sie die ANSI-Spalte aus. Wählen Sie im Menüband auf der Registerkarte Start die Optionen Spalten entfernen > Andere Spalten entfernen aus.

    Screenshot of Power Query Editor highlighting the Remove Columns dropdown and the Remove Other Columns item.

    Hinweis

    Die Reihenfolge der im Power Query-Editor angewendeten Schritte ist wichtig und wirkt sich auf die Formgebung der Daten aus. Es ist auch wichtig zu berücksichtigen, wie sich ein Schritt auf einen anderen nachfolgenden Schritt auswirken könnte. Wenn Sie beispielsweise einen Schritt aus den angewendeten Schritten entfernen, verhalten sich nachfolgende Schritte möglicherweise nicht wie ursprünglich vorgesehen.

    Hinweis

    Wenn Sie die Breite des Power Query-Editorfensters verringern, werden einige Elemente des Menübands gestaucht, um den angezeigten Raum optimal zu nutzen. Wenn Sie das Fenster des Power Query-Editors verbreitern, werden die Elemente des Menübands gedehnt, um die größere Fläche des Menübands zu nutzen.

  5. Benennen Sie die Spalten und die Tabelle um. Es gibt mehrere Möglichkeiten, eine Spalte umzubenennen: Wählen Sie zuerst die Spalte aus, und wählen Sie dann entweder Umbenennen auf der Registerkarte Transformieren im Menüband aus, oder klicken Sie mit der rechten Maustaste und wählen Sie Umbenennen aus. In der folgenden Abbildung werden diese beiden Optionen angezeigt, Sie müssen sich jedoch nur für eine entscheiden.

    Screenshot of Power Query Editor highlighting the Rename button and also the Rename right-click item.

  6. Benennen Sie die Spalten in State Name und State Code um. Um die Tabelle umzubenennen, geben Sie NameCodes für Bundesstaaten im Bereich Abfrageeinstellungen ein.

    Screenshot of Power Query Editor window showing the results of shaping state codes source data into a table.

Kombinieren von Abfragen

Nachdem die Tabelle Codes für Bundesstaaten wie gewünscht geformt wurde, können diese zwei Tabellen (oder Abfragen) zu einer Tabelle kombiniert werden. Da die jetzt vorliegenden Tabellen das Ergebnis der Abfragen sind, die wir auf die Daten angewendet haben, werden sie häufig als Abfragen bezeichnet.

Zum Kombinieren von Abfragen gibt zwei Möglichkeiten: Zusammenführen und Anfügen.

  • Bei einer oder mehreren Spalten, die Sie zu einer anderen Abfrage hinzufügen möchten, sollten Sie die Abfragen zusammenführen.
  • Bei einer oder mehreren Datenzeilen, die Sie zu einer vorhandenen Abfrage hinzufügen möchten, sollten Sie die Abfrage anfügen.

Im diesem Fall sollen die Abfragen zusammengeführt werden:

  1. Wählen Sie im linken Bereich des Power Query-Editors die Abfrage aus, in der beide Abfragen zusammengeführt werden sollen. In diesem Fall handelt es sich um Ruhesetzungsdaten.

  2. Wählen Sie im Menüband auf der Registerkarte Start die Option Abfragen zusammenführen > Abfragen zusammenführen aus.

    Screenshot of Power Query Editor's Merge Queries dropdown with the Merge Queries item highlighted.

    Sie werden möglicherweise aufgefordert, die Datenschutzebenen festzulegen. So wird beim Kombinieren der Daten sichergestellt, dass keine Daten einbezogen oder übertragen werden, die nicht übertragen werden sollen.

    Das Fenster Zusammenführen wird geöffnet. Sie werden aufgefordert, die Tabelle auszuwählen, die mit der ausgewählten Tabelle zusammengeführt werden soll. Anschließend müssen Sie die entsprechenden Spalten angeben, die für die Zusammenführung verwendet werden sollen.

  3. Wählen Sie Bundesstaat aus der Tabelle Ruhesetzungsdaten und dann die Abfrage Codes für Bundesstaaten aus.

    Wenn Sie eine passende Spalte auswählen, wird die Schaltfläche OK aktiviert.

    Screenshot of Power Query Editor's Merge dialog.

  4. Klicken Sie auf OK.

    Der Power Query-Editor erstellt am Ende der Abfrage eine neue Spalte, die den Inhalt der Tabelle (Abfrage) umfasst, die mit der vorhandenen Abfrage zusammengeführt wurde. Alle Spalten aus der zusammengeführten Abfrage werden auf die neue Spalte zusammengefasst. Sie können jedoch die Tabelle Erweitern und gewünschte Spalten einbeziehen.

  5. Um die zusammengeführte Tabelle zu erweitern und auszuwählen, welche Spalten einbezogen werden sollen, klicken Sie auf das Erweiterungssymbol ( ).

    Das Fenster Erweitern wird geöffnet.

    Screenshot of Power Query Editor's column Expand dialog showing the State Code column highlighted.

  6. In unserem Fall wird nur die Spalte State Code benötigt. Wählen Sie diese Spalte aus, deaktivieren Sie Ursprünglichen Spaltennamen als Präfix verwenden, und klicken Sie dann auf OK.

    Wenn Sie das Kontrollkästchen Ursprünglichen Spaltennamen als Präfix verwenden aktiviert lassen, würde der Name der zusammengeführten Spalte State Codes.State Code lauten.

    Hinweis

    Wenn Sie untersuchen möchten, wie Sie die Tabelle Codes für Bundesstaaten einbinden, können Sie ein wenig experimentieren. Wenn Ihnen die Ergebnisse nicht gefallen, löschen Sie diesen Schritt einfach aus der Liste ANGEWENDETE SCHRITTE im Bereich Abfrageeinstellungen, und Ihre Abfrage kehrt zum Bundesstaat zurück, bevor der Schritt Erweitern angewendet wird. Sie können beliebig oft und solange experimentieren, bis die Erweiterung Ihren Vorstellungen entspricht.

    Sie verfügen jetzt über eine einzelne Abfrage (Tabelle), die zwei Datenquellen kombiniert, von denen jede so geformt ist, dass sie den Anforderungen entspricht. Diese Abfrage kann eine Grundlage für interessante Datenverbindungen sein, wie z. B. Statistiken zu Wohnkosten, Lebensqualität oder Kriminalitätsrate in einem beliebigen Bundesstaat.

  7. Um Ihre Änderungen zu übernehmen und den Power Query-Editor zu schließen, wählen Sie auf der Registerkarte Start des Menübands die Option Schließen und Anwenden aus.

    Das transformierte semantische Modell wird in Power BI Desktop angezeigt und kann für das Erstellen von Berichten verwendet werden.

    Screenshot of Power Query Editor's Close & Apply button.

Weitere Informationen zu Power BI Desktop und seinen Funktionen finden Sie in den folgenden Ressourcen: