Einführung

Abgeschlossen

Stellen Sie sich folgendes Szenario vor: Sie haben Daten aus mehreren verschiedenen Quellen in Power BI importiert. Als Sie die Daten untersuchen, stellen Sie fest, dass diese nicht bereit für die Analyse sind. Woran kann dies liegen?

Als Sie die Daten untersuchen, fallen Ihnen diverse Probleme auf, z. B. die folgenden:

  • Eine Spalte mit dem Namen Employment status enthält nur Ziffern.

  • Mehrere der Spalten enthalten Fehler.

  • Einige Spalten enthalten NULL-Werte.

  • Die Kunden-ID in einigen Spalten scheint mehrfach dupliziert worden zu sein.

  • Straße und Hausnummer, Ort, Bundesstaat und Postleitzahl sind zusammen in einer einzelnen Adressspalte enthalten.

Sie beginnen, mit den Daten zu arbeiten, aber immer wenn Sie Visuals in Berichten erstellen, erhalten Sie ungültige Daten und falsche Ergebnisse, und einfache Berichte über die Gesamtumsätze sind falsch.

Nicht bereinigte Daten können eine große Herausforderung darstellen. Auch wenn Sie frustriert sind, entschließen Sie sich, sich an die Arbeit zu machen und herauszufinden, wie Sie dieses semantische Modell so gut wie möglich optimieren können.

Glücklicherweise stellen Power BI und Power Query eine leistungsstarke Umgebung zum Bereinigen und Vorbereiten der Daten bereit. Bereinigte Daten bieten die folgenden Vorteile:

  • Measures und Spalten generieren korrektere Ergebnisse beim Ausführen von Aggregationen und Berechnungen.

  • Tabellen sind so organisiert, dass Benutzer die Daten intuitiv finden können.

  • Duplikate werden entfernt, was die Datennavigation vereinfacht. Außerdem werden Spalten erstellt, die in Slicern und Filtern verwendet werden können.

  • Eine komplexe Spalte kann in zwei einfachere Spalten aufgeteilt werden. Zur besseren Lesbarkeit können mehrere Spalten in einer Spalte kombiniert werden.

  • Codes und ganze Zahlen können durch von Menschen lesbare Werte ersetzt werden.

Dieses Modul umfasst Folgendes:

  • Beheben von Inkonsistenzen und von Problemen aufgrund von unerwarteten Werten bzw. NULL-Werten sowie von Datenqualitätsproblemen

  • Anwenden benutzerfreundlicher Wertersetzungen

  • Profilerstellung für Daten zum Erfassen weiterer Informationen zu einer bestimmten Spalte vor ihrer Verwendung

  • Auswerten und Transformieren von Spaltendatentypen

  • Anwenden von Datenformtransformationen auf Tabellenstrukturen

  • Kombinieren von Abfragen

  • Anwenden benutzerfreundlicher Namenskonventionen auf Spalten und Abfragen

  • Bearbeiten von M-Code im erweiterten Editor