CSV-Dateien kombinieren

In Power Query können Sie mehrere Dateien aus einer bestimmten Datenquelle kombinieren. In diesem Artikel wird beschrieben, wie die Erfahrung funktioniert, wenn es sich bei den Dateien, die Sie kombinieren möchten, um CSV-Dateien handelt. Weitere Informationen: Übersicht über das Kombinieren von Dateien

Tipp

Sie können diesem Beispiel folgen, indem Sie die in diesem Artikel verwendeten Beispieldateien über diesen Downloadlink herunterladen. Sie können diese Dateien in der Datenquelle Ihrer Wahl platzieren, z. B. in einem lokalen Ordner, SharePoint-Ordner, Azure Blob Storage, Azure Data Lake Storage oder in einer anderen Datenquelle, die die Dateisystemansicht bereitstellt.

Der Einfachheit halber verwendet das Beispiel in diesem Artikel den Ordner-Connector. Weitere Informationen: Ordner

Informationen zu den verwendeten Beispieldateien

Um Dateien zu kombinieren, müssen sie alle über die gleiche Struktur und die gleiche Erweiterung verfügen. Alle in diesem Beispiel verwendeten Dateien weisen die gleiche Struktur und Erweiterung (.csv) auf.

Es gibt 12 CSV-Dateien, eine für jeden Monat des Kalenderjahres 2019. Die folgende Abbildung zeigt die ersten 15 Zeilen der Datei für den Monat Januar.

CSV-Beispieldatei für Januar 2019 mit dem Kopfzeilenabschnitt und den restlichen Daten, alle durch Kommas getrennt.

Die Anzahl der Zeilen variiert von Datei zu Datei, aber alle Dateien weisen einen Kopfzeilenabschnitt in den ersten vier Zeilen auf. Sie haben Spaltenüberschriften in der fünften Zeile, und die Daten für die Tabelle beginnen in der sechsten Zeile und werden durch alle nachfolgenden Zeilen fortgesetzt.

Ziel ist es, alle 12 Dateien in einer einzigen Tabelle zu kombinieren. Diese kombinierte Tabelle enthält die Kopfzeile oben in der Tabelle und beinhaltet den Quellnamen, das Datum, das Land, die Einheiten und die Umsatzdaten für das gesamte Jahr in separaten Spalten nach der Kopfzeile.

Beispiel für eine endgültige kombinierte Tabelle.

Tabellenvorschau

Beim Herstellen einer Verbindung mit dem Ordner, der die zu kombinierenden Dateien hosten soll – in diesem Beispiel ist der Name dieses Ordners CSV-Dateien – wird das Dialogfeld „Tabellenvorschau“ angezeigt, in dem der Ordnerpfad in der oberen linken Ecke dargestellt wird. Die Datenvorschau zeigt die Dateisystemansicht an.

Tabellenvorschau für die Dateisystemansicht.

Wählen Sie für dieses Beispiel Kombinieren aus.

Hinweis

In einer anderen Situation können Sie Daten transformieren auswählen, um Ihre Daten weiter zu filtern und zu transformieren, bevor Sie die Dateien kombinieren. Die Auswahl von Kombinieren wird nur empfohlen, wenn Sie sicher sind, dass der Ordner nur die Dateien enthält, die Sie kombinieren möchten.

Dialogfeld „Dateien kombinieren“

Nach Auswahl von Kombinieren in der Tabellenvorschau wird das Dialogfeld Dateien kombinieren angezeigt.

Dialogfeld

Hinweis

Power Query erkennt automatisch, welcher Connector basierend auf der ersten Datei in der Liste verwendet werden soll. Weitere Informationen zum CSV-Connector finden Sie unter Text/CSV.

Behalten Sie in diesem Beispiel alle Standardeinstellungen bei (Beispieldatei ist auf Erste Datei und die Standardwerte für Dateiursprung, Trennzeichen und Datentyperkennung festgelegt).

Wählen Sie jetzt Daten transformieren in der unteren rechten Ecke aus, um zur Ausgabeabfrage zu wechseln.

Ausgabeabfrage

Nach Auswahl von Daten transformieren im Dialogfeld Dateien kombinieren gelangen Sie zurück zum Power Query-Editor in der Abfrage, die Sie ursprünglich aus der Verbindung mit dem lokalen Ordner erstellt haben. Die Ausgabeabfrage enthält nun den Namen der Quelldatei in der Spalte ganz links sowie die Daten aus jeder Quelldatei in den verbleibenden Spalten.

Ausgabeabfrage für kombinierte Dateien ohne zusätzliche Transformationen.

Allerdings sind die Daten nicht in der richtigen Form. Sie müssen die obersten vier Zeilen aus jeder Datei entfernen, bevor Sie sie kombinieren. Wenn Sie diese Änderung in jeder Datei vornehmen möchten, bevor Sie sie kombinieren, wählen Sie im Bereich Abfragen auf der linken Seite des Bildschirms die Abfrage Transformationsbeispieldatei aus.

Die Abfrage „Transformationsbeispieldatei“ ändern

In dieser Abfrage Transformationsbeispieldatei geben die Werte in der Spalte Datum an, dass die Daten für den Monat April gelten, der das Jahr-Monat-Tag-Format (JJJJ-MM-TT) aufweist. April 2019.csv ist die erste Datei, die in der Tabellenvorschau angezeigt wird.

Tabelle mit den Datenspalten vom April 2019, einschließlich des Kopfzeilenabschnitts in den ersten vier Zeilen und den Überschriften in der fünften Zeile.

Sie müssen jetzt eine neue Gruppe von Transformationen anwenden, um die Daten zu bereinigen. Jede Transformation wird automatisch in eine Funktion innerhalb der Hilfsabfragegruppe konvertiert, die auf jede Datei im Ordner angewendet wird, bevor die Daten aus jeder Datei kombiniert werden.

Die Transformationen, die der Abfrage Transformationsbeispieldatei hinzugefügt werden müssen, sind:

  1. Oberste Zeilen entfernen: Wählen Sie zum Ausführen dieses Vorgangs das Tabellensymbolmenü in der oberen linken Ecke der Tabelle und dann Oberste Zeilen entfernen aus.

    Die obersten Zeilen im Tabellenmenü entfernen.

    Geben Sie im Dialogfeld Oberste Zeilen entfernen4 ein, und wählen Sie dann OK aus.

    Dialogfeld

    Nach Auswahl von OK enthält Ihre Tabelle nicht mehr die obersten vier Zeilen.

    Beispielabfrage mit entfernten Zeilen.

  2. Erste Zeile als Überschriften verwenden: Wählen Sie erneut das Tabellensymbol und dann Erste Zeile als Überschriften verwenden aus.

    Symbol

    Das Ergebnis dieses Vorgangs stuft die erste Zeile der Tabelle auf die neuen Spaltenüberschriften hoch.

    Hervorgehobene Beispieltabellenüberschriften.

Nach Abschluss dieses Vorgangs versucht Power Query standardmäßig, die Datentypen der Spalten automatisch zu erkennen und einen neuen Schritt vom Typ Geänderte Spalte hinzuzufügen.

Ausgabeabfrage überarbeiten

Wenn Sie zur Abfrage CSV-Dateien zurückkehren, werden Sie feststellen, dass der letzte Schritt den Fehler „Die Spalte „Spalte1“ der Tabelle wurde nicht gefunden“ enthält. Der Grund für diesen Fehler besteht darin, dass der vorherige Status der Abfrage einen Vorgang für eine Spalte mit dem Namen Spalte1 ausgeführt hat. Aufgrund der Änderungen an der Abfrage Transformationsbeispieldatei ist diese Spalte jedoch nicht mehr vorhanden. Weitere Informationen: Umgang mit Fehlern in Power Query

Ausgabeabfrage mit Fehler auf Schrittebene.

Sie können diesen letzten Schritt der Abfrage aus dem Bereich Angewendete Schritte entfernen, indem Sie auf der linken Seite des Schrittnamens das X-Symbol zum Löschen auswählen. Nach dem Löschen dieses Schritts zeigt Ihre Abfrage die richtigen Ergebnisse an.

Dateien ohne Fehlerschritt kombinieren.

Beachten Sie jedoch, dass keiner der aus den Dateien abgeleiteten Spalten (Datum, Land, Einheiten, Umsatz) ein bestimmter Datentyp zugewiesen ist. Weisen Sie den richtigen Datentyp jeder Spalte mithilfe der folgenden Tabelle zu.

Spaltenname Datentyp
Datum Date
Land / Region Text
Einheiten Ganze Zahl
Umsatz Währung

Nachdem Sie die Datentypen für jede Spalte definiert haben, können Sie die Tabelle laden.

Beispiel für eine endgültige kombinierte Tabelle.

Hinweis

Informationen zum Definieren oder Ändern von Spaltendatentypen finden Sie unter Datentypen.

Überprüfung

Um zu überprüfen, ob alle Dateien kombiniert wurden, können Sie das Filtersymbol in der Spalte Source.Name auswählen, wodurch alle Namen der kombinierten Dateien angezeigt werden. Wenn die Warnung „Liste ist möglicherweise unvollständig“ angezeigt wird, wählen Sie unten im Menü Mehr laden aus, um weitere verfügbare Werte in der Spalte anzuzeigen.

Unvollständige Liste der Dateien, die kombiniert wurden.

Nach Auswahl von Mehr laden werden alle verfügbaren Dateinamen angezeigt.

Vollständige Liste der Dateien, die kombiniert wurden.