Vorbereiten von Daten mit Datenwrangling

GILT FÜR: Azure Data Factory Azure Synapse Analytics

Mittels Datenwrangling in Data Factory können Sie interaktive Power Query-Mash-ups nativ in ADF erstellen und dann im großen Stil in einer ADF-Pipeline ausführen.

Erstellen einer Power Query-Aktivität

Eine Power Query kann in Azure Data Factory auf zwei Arten erstellt werden. Bei der einen Methode klicken Sie auf das Plussymbol und wählen im Bereich mit den Factory-Ressourcen die Option Power Query aus.

Screenshot: Power Query im Bereich „Factoryressourcen“.

Die andere Möglichkeit befindet sich im Bereich „Aktivitäten“ der Pipelinecanvas. Öffnen Sie das Accordion-Element Power Query, und ziehen Sie die Power Query-Aktivität auf die Canvas.

Screenshot: Hervorhebung der Datenwranglingoption.

Erstellen einer Power Query-Datenwranglingaktivität

Fügen Sie ein Quelldataset für Ihr Power Query-Mash-Up hinzu. Wählen Sie entweder ein vorhandenes Dataset aus, oder erstellen Sie ein neues. Nachdem Sie Ihr Mashup gespeichert haben, können Sie die Power Query-Datenwranglingaktivität zu Ihrer Pipeline hinzufügen und ein Senkendataset auswählen, um ADF mitzuteilen, wohin Ihre Daten gelangen sollen. Sie können zwar ein oder mehrere Quelldatasets auswählen, doch ist derzeit nur eine Senke zulässig. Die Auswahl eines Senkendatasets ist optional, aber es ist mindestens ein Quelldataset erforderlich.

Wrangling

Klicken Sie auf Erstellen, um den Power Query Online-Mashup-Editor zu öffnen.

Zunächst wählen Sie eine Datasetquelle für den Mashup-Editor aus.

Power Query-Quelle.

Nachdem Sie Ihre Power Query erstellt haben, können Sie sie speichern und das Mashup als Aktivität zu Ihrer Pipeline hinzufügen. Dann legen Sie die Eigenschaften des Senkendatasets fest.

Power Query-Senke.

Erstellen Sie Ihre Wrangling-Power Query mithilfe der codefreien Datenvorbereitung. Die Liste der verfügbaren Funktionen finden Sie unter Transformationsfunktionen. ADF übersetzt das M-Skript in ein Datenflussskript, sodass Sie Ihre Power Query im großen Stil mithilfe der Azure Data Factory-Datenfluss-Spark-Umgebung ausführen können.

Screenshot: Prozess zum Erstellen Ihrer Datenwrangling-Power Query.

Ausführen und Überwachen einer Power Query-Datenwranglingaktivität

Um eine Ausführung einer Power Query-Aktivität zum Debuggen einer Pipeline zu starten, klicken Sie in der Pipelinecanvas auf Debuggen. Nachdem Sie Ihre Pipeline veröffentlicht haben, können Sie mit Jetzt auslösen eine bedarfsgesteuerte Ausführung der letzten veröffentlichten Pipeline durchführen. Power Query-Pipelines können mit allen vorhandenen Azure Data Factory-Triggern geplant werden.

Screenshot: Hinzufügen einer Power Query-Datenwranglingaktivität.

Wechseln Sie zur Registerkarte Überwachen, um die Ausgabe einer ausgelösten Power Query-Aktivität zu visualisieren.

Screenshot: Ausgabe einer ausgelösten Wrangling-Power Query-Aktivitätsausführung.

Nächste Schritte

Erfahren Sie, wie Sie einen Zuordnungsdatenfluss erstellen.