Was sind Wranglingdatenflüsse?What are wrangling data flows?

Organisationen müssen Datenaufbereitung und Data Wrangling durchführen, um komplexe Daten, deren Menge täglich wächst, exakt analysieren zu können.Organizations need to do data preparation and wrangling for accurate analysis of complex data that continues to grow every day. Die Datenaufbereitung ist erforderlich, damit Organisationen die Daten in verschiedenen Geschäftsprozessen verwenden und die Amortisationszeit verkürzen können.Data preparation is required so that organizations can use the data in various business processes and reduce the time to value.

Wranglingdatenflüsse in Azure Data Factory ermöglichen Ihnen das iterative Vorbereiten von Daten ohne Code für die Cloud.Wrangling data flows in Azure Data Factory allow you to do code-free data preparation at cloud scale iteratively. Wranglingdatenflüsse können in Power Query Online integriert werden und stellen Power Query M-Funktionen für Data Factory-Benutzer bereit.Wrangling data flows integrate with Power Query Online and makes Power Query M functions available for data factory users.

Wranglingdatenflüsse übersetzen M-Code, der vom Power Query Online Mashup Editor generiert wird, in Spark-Code für die Cloudskalierungsausführung.Wrangling data flow translates M generated by the Power Query Online Mashup Editor into spark code for cloud scale execution.

Wranglingdatenflüsse sind besonders nützlich für Datentechniker oder für Datenintegratoren ohne Programmiererfahrung.Wrangling data flows are especially useful for data engineers or 'citizen data integrators'.

AnwendungsfälleUse cases

Schnelle interaktive Untersuchung und Aufbereitung von DatenFast interactive data exploration and preparation

Mehrere Datentechniker und Datenintegratoren ohne Programmiererfahrung können Datasets in der Cloud interaktiv untersuchen und aufbereiten.Multiple data engineers and citizen data integrators can interactively explore and prepare datasets at cloud scale. Mit zunehmender Menge, Vielfalt und Geschwindigkeit der Daten in Data Lakes benötigen Benutzer eine effektive Möglichkeit zum Untersuchen und Aufbereiten von Datasets.With the rise of volume, variety and velocity of data in data lakes, users need an effective way to explore and prepare data sets. Beispielsweise müssen Sie möglicherweise ein Dataset erstellen, das über alle demografischen Informationen zu neuen Kunden seit 2017 verfügt.For example, you may need to create a dataset that 'has all customer demographic info for new customers since 2017'. Sie führen keine Zuordnung zu einem bekannten Ziel durch.You aren't mapping to a known target. Vor dem Veröffentlichen im Lake unterziehen Sie Datasets der Untersuchung, dem Wrangling und der Aufbereitung, damit sie eine Anforderung erfüllen.You're exploring, wrangling, and prepping datasets to meet a requirement before publishing it in the lake. Wranglingdatenflüsse werden oft für weniger formale Analyseszenarios verwendet.Wrangling data flows are often used for less formal analytics scenarios. Die aufbereiteten Datasets können für Downstreamtransformationen und -Machine Learning-Vorgänge verwendet werden.The prepped datasets can be used for doing transformations and machine learning operations downstream.

Codefreie agile DatenaufbereitungCode-free agile data preparation

Die Datenintegratoren ohne Programmiererfahrung verbringen mehr als 60 % ihrer Zeit mit dem Suchen nach und Aufbereiten von Daten.Citizen data integrators spend more than 60% of their time looking for and preparing data. Sie versuchen, dies ohne Code durchzuführen, um die operative Produktivität zu verbessern.They're looking to do it in a code free manner to improve operational productivity. Indem Datenintegratoren ohne Programmiererfahrung die Möglichkeit erhalten, Daten mit bekannten Tools wie Power Query Online skalierbar zu erweitern, zu strukturieren und zu veröffentlichen, wird ihre Produktivität erheblich verbessert.Allowing citizen data integrators to enrich, shape, and publish data using known tools like Power Query Online in a scalable manner drastically improves their productivity. Ein Wranglingdatenfluss aktiviert in Azure Data Factory den vertrauten Power Query Online Mashup Editor, damit Datenintegratoren ohne Programmiererfahrung schnell Fehler beheben, Daten standardisieren und qualitativ hochwertige Daten zur Unterstützung von Geschäftsentscheidungen produzieren können.Wrangling data flow in Azure Data Factory enables the familiar Power Query Online mashup editor to allow citizen data integrators to fix errors quickly, standardize data, and produce high-quality data to support business decisions.

DatenüberprüfungData validation

Überprüfen Sie Ihre Daten visuell ohne Code, um alle Ausreißer sowie Anomalien zu entfernen und sie in eine Form zu bringen, die eine schnelle Analyse ermöglicht.Visually scan your data in a code-free manner to remove any outliers, anomalies, and conform it to a shape for fast analytics.

Unterstützte QuellenSupported sources

ConnectorConnector DatenformatData format AuthentifizierungsartAuthentication type
Azure Blob StorageAzure Blob Storage CSVCSV KontoschlüsselAccount Key
Azure Data Lake Storage Gen1Azure Data Lake Storage Gen1 CSVCSV DienstprinzipalService Principal
Azure Data Lake Storage Gen2Azure Data Lake Storage Gen2 CSVCSV Kontoschlüssel, DienstprinzipalAccount Key, Service Principal
Azure SQL-DatenbankAzure SQL Database - SQL-AuthentifizierungSQL authentication
Azure Synapse AnalyticsAzure Synapse Analytics - SQL-AuthentifizierungSQL authentication

Mashup-EditorThe mashup editor

Wenn Sie einen Wranglingdatenfluss erstellen, werden alle Quelldatasets zu Datenbankabfragen, die im Ordner ADFResource platziert werden.When you create a wrangling data flow, all source datasets become dataset queries and are placed in the ADFResource folder. Standardmäßig zeigt die UserQuery auf die erste Datasetabfrage.By default, the UserQuery will point to the first dataset query. Alle Transformationen sind für die UserQuery durchzuführen, da Änderungen an Datasetabfragen weder unterstützt noch beibehalten werden.All transformations should be done on the UserQuery as changes to dataset queries are not supported nor will they be persisted. Das Umbenennen, Hinzufügen und Löschen von Abfragen werden derzeit nicht unterstützt.Renaming, adding and deleting queries is currently not supported.

Wrangling

Derzeit werden nicht alle Power Query M-Funktionen für Data Wrangling unterstützt, obwohl sie während der Erstellung verfügbar sind.Currently not all Power Query M functions are supported for data wrangling despite being available during authoring. Beim Erstellen von Wranglingdatenflüssen wird die folgende Fehlermeldung angezeigt, wenn eine Funktion nicht unterstützt wird:While building your wrangling data flows, you'll be prompted with the following error message if a function isn't supported:

The wrangling data flow is invalid. Expression.Error: The transformation logic isn't supported. Please try a simpler expression

Weitere Informationen zu unterstützten Transformationen finden Sie unter Funktionen im Wranglingdatenfluss.For more information on supported transformations, see wrangling data flow functions.

Derzeit unterstützt der Wranglingdatenfluss nur das Schreiben in eine Senke.Currently wrangling data flow only supports writing to one sink.

Nächste SchritteNext steps

Erfahren Sie, wie Sie einen Wranglingdatenfluss erstellen.Learn how to create a wrangling data flow.