Övning – Använda Azure Data Factory-dataomvandling

Slutförd

Med Power Query-funktionen i Azure Data Factory kan du arbeta med och omvandla data. Det är ett objekt som kan läggas till i arbetsytedesignern som en aktivitet i en Azure Data Factory-pipeline för att utföra förberedelse av kodfria data. Det gör det möjligt för personer som inte är konvektörer med traditionella tekniker för förberedelse av data, till exempel Spark eller SQL Server, och språk som Python och T-SQL att förbereda data i molnskala iterativt.

Power Query-funktionen använder ett rutnätstypgränssnitt för grundläggande dataförberedelser som liknar estetiken i Excel, som kallas för en online-kombinationsredigerare. Redigeraren gör det också möjligt för mer avancerade användare att utföra mer komplexa dataförberedelser med hjälp av formler. Först måste du skapa en länkad tjänst till en datakälla innan du kan komma åt data

Online Mashup Editor

Formlerna fungerar med Power Query Online och gör Power Query M-funktioner tillgängliga för datafabriksanvändare. Power Query översätter sedan det M-språk som genereras av Online Mashup-redigeraren till Spark-kod för körning i molnskala.

Med den här funktionen kan både datatekniker och dataanalytiker interaktivt utforska och förbereda datauppsättningar. Dessutom kan de interaktivt arbeta med M-språket och förhandsgranska resultatet innan de visar det i kontexten för en bredare pipeline.

Om du vill lägga till en Power Query-aktivitet i Azure Data Factory klickar du på plusikonen och väljer Power Query i fönstret Fabriksresurser.

Create a Power Query activity

Lägg till en källdatauppsättning för ditt vridningsdataflöde och välj en datauppsättning för mottagare. Följande datakällor stöds.

Koppling Dataformat Authentication type
Azure Blob Storage CSV, Parquet Kontonyckel
Azure Data Lake Storage Gen1 CSV Tjänstens huvudnamn
Azure Data Lake Storage Gen2 CSV, Parquet Kontonyckel, tjänstens huvudnamn
Azure SQL Database SQL-autentisering
Azure Synapse Analytics SQL-autentisering

När du har valt en källa klickar du på Skapa.

Adding source datasets to wrangling data flow

Då öppnas Kombinationsredigeraren online.

Navigating the wrangling data flow

Den består av följande komponenter:

  1. Datamängdslista.

    Detta ger de datauppsättningar som har definierats som källa för dataomvandlingen.

  2. Verktygsfältet För att vrida funktion.

    Verktygsfältet innehåller en mängd olika dataomvandlingsfunktioner som användaren kan komma åt för att ändra data, inklusive:

    • Hantera kolumner.
    • Transformera tabeller.
    • Minska rader.
    • Lägger till kolumner.
    • Kombinera tabeller.

    Varje objekt är kontextkänsligt och innehåller underfunktioner som är specifika för det.

  3. Kolumnrubriker.

    Förutom möjligheten att byta namn på kolumner visas sammanhangskänsliga objekt för att hantera kolumner genom att högerklicka på kolumnen.

  4. Inställningar.

    På så sätt kan du lägga till eller redigera datakällor och datamottagare och ändra inställningen för dataaktiviteten.

  5. Fönstret Steg.

    I det här fönstret visas de steg som har tillämpats på utdata för vridning. I exemplet i bilden har steget med namnet "Källa" tillämpats på utdata med namnet "UserQuery".

  6. Power Query-utdatalista.

    Visar de dataomvandlingsutdata som har definierats.

  7. Knappen Publicera.

    Gör att du kan publicera det arbete som har skapats.

En Power Query-uppgift kan läggas till i arbetsytedesignern precis som en kopieringsaktivitet eller en mappning Dataflöde uppgift och kan hanteras och övervakas på samma sätt.

completing the wrangling data flow