Uniontransformering i mappning av dataflöde

GÄLLER FÖR: Azure Data Factory Azure Synapse Analytics

Dricks

Prova Data Factory i Microsoft Fabric, en allt-i-ett-analyslösning för företag. Microsoft Fabric omfattar allt från dataflytt till datavetenskap, realtidsanalys, business intelligence och rapportering. Lär dig hur du startar en ny utvärderingsversion kostnadsfritt!

Dataflöden är tillgängliga både i Azure Data Factory och Azure Synapse Pipelines. Den här artikeln gäller för mappning av dataflöden. Om du är nybörjare på transformeringar kan du läsa den inledande artikeln Transformera data med hjälp av ett mappningsdataflöde.

Union kombinerar flera dataströmmar till en, med SQL Union för dessa strömmar som nya utdata från unionomvandlingen. Alla scheman från varje indataström kombineras i dataflödet, utan att behöva ha en kopplingsnyckel.

Du kan kombinera n-antal strömmar i inställningstabellen genom att välja ikonen "+" bredvid varje konfigurerad rad, inklusive både källdata och strömmar från befintliga transformeringar i dataflödet.

Här är en kort genomgång av unionstransformeringen i dataflödet för mappning:

Union transformation

I det här fallet kan du kombinera olika metadata från flera källor (i det här exemplet tre olika källfiler) och kombinera dem till en enda ström:

Union transformation overview

För att uppnå detta lägger du till ytterligare rader i Union Inställningar genom att inkludera alla källor som du vill lägga till. Det finns inget behov av en gemensam uppslags- eller kopplingsnyckel:

Union transformation settings

Om du anger en Select-transformering efter din union kan du byta namn på överlappande fält eller fält som inte har namngetts från huvudlösa källor. Klicka på "Inspektera" för att se kombinera metadata med totalt 132 kolumner i det här exemplet från tre olika källor:

Union transformation final

Namn och position

När du väljer "union by name" hamnar varje kolumnvärde i motsvarande kolumn från varje källa, med ett nytt sammanfogat metadataschema.

Om du väljer "union by position" hamnar varje kolumnvärde i den ursprungliga positionen från varje motsvarande källa, vilket resulterar i en ny kombinerad dataström där data från varje källa läggs till i samma ström:

Union output

Utforska liknande omvandlingar, inklusive Join and Exists.