Sortera transformering i mappning av dataflöde

gäller för: Azure Data Factory Azure Synapse Analytics

Med sorteringstransformering kan du sortera inkommande rader i den aktuella dataströmmen. Du kan välja enskilda kolumner och sortera dem i stigande eller fallande ordning.

Anteckning

Mappningsdataflöden körs på Spark-kluster som distribuerar data över flera noder och partitioner. Om du väljer att partitionera om dina data i en efterföljande transformering kan du förlora sorteringen på grund av omsuffring av data. Det bästa sättet att upprätthålla sorteringsordningen i ditt dataflöde är att ange en enskild partition på fliken Optimera på transformeringsfliken och hålla sorteringstransformationen så nära mottagaren som möjligt.

Konfiguration

Sorteringsinställningar

Okänsligt fall: Om du vill ignorera fall vid sortering av sträng- eller textfält

Sortera endast inom partitioner: När dataflöden körs på Spark delas varje dataström in i partitioner. Den här inställningen sorterar endast data inom inkommande partitioner i stället för att sortera hela dataströmmen.

Sorteringsvillkor: Välj vilka kolumner du sorterar efter och i vilken ordning sorteringen ska ske. Ordningen avgör sorteringsprioritet. Välj om null-värden ska visas i början eller slutet av dataströmmen.

Beräknade kolumner

Om du vill ändra eller extrahera ett kolumnvärde innan du tillämpar sorteringen hovrar du över kolumnen och väljer "beräknad kolumn". Då öppnas uttrycksverktyget för att skapa ett uttryck för sorteringsåtgärden i stället för att använda ett kolumnvärde.

Dataflödesskript

Syntax

<incomingStream>
    sort(
        desc(<sortColumn1>, { true | false }),
        asc(<sortColumn2>, { true | false }),
        ...
    ) ~> <sortTransformationName<>

Exempel

Sorteringsinställningar

Dataflödesskriptet för sorteringskonfigurationen ovan finns i kodfragmentet nedan.

BasketballStats sort(desc(PTS, true),
    asc(Age, true)) ~> Sort1

Nästa steg

Efter sorteringen kanske du vill använda aggregeringsomvandlingen