Transformação de classificação em fluxo de dados de mapeamento

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Dica

Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange desde movimentação de dados até ciência de dados, análise em tempo real, business intelligence e relatórios. Saiba como iniciar uma avaliação gratuita!

Os fluxos de dados estão disponíveis nos pipelines do Azure Data Factory e do Azure Synapse. Este artigo se aplica ao fluxo de dados de mapeamento. Se você for iniciante nas transformações, veja o artigo introdutório Transformar dados usando um fluxo de dados de mapeamento.

Use a transformação de classificação para gerar uma classificação ordenada com base nas condições de classificação especificadas pelo usuário.

Configuração

Rank settings

Não diferenciar maiúsculas de minúsculas: se uma coluna classificada for do tipo de cadeia de caracteres, as maiúsculas e minúsculas serão fatoradas na classificação.

Denso: se habilitado, a coluna de classificação será classificada como densa. Cada contagem de classificação será um número consecutivo e os valores de classificação não serão ignorados após um empate.

Coluna de classificação: o nome da coluna de classificação gerada. Esta coluna será do tipo longo.

Condições de classificação: escolha quais colunas você está classificando e em qual ordem a classificação acontece. A ordem determina a prioridade de classificação.

A configuração acima usa dados de basquete de entrada e cria uma coluna de classificação chamada 'pointsRanking'. A linha com o valor mais alto da coluna PTS terá um valor pointsRanking de 1.

Script de fluxo de dados

Sintaxe

<incomingStream>
    rank(
        desc(<sortColumn1>),
        asc(<sortColumn2>),
        ...,
        caseInsensitive: { true | false }
        dense: { true | false }
        output(<rankColumn> as long)
    ) ~> <sortTransformationName<>

Exemplo

Rank settings

O script de fluxo de dados para a configuração de classificação acima está no trecho de código a seguir.

PruneColumns
    rank(
        desc(PTS, true),
        caseInsensitive: false,
        output(pointsRanking as long),
        dense: false
    ) ~> RankByPoints

Filtrar linhas com base nos valores de classificação usando a transformação de filtro.