Partilhar via


Cenário de preços usando um pipeline de dados para carregar 1 TB de dados do Parquet em um data warehouse com preparo

Nesse cenário, uma atividade de cópia foi usada em um pipeline de dados para carregar 1 TB de dados da tabela Parquet armazenados no Azure Data Lake Storage (ADLS) Gen2 para um data warehouse com preparo no Microsoft Fabric.

Os preços usados no exemplo a seguir são hipotéticos e não pretendem implicar preços reais exatos. Estes são apenas para demonstrar como você pode estimar, planejar e gerenciar o custo para projetos do Data Factory no Microsoft Fabric. Além disso, como as capacidades de malha têm preços exclusivos entre regiões, usamos o preço pré-pago para uma capacidade de malha no Oeste dos EUA 2 (uma região típica do Azure), a US$ 0,18 por por hora. Consulte aqui Microsoft Fabric - Pricing para explorar outras opções de preços de capacidade de malha.

Configuração

Para realizar esse cenário, você precisa criar um pipeline com a seguinte configuração:

Screenshot showing the configuration of a pipeline copying Parquet data from ADLS Gen2 to a data warehouse with staging.

Estimativa de custos usando o aplicativo Fabric Metrics

Screenshot showing the duration and CU consumption of the job in the Fabric Metrics App.

A operação de movimentação de dados utilizou 267.480 segundos com uma duração de 1504,42 segundos (25,07 minutos) enquanto a operação de execução de atividade era nula, uma vez que não havia nenhuma atividade sem cópia na execução do pipeline.

Nota

Embora relatada como uma métrica, a duração real da execução não é relevante ao calcular as horas efetivas com o Fabric Metrics App, uma vez que a métrica segundos que ela também relata já contabiliza sua duração.

Metric Operação de movimentação de dados
segundos 267.480 segundos
-horas efetivas (267.480) / (60*60)-horas = 74,3-horas

Custo total de execução em $0.18/hora = (74.3-horas) * ($0.18/hora ) ~= $13.37