Visão geral do Azure Data Factory

O Azure Data Factory é um serviço de integração de dados baseado em nuvem que orquestra e automatiza a movimentação e a transformação de dados. Você pode criar soluções de integração de dados usando o serviço Data Factory que podem receber dados de vários repositórios de dados, transformar/processar os dados e publicar os dados resultantes nos repositórios de dados.

Atualmente, há duas versões do serviço: versão 1 (V1) e versão 2 (V2).

Versão 1

O serviço do Data Factory versão 1 (V1) permite criar pipelines de dados que movem e transformam dados e, em seguida, executam os pipelines em um agendamento especificado (por hora, diariamente, semanalmente etc.). Ele também fornece visualizações avançadas para exibir a linhagem e as dependências entre os pipelines de dados e monitorar todos os seus pipelines de dados em uma única exibição unificada, a fim de identificar os problemas e configurar alertas de monitoramento facilmente.

Consulte Referência da API REST V1 para obter uma lista de operações compatíveis com o Data Factory V1. Para saber mais sobre o serviço, consulte Introdução ao Data Factory V1.

Versão 2

O Data Factory versão 2 (V2) se baseia no Data Factory V1 e dá suporte a um conjunto mais amplo de cenários de integração de dados na nuvem. Os recursos adicionais do Data Factory incluem:

  • Fluxo de controle: ramificação, loop e processamento condicional
  • Implante e execute pacotes do SSIS (SQL Server Integration Services) no Azure.
  • Suporte para ambientes de VNET (rede virtual).
  • Escalar horizontalmente com o poder de processamento sob demanda.
  • Suporte para cluster Spark sob demanda.
  • Agendamento flexível para dar suporte a cargas de dados incrementais.
  • Gatilhos para executar pipelines de dados.

Consulte Referência da API REST V2 para obter uma lista de operações com suporte do Data Factory V2. Para saber mais sobre o serviço, consulte Introdução ao Data Factory V2.