Guia de início rápido: introdução ao Azure Data Factory

Artigo
12/09/2023

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Gorjeta

Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange tudo, desde a movimentação de dados até ciência de dados, análises em tempo real, business intelligence e relatórios. Saiba como iniciar uma nova avaliação gratuitamente!

Bem-vindo ao Azure Data Factory! Este artigo de introdução permitirá que você crie seu primeiro data factory e pipeline em 5 minutos. O modelo ARM abaixo criará e configurará tudo o que você precisa para experimentá-lo. Em seguida, você só precisa navegar até o data factory de demonstração e fazer mais um clique para acionar o pipeline, que move alguns dados de exemplo de um armazenamento de blob do Azure para outro.

Pré-requisitos

Se não tiver uma subscrição do Azure, crie uma conta gratuita antes de começar.

Resumo do vídeo

O vídeo a seguir fornece um passo a passo do exemplo:

Experimente a sua primeira demonstração com um clique

Em seu primeiro cenário de demonstração, você usará a atividade Copiar em uma fábrica de dados para copiar um blob do Azure chamado moviesDB2.csv de uma pasta de entrada em um Armazenamento de Blob do Azure para uma pasta de saída. Em um cenário do mundo real, essa operação de cópia pode estar entre qualquer uma das muitas fontes de dados suportadas e coletores disponíveis no serviço. Também pode envolver transformações nos dados.

Experimente agora com um clique! Depois de clicar no botão abaixo, os seguintes objetos serão criados no Azure:

Uma conta de fábrica de dados
Um pipeline dentro do data factory com uma atividade de cópia
Um armazenamento de blob do Azure com moviesDB2.csv carregado em uma pasta de entrada como origem
Um serviço vinculado para conectar a fábrica de dados ao armazenamento de blob do Azure

Passo 1: Clique no botão para iniciar

Selecione o botão abaixo para experimentar! (Se você já clicou no acima, não precisa fazê-lo novamente.)

Você será redirecionado para a página de configuração mostrada na imagem abaixo para implantar o modelo. Aqui, você só precisa criar um novo grupo de recursos. (Você pode deixar todos os outros valores com seus padrões.) Em seguida, clique em Rever + criar e clique em Criar para implementar os recursos.

Nota

O usuário que implanta o modelo precisa atribuir uma função a uma identidade gerenciada. Isso requer permissões que podem ser concedidas por meio das funções Proprietário, Administrador de Acesso de Usuário ou Operador de Identidade Gerenciada.

Todos os recursos mencionados acima serão criados no novo grupo de recursos, para que você possa limpá-los facilmente depois de tentar a demonstração.

A screenshot of the deployment template creation dialog.

Etapa 2: Revisar os recursos implantados

Selecione Ir para o grupo de recursos após a conclusão da implantação.
No grupo de recursos, você verá o novo data factory, a conta de armazenamento de blob do Azure e a identidade gerenciada que foram criadas pela implantação.
Selecione o data factory no grupo de recursos para exibi-lo. Em seguida, selecione o botão Iniciar estúdio para continuar.
Selecione na guia Autor e, em seguida, o Pipeline criado pelo modelo. Em seguida, verifique os dados de origem selecionando Abrir.
No conjunto de dados de origem que você verá, selecione Procurar e anote o arquivo moviesDB2.csv, que já foi carregado na pasta de entrada.

Etapa 3: acionar o pipeline de demonstração para ser executado

Selecione Adicionar gatilho e, em seguida , Acionar agora.
No painel direito, em Execução de pipeline, selecione OK.

Monitorizar o pipeline

Selecione a guia Monitor .
Você pode ver uma visão geral das execuções do pipeline na guia Monitor, como hora de início da execução, status, etc.
Neste início rápido, o pipeline tem apenas um tipo de atividade: Copiar. Clique no nome do pipeline e você pode ver os detalhes dos resultados de execução da atividade de cópia.
Clique nos detalhes e o processo de cópia detalhado é exibido. A partir dos resultados, os dados lidos e gravados são os mesmos, e 1 arquivo foi lido e gravado, o que também prova que todos os dados foram copiados com sucesso para o destino.

Clean up resources (Limpar recursos)

Você pode limpar todos os recursos criados neste início rápido de duas maneiras. Você pode excluir todo o grupo de recursos do Azure, que inclui todos os recursos criados nele. Ou se você quiser manter alguns recursos intactos, navegue até o grupo de recursos e exclua apenas os recursos específicos desejados, mantendo os outros. Por exemplo, se você estiver usando esse modelo para criar uma fábrica de dados para uso em outro tutorial, poderá excluir os outros recursos, mas manter apenas a fábrica de dados.

Neste início rápido, você criou um Azure Data Factory contendo um pipeline com uma atividade de cópia. Para saber mais sobre o Azure Data Factory, continue no artigo e no módulo Aprenda abaixo.