Guia de início rápido: introdução ao Azure Data Factory

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Gorjeta

Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange tudo, desde a movimentação de dados até ciência de dados, análises em tempo real, business intelligence e relatórios. Saiba como iniciar uma nova avaliação gratuitamente!

Bem-vindo ao Azure Data Factory! Este artigo de introdução permitirá que você crie seu primeiro data factory e pipeline em 5 minutos. O modelo ARM abaixo criará e configurará tudo o que você precisa para experimentá-lo. Em seguida, você só precisa navegar até o data factory de demonstração e fazer mais um clique para acionar o pipeline, que move alguns dados de exemplo de um armazenamento de blob do Azure para outro.

Pré-requisitos

Se não tiver uma subscrição do Azure, crie uma conta gratuita antes de começar.

Resumo do vídeo

O vídeo a seguir fornece um passo a passo do exemplo:

Experimente a sua primeira demonstração com um clique

Em seu primeiro cenário de demonstração, você usará a atividade Copiar em uma fábrica de dados para copiar um blob do Azure chamado moviesDB2.csv de uma pasta de entrada em um Armazenamento de Blob do Azure para uma pasta de saída. Em um cenário do mundo real, essa operação de cópia pode estar entre qualquer uma das muitas fontes de dados suportadas e coletores disponíveis no serviço. Também pode envolver transformações nos dados.

Experimente agora com um clique! Depois de clicar no botão abaixo, os seguintes objetos serão criados no Azure:

  • Uma conta de fábrica de dados
  • Um pipeline dentro do data factory com uma atividade de cópia
  • Um armazenamento de blob do Azure com moviesDB2.csv carregado em uma pasta de entrada como origem
  • Um serviço vinculado para conectar a fábrica de dados ao armazenamento de blob do Azure

Passo 1: Clique no botão para iniciar

Selecione o botão abaixo para experimentar! (Se você já clicou no acima, não precisa fazê-lo novamente.)

Try your first data factory demo

Você será redirecionado para a página de configuração mostrada na imagem abaixo para implantar o modelo. Aqui, você só precisa criar um novo grupo de recursos. (Você pode deixar todos os outros valores com seus padrões.) Em seguida, clique em Rever + criar e clique em Criar para implementar os recursos.

Nota

O usuário que implanta o modelo precisa atribuir uma função a uma identidade gerenciada. Isso requer permissões que podem ser concedidas por meio das funções Proprietário, Administrador de Acesso de Usuário ou Operador de Identidade Gerenciada.

Todos os recursos mencionados acima serão criados no novo grupo de recursos, para que você possa limpá-los facilmente depois de tentar a demonstração.

A screenshot of the deployment template creation dialog.

Etapa 2: Revisar os recursos implantados

  1. Selecione Ir para o grupo de recursos após a conclusão da implantação. A screenshot of the deployment complete page in the Azure portal after successfully deploying the template.

  2. No grupo de recursos, você verá o novo data factory, a conta de armazenamento de blob do Azure e a identidade gerenciada que foram criadas pela implantação. A screenshot of the contents of the resource group created for the demo.

  3. Selecione o data factory no grupo de recursos para exibi-lo. Em seguida, selecione o botão Iniciar estúdio para continuar. A screenshot of the Azure portal on the newly created data factory page, highlighting the location of the Open Azure Data Factory Studio button.

  4. Selecione na guia Author tab Autor e, em seguida, o Pipeline criado pelo modelo. Em seguida, verifique os dados de origem selecionando Abrir.

    Screenshot of the Azure Data Factory Studio showing the pipeline created by the template.

  5. No conjunto de dados de origem que você verá, selecione Procurar e anote o arquivo moviesDB2.csv, que já foi carregado na pasta de entrada.

    Screenshot of the source dataset highlighting the Browse button where the user can see the input file created for the demo.

    Screenshot of the contents of the input folder showing the moviesDB2.csv file used in the demo.

Etapa 3: acionar o pipeline de demonstração para ser executado

  1. Selecione Adicionar gatilho e, em seguida , Acionar agora. Screenshot of the Trigger Now button for the pipeline in the demo.
  2. No painel direito, em Execução de pipeline, selecione OK.

Monitorizar o pipeline

  1. Selecione a guia Monitor tabMonitor .

  2. Você pode ver uma visão geral das execuções do pipeline na guia Monitor, como hora de início da execução, status, etc.

    Screenshot of the data factory monitoring tab.

  3. Neste início rápido, o pipeline tem apenas um tipo de atividade: Copiar. Clique no nome do pipeline e você pode ver os detalhes dos resultados de execução da atividade de cópia.

    Screenshot of the run results of a copy activity in the data factory monitoring tab.

  4. Clique nos detalhes e o processo de cópia detalhado é exibido. A partir dos resultados, os dados lidos e gravados são os mesmos, e 1 arquivo foi lido e gravado, o que também prova que todos os dados foram copiados com sucesso para o destino.

    Screenshot of the detailed copy activity run results.

Clean up resources (Limpar recursos)

Você pode limpar todos os recursos criados neste início rápido de duas maneiras. Você pode excluir todo o grupo de recursos do Azure, que inclui todos os recursos criados nele. Ou se você quiser manter alguns recursos intactos, navegue até o grupo de recursos e exclua apenas os recursos específicos desejados, mantendo os outros. Por exemplo, se você estiver usando esse modelo para criar uma fábrica de dados para uso em outro tutorial, poderá excluir os outros recursos, mas manter apenas a fábrica de dados.

Neste início rápido, você criou um Azure Data Factory contendo um pipeline com uma atividade de cópia. Para saber mais sobre o Azure Data Factory, continue no artigo e no módulo Aprenda abaixo.