Início rápido: Utilize a ferramenta Dados de Cópia para copiar dados

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Neste início rápido, irá utilizar o portal do Azure para criar uma fábrica de dados. Utilize a ferramenta Copiar Dados para criar um pipeline que copia dados de uma pasta num armazenamento de Blobs do Azure para outra pasta.

Nota

Se não estiver familiarizado com o Azure Data Factory, veja Introdução ao Azure Data Factory antes de começar o início rápido.

Pré-requisitos

Subscrição do Azure

Se não tiver uma subscrição do Azure, crie uma conta gratuita antes de começar.

Funções do Azure

Para criar instâncias do Data Factory, a conta de utilizador que utiliza para iniciar sessão no Azure tem de ser membro das funções contribuidor ou proprietário ou administrador da subscrição do Azure. Para visualizar as permissões que tem na subscrição, vá ao portal Azure,selecione o seu nome de utilizador no canto superior direito, selecione "..." ícone para mais opções e, em seguida, selecione As minhas permissões. Se tiver acesso a várias subscrições, selecione a subscrição apropriada.

Para criar e gerir recursos subordinados do Data Factory - incluindo conjuntos de dados, serviços ligados, pipelines, acionadores e runtimes de integração - os requisitos seguintes são aplicáveis:

  • Para criar e gerir recursos infantis no portal Azure, deve pertencer à função de Contribuinte da Data Factory ao nível do grupo de recursos ou superior.
  • Para criar e gerir recursos subordinados com o PowerShell ou o SDK, a função contribuidor ao nível do grupo de recursos ou superior é suficiente.

Para obter instruções de exemplo sobre como adicionar um utilizador a uma função, veja o artigo Adicionar funções.

Para obter mais informações, veja os artigos seguintes:

Conta de armazenamento do Azure

Utiliza uma conta de armazenamento Azure de uso geral (especificamente armazenamento blob) como lojas de dados de origem e destino neste arranque rápido. Se não tiver uma conta de Armazenamento Azure para fins gerais, consulte criar uma conta de armazenamento para criar uma.

Obtenha o nome da conta de armazenamento

Precisa do nome da sua conta de Armazenamento Azure para este arranque rápido. O procedimento a seguir fornece passos para obter o nome da sua conta de armazenamento:

  1. Num navegador web, vá ao portal Azure e inscreva-se usando o seu nome de utilizador E password Azure.
  2. A partir do menu do portal Azure, selecione Todos os serviços e, em seguida, selecione > contas de Armazenamento. Também pode pesquisar e selecionar contas de Armazenamento a partir de qualquer página.
  3. Na página de contas de Armazenamento, filtre a sua conta de armazenamento (se necessário) e, em seguida, selecione a sua conta de armazenamento.

Também pode pesquisar e selecionar contas de Armazenamento a partir de qualquer página.

Criar um contentor de blobs

Nesta secção, vai criar um contentor de blobs com o nome adftutorial no armazenamento de Blobs do Azure.

  1. Na página da conta de armazenamento, selecione > Overview Containers.

  2. Na <Account name> - barra de ferramentas da página dos contentores, selecione Recipiente.

  3. Na caixa de diálogo Novo contentor, introduza adftutorial para o nome e selecione OK. A página <Account name> - de Contentores é atualizada para incluir adftutorial na lista de contentores.

    Lista de contentores

Adicione uma pasta de entrada e ficheiro para o recipiente blob

Nesta secção, cria-se uma pasta denominada entrada no recipiente que criou e, em seguida, envia um ficheiro de amostra para a pasta de entrada. Antes de começar, abra um editor de texto como o Notepad e crie um ficheiro com o nome emp.txt com o seguinte conteúdo:

John, Doe
Jane, Doe

Guarde o ficheiro na pasta C:\ADFv2QuickStartPSH. (Se a pasta já não existir, crie-a.) Em seguida, volte ao portal Azure e siga estes passos:

  1. Na <Account name> - página de Recipientes onde paraste, selecione adftutorial da lista atualizada de contentores.

    1. Se fechou a janela ou foi para outra página, inscreva-se novamente no portal Azure.
    2. A partir do menu do portal Azure, selecione Todos os serviços e, em seguida, selecione > contas de Armazenamento. Também pode pesquisar e selecionar contas de Armazenamento a partir de qualquer página.
    3. Selecione a sua conta de armazenamento e, em seguida, selecione Contentores > adftutorial.
  2. Na barra de ferramentas da página do contentor adftutorial, selecione Upload.

  3. Na página 'Carregar blob', selecione a caixa 'Ficheiros' e, em seguida, navegue para e selecione o ficheiro emp.txt.

  4. Expandir o rumo avançado. A página agora mostra como mostrado:

    Selecionar a ligação Avançadas

  5. Na caixa de upload para pasta, introduza a entrada.

  6. Selecione o botão Carregar. Deverá ver o ficheiro emp.txt e o estado do carregamento na lista.

  7. Selecione o ícone Close (um X) para fechar a página de blob upload.

Mantenha a página do recipiente adftutorial aberta. Vai utilizá-la para verificar a saída no final deste início rápido.

Criar uma fábrica de dados

  1. Abra o browser Microsoft Edge ou Google Chrome. Atualmente, a IU do Data Factory é suportada apenas nos browsers Microsoft Edge e Google Chrome.

  2. Aceda ao Portal do Azure.

  3. A partir do menu do portal Azure, selecione Criar uma Fábrica de > Dados de Integração de > Recursos:

    Criação de nova fábrica de dados

  4. Na página Nova fábrica de dados, introduza ADFTutorialDataFactory em Nome.

    O nome da Fábrica de Dados Azure deve ser globalmente único. Se vir o seguinte erro, altere o nome da fábrica de dados (por exemplo, < o seu nome > ADFTutorialDataFactory) e tente criar novamente. Para regras de nomenclatura de artefactos do Data Factory, veja o artigo Data Factory – Regras de Nomenclatura.

    Erro quando um nome não está disponível

  5. Em Subscrição, selecione a sua subscrição do Azure na qual pretende criar a fábrica de dados.

  6. Em Grupo de Recursos, siga um destes passos:

    • Selecione Utilizar existente e selecione um grupo de recursos já existente na lista.
    • Selecione Criar novo e introduza o nome de um grupo de recursos.

    Para saber mais sobre os grupos de recursos, veja Utilizar grupos de recursos para gerir os recursos do Azure.

  7. Em Versão, selecione V2.

  8. Em Localização, selecione a localização para a fábrica de dados.

    A lista mostra apenas as localizações suportadas pelo Data Factory e onde serão armazenados os seus metadados do Azure Data Factory. As lojas de dados associadas (como a Azure Armazenamento e Base de Dados SQL do Azure) e os cálculos (como o Azure HDInsight) que a Data Factory utiliza podem funcionar noutras regiões.

  9. Selecione Criar.

  10. Depois de concluída a criação, vê a página data factory. Selecione Open on the Open Azure Data Factory Studio para iniciar a aplicação de interface de utilizador Azure Data Factory (UI) num separador.

    Página inicial da Azure Data Factory, com o azulejo Open Azure Data Factory Studio.

Iniciar a ferramenta Copiar Dados

  1. Na página inicial da Azure Data Factory, selecione o azulejo Ingeste para iniciar a ferramenta Dados de Cópia.

    Screenshot que mostra a página inicial da Azure Data Factory.

  2. Na página Propriedades da ferramenta Dados de Cópia, escolha tarefa de cópia incorporada no tipo de Tarefa e, em seguida, selecione Seguinte.

    Página "Propriedades"

  3. Na página Arquivo de dados de origem, conclua os seguintes passos:

    1. Clique + Crie uma nova ligação para adicionar uma ligação.

    2. Selecione o tipo de serviço ligado que pretende criar para a ligação de origem. Neste tutorial, usamos Azure Blob Armazenamento. Selecione-o na galeria e, em seguida, selecione Continue.

      Selecione Blob

    3. Na página Nova ligação (Azure Blob Armazenamento), especifique um nome para a sua ligação. Selecione a sua subscrição Azure a partir da lista de subscrições do Azure e da sua conta de armazenamento a partir da lista de nomes de conta Armazenamento, da ligação de teste e, em seguida, selecione Criar.

      Configurar a conta de armazenamento de Blobs do Azure

    4. Selecione a ligação recém-criada no bloco De Ligação.

    5. Na secção Ficheiro ou pasta, selecione Navegar para a pasta adftutorial/entrada, selecione o ficheiro emp.txt e, em seguida, clique em OK.

    6. Selecione a caixa de verificação de cópias Binary para copiar o ficheiro como está e, em seguida, selecione Seguinte.

      Screenshot que mostra a página da loja de dados Source.

  4. Na página da loja de dados destino, complete os seguintes passos:

    1. Selecione a ligação AzureBlobStorage que criou no bloco De Ligação.

    2. Na secção caminho da pasta, introduza adftutorial/saída para o caminho da pasta.

      Screenshot que mostra a página da loja de dados destino.

    3. Deixe outras definições como padrão e, em seguida, selecione Seguinte.

  5. Na página Definições, especifique um nome para o pipeline e a sua descrição e, em seguida, selecione Seguinte para utilizar outras configurações predefinidos.

    Screenshot que mostra a página de definições.

  6. Reveja todas as definições na página Resumo e selecione Seguinte.

  7. Na página Implementação concluída, selecione Monitorização para monitorizar o pipeline que criou.

    Página "Implementação concluída"

  8. A aplicação muda para o separador Monitor. Vê o estado do oleoduto nesta conta. Selecione Refresh para refrescar a lista. Clique no link no nome Pipeline para ver detalhes de execução de atividade ou reexecur o pipeline.

    Atualizar o gasoduto

  9. Na página 'Activity's runs, selecione o link Detalhes (ícone de óculos) na coluna 'Nome de Atividade' para obter mais detalhes sobre a operação de cópia. Para obter os detalhes das propriedades, veja Copy Activity overview (Descrição geral da Atividade Copy).

  10. Para voltar à vista Pipeline Runs, selecione a ligação de todas as tubagem no menu pão ramb. Para atualizar a vista, selecione Atualizar.

  11. Verifique se é criado um ficheiro emp.txt na pasta saída do contentor adftutorial. Se a pasta de saída não existir, o serviço Data Factory cria-a automaticamente.

  12. Mude para o separador Criar acima do Monitor no painel esquerdo, para que possa editar os serviços ligados, conjuntos de dados e pipelines. Para saber mais sobre a edição dos mesmos na IU do Data Factory, consulte Criar uma fábrica de dados através do portal do Azure.

    Selecione o separador autor

Passos seguintes

O pipeline neste exemplo copia dados de uma localização para outra localização num armazenamento de Blobs do Azure. Para saber como utilizar o Data Factory em mais cenários, aceda aos tutoriais.