Copie dados do Armazenamento de Blobs do Azure para um Banco de Dados SQL usando a ferramenta Copiar DadosCopy data from Azure Blob storage to a SQL Database by using the Copy Data tool

APLICA-SE A: Azure Data Factory Azure Synapse Analytics (Versão prévia)

Neste tutorial, você pode usar o portal do Azure para criar um Data Factory.In this tutorial, you use the Azure portal to create a data factory. Em seguida, você usará a ferramenta Copiar Dados para criar um pipeline que copia dados do Armazenamento de Blobs do Azure para um Banco de Dados SQL.Then you use the Copy Data tool to create a pipeline that copies data from Azure Blob storage to a SQL Database.

Observação

Se estiver se familiarizando com o Azure Data Factory, confira Introdução ao Azure Data Factory.If you're new to Azure Data Factory, see Introduction to Azure Data Factory.

Neste tutorial, você executa as seguintes etapas:In this tutorial, you perform the following steps:

  • Criar um data factory.Create a data factory.
  • Usar a ferramenta Copy Data para criar um pipeline.Use the Copy Data tool to create a pipeline.
  • Monitore as execuções de pipeline e de atividade.Monitor the pipeline and activity runs.

Pré-requisitosPrerequisites

  • Assinatura do Azure: Se você não tiver uma assinatura do Azure, crie uma conta gratuita antes de começar.Azure subscription: If you don't have an Azure subscription, create a free account before you begin.
  • Conta de Armazenamento do Azure: Use o armazenamento de Blobs como um armazenamento de dados de origem.Azure Storage account: Use Blob storage as the source data store. Se você não tiver uma conta de armazenamento do Azure, confira as instruções em Criar uma conta de armazenamento.If you don't have an Azure Storage account, see the instructions in Create a storage account.
  • Banco de Dados SQL do Azure: Use um Banco de Dados SQL como o armazenamento de dados coletor.Azure SQL Database: Use a SQL Database as the sink data store. Se você não tiver um Banco de Dados SQL, confira as instruções em Criar um Banco de Dados SQL.If you don't have a SQL Database, see the instructions in Create a SQL Database.

Criar um blob e uma tabela SQLCreate a blob and a SQL table

Prepare o Armazenamento de Blobs e o Banco de Dados SQL para o tutorial executando estas etapas.Prepare your Blob storage and your SQL Database for the tutorial by performing these steps.

Criar um blob de origemCreate a source blob

  1. Inicie o Bloco de notas.Launch Notepad. Copie o texto a seguir e salve-o em um arquivo chamado inputEmp.txt no disco:Copy the following text and save it in a file named inputEmp.txt on your disk:

    FirstName|LastName
    John|Doe
    Jane|Doe
    
  2. Crie um contêiner chamado adfv2tutorial e carregue o arquivo inputEmp.txt no contêiner.Create a container named adfv2tutorial and upload the inputEmp.txt file to the container. É possível usar o portal do Azure ou várias ferramentas como o Gerenciador de Armazenamento do Azure para executar essas tarefas.You can use the Azure portal or various tools like Azure Storage Explorer to perform these tasks.

Criar uma tabela do SQL de coletorCreate a sink SQL table

  1. Use o seguinte script SQL para criar uma tabela chamada dbo.emp no Banco de Dados SQL:Use the following SQL script to create a table named dbo.emp in your SQL Database:

    CREATE TABLE dbo.emp
    (
        ID int IDENTITY(1,1) NOT NULL,
        FirstName varchar(50),
        LastName varchar(50)
    )
    GO
    
    CREATE CLUSTERED INDEX IX_emp_ID ON dbo.emp (ID);
    
  2. Permita que os serviços do Azure acessem o SQL Server.Allow Azure services to access SQL Server. Verifique se a configuração Permitir que serviços e recursos do Azure acessem este servidor está habilitada para o servidor que executa o Banco de Dados SQL.Verify that the setting Allow Azure services and resources to access this server is enabled for your server that's running SQL Database. Essa configuração permite que o Data Factory grave dados em sua instância de banco de dados.This setting lets Data Factory write data to your database instance. Para confirmar e ativar essa configuração, acesse servidor SQL lógico > Firewalls e redes virtuais > defina a opção Permitir que serviços e recursos do Azure acessem este servidor como ATIVADA.To verify and turn on this setting, go to logical SQL server > Security > Firewalls and virtual networks > set the Allow Azure services and resources to access this server option to ON.

Criar uma data factoryCreate a data factory

  1. No menu à esquerda, selecione Criar um recurso > Analytics > Data Factory:On the left menu, select Create a resource > Analytics > Data Factory:

    Criação do novo data factory

  2. Na página Novo data factory, em Nome, insira ADFTutorialDataFactory.On the New data factory page, under Name, enter ADFTutorialDataFactory.

    O nome do seu data factory deve ser globalmente exclusivo.The name for your data factory must be globally unique. Você deve ver a seguinte mensagem de erro:You might receive the following error message:

    Mensagem de erro do novo data factory

    Se você receber uma mensagem de erro sobre o valor do nome, insira um nome diferente para o data factory.If you receive an error message about the name value, enter a different name for the data factory. Por exemplo, use o nome seunomeADFTutorialDataFactory.For example, use the name yournameADFTutorialDataFactory. Para ver as regras de nomenclatura de artefatos do Data Factory, confira Regras de nomenclatura do Data Factory.For the naming rules for Data Factory artifacts, see Data Factory naming rules.

  3. Selecione a assinatura do Azure na qual deseja criar o novo data factory.Select the Azure subscription in which to create the new data factory.

  4. Em Grupo de Recursos, use uma das seguintes etapas:For Resource Group, take one of the following steps:

    a.a. Selecione Usar existentee selecione um grupo de recursos existente na lista suspensa.Select Use existing, and select an existing resource group from the drop-down list.

    b.b. Selecione Criar novoe insira o nome de um grupo de recursos.Select Create new, and enter the name of a resource group.

    Para saber mais sobre grupos de recursos, confira Usar grupos de recursos para gerenciar recursos do Azure.To learn about resource groups, see Use resource groups to manage your Azure resources.

  5. Em versão, selecione V2 para a versão.Under version, select V2 for the version.

  6. Em local, selecione o local para o data factory.Under location, select the location for the data factory. Somente os locais com suporte são exibidos na lista suspensa.Only supported locations are displayed in the drop-down list. Os armazenamentos de dados (por exemplo, Armazenamento do Azure e Banco de Dados SQL) e os serviços de computação (por exemplo, Azure HDInsight) usados pelo seu data factory podem estar em outros locais e regiões.The data stores (for example, Azure Storage and SQL Database) and computes (for example, Azure HDInsight) that are used by your data factory can be in other locations and regions.

  7. Selecione Criar.Select Create.

  8. Depois de finalizada a criação, a home page do Data Factory é exibida.After creation is finished, the Data Factory home page is displayed.

    Página inicial do data factory

  9. Para iniciar a interface do usuário do Azure Data Factory em uma guia separada, selecione o bloco Criar e Monitorar.To launch the Azure Data Factory user interface (UI) in a separate tab, select the Author & Monitor tile.

Use a ferramenta Copy Data para criar um pipelineUse the Copy Data tool to create a pipeline

  1. Na página Introdução, selecione o bloco Copy Data para iniciar a ferramenta Copy Data.On the Let's get started page, select the Copy Data tile to launch the Copy Data tool.

    Bloco Ferramenta Copy Data

  2. Na página Propriedades, em Nome da tarefa, insira CopyFromBlobToSqlPipeline.On the Properties page, under Task name, enter CopyFromBlobToSqlPipeline. Em seguida, selecione Avançar.Then select Next. A interface do usuário do Data Factory cria um pipeline com o nome especificado da tarefa.The Data Factory UI creates a pipeline with the specified task name. Criar uma pipelineCreate a pipeline

  3. Na página Configurações do armazenamento de dados, conclua as seguintes etapas:On the Source data store page, complete the following steps:

    a.a. Clique em + Criar nova conexão para adicionar uma conexãoClick + Create new connection to add a connection

    b.b. Selecione Armazenamento de Blobs do Azure na galeria e, em seguida, selecione Continuar.Select Azure Blob Storage from the gallery, and then select Continue.

    c.c. Na página Novo Serviço Vinculado, selecione a assinatura do Azure e a conta de armazenamento na lista Nome da conta de armazenamento.On the New Linked Service page, select your Azure subscription, and select your storage account from the Storage account name list. Teste a conexão e, em seguida, selecione Concluir.Test connection and then select Create.

    d.d. Selecione o serviço vinculado recém-criado como fonte, depois clique Avançar.Select the newly created linked service as source, then click Next.

    Selecione o serviço de origem vinculado

  4. Na página Escolha o arquivo de entrada ou a pasta, execute as seguintes etapas:On the Choose the input file or folder page, complete the following steps:

    a.a. Clique em Navegar para navegar até a pasta adfv2tutorial/input, selecione o arquivo inputEmp.txt e então clique em Escolher.Click Browse to navigate to the adfv2tutorial/input folder, select the inputEmp.txt file, then click Choose.

    b.b. Clique em Avançar para mover-se para a próxima etapa.Click Next to move to next step.

  5. Na página Configurações de formato de arquivo, habilite a caixa de seleção Primeira linha como cabeçalho.On the File format settings page, enable the checkbox for First row as header. Observe que a ferramenta detecta automaticamente os delimitadores de coluna e de linha.Notice that the tool automatically detects the column and row delimiters. Selecione Avançar.Select Next. Visualize também os dados e veja o esquema dos dados de entrada nesta página.You can also preview data and view the schema of the input data on this page.

    Configurações de formato de arquivo

  6. Na página Armazenamento de dados de destino, conclua as seguintes etapas:On the Destination data store page, completes the following steps:

    a.a. Clique em + Criar nova conexão para adicionar uma conexãoClick + Create new connection to add a connection

    b.b. Selecione Banco de Dados SQL do Azure por meio da galeria e, em seguida, selecione Continuar.Select Azure SQL Database from the gallery, and then select Continue.

    c.c. Na página Novo Serviço Vinculado, selecione o nome do servidor e o nome do BD na lista suspensa, especifique o nome de usuário e a senha e, em seguida, selecione Criar.On the New Linked Service page, select your server name and DB name from the dropdown list, and specify the username and password, then select Create.

    Configure o Banco de Dados SQL do Azure

    d.d. Selecione o serviço vinculado criado recentemente como coletor e clique em Avançar.Select the newly created linked service as sink, then click Next.

  7. Na página Mapeamento de tabela, selecione a tabela [dbo].[emp] e clique em Avançar.On the Table mapping page, select the [dbo].[emp] table, and then select Next.

  8. Na página Mapeamento de coluna, observe que a segunda e a terceira colunas do arquivo de entrada são mapeadas para as colunas FirstName e LastName da tabela emp.On the Column mapping page, notice that the second and the third columns in the input file are mapped to the FirstName and LastName columns of the emp table. Ajuste o mapeamento para garantir que não haja nenhum erro e, em seguida, selecione Avançar.Adjust the mapping to make sure that there is no error, and then select Next.

    Página Mapeamento de coluna

  9. Na página Configurações, selecione Avançar.On the Settings page, select Next.

  10. Na página Resumo, analise as configurações e selecione Avançar.On the Summary page, review the settings, and then select Next.

  11. Na página Implantação, selecione Monitorar para monitorar o pipeline (tarefa).On the Deployment page, select Monitor to monitor the pipeline (task).

    Monitorar o pipeline

  12. Na página Execuções de pipeline, selecione Atualizar para atualizar a lista.On the Pipeline runs page, select Refresh to refresh the list. Clique no link em NOME DO PIPELINE para ver os detalhes da execução de atividade ou execute o pipeline novamente.Click the link under PIPELINE NAME to view activity run details or rerun the pipeline. Execução de pipelinePipeline run

  13. Na página Execuções de atividade, selecione o link Detalhes (ícone de óculos) na coluna NOME DA ATIVIDADE para obter mais detalhes sobre a operação de cópia.On the Activity runs page, select the Details link (eyeglasses icon) under the ACTIVITY NAME column for more details about copy operation. Para voltar à exibição Execuções de Pipeline, selecione o link TODAS as execuções de pipeline no menu de navegação estrutural.To go back to the Pipeline Runs view, select the ALL pipeline runs link in the breadcrumb menu. Para atualizar a exibição, selecione Atualizar.To refresh the view, select Refresh.

    Monitorar execuções de atividade

  14. Verifique se os dados foram inseridos na tabela dbo.emp no Banco de Dados SQL.Verify that the data is inserted into the dbo.emp table in your SQL Database.

  15. Selecione a guia Criar à esquerda para alternar para o modo de edição.Select the Author tab on the left to switch to the editor mode. É possível atualizar os serviços vinculados, os conjuntos de dados e os pipelines criados com a ferramenta usando o editor.You can update the linked services, datasets, and pipelines that were created via the tool by using the editor. Para obter detalhes sobre essas entidades na IU do Data Factory, confira em a versão do portal do Azure deste tutorial.For details on editing these entities in the Data Factory UI, see the Azure portal version of this tutorial.

    Selecionar a guia Autor

Próximas etapasNext steps

O pipeline desta amostra copia dados do Armazenamento de Blobs para um Banco de Dados SQL.The pipeline in this sample copies data from Blob storage to a SQL Database. Você aprendeu a:You learned how to:

  • Criar um data factory.Create a data factory.
  • Usar a ferramenta Copy Data para criar um pipeline.Use the Copy Data tool to create a pipeline.
  • Monitore as execuções de pipeline e de atividade.Monitor the pipeline and activity runs.

Avance para o tutorial a seguir para saber mais sobre como copiar dados do local para a nuvem:Advance to the following tutorial to learn how to copy data from on-premises to the cloud: