Share via


Como copiar dados usando a atividade de cópia

No Pipeline de Dados, você pode usar a atividade Copiar para copiar dados entre armazenamentos de dados localizados na nuvem.

Depois de copiar os dados, você pode usar outras atividades para transformá-los e analisá-los ainda mais. Você também pode usar a atividade Copiar para publicar resultados de transformação e análise para business intelligence (BI) e consumo de aplicativos.

Para copiar dados de uma origem para um destino, o serviço que executa a atividade Copiar executa estas etapas:

  1. Lê dados de um armazenamento de dados de origem.
  2. Executa serialização/desserialização, compressão/descompressão, mapeamento de colunas e assim por diante. Ele executa essas operações com base na configuração.
  3. Grava dados no armazenamento de dados de destino.

Pré-requisitos

Para começar, você deve preencher os seguintes pré-requisitos:

  • Uma conta de locatário do Microsoft Fabric com uma assinatura ativa. Crie uma conta gratuitamente.

  • Verifique se você tem um espaço de trabalho habilitado para Microsoft Fabric.

Adicionar uma atividade de cópia usando o assistente de cópia

Siga estas etapas para configurar sua atividade de cópia usando o assistente de cópia.

Comece com o assistente de cópia

  1. Abra um pipeline de dados existente ou crie um novo pipeline de dados.

  2. Selecione Copiar dados na tela para abrir a ferramenta Assistente de Cópia para começar. Ou selecione Usar assistente de cópia na lista suspensa Copiar dados na guia Atividades da faixa de opções.

    Captura de ecrã a mostrar opções para abrir o assistente de cópia.

Configure a sua origem

  1. Selecione um tipo de fonte de dados na categoria. Você usará o Armazenamento de Blobs do Azure como exemplo. Selecione Armazenamento de Blobs do Azure e, em seguida, selecione Avançar.

    Captura de tela da tela Escolher fonte de dados.

    Captura de tela mostrando onde selecionar a fonte de dados correta.

  2. Crie uma conexão com sua fonte de dados selecionando Criar nova conexão.

    Captura de ecrã a mostrar onde selecionar Nova ligação.

    Depois de selecionar Criar nova conexão, preencha as informações de conexão necessárias e selecione Avançar. Para obter os detalhes da criação de conexão para cada tipo de fonte de dados, você pode consultar cada artigo do conector.

    Se você tiver conexões existentes, poderá selecionar Conexão existente e selecionar sua conexão na lista suspensa.

    Captura de tela mostrando a conexão existente.

  3. Escolha o arquivo ou pasta a ser copiado nesta etapa de configuração de origem e selecione Avançar.

    Captura de tela mostrando onde selecionar os dados a serem copiados.

Configure o seu destino

  1. Selecione um tipo de fonte de dados na categoria. Você usará o Armazenamento de Blobs do Azure como exemplo. Selecione Armazenamento de Blobs do Azure e, em seguida, selecione Avançar.

    Captura de ecrã a mostrar como selecionar o Armazenamento de Blobs do Azure.

  2. Você pode criar uma nova conexão vinculada a uma nova conta de Armazenamento de Blob do Azure seguindo as etapas na seção anterior ou usar uma conexão existente na lista suspensa de conexão. Os recursos de Testar conexão e Editar estão disponíveis para cada conexão selecionada.

    Captura de ecrã a mostrar opções de ligação de dados.

  3. Configure e mapeie os dados de origem para o seu destino. Em seguida, selecione Avançar para concluir as configurações de destino.

    Captura de ecrã do ecrã Mapa para destino.

    Captura de ecrã de Ligar ao destino dos dados.

Rever e criar a sua atividade de cópia

  1. Revise as configurações de atividade de cópia nas etapas anteriores e selecione OK para concluir. Ou você pode voltar às etapas anteriores para editar suas configurações, se necessário, na ferramenta.

    Captura de ecrã a mostrar o ecrã Rever e criar.

Uma vez concluída, a atividade de cópia será adicionada à tela do pipeline de dados. Todas as definições, incluindo as definições avançadas para esta atividade de cópia, estão disponíveis nos separadores quando é selecionada.

Captura de tela mostrando uma atividade de cópia na tela do pipeline de dados.

Agora você pode salvar seu pipeline de dados com essa atividade de cópia única ou continuar a projetar seu pipeline de dados.

Adicionar uma atividade de cópia diretamente

Siga estas etapas para adicionar uma atividade de cópia diretamente.

Adicionar uma atividade de cópia

  1. Abra um pipeline de dados existente ou crie um novo pipeline de dados.

  2. Adicione uma atividade de cópia selecionando Adicionar atividade>de pipeline Copiar atividade ou selecionando Copiar dados>Adicionar à tela na guia Atividades.

    Captura de ecrã a mostrar duas formas de adicionar uma atividade de cópia.

Configure suas configurações gerais na guia geral

Para saber como definir as configurações gerais, consulte Geral.

Configure sua fonte na guia fonte

  1. Selecione + Novo ao lado de Conexão para criar uma conexão com sua fonte de dados.

    Captura de tela mostrando onde selecionar Novo.

    1. Escolha o tipo de fonte de dados na janela pop-up. Você usará o Banco de Dados SQL do Azure como exemplo. Selecione Banco de Dados SQL do Azure e, em seguida, selecione Continuar.

      Captura de tela mostrando como selecionar a fonte de dados.

    2. Ele navega até a página de criação de conexão. Preencha as informações de conexão necessárias no painel e selecione Criar. Para obter os detalhes da criação de conexão para cada tipo de fonte de dados, você pode consultar cada artigo do conector.

      Captura de ecrã a mostrar a página Nova ligação.

    3. Depois que a conexão for criada com êxito, você voltará para a página do pipeline de dados. Em seguida, selecione Atualizar para buscar a conexão que você criou na lista suspensa. Você também pode escolher uma conexão existente do Banco de Dados SQL do Azure diretamente na lista suspensa se já a tiver criado antes. Os recursos de Testar conexão e Editar estão disponíveis para cada conexão selecionada. Em seguida, selecione Banco de Dados SQL do Azure em Tipo de conexão .

      Captura de ecrã a mostrar onde atualizar a ligação.

  2. Especifique uma tabela a ser copiada. Selecione Visualizar dados para visualizar sua tabela de origem. Você também pode usar o procedimento Consulta e Armazenado para ler dados de sua fonte.

    Captura de tela mostrando as opções de configurações da tabela de origem.

  3. Expanda Avançado para obter configurações mais avançadas.

    Captura de ecrã das definições avançadas.

Configure seu destino na guia de destino

  1. Escolha o seu tipo de destino. Pode ser seu armazenamento de dados interno de primeira classe do seu espaço de trabalho, como o Lakehouse, ou seus armazenamentos de dados externos. Você usará Lakehouse como exemplo.

    Captura de tela mostrando onde selecionar o tipo de destino.

  2. Escolha usar Lakehouse no tipo de armazenamento de dados do espaço de trabalho. Selecione + Novo e ele navegará até a página de criação do Lakehouse. Especifique o nome do Lakehouse e selecione Criar.

    Captura de tela mostrando a criação de Lakehouse.

  3. Depois que a conexão for criada com êxito, você voltará para a página do pipeline de dados. Em seguida, selecione Atualizar para buscar a conexão que você criou na lista suspensa. Você também pode escolher uma conexão Lakehouse existente diretamente na lista suspensa se já a tiver criado antes.

    Captura de tela mostrando a seleção da conexão.

  4. Especifique uma tabela ou configure o caminho do arquivo para definir o arquivo ou pasta como destino. Aqui, selecione Tabelas e especifique uma tabela para gravar dados.

    Captura de ecrã a mostrar onde encontrar as definições da Tabela.

  5. Expanda Avançado para obter configurações mais avançadas.

    Captura de ecrã das opções avançadas.

Agora você pode salvar seu pipeline de dados com essa atividade de cópia única ou continuar a projetar seu pipeline de dados.

Configurar seus mapeamentos na guia mapeamento

Se o conector que você aplica oferecer suporte ao mapeamento, você poderá ir para a guia Mapeamento para configurar o mapeamento.

  1. Selecione Importar esquemas para importar seu esquema de dados.

    Captura de tela das configurações de mapeamento 1.

  2. Você pode ver que o mapeamento automático é mostrado. Especifique a coluna Origem e a coluna Destino. Se você criar uma nova tabela no destino, poderá personalizar o nome da coluna Destino aqui. Se quiser gravar dados na tabela de destino existente, não será possível modificar o nome da coluna Destino existente. Você também pode exibir as colunas Tipo de origem e destino.

    Captura de tela das configurações de mapeamento 2.

Além disso, você pode selecionar + Novo mapeamento para adicionar novo mapeamento, selecionar Limpar para limpar todas as configurações de mapeamento e selecionar Redefinir para redefinir toda a coluna Origem do mapeamento.

Configure sua conversão de tipo

Expanda Configurações de conversão de tipo para configurar sua conversão de tipo, se necessário.

Captura de tela da conversão de tipo de mapeamento.

Consulte a tabela a seguir para obter os detalhes da configuração.

Definição Descrição
Permitir truncamento de dados Permita o truncamento de dados ao converter dados de origem em destino com tipo diferente durante a cópia. Por exemplo, de decimal para inteiro, de DatetimeOffset para Datetime.
Tratar booleano como número Trate booleano como número. Por exemplo, trate true como 1.
Formato de data Formatar string ao converter entre datas e strings, por exemplo, "yyyy-MM-dd". Para obter mais informações, consulte Cadeias de caracteres de formato de data e hora personalizadas.

A coluna de data pode ser lida como tipo de data para:
 • Amazon RDS para SQL Server
 • Banco de Dados SQL do Azure
 • Instância Gerenciada do Banco de Dados SQL do Azure
 • Azure Synapse Analytics
 • Formato de texto delimitado
 • Mesa Lakehouse
 • Formato Parquet
 • Servidor SQL
Formato DateTime Formate a cadeia de caracteres ao converter entre datas sem deslocamento de fuso horário e cadeias de caracteres. Por exemplo, "aaaa-MM-dd HH:mm:ss.fff".
Formato DateTimeOffset Formate a cadeia de caracteres ao converter entre datas com deslocamento de fuso horário e cadeias de caracteres. Por exemplo, "aaaa-MM-dd HH:mm:ss.fff zzz".
Formato TimeSpan Formate a cadeia de caracteres ao converter entre períodos de tempo e cadeias de caracteres. Por exemplo, "dd.hh:mm:ss".
Cultura Informações de cultura a serem usadas ao converter tipos. Por exemplo, "en-us", "fr-fr".

Configure as suas outras definições no separador definições

A guia Configurações contém as configurações de desempenho, preparo e assim por diante.

Captura de ecrã do separador Definições.

Consulte a tabela a seguir para obter a descrição de cada configuração.

Definição Descrição
Otimização inteligente da taxa de transferência Especifique para otimizar a taxa de transferência. Pode escolher entre:
• Automático
• Padrão
• Equilibrado
• Máximo
Quando você escolhe Automático, a configuração ideal é aplicada dinamicamente com base no par origem-destino e no padrão de dados. Você também pode personalizar sua taxa de transferência, e o valor personalizado pode ser de 2 a 256, enquanto o valor mais alto implica mais ganhos.
Grau de paralelismo de cópia Especifique o grau de paralelismo que o carregamento de dados utilizaria.
Tolerância a falhas Ao selecionar essa opção, você pode ignorar alguns erros ocorridos no meio do processo de cópia. Por exemplo, linhas incompatíveis entre o armazenamento de origem e de destino, arquivo sendo excluído durante a movimentação de dados, etc.
Ativar registo Ao selecionar essa opção, você pode registrar arquivos copiados, arquivos ignorados e linhas
Ativar preparo Especifique se os dados devem ser copiados por meio de um repositório de preparo provisório. Habilite o preparo apenas para os cenários benéficos.
Conexão de conta de preparo Ao selecionar Habilitar preparo, especifique a conexão de uma fonte de dados de armazenamento do Azure como um repositório de preparo provisório. Selecione + Novo para criar uma conexão de preparo, se você não a tiver.

Configurar parâmetros em uma atividade de cópia

Os parâmetros podem ser usados para controlar o comportamento de um pipeline e suas atividades. Você pode usar Adicionar conteúdo dinâmico para especificar parâmetros para suas propriedades de atividade de cópia. Vamos tomar a especificação Lakehouse/Data Warehouse/KQL Database como um exemplo para ver como usá-lo.

  1. Na origem ou no destino, depois de selecionar Espaço de trabalho como tipo de armazenamento de dados e especificar o banco de dados KQL do Lakehouse/Data Warehouse/como tipo de armazenamento de dados do espaço de trabalho, selecione Adicionar conteúdo dinâmico na lista suspensa de Lakehouse ou Data Warehouse ou Banco de dados KQL.

  2. No pop-up Adicionar painel de conteúdo dinâmico, na guia Parâmetros , selecione +.

    Captura de ecrã a mostrar a página Adicionar conteúdo dinâmico.

  3. Especifique o nome para o parâmetro e atribua-lhe um valor padrão, se desejar, ou especifique o valor para o parâmetro depois de selecionar Executar no pipeline.

    A captura de tela mostra a criação de um novo parâmetro.

    Observe que o valor do parâmetro deve ser Lakehouse/Data Warehouse/KQL Database object ID. Para obter seu ID de objeto Lakehouse/Data Warehouse/KQL Database, abra seu Lakehouse/Data Warehouse/KQL Database em seu espaço de trabalho e o ID estará depois /lakehouses/ou /datawarehouses//databases/ em sua URL.

    • ID do objeto Lakehouse:

      Captura de tela mostrando o ID do objeto Lakehouse.

    • ID do objeto do Data Warehouse:

      Captura de ecrã a mostrar o ID do objeto do Data Warehouse.

    • ID do objeto do banco de dados KQL:

      Captura de tela mostrando a ID do objeto Banco de Dados KQL.

  4. Selecione Salvar para voltar ao painel Adicionar conteúdo dinâmico. Em seguida, selecione o parâmetro para que ele apareça na caixa de expressão. Em seguida, selecione OK. Você voltará para a página do pipeline e poderá ver que a expressão do parâmetro é especificada após o ID/do objeto Lakehouse ID do objeto Data Warehouse ID/ do objeto KQL Database.

    Captura de tela mostrando o parâmetro de seleção.