Quickstart: Carregamento a granel com Synapse Studio

Os dados de carregamento são fáceis com o assistente de carga em massa em Synapse Studio. Synapse Studio é uma característica da Azure Synapse Analytics. O assistente de carga em massa guia-o através da criação de um script T-SQL com a declaração COPY para carregar em massa dados num pool de SQL dedicado.

Pontos de entrada para o assistente de carga a granel

Pode carregar dados em massa clicando na seguinte área dentro de Synapse Studio: um ficheiro ou pasta de uma conta de armazenamento Azure que está anexada ao seu espaço de trabalho.

Screenshot that shows right-clicking a file or folder from a storage account.

Pré-requisitos

  • O assistente gera uma declaração COPY, que utiliza Azure Ative Directory (Azure AD) para autenticação. O utilizador Azure AD deve ter acesso ao espaço de trabalho com, pelo menos, o papel Armazenamento Do Contribuinte de Dados Blob para a conta Azure Data Lake Storage Gen2.

  • Tem de ter as permissões necessárias para utilizar a declaração COPY e criar permissões de Tabela se estiver a criar uma nova tabela para carregar.

  • O serviço ligado associado à conta Data Lake Storage Gen2 deve ter acesso ao ficheiro ou pasta para carregar. Por exemplo, se o mecanismo de autenticação do serviço ligado for uma identidade gerida, a identidade gerida do espaço de trabalho deve ter pelo menos Armazenamento permissão do Leitor de Dados Blob na conta de armazenamento.

  • Se uma rede virtual estiver ativada no seu espaço de trabalho, certifique-se de que o tempo de funcionamento integrado associado aos serviços ligados à conta Data Lake Storage Gen2 para os dados de origem e localização de ficheiros de erro tem a autoria interativa ativada. A autoria interativa é necessária para a deteção automática, pré-visualização do conteúdo do ficheiro de origem e navegação Data Lake Storage Gen2 contas de armazenamento dentro do assistente.

Passos

  1. No painel de localização de armazenamento Source , selecione a conta de armazenamento e o ficheiro ou pasta a partir do qual está a carregar. O assistente tenta automaticamente detetar ficheiros Parquet e ficheiros de texto delimitado (CSV), incluindo mapear os campos de origem do ficheiro para os tipos de dados SQL alvo apropriados.

    Screenshot that shows selecting a source location.

  2. Selecione as definições do formato de ficheiro, incluindo as definições de erro para quando há linhas rejeitadas durante o processo de carga a granel. Também pode selecionar dados de pré-visualização para ver como a declaração COPY irá analisar o ficheiro para o ajudar a configurar as definições do formato de ficheiro. Selecione os dados de pré-visualização sempre que alterar uma definição de formato de ficheiro, para ver como a declaração COPY irá analisar o ficheiro com a definição atualizada.

    Screenshot that shows previewing data.

    Nota

    • O assistente de carga em massa não suporta a pré-visualização dos dados com exterminadores de campo de vários caracteres. Quando especificar um exterminador de campo de vários caracteres, o assistente irá visualizar os dados numa única coluna.
    • Quando selecionar os nomes das colunas Infer, o assistente de carga em massa analisará os nomes das colunas da primeira linha especificada pelo campo primeira linha . O assistente de carga a granel irá automaticamente aumentar o FIRSTROW valor na declaração COPY por 1 para ignorar esta linha do cabeçalho.
    • Especificar terminadores de linha de vários caracteres é suportado na declaração COPY. No entanto, o assistente de carga a granel não o suporta e lançará um erro.
  3. Selecione a piscina SQL dedicada que está a usar para carregar, incluindo se a carga será para uma mesa existente ou para uma nova mesa. Screenshot that shows selecting a target location.

  4. Selecione o mapeamento de colunas configurar para se certificar de que tem o mapeamento de colunas apropriado. Os nomes das colunas de notas serão detetados automaticamente se ativar os nomes das colunas Infer. Para novas tabelas, configurar o mapeamento da coluna é fundamental para atualizar os tipos de dados da coluna-alvo.

    Screenshot that shows configuring column mapping.

  5. Selecione o roteiro aberto. Um script T-SQL é gerado com a declaração COPY para carregar a partir do seu lago de dados. Screenshot that shows opening the SQL script.

Passos seguintes