Quickstart: Carregamento a granel com Synapse Studio
Os dados de carregamento são fáceis com o assistente de carga em massa em Synapse Studio. Synapse Studio é uma característica da Azure Synapse Analytics. O assistente de carga em massa guia-o através da criação de um script T-SQL com a declaração COPY para carregar em massa dados num pool de SQL dedicado.
Pontos de entrada para o assistente de carga a granel
Pode carregar dados em massa clicando na seguinte área dentro de Synapse Studio: um ficheiro ou pasta de uma conta de armazenamento Azure que está anexada ao seu espaço de trabalho.
Pré-requisitos
O assistente gera uma declaração COPY, que utiliza Azure Ative Directory (Azure AD) para autenticação. O utilizador Azure AD deve ter acesso ao espaço de trabalho com, pelo menos, o papel Armazenamento Do Contribuinte de Dados Blob para a conta Azure Data Lake Storage Gen2.
Tem de ter as permissões necessárias para utilizar a declaração COPY e criar permissões de Tabela se estiver a criar uma nova tabela para carregar.
O serviço ligado associado à conta Data Lake Storage Gen2 deve ter acesso ao ficheiro ou pasta para carregar. Por exemplo, se o mecanismo de autenticação do serviço ligado for uma identidade gerida, a identidade gerida do espaço de trabalho deve ter pelo menos Armazenamento permissão do Leitor de Dados Blob na conta de armazenamento.
Se uma rede virtual estiver ativada no seu espaço de trabalho, certifique-se de que o tempo de funcionamento integrado associado aos serviços ligados à conta Data Lake Storage Gen2 para os dados de origem e localização de ficheiros de erro tem a autoria interativa ativada. A autoria interativa é necessária para a deteção automática, pré-visualização do conteúdo do ficheiro de origem e navegação Data Lake Storage Gen2 contas de armazenamento dentro do assistente.
Passos
No painel de localização de armazenamento Source , selecione a conta de armazenamento e o ficheiro ou pasta a partir do qual está a carregar. O assistente tenta automaticamente detetar ficheiros Parquet e ficheiros de texto delimitado (CSV), incluindo mapear os campos de origem do ficheiro para os tipos de dados SQL alvo apropriados.
Selecione as definições do formato de ficheiro, incluindo as definições de erro para quando há linhas rejeitadas durante o processo de carga a granel. Também pode selecionar dados de pré-visualização para ver como a declaração COPY irá analisar o ficheiro para o ajudar a configurar as definições do formato de ficheiro. Selecione os dados de pré-visualização sempre que alterar uma definição de formato de ficheiro, para ver como a declaração COPY irá analisar o ficheiro com a definição atualizada.
Nota
- O assistente de carga em massa não suporta a pré-visualização dos dados com exterminadores de campo de vários caracteres. Quando especificar um exterminador de campo de vários caracteres, o assistente irá visualizar os dados numa única coluna.
- Quando selecionar os nomes das colunas Infer, o assistente de carga em massa analisará os nomes das colunas da primeira linha especificada pelo campo primeira linha . O assistente de carga a granel irá automaticamente aumentar o
FIRSTROW
valor na declaração COPY por 1 para ignorar esta linha do cabeçalho. - Especificar terminadores de linha de vários caracteres é suportado na declaração COPY. No entanto, o assistente de carga a granel não o suporta e lançará um erro.
Selecione a piscina SQL dedicada que está a usar para carregar, incluindo se a carga será para uma mesa existente ou para uma nova mesa.
Selecione o mapeamento de colunas configurar para se certificar de que tem o mapeamento de colunas apropriado. Os nomes das colunas de notas serão detetados automaticamente se ativar os nomes das colunas Infer. Para novas tabelas, configurar o mapeamento da coluna é fundamental para atualizar os tipos de dados da coluna-alvo.
Selecione o roteiro aberto. Um script T-SQL é gerado com a declaração COPY para carregar a partir do seu lago de dados.
Passos seguintes
- Consulte o artigo de declaração COPY para obter mais informações sobre as capacidades COPY.
- Consulte o artigo de visão geral de carregamento de dados para obter informações sobre a utilização de um processo de extrato, transformação e carga (ETL).