Exportar para Tabela do Azure

Importante

O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.

A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).

A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.

Este artigo descreve como usar a opção Exportar para o Azure no módulo Exportar Dados no Machine Learning Studio (clássico).

Observação

Aplica-se a: Machine Learning Studio (clássico) somente

Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.

Essa opção é útil quando você deseja exportar resultados ou dados intermediários de um experimento de machine learning para uma tabela do Azure. O serviço tabela do Azure é um serviço de gerenciamento de dados no Azure que pode armazenar grandes quantidades de dados estruturados e não relacionais. É um armazenamento de dados NoSQL que aceita chamadas autenticadas de dentro e fora do Azure.

Como exportar dados para uma tabela do Azure

  1. Adicione o módulo Exportar Dados ao seu experimento. Você pode encontrar este módulo na categoria Entrada e Saída de Dados no Studio (clássico).

  2. Conexão para o módulo que produz os dados que você deseja exportar para o armazenamento de tabelas do Azure.

  3. Especifique se deseja exportar dados para um recurso compartilhado público ou para uma conta de armazenamento privada que requer credenciais de logon, definindo a opção Tipo de autenticação.

    • Público (URL de SAS): escolha esta opção se a conta for compatível com o acesso por meio da URL SAS. No campo URI de SAS de Tabela, digite ou colar o URI completo que define a conta e o blob público.

      A URL de SAS é uma URL de acesso com limite de tempo que você pode gerar usando um utilitário de armazenamento do Azure. Em uma página acessível por meio da URL de SAS, os dados podem ser armazenados usando apenas estes formatos: CSV, TSV e ARFF.

    • Conta: escolha esta opção se os dados estão em uma conta privada. Você também deve fornecer credenciais, incluindo o nome da conta e a chave.

  4. Se você quiser exportar seus dados para armazenamento seguro e privado, forneça as credenciais necessárias para acessar a conta:

    • Nome da conta de tabela: digite ou colar o nome da conta que contém o blob que você deseja acessar. Por exemplo, se a URL completa da conta de armazenamento for https://myshared.table.core.windows.net, digite myshared.

    • Chave de conta de tabela: colar a chave de acesso associada à conta de armazenamento.

    • Nome da tabela: digite o nome da tabela específica que você deseja ler.

  5. Especifique quais colunas salvar no armazenamento de tabelas e quais colunas usar na definição do esquema de tabela usando as propriedades da coluna.

    • Chave de partição: escolha a coluna que deve ser usada para particionar o conjuntos de dados salvo para a tabela no Azure Armazenamento. As tabelas no Azure são particionadas para oferecer suporte ao balanceamento de carga entre os nós de armazenamento. Todas as entidades de tabela são organizadas por partição; portanto, a propriedade PartitionKey é necessária para todas as operações de tabela.

    • Chave de linha da tabela do Azure: escolha a coluna que deve ser usada para a propriedade RowKey . A propriedade RowKey é uma propriedade do sistema necessária para cada entidade em uma tabela. Junto com a propriedade PartitionKey , ela forma um índice exclusivo para cada linha na tabela.

    Observação

    Você deve usar colunas diferentes para RowKey e PartitionKey. Certifique-se de que qualquer coluna selecionada para RowKey ou PartitionKey também seja incluída na lista de colunas de destino ou se um erro será gerado.

    • Colunas de origem da tabela do Azure: selecione as colunas adicionais do conjuntos de dados que você deseja salvar na tabela do Azure. Você também deve incluir as colunas selecionadas para PartitionKey e RowKey.

    Para obter mais informações sobre tabelas no Azure Armazenamento, consulte Noções básicas sobre o modelo de dados do serviço tabela.

  6. Especifique os nomes das colunas a gravar na tabela.

    Importante

    Você deve fornecer um nome de coluna para cada coluna que você saída para a tabela, incluindo RowKey, PartitionKey e todas as colunas de origem.

    Se o número de nomes de coluna que você fornecer não corresponder ao número de colunas de saída, um erro será gerado.

    Se você digitar novos nomes de coluna, eles deverão ser fornecidos na ordem dos índices de coluna das colunas de origem.

  7. Modo de gravação de tabela do Azure: indique como você deseja que os Dados de Exportação se comportem quando os dados já existirem na tabela do Azure.

    • Inserir: a Insert Entity operação insere uma nova entidade com uma chave primária exclusiva, que é formada de uma combinação das propriedades PartitionKey e RowKey .

    • Mesclagem: a Merge Entity operação atualiza uma entidade existente atualizando as propriedades da entidade. Essa operação não substitui a entidade existente.

    • Substituir: a Update Entity operação substitui o conteúdo da entidade determinada em uma tabela.

    • InsertOrReplace: a InsertOrReplace Entity operação insere a entidade se a entidade não existir. Se a entidade existir, substituirá a entidade existente.

    • InsertOrMerge: a InsertOrMerge Entity operação insere a entidade se a entidade não existir. Se a entidade existir, ele mescla as propriedades de entidade fornecidas com as existentes.

  8. Usar resultados armazenados em cache: indique se deseja que os dados sejam atualizados sempre que o experimento for executado.

    Se você selecionar essa opção, o módulo Exportar Dados salvará os dados na tabela especificada na primeira vez que o experimento for executado e, depois disso, não executará gravações, a menos que haja alterações upstream.

    Se você desmarcar essa opção, os dados serão gravados no destino sempre que o experimento for executado, independentemente de os dados ser os mesmos ou não.

  9. Execute o experimento.

Observações técnicas

Esta seção contém detalhes de implementação, dicas e respostas para perguntas frequentes.

Perguntas comuns

Por que eu fiz um erro ao escrever em uma tabela existente

Verifique o esquema da tabela para verificar se os nomes das colunas e os tipos de dados são os mesmos. Por exemplo, no armazenamento de tabelas do Azure, espera-se que a coluna ID seja uma cadeia de caracteres.

Se você receber o erro Erro 0027: O tamanho dos objetos passados é inconsistente, verifique se a tabela existe no contêiner especificado. Atualmente, o Azure ML pode gravar somente em tabelas existentes.

Por que eu vejo o erro de que uma coluna existente não pode ser encontrada

Se você não tiver executado o experimento, as colunas upstream às vezes não serão detectadas pelos Dados de Exportação. Se você fizer alterações upstream no experimento, talvez seja necessário remover o módulo Exportar Dados e, em seguida, adicioná-lo e reconfigurá-lo.

Como evitar a reescrevê-lo desnecessariamente

Se os dados em seu experimento mudarem por algum motivo, o módulo Exportar Dados sempre gravará os novos dados.

No entanto, se você estiver executando o experimento com outras alterações que não afetam os resultados, de definir a opção Usar resultados armazenados em cache como TRUE. O módulo verificará se o experimento foi executado anteriormente usando as mesmas opções e, se um resultado anterior for encontrado, os dados não serão gravados na tabela do Azure.

Posso exportar dados para uma região geográfica diferente

Sim. No entanto, se a conta de armazenamento estiver em uma região diferente do nó de computação usado para o experimento de machine learning, o acesso a dados poderá ser mais lento. Além disso, você será cobrado pela entrada e saída de dados na assinatura.

Exemplos

Para ver exemplos de como usar esses módulos de aprendizado de máquina, consulte o Galeria de IA do Azure.

Parâmetros do módulo

Público ou SAS – Opções públicas

Nome Intervalo Type Padrão Descrição
URI da SAS de tabela any Cadeia de caracteres

Conta – Opções de conta privada

Nome Intervalo Type Padrão Descrição
Nome da conta de tabela
Chave de conta de tabela any SecureString

Opções de armazenamento

Nome Intervalo Type Padrão Descrição
Nome da tabela Cadeia de caracteres nenhum
Chave de partição any SecureString nenhum Escolha a coluna a ser usada como a chave ao particionar a tabela. Se nenhuma coluna for selecionada, o nome da coluna como a chave de partição para todas as entradas
Chave de linha de tabela do Azure any Columnpickerfor nenhum Escolha a coluna que contém o identificador exclusivo para linhas de tabela. Usa como padrão uma chave de linha baseada em GUID
Colunas de origem de tabela do Azure any Columnpickerfor nenhum Especificar quais colunas incluir na tabela, seja por nome ou por índice de coluna
Colunas de destino da tabela do Azure any String nenhum Digite os nomes das colunas a serem usadas na tabela de destino
Modo de gravação de tabela do Azure Lista: inserir, mesclar, substituir, InsertOrReplace, InsertOrMerge Enumeração nenhum
Usar resultados em cache TRUE/FALSE Boolean FALSE O módulo só será executado se o cache válido não existir; caso contrário, use dados armazenados em cache da execução anterior.

Exceções

Exceção Descrição
Erro 0027 Uma exceção ocorre quando dois objetos precisam ser do mesmo tamanho, mas eles não são.
Erro 0003 Ocorrerá uma exceção se uma ou mais das entradas forem nulas ou estiverem vazias.
Erro 0029 Ocorrerá uma exceção quando um URI inválido for passado.
Erro 0030 ocorrerá uma exceção quando não for possível baixar um arquivo.
Erro 0002 Ocorrerá uma exceção se um ou mais parâmetros não puderem ser analisados ou convertidos do tipo especificado para o tipo exigido pelo método de destino.
Erro 0009 Ocorrerá uma exceção se o nome da conta de armazenamento do Azure ou o nome do contêiner foi especificado incorretamente.
Erro 0048 Uma exceção ocorre quando não for possível abrir um arquivo.
Erro 0046 Ocorrerá uma exceção quando não for possível criar um diretório no caminho especificado.
Erro 0049 Uma exceção ocorre quando não for possível analisar um arquivo.

para obter uma lista de erros específicos para módulos do Studio (clássicos), consulte Machine Learning códigos de erro.

para obter uma lista de exceções de api, consulte Machine Learning códigos de erro da api REST.

Confira também

Importar dados
Exportar dados
Exportar para Banco de Dados SQL do Azure
Exportar para o Armazenamento de Blobs do Azure
Exportar para consulta do Hive