Exportar para o Armazenamento de Blobs do Azure

Este artigo descreve como usar a opção exportar para o armazenamento de BLOBs do Azure , no módulo exportar dados no Azure Machine Learning Studio (clássico).

Observação

Aplica-se a: Machine Learning Studio (clássico)

Esse conteúdo pertence apenas ao estúdio (clássico). Módulos de arrastar e soltar semelhantes foram adicionados ao designer de Azure Machine Learning. Saiba mais neste artigo comparando as duas versões.

Essa opção é útil quando você deseja exportar dados de um experimento do Machine Learning para o armazenamento de BLOBs do Azure. Por exemplo, talvez você queira compartilhar saídas de dados de aprendizado de máquina com outros aplicativos ou armazenar dados intermediários ou conjuntos de dados limpos para uso em outros experimentos.

Os BLOBs do Azure podem ser acessados de qualquer lugar, usando HTTP ou HTTPS. Como o armazenamento de BLOBs do Azure é um armazenamento de dados não estruturado, você pode exportar dados em vários formatos. Atualmente, há suporte para os formatos CSV, TSV e ARFF.

Para exportar dados para o blob do Azure para uso por outros aplicativos, use o módulo exportar dados para salvar os dados no armazenamento de BLOBs do Azure. Em seguida, use qualquer ferramenta que possa ler dados do armazenamento do Azure (como Excel, utilitários de armazenamento em nuvem ou outros serviços de nuvem) para carregar e usar os dados.

Observação

Os módulos importar dados e exportar dados podem ler e gravar dados somente do armazenamento do Azure criado usando o modelo de implantação clássico. Em outras palavras, o novo tipo de conta de armazenamento de BLOBs do Azure que oferece camadas de acesso de armazenamento quentes e frias ainda não tem suporte.

De modo geral, as contas de armazenamento do Azure que você possa ter criado antes de essa opção se tornar disponível não deverão ser afetadas.

No entanto, se você precisar criar uma nova conta para uso com Azure Machine Learning, recomendamos que você selecione clássico para o modelo de implantação ou use o Resource Manager e, para tipo de conta, selecione uso geral em vez de armazenamento de BLOBs.

Como exportar dados para o armazenamento de BLOBs do Azure

O serviço blob do Azure é para armazenar grandes quantidades de dados, incluindo dados binários. Há dois tipos de armazenamento de blob: BLOBs públicos e blobs que exigem credenciais de logon.

  1. Adicione o módulo exportar dados ao seu experimento. Você pode encontrar esse módulo na categoria de entrada e saída de dados no Studio (clássico).

  2. Conecte exportar dados ao módulo que produz os dados que você deseja exportar para o armazenamento de BLOBs do Azure.

  3. Abra o painel Propriedades de exportar dados. Para o destino de dados, selecione armazenamento de BLOBs do Azure.

  4. Para tipo de autenticação, escolha público (URL SAS) se você souber que o armazenamento dá suporte ao acesso por meio de uma URL SAS.

    Uma URL SAS é um tipo especial de URL que pode ser gerado usando um utilitário de armazenamento do Azure e está disponível apenas por um tempo limitado. Ele contém todas as informações necessárias para autenticação e download.

    Para URI, digite ou cole o URI completo que define a conta e o blob público.

  5. Para contas particulares, escolha conta e forneça o nome da conta e a chave da conta, para que o experimento possa gravar na conta de armazenamento.

    • Nome da conta: digite ou cole o nome da conta em que você deseja salvar os dados. Por exemplo, se a URL completa da conta de armazenamento for https://myshared.blob.core.windows.net , você digitaria myshared .

    • Chave de conta: Cole a chave de acesso de armazenamento associada à conta.

  6. Caminho para o contêiner, diretório ou BLOB: digite o nome do blob em que os dados exportados serão armazenados. Por exemplo, para salvar os resultados de seu experimento em um novo BLOB chamado results01.csv nas previsões de contêiner em uma conta chamada mymldata, a URL completa para o blob seria https://mymldata.blob.core.windows.net/predictions/results01.csv .

    Portanto, no caminho do campo para o contêiner, diretório ou BLOB, você especificaria o contêiner e o nome do blob da seguinte maneira: predictions/results01.csv

  7. Se você especificar o nome de um blob que ainda não existe, o Azure criará o blob para você.

    Ao gravar em um blob existente, você pode especificar que o conteúdo atual do blob seja substituído definindo a propriedade, o modo de gravação do armazenamento de BLOBs do Azure. Por padrão, essa propriedade é definida como erro, o que significa que um erro é gerado sempre que um arquivo de blob existente com o mesmo nome é encontrado.

  8. Para formato de arquivo para arquivo de blob, selecione o formato no qual os dados devem ser armazenados.

    • CSV: valores separados por vírgulas (CSV) é o formato de armazenamento padrão. Para exportar os títulos de coluna junto com os dados, selecione a opção gravar linha de cabeçalho de blob. Para obter mais informações sobre o formato delimitado por vírgula usado em Azure Machine Learning, consulte converter em CSV.

    • TSV: o formato TSV (valores separados por tabulações) é compatível com muitas ferramentas de aprendizado de máquina. Para exportar os títulos de coluna junto com os dados, selecione a opção gravar linha de cabeçalho de blob. Para obter mais informações sobre o formato separado por tabulações usado em Azure Machine Learning, consulte converter em TSV.

    • ARFF: esse formato dá suporte ao salvamento de arquivos no formato usado pelo conjunto de ferramentas do weka. Não há suporte para esse formato em arquivos armazenados em uma URL SAS. Para obter mais informações sobre o formato ARFF, consulte converter em ARFF.

  9. Usar resultados em cache: Selecione esta opção se desejar evitar a regravação dos resultados para o arquivo de blob sempre que executar o experimento. Se não houver nenhuma outra alteração nos parâmetros do módulo, o experimento gravará os resultados somente na primeira vez em que o módulo for executado ou quando houver alterações nos dados.

Exemplos

Para obter exemplos de como usar o módulo exportar dados , consulte a Galeria de ia do Azure:

Observações técnicas

Esta seção contém detalhes de implementação, dicas e respostas para perguntas frequentes.

Perguntas comuns

Como posso evitar gravar os dados se o experimento não for alterado

Quando o experimento resulta em alterações, os dados de exportação sempre salvam o novo conjunto. No entanto, se você estiver executando o experimento repetidamente sem fazer alterações que afetem os dados de saída, poderá selecionar a opção usar resultados em cache .

O módulo verifica se o experimento foi executado anteriormente usando os mesmos dados e as mesmas opções e, se uma execução anterior for encontrada, a operação de gravação não será repetida.

Posso salvar dados em uma conta em uma região geográfica diferente

Sim, você pode gravar dados em contas em regiões diferentes. No entanto, se a conta de armazenamento estiver em uma região diferente do nó de computação usado para o experimento do Machine Learning, o acesso aos dados poderá ser mais lento. Além disso, você é cobrado pela entrada e saída de dados na assinatura.

Parâmetros do módulo

Opções gerais

Name Intervalo Type Padrão Descrição
Fonte de dados Lista Fonte de dados ou coletor Armazenamento do Blobs do Azure O destino pode ser um arquivo no armazenamento de BLOBs do Azure, uma tabela do Azure, uma tabela ou uma exibição em um banco de dados SQL do Azure ou uma tabela do hive.
Usar resultados em cache TRUE/FALSE Boolean FALSE O módulo só será executado se o cache válido não existir; caso contrário, use dados armazenados em cache da execução anterior.
Especifique o tipo de autenticação SAS/conta AuthenticationType Conta Indica se as credenciais SAS ou de conta devem ser usadas para autorização de acesso

Público ou SAS – opções de armazenamento público

Name Intervalo Type Padrão Descrição
URI SAS para blob any String nenhum O URI de SAS do blob a ser gravado (obrigatório)
Formato de arquivo para o arquivo SAS ARFF

CSV

TSV
Tipos de LoaderUtils. CSV Indica se o arquivo é CSV, TSV ou ARFF. (obrigatório)
Gravar linha de cabeçalho SAS TRUE/FALSE Boolean FALSE Indica se os títulos de coluna devem ser gravados no arquivo

Conta – opções de armazenamento privado

Name Intervalo Type Padrão Descrição
Nome da conta do Azure any String nenhum Nome da conta de usuário do Azure
Chave de conta do Azure any SecureString nenhum Chave de armazenamento do Azure
Caminho para o início do blob com contêiner any String nenhum Nome do arquivo de BLOB, começando com o nome do contêiner
Modo de gravação de armazenamento de Blob do Azure Lista: erro, substituir enum: BlobFileWriteMode Erro Escolha o método de gravação de arquivos de BLOB
Formato de arquivo para o arquivo de blob ARFF

CSV

TSV
Tipos de LoaderUtils. CSV Indica se o arquivo de blob é CSV, TSV ou ARFF
Gravar linha de cabeçalho do blob TRUE/FALSE Boolean FALSE Indica se o arquivo de BLOB deve ter uma linha de cabeçalho

Exceções

Exceção Descrição
Erro 0027 Uma exceção ocorre quando dois objetos precisam ser do mesmo tamanho, mas eles não são.
Erro 0003 Ocorrerá uma exceção se uma ou mais das entradas forem nulas ou estiverem vazias.
Erro 0029 Ocorrerá uma exceção quando um URI inválido for passado.
Erro 0030 ocorrerá uma exceção quando não for possível baixar um arquivo.
Erro 0002 Ocorrerá uma exceção se um ou mais parâmetros não puderem ser analisados ou convertidos do tipo especificado para o tipo exigido pelo método de destino.
Erro 0009 Ocorrerá uma exceção se o nome da conta de armazenamento do Azure ou o nome do contêiner foi especificado incorretamente.
Erro 0048 Uma exceção ocorre quando não for possível abrir um arquivo.
Erro 0046 Ocorrerá uma exceção quando não for possível criar um diretório no caminho especificado.
Erro 0049 Uma exceção ocorre quando não for possível analisar um arquivo.

Para obter uma lista de erros específicos para módulos do Studio (clássicos), consulte Machine Learning códigos de erro.

Para obter uma lista de exceções de API, consulte Machine Learning códigos de erro da API REST.

Consulte também

Importar dados
Exportar dados
Exportar para o banco de dados SQL do Azure
Exportar para consulta de Hive
Exportar para Tabela do Azure