Exportação para Armazenamento de Blob Azure

Este artigo descreve como utilizar a opção Export to Azure Blob Storage, no módulo de Dados de Exportação no Azure Machine Learning Studio (clássico).

Nota

Aplica-se a: Machine Learning Studio (clássico)

Este conteúdo diz respeito apenas ao Studio (clássico). Módulos semelhantes de arrasto e queda foram adicionados ao designer de Aprendizagem automática Azure. Saiba mais neste artigo comparando as duas versões.

Esta opção é útil quando pretende exportar dados de uma experiência de machine learning para o armazenamento de blob Azure. Por exemplo, pode querer partilhar saídas de dados de machine learning com outras aplicações, ou armazenar dados intermédios ou conjuntos de dados limpos para utilização noutras experiências.

As bolhas Azure podem ser acedidas a partir de qualquer lugar, utilizando HTTP ou HTTPS. Como o armazenamento de blob Azure é uma loja de dados não estruturada, pode exportar dados em vários formatos. Atualmente, os formatos CSV, TSV e ARFF são suportados.

Para exportar dados para a bolha Azure para utilização por outras aplicações, utilize o módulo de Dados de Exportação para guardar os dados para o armazenamento de blob Azure. Em seguida, utilize qualquer ferramenta que possa ler dados a partir do armazenamento do Azure (como o Excel, utilitários de armazenamento em nuvem ou outros serviços na nuvem), para carregar e utilizar os dados.

Nota

Os módulos de Dados de Importação e Dados de Exportação só podem ler e escrever dados a partir do armazenamento Azure criados com o modelo de implementação Clássico. Por outras palavras, o novo tipo de conta Azure Blob Storage que oferece um nível de acesso de armazenamento quente e fresco ainda não está suportado.

Geralmente, quaisquer contas de armazenamento Azure que possa ter criado antes desta opção de serviço ficar disponível não devem ser afetadas.

No entanto, se precisar de criar uma nova conta para utilização com a Azure Machine Learning, recomendamos que selecione Classic para o modelo de Implementação, ou utilize o gestor de recursos e para o tipo Conta, selecione Finalidade Geral em vez de armazenamento blob.

Como exportar dados para o armazenamento de bolhas Azure

O serviço de blob Azure destina-se a armazenar grandes quantidades de dados, incluindo dados binários. Existem dois tipos de armazenamento de bolhas: bolhas públicas e bolhas que requerem credenciais de login.

  1. Adicione o módulo de Dados de Exportação à sua experiência. Pode encontrar este módulo na categoria entrada e saída de dados em Studio (clássico).

  2. Ligue os Dados de Exportação ao módulo que produz os dados que pretende exportar para o armazenamento de bolhas Azure.

  3. Abra o painel de propriedades dos dados de exportação. Para o destino de dados, selecione Azure Blob Storage.

  4. Para tipo de autenticação, escolha Público (URL SAS) se souber que o armazenamento suporta o acesso através de um URL SAS.

    Um URL SAS é um tipo especial de URL que pode ser gerado usando um utilitário de armazenamento Azure, e está disponível por apenas um tempo limitado. Contém toda a informação necessária para autenticação e download.

    Para URI, escreva ou cole o URI completo que define a conta e a bolha pública.

  5. Para contas privadas, escolha Conta, e forneça o nome da conta e a chave da conta, para que a experiência possa escrever na conta de armazenamento.

    • Nome da conta: Digite ou cole o nome da conta onde pretende guardar os dados. Por exemplo, se o URL completo da conta de armazenamento https://myshared.blob.core.windows.net for, escreveria myshared .

    • Tecla conta: Cole a chave de acesso ao armazenamento que está associada à conta.

  6. Caminho para o contentor, diretório ou bolha: Escreva o nome da bolha onde os dados exportados serão armazenados. Por exemplo, para guardar os resultados da sua experiência para uma nova bolha chamada results01.csv nas previsões do contentor numa conta chamada mymldata, o URL completo para a bolha seria https://mymldata.blob.core.windows.net/predictions/results01.csv .

    Assim, no campo Caminho para o contentor, diretório ou bolha, você especificaria o recipiente e o nome blob da seguinte forma: predictions/results01.csv

  7. Se especificar o nome de uma bolha que já não existe, a Azure cria a bolha para si.

    Ao escrever para uma bolha existente, pode especificar que o conteúdo atual da bolha será substituído definindo a propriedade, modo de escrita de armazenamento de bolhas Azure. Por predefinição, esta propriedade é definida como Error, o que significa que um erro é levantado sempre que um ficheiro blob existente com o mesmo nome é encontrado.

  8. Para o formato de ficheiro para ficheiro blob, selecione o formato em que os dados devem ser armazenados.

    • CSV: Valores separados por vírgula (CSV) é o formato de armazenamento padrão. Para exportar os títulos das colunas juntamente com os dados, selecione a opção, Escreva a linha do cabeçalho blob. Para obter mais informações sobre o formato delimitado em vírgula utilizado no Azure Machine Learning, consulte Converter em CSV.

    • TSV: O formato de valores separados por separados por separados por separados por separados por separados por separados por separados por guias (TSV) é compatível com muitas ferramentas de aprendizagem automática. Para exportar os títulos das colunas juntamente com os dados, selecione a opção, Escreva a linha do cabeçalho blob. Para obter mais informações sobre o formato separado do separado por separados do separador utilizado no Azure Machine Learning, consulte Converter em TSV.

    • ARFF: Este formato suporta a poupança de ficheiros no formato utilizado pelo toolset Weka. Este formato não é suportado para ficheiros armazenados num URL SAS. Para obter mais informações sobre o formato ARFF, consulte Converter em ARFF.

  9. Utilize resultados em cache: Selecione esta opção se quiser evitar reescrever os resultados no ficheiro blob sempre que executar a experiência. Se não houver outras alterações nos parâmetros do módulo, a experiência escreve os resultados apenas na primeira vez que o módulo é executado, ou quando há alterações nos dados.

Exemplos

Por exemplo, como utilizar o módulo de Dados de Exportação, consulte a Galeria Azure AI:

Notas técnicas

Esta secção contém detalhes de implementação, dicas e respostas a perguntas frequentes.

Perguntas comuns

Como posso evitar escrever os dados se a experiência não mudou

Quando os resultados da sua experiência mudam, os Dados de Exportação guardam sempre o novo conjunto de dados. No entanto, se estiver a executar a experiência repetidamente sem fazer alterações que afetem os dados de saída, pode selecionar a opção de resultados em cache Utilização.

O módulo verifica se a experiência já foi executada anteriormente utilizando os mesmos dados e as mesmas opções, e se for encontrada uma execução anterior, a operação de escrita não é repetida.

Posso guardar dados para uma conta numa região geográfica diferente

Sim, pode escrever dados em contas em diferentes regiões. No entanto, se a conta de armazenamento estiver numa região diferente do nó de computação utilizado para a experiência de machine learning, o acesso a dados pode ser mais lento. Além disso, é cobrado por entrada de dados e saída na subscrição.

Parâmetros do módulo

Secção de opções Geral

Nome Intervalo Tipo Predefinição Descrição
Origem de dados Lista Fonte de dados ou pia Armazenamento de Blobs do Azure O destino pode ser um arquivo no armazenamento Azure BLOB, uma mesa Azure, uma mesa ou vista em uma Base de Dados Azure SQL, ou uma mesa de Colmeia.
Use resultados em cache VERDADEIRO/FALSO Booleano FALSE O módulo só executa se não existir cache válido; caso contrário, utilize dados em cache da execução prévia.
Por favor, especifique o tipo de autenticação SAS/Conta AutenticaçãoType Conta Indica se as credenciais de SAS ou de conta devem ser usadas para autorização de acesso

Público ou SAS - Opções de armazenamento público

Nome Intervalo Tipo Predefinição Descrição
SAS URI para bolha qualquer String nenhum O SAS URI da bolha a ser escrito para (obrigatório)
Formato de ficheiro para ficheiro SAS ARFF

CSV

TSV
LoaderUtils.FileTypes CSV Indica se o ficheiro é CSV, TSV ou ARFF. (obrigatório)
Escreva linha de cabeçalho SAS VERDADEIRO/FALSO Booleano FALSE Indica se as rubricas das colunas devem ser escritas para o ficheiro

Conta - Opções de armazenamento privado

Nome Intervalo Tipo Predefinição Descrição
Nome da conta Azure qualquer String nenhum Nome da conta do utilizador Azure
Chave da conta Azure qualquer SecureString nenhum Chave de armazenamento azul
Caminho para blob começando com recipiente qualquer String nenhum Nome do ficheiro blob, começando com o nome do recipiente
Modo de escrita de armazenamento de bolhas Azure Lista: Erro, Substituição enum:BlobFileWriteMode Erro Escolha o método de escrever ficheiros blob
Formato de ficheiro para ficheiro blob ARFF

CSV

TSV
LoaderUtils.FileTypes CSV Indica se o ficheiro blob é CSV, TSV ou ARFF
Escreva a linha do cabeçalho blob VERDADEIRO/FALSO Booleano FALSE Indica se o ficheiro blob deve ter a linha do cabeçalho

Exceções

Exceção Descrição
Erro 0027 Uma exceção ocorre quando dois objetos têm que ter o mesmo tamanho, mas não são.
Erro 0003 Uma exceção ocorre se uma ou mais entradas forem nulas ou vazias.
Erro 0029 Uma exceção ocorre quando um URI inválido é passado.
Erro 0030 uma exceção ocorre quando não é possível descarregar um ficheiro.
Erro 0002 Uma exceção ocorre se um ou mais parâmetros não puderem ser analisados ou convertidos do tipo especificado para o tipo exigido pelo método-alvo.
Erro 0009 Ocorre uma exceção se o nome da conta de armazenamento Azure ou o nome do recipiente forem especificados incorretamente.
Erro 0048 Uma exceção ocorre quando não é possível abrir um ficheiro.
Erro 0046 Uma exceção ocorre quando não é possível criar um diretório em caminho especificado.
Erro 0049 Uma exceção ocorre quando não é possível analisar um ficheiro.

Para obter uma lista de erros específicos dos módulos Studio (clássicos), consulte códigos de erro de aprendizagem automática.

Para obter uma lista de exceções da API, consulte códigos de erro da API de aprendizagem automática.

Ver também

Dados de Importação
Dados de Exportação
Exportação para Base de Dados Azure SQL
Exportação para Consulta de Colmeia
Exportação para quadro de Azure