Converter em TSV

Importante

O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.

A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).

A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.

Converte a entrada de dados para um formato delimitado por tabulação

Categoria: conversões de formato de dados

Observação

aplica-se a: somente Machine Learning Studio (clássico)

Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.

Visão geral do módulo

este artigo descreve como usar o módulo converter para TSV no Machine Learning studio (clássico), para converter qualquer conjunto de todos os conjuntos de todos os módulos do formato interno que são usados por todos os módulo do Machine Learning Studio (clássico), em um arquivo simples no formato separado por tabulações.

Os arquivos de valor separado por tabulações (TSV) são compatíveis com muitas ferramentas externas, incluindo:

  • R e Python

  • Excel e PowerPivot

  • Todos os bancos de dados relacionais

Por exemplo, se o experimento tiver um conjunto de um DataSet intermediário que você gostaria de salvar para reutilizar em outra ferramenta ou desejar chamar do código, converta-o no formato TSV e clique com o botão direito do mouse no conjunto de ferramentas convertido para obter o código Python necessário para acessar o conjunto de um.

Como usar Convert para TSV

Use o módulo converter para TSV sempre que precisar baixar um conjunto de um DataSet em formato delimitado por tabulação.

  1. Adicione converter em TSV ao seu experimento. você pode encontrar esse módulo na categoria de conversões de formato de dados no Machine Learning Studio (clássico).

  2. Conexão o módulo para outro conjunto, ou para um módulo que gera um conjunto de resultados de tabela.

  3. Execute o experimento ou clique com o botão direito do mouse apenas no módulo converter para TSV e selecione executar selecionado.

Resultados

Quando a conversão for concluída, você poderá abrir o conjunto de um, chamá-lo do código R ou Python, usá-lo em um notebook Jupyter ou salvá-lo em um arquivo local.

Se você quiser baixar o conjunto de resultados, clique duas vezes na saída do módulo e indique se deseja abrir ou salvar o conjunto.

  • Se você selecionar abrir, o conjunto de os é carregado usando qualquer ferramenta que seu computador usa por padrão para abrir. Arquivos TSV. Normalmente, isso é Microsoft Excel.

  • Se você selecionar baixar conjuntode trabalho, por padrão, o arquivo será salvo com o nome do módulo, além de um GUID que representa a ID do Workspace. No entanto, você pode selecionar a opção salvar como durante o download e alterar o nome ou o local do arquivo.

Exemplos

Embora não haja nenhum exemplo específico para esse formato, você pode ver exemplos de como a conversão de formato é usada explorando esses experimentos de exemplo no Galeria de ia do Azure:

Observações técnicas

Esta seção contém detalhes de implementação, dicas e respostas para perguntas frequentes.

Requisitos de formato TSV

Os valores separados por tabulações (TSV) é um formato de texto que é usado para armazenar dados em uma estrutura tabular. É semelhate ao formato CSV, mas o delimitador é uma tabulação em vez de uma vírgula.

O formato TSV é uma alternativa útil para o formato CSV, se seus dados contiverem vírgulas. Vírgulas são muito comuns nos dados de texto e são usados em formatos de número europeu.

Um problema com o formato delimitado por tabulação é que estas paradas de tabulação com frequência são consideradas como espaços em branco no texto não estruturado. No entanto, o padrão IANA para TSV promove análise limpa e precisa dos arquivos TSV ao desabilitar tabulações dentro dos campos.

observe os seguintes requisitos para arquivos TSV no Machine Learning Studio (clássico):

  • O módulo Converter para TSV suporta a saída de uma linha de cabeçalho único, se o conjunto de dados contém nomes de coluna.

  • O provedor TSV oferece suporte somente à codificação de caracteres UTF-8.

  • Ao ler de ou gravar para arquivos TSV, o desempenho pode ser mais lento do que com outros formatos (como CSV).

Entradas esperadas

Nome Tipo Descrição
Dataset Tabela de Dados Conjunto de dados de entrada

Saída

Nome Tipo Descrição
Conjunto de dados de resultados GenericTsv Conjunto de dados de saída

Confira também

Conversões de Formato de Dados
Lista de Módulo A-Z