Converter em TSV

Converte a entrada de dados num formato delimitado por separadores

Categoria: Conversões de formato de dados

Nota

Aplica-se a: Machine Learning Studio (clássico)

Este conteúdo diz respeito apenas ao Studio (clássico). Módulos semelhantes de arrasto e queda foram adicionados ao designer de Aprendizagem automática Azure. Saiba mais neste artigo comparando as duas versões.

Visão geral do módulo

Este artigo descreve como utilizar o módulo Converte para TSV no Azure Machine Learning Studio (clássico), para converter qualquer conjunto de dados do formato interno que é usado por todos os módulos Azure Machine Learning Studio (clássicos) para um ficheiro plano em formato separado por separados por separados.

Os ficheiros de valor separados por separados por separados (TSV) são compatíveis com muitas ferramentas externas, incluindo:

  • R e Python

  • Excel e PowerPivot

  • Todas as bases de dados relacionais

Por exemplo, se a sua experiência tiver um conjunto de dados intermédio que gostaria de guardar para reutilização noutra ferramenta ou quiser ligar a partir de código, converta-o no formato TSV e, em seguida, clique com o conjunto de dados convertido para obter o código Python necessário para aceder ao conjunto de dados.

Como usar Converter em TSV

Utilize o módulo Converte para TSV sempre que precisar de descarregar um conjunto de dados em formato delimitado por separadores.

  1. Adicione o Convert em TSV à sua experiência. Pode encontrar este módulo na categoria De Conversão de Formato de Dados no Azure Machine Learning Studio (clássico).

  2. Ligue o módulo a outro datset, ou a um módulo que produz um conjunto de dados tabular.

  3. Executar a experiência, ou clique com o botão direito apenas o módulo Converte para TSV, e selecione Executar selecionado.

Resultados

Quando a conversão estiver concluída, pode abrir o conjunto de dados, chamá-lo a partir do código R ou Python, usá-lo num bloco de notas Jupyter ou guardá-lo para um ficheiro local.

Se pretender descarregar o conjunto de dados, clique duas vezes na saída do módulo e indique se pretende abrir ou guardar o datset.

  • Se selecionar Open, o conjunto de dados é carregado utilizando qualquer ferramenta que o computador utilize por defeito para abrir . Ficheiros TSV. Normalmente, este é o Microsoft Excel.

  • Se selecionar O conjunto de dados de descarregamento, por predefinição, o ficheiro é guardado com o nome do módulo mais um GUIADO que representa o ID do espaço de trabalho. No entanto, pode selecionar a opção Guardar como durante o download e alterar o nome ou localização do ficheiro.

Exemplos

Embora não existam exemplos específicos deste formato, pode ver exemplos de como a conversão de formatos é usada explorando estas experiências de amostra na Galeria Azure AI:

Notas técnicas

Esta secção contém detalhes de implementação, dicas e respostas a perguntas frequentes.

Requisitos de formato TSV

Valores separados por separados por separados por separados por separados (TSV) é um formato de texto que é utilizado para armazenar dados numa estrutura tabular. É muito semelhante ao formato CSV, mas o delimiter é um separador em vez de uma vírgula.

O formato TSV é uma alternativa útil ao formato CSV se os seus dados contiverem vírgulas. As vírgulas são muito comuns nos dados de texto e são utilizadas em formatos de número europeu.

Um problema com o formato delimitado é que as paragens do separador são frequentemente consideradas como espaço branco em texto não estruturado. No entanto, a norma IANA para a TSV promove uma análise limpa e precisa dos ficheiros de TSV, desafetando separadores dentro dos campos.

Note os seguintes requisitos para ficheiros TSV no Azure Machine Learning Studio (clássico):

  • O módulo Converte para TSV suporta a saída de uma única linha de posição, se o conjunto de dados contiver nomes de colunas.

  • O fornecedor TSV suporta apenas a codificação de caracteres UTF-8.

  • Ao ler ou escrever para ficheiros de TSV, o desempenho pode ser mais lento do que com outros formatos (como o CSV).

Entradas esperadas

Nome Tipo Descrição
Conjunto de dados Tabela de Dados Conjunto de dados de entrada

Saída

Nome Tipo Descrição
Conjunto de dados de resultados Genéricos Conjunto de dados de saída

Ver também

Conversões de formato de dados
Lista de Módulos A-Z