Converter em TSV

Importante

O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.

A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).

A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.

Converte a entrada de dados num formato delimitado por separadores

Categoria: Conversões de formato de dados

Nota

Aplica-se a: Machine Learning Studio (clássico) apenas

Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.

Visão geral do módulo

Este artigo descreve como utilizar o módulo Converte para TSV em Machine Learning Studio (clássico), para converter qualquer conjunto de dados do formato interno que é usado por todos os módulos Machine Learning Studio (clássico) para um ficheiro plano em formato separado de separado por separados.

Os ficheiros de valor separados por separados por separados (TSV) são compatíveis com muitas ferramentas externas, incluindo:

  • R e Python

  • Excel e PowerPivot

  • Todas as bases de dados relacionais

Por exemplo, se a sua experiência tiver um conjunto de dados intermédio que gostaria de guardar para reutilização noutra ferramenta ou quiser ligar a partir de código, converta-o no formato TSV e, em seguida, clique com o conjunto de dados convertido para obter o código Python necessário para aceder ao conjunto de dados.

Como utilizar Converter em TSV

Utilize o módulo Converte para TSV sempre que precisar de descarregar um conjunto de dados em formato delimitado por separadores.

  1. Adicione o Convert em TSV à sua experiência. Pode encontrar este módulo na categoria De Conversão de Formato de Dados no Machine Learning Studio (clássico).

  2. Ligação o módulo a outro datset, ou a um módulo que produz um conjunto de dados tabular.

  3. Executar a experiência, ou clique com o botão direito apenas o módulo Converter para TSV , e selecione Executar selecionado.

Resultados

Quando a conversão estiver concluída, pode abrir o conjunto de dados, chamá-lo a partir do código R ou Python, usá-lo num caderno Jupyter ou guardá-lo para um ficheiro local.

Se pretender descarregar o conjunto de dados, clique duas vezes na saída do módulo e indique se pretende abrir ou guardar o datset.

  • Se selecionar Open, o conjunto de dados é carregado utilizando qualquer ferramenta que o computador utilize por defeito para abrir . Ficheiros TSV. Normalmente isto é Microsoft Excel.

  • Se selecionar Baixar conjunto de dados, por predefinição, o ficheiro é guardado com o nome do módulo mais um GUIADO que representa o ID do espaço de trabalho. No entanto, pode selecionar a opção Guardar como durante o download e alterar o nome ou localização do ficheiro.

Exemplos

Embora não existam exemplos específicos deste formato, pode ver exemplos de como a conversão de formatos é usada explorando estas experiências de amostra na Galeria Azure AI:

Notas técnicas

Esta secção contém detalhes de implementação, dicas e respostas a perguntas frequentes.

Requisitos de formato TSV

Valores separados por separados por separados por separados (TSV) é um formato de texto que é usado para armazenar dados numa estrutura tabular. É muito semelhante ao formato CSV, mas olimiter é um separador em vez de uma vírgula.

O formato TSV é uma alternativa útil ao formato CSV se os seus dados contiverem vírgulas. As vírgulas são muito comuns nos dados de texto e são utilizadas em formatos de número europeu.

Um problema com o formato delimitado é que as paragens do separador são frequentemente consideradas como espaço branco em texto não estruturado. No entanto, a norma IANA para a TSV promove uma análise limpa e precisa dos ficheiros de TSV, desafetando separadores dentro dos campos.

Note os seguintes requisitos para ficheiros TSV em Machine Learning Studio (clássico):

  • O módulo Converte para TSV suporta a saída de uma única linha de posição, se o conjunto de dados contiver nomes de colunas.

  • O fornecedor TSV suporta apenas a codificação de caracteres UTF-8.

  • Ao ler ou escrever para ficheiros de TSV, o desempenho pode ser mais lento do que com outros formatos (como o CSV).

Entradas esperadas

Nome Tipo Description
Conjunto de dados Tabela de Dados Conjunto de dados de entrada

Saída

Nome Tipo Description
Conjunto de dados de resultados Genéricos Conjunto de dados de saída

Ver também

Conversões de formato de dados
Lista de Módulos A-Z