Convertir en TSV

Convierte la entrada de datos a un formato delimitado por tabuladores

Categoría: conversiones de formato de datos

Nota

Se aplica a: machine learning Studio (clásico)

Este contenido solo pertenece a Studio (clásico). Se han agregado módulos similares de arrastrar y colocar al diseñador de Azure Machine Learning. Obtenga más información en este artículo comparativa de las dos versiones.

Información general sobre el módulo

En este artículo se describe cómo usar el módulo convertir en TSV en Azure machine learning Studio (clásico), para convertir cualquier conjunto de archivos del formato interno que usan todos los módulos de Azure machine learning Studio (clásico) en un archivo plano en formato separado por tabulaciones.

Los archivos de valores separados por tabulaciones (TSV) son compatibles con muchas herramientas externas, como las siguientes:

  • R y Python

  • Excel y PowerPivot

  • Todas las bases de datos relacionales

Por ejemplo, si el experimento tiene un conjunto de información intermedio que desea guardar para reutilizarlo en otra herramienta o que desea llamar desde código, conviértalo al formato TSV y, a continuación, haga clic con el botón derecho en el conjunto de los conjuntos de cambios para obtener el código de Python necesario para obtener acceso al conjunto de información.

Cómo usar Convert en TSV

Use el módulo convertir en TSV siempre que necesite descargar un conjunto de los conjuntos de tipos en formato delimitado por tabuladores.

  1. Agregue la conversión a TSV al experimento. Puede encontrar este módulo en la categoría conversiones de formato de datos en Azure machine learning Studio (clásico).

  2. Conecte el módulo a otro conjuntos o a un módulo que genere un conjunto de resultados tabular.

  3. Ejecute el experimento o haga clic con el botón derecho en el módulo convertir en TSV y seleccione Ejecutar seleccionado.

Results

Una vez finalizada la conversión, puede abrir el conjunto de archivos, llamarlo desde el código de R o Python, usarlo en un cuaderno de Jupyter Notebook o guardarlo en un archivo local.

Si desea descargar el conjunto de información, haga doble clic en la salida del módulo e indique si desea abrir o guardar conjuntos.

  • Si selecciona abrir, el conjunto de DataSet se carga con cualquier herramienta que use el equipo de forma predeterminada para abrirlo. Archivos TSV. Normalmente es Microsoft Excel.

  • Si selecciona Descargar conjunto de archivos, de forma predeterminada, el archivo se guarda con el nombre del módulo más un GUID que representa el identificador del área de trabajo. Sin embargo, puede seleccionar la opción Guardar como durante la descarga y cambiar el nombre o la ubicación del archivo.

Ejemplos

Aunque no hay ejemplos específicos de este formato, puede ver ejemplos de cómo se usa la conversión de formato explorando estos experimentos de ejemplo en la Azure AI Gallery:

Notas técnicas

Esta sección contiene detalles de implementación, sugerencias y respuestas a las preguntas más frecuentes.

Requisitos de formato TSV

Los valores separados por tabulaciones (TSV) es un formato de texto que se utiliza para almacenar datos en una estructura tabular. Es muy parecido al formato CSV, pero el delimitador es una tabulación en lugar de una coma.

El formato TSV es una alternativa útil al formato CSV, si los datos contienen comas. Las comas son muy comunes en los datos de texto y se usan en los formatos de número europeos.

Un problema del formato delimitado por tabulaciones es que las tabulaciones con frecuencia se consideran espacios en blanco en un texto no estructurado. Sin embargo, el estándar IANA para TSV fomenta el análisis limpio y preciso de archivos TSV al no permitir tabulaciones en los campos.

Tenga en cuenta los siguientes requisitos para los archivos TSV en Azure Machine Learning Studio (clásico):

  • El módulo Convertir en TSV module admite la salida de una fila de un solo encabezado si el conjunto de datos contiene nombres de columna.

  • El proveedor de TSV solamente admite codificación de caracteres UTF-8.

  • Cuando se realizan operaciones de lectura y escritura en archivos TSV, el rendimiento puede ser más lento que con otros formatos (como CSV).

Entradas esperadas

Nombre Tipo Descripción
Dataset Tabla de datos Conjunto de datos de entrada

Output

Nombre Tipo Descripción
Conjunto de datos de resultados GenericTsv Conjunto de datos de salida

Consulte también

Conversiones de formato de datos
Lista de módulos A-Z