Convertir en TSV

Importante

El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.

A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.

La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.

Convierte la entrada de datos a un formato delimitado por tabuladores

Categoría: Conversiones de formato de datos

Nota:

Solo se aplica a: Machine Learning Studio (clásico)

Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.

Información general sobre el módulo

En este artículo se describe cómo usar el módulo Convertir en TSV en Machine Learning Studio (clásico) para convertir cualquier conjunto de datos del formato interno que usan todos los módulos de Machine Learning Studio (clásico) en un archivo plano en formato separado por tabulaciones.

Los archivos de valores separados por tabulaciones (TSV) son compatibles con muchas herramientas externas, como las siguientes:

  • R y Python

  • Excel y PowerPivot

  • Todas las bases de datos relacionales

Por ejemplo, si el experimento tiene un conjunto de datos intermedio que le gustaría guardar para volver a usarlo en otra herramienta o desea llamar a desde código, conviéndolo al formato TSV y, a continuación, haga clic con el botón derecho en el conjunto de datos convertido para obtener el código de Python necesario para acceder al conjunto de datos.

Cómo usar Convertir en TSV

Use el módulo Convertir en TSV siempre que necesite descargar un conjunto de datos en formato delimitado por tabulaciones.

  1. Agregue convert to TSV (Convertir en TSV ) al experimento. Puede encontrar este módulo en la categoría Conversiones de formato de datos en Machine Learning Studio (clásico).

  2. Conectar el módulo a otro conjunto de datos o a un módulo que genera un conjunto de datos tabular.

  3. Ejecute el experimento o haga clic con el botón derecho en el módulo Convertir en TSV y seleccione Ejecutar seleccionado.

Results

Una vez completada la conversión, puede abrir el conjunto de datos, llamarlo desde código de R o Python, usarlo en un cuaderno de Jupyter Notebook o guardarlo en un archivo local.

Si desea descargar el conjunto de datos, haga doble clic en la salida del módulo e indique si desea abrir o guardar el conjunto de datos.

  • Si selecciona Abrir, el conjunto de datos se carga con cualquier herramienta que use el equipo de forma predeterminada para abrir . Archivos TSV. Normalmente esto es Microsoft Excel.

  • Si selecciona Descargar conjunto de datos, de forma predeterminada, el archivo se guarda con el nombre del módulo más un GUID que representa el identificador del área de trabajo. Sin embargo, puede seleccionar la opción Guardar como durante la descarga y cambiar el nombre o la ubicación del archivo.

Ejemplos

Aunque no hay ejemplos específicos de este formato, puede ver ejemplos de cómo se usa la conversión de formato explorando estos experimentos de ejemplo en el Azure AI Gallery:

  • Ejemplo de validación cruzada para clasificación binaria: exporta los resultados de la validación cruzada al formato de valores separados por comas (CSV) para que los resultados de varios modelos se puedan comparar mediante una herramienta como Excel.

  • Cuantificación de compresión de imágenes basada en colores: exporta los conjuntos de datos que se usan para cada parte del análisis a archivos CSV, de modo que pueda ejecutar fácilmente un modelo similar en cualquier herramienta que admita el formato CSV.

Notas técnicas

Esta sección contiene detalles de implementación, sugerencias y respuestas a las preguntas más frecuentes.

Requisitos de formato de TSV

Los valores separados por tabulaciones (TSV) es un formato de texto que se utiliza para almacenar datos en una estructura tabular. Es muy parecido al formato CSV, pero el delimitador es una tabulación en lugar de una coma.

El formato TSV es una alternativa útil al formato CSV, si los datos contienen comas. Las comas son muy comunes en los datos de texto y se usan en los formatos de número europeos.

Un problema del formato delimitado por tabulaciones es que las tabulaciones con frecuencia se consideran espacios en blanco en un texto no estructurado. Sin embargo, el estándar IANA para TSV fomenta el análisis limpio y preciso de archivos TSV al no permitir tabulaciones en los campos.

Tenga en cuenta los siguientes requisitos para los archivos TSV en Machine Learning Studio (clásico):

  • El módulo Convertir en TSV module admite la salida de una fila de un solo encabezado si el conjunto de datos contiene nombres de columna.

  • El proveedor de TSV solamente admite codificación de caracteres UTF-8.

  • Cuando se realizan operaciones de lectura y escritura en archivos TSV, el rendimiento puede ser más lento que con otros formatos (como CSV).

Entradas esperadas

Nombre Tipo Descripción
Dataset Tabla de datos Conjunto de datos de entrada

Output

Nombre Tipo Descripción
Conjunto de datos de resultados GenericTsv Conjunto de datos de salida

Consulte también

Conversiones de formato de datos
Lista de módulos A-Z