Convertir en TSV
Convierte la entrada de datos a un formato delimitado por tabuladores
Categoría: conversiones de formato de datos
Nota
Se aplica a: machine learning Studio (clásico)
Este contenido solo pertenece a Studio (clásico). Se han agregado módulos similares de arrastrar y colocar al diseñador de Azure Machine Learning. Obtenga más información en este artículo comparativa de las dos versiones.
Información general sobre el módulo
En este artículo se describe cómo usar el módulo convertir en TSV en Azure machine learning Studio (clásico), para convertir cualquier conjunto de archivos del formato interno que usan todos los módulos de Azure machine learning Studio (clásico) en un archivo plano en formato separado por tabulaciones.
Los archivos de valores separados por tabulaciones (TSV) son compatibles con muchas herramientas externas, como las siguientes:
R y Python
Excel y PowerPivot
Todas las bases de datos relacionales
Por ejemplo, si el experimento tiene un conjunto de información intermedio que desea guardar para reutilizarlo en otra herramienta o que desea llamar desde código, conviértalo al formato TSV y, a continuación, haga clic con el botón derecho en el conjunto de los conjuntos de cambios para obtener el código de Python necesario para obtener acceso al conjunto de información.
Cómo usar Convert en TSV
Use el módulo convertir en TSV siempre que necesite descargar un conjunto de los conjuntos de tipos en formato delimitado por tabuladores.
Agregue la conversión a TSV al experimento. Puede encontrar este módulo en la categoría conversiones de formato de datos en Azure machine learning Studio (clásico).
Conecte el módulo a otro conjuntos o a un módulo que genere un conjunto de resultados tabular.
Ejecute el experimento o haga clic con el botón derecho en el módulo convertir en TSV y seleccione Ejecutar seleccionado.
Results
Una vez finalizada la conversión, puede abrir el conjunto de archivos, llamarlo desde el código de R o Python, usarlo en un cuaderno de Jupyter Notebook o guardarlo en un archivo local.
Si desea descargar el conjunto de información, haga doble clic en la salida del módulo e indique si desea abrir o guardar conjuntos.
Si selecciona abrir, el conjunto de DataSet se carga con cualquier herramienta que use el equipo de forma predeterminada para abrirlo. Archivos TSV. Normalmente es Microsoft Excel.
Si selecciona Descargar conjunto de archivos, de forma predeterminada, el archivo se guarda con el nombre del módulo más un GUID que representa el identificador del área de trabajo. Sin embargo, puede seleccionar la opción Guardar como durante la descarga y cambiar el nombre o la ubicación del archivo.
Ejemplos
Aunque no hay ejemplos específicos de este formato, puede ver ejemplos de cómo se usa la conversión de formato explorando estos experimentos de ejemplo en la Azure AI Gallery:
Ejemplo de validación cruzada para clasificación binaria: exporta los resultados de la validación cruzada al formato de valores separados por comas (CSV) para que se puedan comparar los resultados para varios modelos mediante una herramienta como Excel.
Cuantificación de compresión de imágenes basada en color: exporta los conjuntos de valores que se usan para cada parte del análisis a archivos CSV, de modo que pueda ejecutar fácilmente un modelo similar en cualquier herramienta que admita el formato CSV.
Notas técnicas
Esta sección contiene detalles de implementación, sugerencias y respuestas a las preguntas más frecuentes.
Requisitos de formato TSV
Los valores separados por tabulaciones (TSV) es un formato de texto que se utiliza para almacenar datos en una estructura tabular. Es muy parecido al formato CSV, pero el delimitador es una tabulación en lugar de una coma.
El formato TSV es una alternativa útil al formato CSV, si los datos contienen comas. Las comas son muy comunes en los datos de texto y se usan en los formatos de número europeos.
Un problema del formato delimitado por tabulaciones es que las tabulaciones con frecuencia se consideran espacios en blanco en un texto no estructurado. Sin embargo, el estándar IANA para TSV fomenta el análisis limpio y preciso de archivos TSV al no permitir tabulaciones en los campos.
Tenga en cuenta los siguientes requisitos para los archivos TSV en Azure Machine Learning Studio (clásico):
El módulo Convertir en TSV module admite la salida de una fila de un solo encabezado si el conjunto de datos contiene nombres de columna.
El proveedor de TSV solamente admite codificación de caracteres UTF-8.
Cuando se realizan operaciones de lectura y escritura en archivos TSV, el rendimiento puede ser más lento que con otros formatos (como CSV).
Entradas esperadas
Nombre | Tipo | Descripción |
---|---|---|
Dataset | Tabla de datos | Conjunto de datos de entrada |
Output
Nombre | Tipo | Descripción |
---|---|---|
Conjunto de datos de resultados | GenericTsv | Conjunto de datos de salida |