Convertir a ARFF

Convierte la entrada de datos al formato de archivo de relación de atributos usado por el conjunto de herramientas Weka.

Categoría: conversiones de formato de datos

Nota

Se aplica a: machine learning Studio (clásico)

Este contenido solo pertenece a Studio (clásico). Se han agregado módulos similares de arrastrar y colocar al diseñador de Azure Machine Learning. Obtenga más información en este artículo comparativa de las dos versiones.

Información general sobre el módulo

En este artículo se describe cómo usar el módulo convertir en ARFF en Azure machine learning Studio (clásico) para convertir conjuntos de archivos y resultados en Azure machine learning al formato de archivo de relación de atributo que usa el conjunto de herramientas Weka. Este formato se conoce como ARFF.

La especificación de datos de ARFF para Weka admite varias tareas de aprendizaje automático, incluidos el preprocesamiento de datos, la clasificación y la selección de características. En este formato, los datos se organizan por entites y sus atributos, y se encuentran en un único archivo de texto. Puede encontrar detalles del formato de archivo Weka en la sección notas técnicas .

En general, la conversión al formato de archivo Weka solo se requiere si se desea usar Azure Machine Learning y WEKA, y se pretende mover los datos de entrenamiento entre ellos.

Para obtener más información sobre el conjunto de herramientas de WEKA, consulte este artículo de Wikipedia: Weka (machine learning)

Advertencia

No puede sobrescribir un archivo ARFF existente en Azure Storage.

Cómo usar Convert en ARFF

  1. Agregue el módulo convertir a ARFF en el experimento. Puede encontrar este módulo en la categoría conversiones de formato de datos en Azure machine learning Studio (clásico).

  2. Conéctelo a cualquier módulo que genere un conjunto de datos.

  3. Ejecute el experimento o haga clic en el módulo convertir en ARFF y haga clic en Ejecutar seleccionado.

Results

  • Para crear una copia de los datos en una carpeta local, haga doble clic en la salida de convertir en ARFFy seleccione la opción Descargar .

    Si no especifica una carpeta, se aplica un nombre de archivo predeterminado y el archivo se guarda en la biblioteca local downloads .

Nota

Este módulo no admite la exportación a código de Python o R.

Ejemplos

No hay ejemplos específicos de este formato en el Azure AI Gallery. Sin embargo, estos experimentos demuestran otros tipos de conversión de formato:

Notas técnicas

Esta sección contiene detalles de implementación, sugerencias y respuestas a las preguntas más frecuentes.

Ejemplo de formato ARFF

En esta sección se proporciona un ejemplo de cómo sería un conjunto de información típico cuando se convierte en ARFF.

Normalmente, un archivo de datos ARFF se compone de dos secciones: un encabezado que define el origen de datos y el esquema, y la sección de datos , que contiene las entidades reales y sus atributos.

Encabezado ARFF

El encabezado de un archivo ARFF define la lista de los atributos (en columnas) y sus tipos de datos. El encabezado también puede contener varias líneas de comentario que describen el origen de datos o cualquier otra nota.

% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}

Sugerencia

Si el conjunto de datos que está convirtiendo no tiene nombres de columna, use el módulo editar metadatos para agregar nombres de columna antes de usar la conversión a ARFF.

Datos de ARFF

La sección de datos consta de valores separados por comas y tiene un aspecto similar al de un archivo CSV sin encabezados de columna.

@DATA 5.1,3.5,1.4,0.2,0

Para obtener más información sobre este formato de archivo, consulte la página wiki de WEKA: ARFF (versión para desarrolladores).

Versión actual de ARFF

Azure Machine Learning Studio (clásico) guarda los archivos ARFF con el formato ARFF 3,0.

Entradas esperadas

Nombre Tipo Descripción
Dataset Tabla de datos Conjunto de datos de entrada

Salidas

Nombre Tipo Descripción
Conjunto de datos de resultados Arff Conjunto de datos de salida

Consulte también

Conversiones de formato de datos
Lista de módulos A-Z