Converter em ARFF

Converte a entrada de dados no formato de ficheiro de relação de atributos utilizado pelo conjunto de ferramentas Weka

Categoria: Conversões de formato de dados

Nota

Aplica-se a: Machine Learning Studio (clássico)

Este conteúdo diz respeito apenas ao Studio (clássico). Módulos semelhantes de arrasto e queda foram adicionados ao designer de Aprendizagem automática Azure. Saiba mais neste artigo comparando as duas versões.

Visão geral do módulo

Este artigo descreve como utilizar o módulo Converte para ARFF no Azure Machine Learning Studio (clássico), para converter conjuntos de dados e resultados em Azure Machine Learning para o formato de ficheiro de relação de atributos usado pelo conjunto de ferramentas Weka. Este formato é conhecido como ARFF.

A especificação de dados ARFF para Weka suporta múltiplas tarefas de aprendizagem automática, incluindo pré-processamento de dados, classificação e seleção de recursos. Neste formato, os dados são organizados por títulos e seus atributos, e estão contidos num único ficheiro de texto. Pode encontrar detalhes do formato de ficheiro Weka na secção Notas Técnicas.

Em geral, a conversão para o formato de ficheiro Weka só é necessária se quiser utilizar tanto a Azure Machine Learning como a Weka, e pretende mover os seus dados de treino para trás e para a frente entre eles.

Para obter mais informações sobre o instrumento Weka, consulte este artigo da Wikipédia: Weka (machine learning)

Aviso

Não é possível substituir um ficheiro ARFF existente no Azure Storage.

Como usar Converter em ARFF

  1. Adicione o módulo Convertendo-o em ARFF à sua experiência. Pode encontrar este módulo na categoria De Conversão de Formato de Dados no Azure Machine Learning Studio (clássico).

  2. Conecte-o a qualquer módulo que produza um conjunto de dados.

  3. Executar a experiência, ou clicar no módulo Converter para ARFF, e clique em Executar selecionado.

Resultados

  • Para criar uma cópia dos dados numa pasta local, clique duas vezes na saída de Converter para ARFFe selecione a opção Download.

    Se não especificar uma pasta, é aplicado um nome de ficheiro predefinido e o ficheiro é guardado na biblioteca local de Downloads.

Nota

Este módulo não suporta a exportação para o código Python ou R.

Exemplos

Não existem exemplos específicos deste formato na Galeria Azure AI. No entanto, estas experiências demonstram outros tipos de conversão de formato:

Notas técnicas

Esta secção contém detalhes de implementação, dicas e respostas a perguntas frequentes.

Exemplo do formato ARFF

Esta secção fornece um exemplo de como um conjunto de dados típico ficaria quando convertido em ARFF.

Normalmente, um ficheiro de dados ARFF é composto por duas secções: um cabeçalho que define a fonte de dados e o esquema, e a secção de dados, que contém as entidades reais e os seus atributos.

Cabeçalho ARFF

O cabeçalho de um ficheiro ARFF define a lista dos atributos (em colunas) e os seus tipos de dados. O cabeçalho também pode conter várias linhas de comentário que descrevem a fonte de dados ou quaisquer outras notas.

% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}

Dica

Se o conjunto de dados que está a converter não tiver nomes de colunas, utilize o módulo editar metadados para adicionar nomes de colunas antes de utilizar a conversão para ARFF.

Dados arff

A secção de dados consiste em valores separados por vírgulas, e parece muito com um ficheiro CSV sem títulos de coluna.

@DATA 5.1,3.5,1.4,0.2,0

Para obter informações adicionais sobre este formato de ficheiro, consulte a página Weka Wiki: ARFF (versão do programador).

Versão ARFF atual

O Azure Machine Learning Studio (clássico) guarda ficheiros ARFF utilizando o formato ARFF 3.0.

Entradas esperadas

Nome Tipo Descrição
Conjunto de dados Tabela de Dados Conjunto de dados de entrada

Saídas

Nome Tipo Descrição
Conjunto de dados de resultados Rio Arff Conjunto de dados de saída

Ver também

Conversões de formato de dados
Lista de Módulos A-Z