Converter em ARFF

Importante

O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.

A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).

A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.

Converte a entrada de dados no formato de ficheiro de relação de atributos utilizado pelo conjunto de ferramentas Weka

Categoria: Conversões de formato de dados

Nota

Aplica-se a: Machine Learning Studio (clássico) apenas

Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.

Visão geral do módulo

Este artigo descreve como utilizar o módulo Converte para ARFF em Machine Learning Studio (clássico), para converter conjuntos de dados e resultar no formato de ficheiro de relação de atributos utilizado pelo conjunto de ferramentas Weka. Este formato é conhecido como ARFF.

A especificação de dados ARFF para Weka suporta múltiplas tarefas de aprendizagem automática, incluindo pré-processamento de dados, classificação e seleção de recursos. Neste formato, os dados são organizados por títulos e seus atributos, e estão contidos num único ficheiro de texto. Pode encontrar detalhes do formato de ficheiro Weka na secção Notas Técnicas .

Em geral, a conversão para o formato de ficheiro Weka só é necessária se quiser utilizar tanto Machine Learning como weka, e pretende mover os seus dados de treino para trás e para a frente entre eles.

Para obter mais informações sobre o instrumento Weka, consulte este artigo da Wikipédia: Weka (machine learning)

Aviso

Não é possível substituir um ficheiro ARFF existente no Armazenamento Azure.

Como utilizar Converter em ARFF

  1. Adicione o módulo Convertendo-o em ARFF à sua experiência. Pode encontrar este módulo na categoria De Conversão de Formato de Dados no Machine Learning Studio (clássico).

  2. Ligação-o a qualquer módulo que produza um conjunto de dados.

  3. Executar a experiência, ou clicar no módulo Converter para ARFF , e clique em Executar selecionado.

Resultados

  • Para criar uma cópia dos dados numa pasta local, clique duas vezes na saída de Converter para ARFF e selecione a opção Descarregar .

    Se não especificar uma pasta, é aplicado um nome de ficheiro predefinido e o ficheiro é guardado na biblioteca local de Downloads .

Nota

Este módulo não suporta a exportação para o código Python ou R.

Exemplos

Não existem exemplos específicos deste formato na Galeria Azure AI. No entanto, estas experiências demonstram outros tipos de conversão de formato:

Notas técnicas

Esta secção contém detalhes de implementação, dicas e respostas a perguntas frequentes.

Exemplo do formato ARFF

Esta secção fornece um exemplo de como um conjunto de dados típico ficaria quando convertido em ARFF.

Normalmente, um ficheiro de dados ARFF é composto por duas secções: um cabeçalho que define a fonte de dados e o esquema, e a secção de dados , que contém as entidades reais e os seus atributos.

Cabeçalho ARFF

O cabeçalho de um ficheiro ARFF define a lista dos atributos (em colunas) e os seus tipos de dados. O cabeçalho também pode conter várias linhas de comentário que descrevem a fonte de dados ou quaisquer outras notas.

% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}

Dica

Se o conjunto de dados que está a converter não tiver nomes de colunas, utilize o módulo editar metadados para adicionar nomes de colunas antes de utilizar a conversão para ARFF.

Dados arff

A secção de dados consiste em valores separados por vírgulas, e parece muito com um ficheiro CSV sem títulos de coluna.

@DATA 5.1,3.5,1.4,0.2,0

Para obter informações adicionais sobre este formato de ficheiro, consulte a página Weka Wiki: ARFF (versão do programador).

Versão ATUAL ARFF

Machine Learning Studio (clássico) salva ficheiros ARFF utilizando o formato ARFF 3.0.

Entradas esperadas

Nome Tipo Description
Conjunto de dados Tabela de Dados Conjunto de dados de entrada

Saídas

Nome Tipo Description
Conjunto de dados de resultados Rio Arff Conjunto de dados de saída

Ver também

Conversões de formato de dados
Lista de Módulos A-Z