Converter em ARFF

Importante

O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.

A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).

A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.

Converte a entrada de dados para o formato de arquivo de relação de atributo usado pelo conjunto de ferramentas Weka

Categoria: conversões de formato de dados

Observação

aplica-se a: somente Machine Learning Studio (clássico)

Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.

Visão geral do módulo

este artigo descreve como usar o módulo converter para ARFF no Machine Learning Studio (clássico), para converter conjuntos de e resultados do formato de arquivo de relação de atributo usado pelo conjunto de ferramentas Weka. Esse formato é conhecido como ARFF.

A especificação de dados ARFF para weka dá suporte a várias tarefas de aprendizado de máquina, incluindo pré-processamento de dados, classificação e seleção de recursos. Nesse formato, os dados são organizados por entidades e seus atributos, e estão contidos em um único arquivo de texto. Você pode encontrar detalhes do formato de arquivo weka na seção observações técnicas .

em geral, a conversão para o formato de arquivo Weka é necessária apenas se você quiser usar Machine Learning e Weka e pretende mover seus dados de treinamento entre eles.

Para obter mais informações sobre o conjunto de ferramentas weka, consulte este artigo da Wikipédia: weka (Machine Learning)

Aviso

Não é possível substituir um arquivo ARFF existente no armazenamento do Azure.

Como usar Convert para ARFF

  1. Adicione o módulo converter em ARFF ao seu experimento. você pode encontrar esse módulo na categoria de conversões de formato de dados no Machine Learning Studio (clássico).

  2. Conecte-o a qualquer módulo que produza um conjunto de dados.

  3. Execute o experimento ou clique no módulo converter para ARFF e clique em executar selecionado.

Resultados

  • Para criar uma cópia dos dados em uma pasta local, clique duas vezes na saída de converter em ARFFe selecione a opção baixar .

    Se você não especificar uma pasta, um nome de arquivo padrão será aplicado e o arquivo será salvo na biblioteca de downloads local.

Observação

Este módulo não dá suporte à exportação para o código Python ou R.

Exemplos

Não há exemplos específicos para esse formato no Galeria de ia do Azure. No entanto, esses experimentos demonstram outros tipos de conversão de formato:

Observações técnicas

Esta seção contém detalhes de implementação, dicas e respostas para perguntas frequentes.

Exemplo de formato ARFF

Esta seção fornece um exemplo de como um conjunto de um DataSet típico seria exibido quando convertido em ARFF.

Normalmente, um arquivo de dados ARFF é composto de duas seções: um cabeçalho que define a fonte de dados e o esquema e a seção de dados , que contém as entidades reais e seus atributos.

Cabeçalho ARFF

O cabeçalho de um arquivo ARFF define a lista de atributos (em colunas) e seus tipos de dados. O cabeçalho também pode conter várias linhas de comentário que descrevem a origem de dados ou quaisquer outras notas.

% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}

Dica

Se o conjunto de módulos que você está convertendo não tiver nomes de coluna, use o módulo Editar metadados para adicionar nomes de coluna antes de usar a conversão em ARFF.

Dados do ARFF

A seção de dados consiste em valores separados por vírgulas e parece muito parecido com um arquivo CSV sem títulos de coluna.

@DATA 5.1,3.5,1.4,0.2,0

Para obter informações adicionais sobre esse formato de arquivo, consulte a página wiki do weka: ARFF (versão do desenvolvedor).

Versão atual do ARFF

Machine Learning Studio (clássico) salva os arquivos ARFF usando o formato ARFF 3,0.

Entradas esperadas

Nome Tipo Descrição
Dataset Tabela de Dados Conjunto de dados de entrada

Saídas

Nome Tipo Descrição
Conjunto de dados de resultados Arff Conjunto de dados de saída

Confira também

Conversões de Formato de Dados
Lista de Módulo A-Z