Konvertera till ARFF

Viktigt

Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.

Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.

Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.

Konverterar indata till attributrelationsfilformatet som används av Weka-verktygsuppsättningen

Kategori: Dataformatkonverteringar

Anteckning

Gäller endast för: Machine Learning Studio (klassisk)

Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.

Modulöversikt

I den här artikeln beskrivs hur du använder modulen Convert to ARFF (Konvertera till ARFF) i Machine Learning Studio (klassisk) för att konvertera datauppsättningar och skapa ett attributrelationsfilformat som används av Weka-verktygsuppsättningen. Det här formatet kallas ARFF.

ARFF-dataspecifikationen för Weka stöder flera maskininlärningsuppgifter, inklusive förbearbetning av data, klassificering och val av funktioner. I det här formatet ordnas data efter entiter och deras attribut och finns i en enda textfil. Du hittar information om Weka-filformatet i avsnittet Tekniska anteckningar.

I allmänhet krävs konvertering till Weka-filformatet endast om du vill använda både Machine Learning och Weka och planerar att flytta dina träningsdata fram och tillbaka mellan dem.

Mer information om Weka-verktygsuppsättningen finns i den här Wikipedia-artikeln: Weka (maskininlärning)

Varning

Du kan inte skriva över en befintlig ARFF-fil i Azure Storage.

Så här använder du Konvertera till ARFF

  1. Lägg till modulen Konvertera till ARFF i experimentet. Du hittar den här modulen i kategorin Dataformatkonverteringar i Machine Learning Studio (klassisk).

  2. Anslut den till valfri modul som matar ut en datauppsättning.

  3. Kör experimentet eller klicka på modulen Konvertera till ARFF och klicka på Kör valt.

Resultat

  • Om du vill skapa en kopia av data i en lokal mapp dubbelklickar du på utdata från Konvertera till ARFF och väljer alternativet Ladda ned.

    Om du inte anger någon mapp används ett standardfilnamn och filen sparas i det lokala biblioteket Hämtade filer.

Anteckning

Den här modulen stöder inte export till Python eller R-kod.

Exempel

Det finns inga exempel som är specifika för det här formatet i Azure AI Gallery. Dessa experiment visar dock andra typer av formatkonvertering:

  • Färgbaserad bildkomprimering: Exporterar de datauppsättningar som används för varje del av analysen till filer för reproducerbarhet och användning på andra analysplattformar.

  • Exempel på korsvalidering för binär klassificering: Exporterar resultaten av korsvalidering till filer så att resultaten för flera modeller kan jämföras med hjälp av ett verktyg som Excel.

Teknisk information

Det här avsnittet innehåller implementeringsinformation, tips och svar på vanliga frågor.

Exempel på ARFF-format

Det här avsnittet innehåller ett exempel på hur en typisk datauppsättning skulle se ut när den konverteras till ARFF.

Normalt består en ARFF-datafil av två avsnitt: en rubrik som definierar datakällan och schemat och dataavsnittet, som innehåller de faktiska entiteterna och deras attribut.

ARFF-rubrik

Rubriken för en ARFF-fil definierar listan över attributen (i kolumner) och deras datatyper. Rubriken kan också innehålla flera kommentarsrader som beskriver datakällan eller andra anteckningar.

% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}

Tips

Om datauppsättningen som du konverterar inte har kolumnnamn använder du modulen Redigera metadata för att lägga till kolumnnamn innan du konverterar till ARFF.

ARFF-data

Dataavsnittet består av kommaavgränsade värden och ser ut ungefär som en CSV-fil utan kolumnrubriker.

@DATA 5.1,3.5,1.4,0.2,0

Mer information om det här filformatet finns på Weka Wiki-sidan: ARFF (utvecklarversion).

Aktuell ARFF-version

Machine Learning Studio (klassisk) sparar ARFF-filer med formatet ARFF 3.0.

Förväntade indata

Namn Typ Description
Datamängd Datatabell Indatauppsättning

Utdata

Namn Typ Description
Resultatdatauppsättning Arff Utdatauppsättning

Se även

Dataformatkonverteringar
A-Z-modullista