Converteren naar ARFF

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

Converteert gegevensinvoer naar de bestandsindeling van de kenmerkrelatie die wordt gebruikt door de Weka-toolset

Categorie: Conversies van gegevensindelingen

Notitie

Van toepassing op: Machine Learning Studio (klassiek)

Vergelijkbare modules met slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.

Moduleoverzicht

In dit artikel wordt beschreven hoe u de module Converteren naar ARFF in Machine Learning Studio (klassiek) gebruikt om gegevenssets en resultaten te converteren naar de bestandsindeling attribute-relation die wordt gebruikt door de Weka-toolset. Deze indeling wordt ARFF genoemd.

De ARFF-gegevensspecificatie voor Weka ondersteunt meerdere machine learning taken, waaronder voorverwerking van gegevens, classificatie en functieselectie. In deze indeling worden gegevens geordend op entiteiten en hun kenmerken en zijn ze opgenomen in één tekstbestand. U vindt de details van de Weka-bestandsindeling in de sectie Technische notities.

Over het algemeen is conversie naar de Weka-bestandsindeling alleen vereist als u zowel Machine Learning als Weka wilt gebruiken en uw trainingsgegevens tussen deze twee wilt verplaatsen.

Zie voor meer informatie over de Weka-toolset dit Wikipedia-artikel: Weka (machine learning)

Waarschuwing

U kunt een bestaand ARFF-bestand niet overschrijven in Azure Storage.

Converteren naar ARFF gebruiken

  1. Voeg de module Converteren naar ARFF toe aan uw experiment. U vindt deze module in de categorie Conversies van gegevensindelingen in Machine Learning Studio (klassiek).

  2. Verbinding maken aan elke module die een gegevensset als uitvoer geeft.

  3. Voer het experiment uit of klik op de module Converteren naar ARFF en klik op Uitvoeren geselecteerd.

Resultaten

  • Als u een kopie van de gegevens in een lokale map wilt maken, dubbelklikt u op de uitvoer van Converteren naar ARFF en selecteert u de optie Downloaden.

    Als u geen map opgeeft, wordt er een standaardbestandsnaam toegepast en wordt het bestand opgeslagen in de lokale downloadbibliotheek .

Notitie

Deze module biedt geen ondersteuning voor het exporteren naar Python- of R-code.

Voorbeelden

Er zijn geen voorbeelden die specifiek zijn voor deze indeling in de Azure AI Gallery. Deze experimenten demonstreren echter andere typen indelingsconversie:

  • Afbeeldingscompressie op basis van kleuren: exporteert de gegevenssets die worden gebruikt voor elk deel van de analyse naar bestanden voor reproduceerbaarheid en gebruik op andere analyseplatforms.

  • Voorbeeld van kruisvalidatie voor binaire classificatie: exporteert de resultaten van kruisvalidatie naar bestanden, zodat de resultaten voor meerdere modellen kunnen worden vergeleken met behulp van een hulpprogramma zoals Excel.

Technische opmerkingen

Deze sectie bevat implementatiedetails, tips en antwoorden op veelgestelde vragen.

Voorbeeld van ARFF-indeling

Deze sectie bevat een voorbeeld van hoe een typische gegevensset eruit zou zien wanneer deze wordt geconverteerd naar ARFF.

Normaal gesproken bestaat een ARFF-gegevensbestand uit twee secties: een header die de gegevensbron en het schema definieert, en de gegevenssectie, die de werkelijke entiteiten en hun kenmerken bevat.

ARFF-header

De header voor een ARFF-bestand definieert de lijst met de kenmerken (in kolommen) en de gegevenstypen. De header kan ook meerdere opmerkingsregels bevatten die de gegevensbron of andere opmerkingen beschrijven.

% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}

Tip

Als de gegevensset die u converteert geen kolomnamen heeft, gebruikt u de module Edit Metadata om kolomnamen toe te voegen voordat u converteert naar ARFF.

ARFF-gegevens

De gegevenssectie bestaat uit door komma's gescheiden waarden en lijkt erg veel op een CSV-bestand zonder kolomkoppen.

@DATA 5.1,3.5,1.4,0.2,0

Zie de Wiki-pagina van Weka: ARFF (ontwikkelaarsversie) voor meer informatie over deze bestandsindeling.

Huidige ARFF-versie

Machine Learning Studio (klassiek) slaat ARFF-bestanden op met behulp van de ARFF 3.0-indeling.

Verwachte invoer

Naam Type Description
Gegevensset Gegevenstabel Invoerset

Uitvoerwaarden

Naam Type Description
Gegevensset met resultaten Arff Uitvoerset

Zie ook

Conversies van gegevensindelingen
Lijst met A-Z-modules