Converteren naar ARFF

Hiermee wordt de gegevens invoer geconverteerd naar de kenmerk relatie bestands indeling die wordt gebruikt door de Fridge-toolset

Categorie: gegevens indeling conversies

Notitie

Van toepassing op : machine learning Studio (klassiek)

Deze inhoud is alleen van toepassing op Studio (klassiek). Er zijn Vergelijk bare modules voor slepen en neerzetten toegevoegd aan Azure Machine Learning Designer. In dit artikel vindt u meer informatie over de twee versies.

Module overzicht

In dit artikel wordt beschreven hoe u de module Convert to ARFF in azure machine learning Studio (klassiek) gebruikt om gegevens sets en Azure machine learning resultaten te converteren naar de kenmerk relatie bestands indeling die wordt gebruikt door de Fridge-toolset. Deze indeling wordt ook wel ARFF genoemd.

De ARFF-gegevens specificatie voor Fridge ondersteunt meerdere machine learning taken, waaronder het voorverwerken van gegevens, de classificatie en de functie selectie. In deze indeling worden gegevens geordend op entiteiten en hun kenmerken, en bevindt deze zich in één tekst bestand. Meer informatie over de bestands indeling van Fridge vindt u in de sectie technische opmerkingen .

Over het algemeen is conversie naar de Fridge-bestands indeling alleen vereist als u zowel Azure Machine Learning als Fridge wilt gebruiken, en u uw trainings gegevens heen en weer wilt verplaatsen.

Zie dit Wikipedia-artikel: Fridge (machine learning) voor meer informatie over de Fridge-toolset.

Waarschuwing

U kunt een bestaand ARFF-bestand niet overschrijven in Azure Storage.

Conversie naar ARFF gebruiken

  1. Voeg de module Convert to ARFF toe aan uw experiment. U kunt deze module vinden in de categorie gegevens indeling conversies in azure machine learning Studio (klassiek).

  2. Verbind het met een wille keurige module die een gegevensset uitvoert.

  3. Voer het experiment uit, of klik op de module converteren naar ARFF en klik op geselecteerde uitvoeren.

Resultaten

  • Als u een kopie van de gegevens in een lokale map wilt maken, dubbelklikt u op de uitvoer van converteren naar ARFFen selecteert u de optie downloaden .

    Als u geen map opgeeft, wordt een standaard bestands naam toegepast en wordt het bestand opgeslagen in de lokale bibliotheek met down loads .

Notitie

Deze module biedt geen ondersteuning voor het exporteren naar python of R-code.

Voorbeelden

Er zijn geen voor beelden die specifiek zijn voor deze indeling in de Azure AI Gallery. Deze experimenten demonstreren echter andere soorten indelings conversie:

Technische opmerkingen

Deze sectie bevat implementatie details, tips en antwoorden op veelgestelde vragen.

Voor beeld van ARFF-indeling

Deze sectie bevat een voor beeld van hoe een typische gegevensset eruit zou zien wanneer deze naar ARFF wordt geconverteerd.

Normaal gesp roken bestaat een ARFF-gegevens bestand uit twee secties: een kop die de gegevens bron en het schema definieert en de sectie gegevens , die de werkelijke entiteiten en hun kenmerken bevat.

ARFF-header

De header voor een ARFF-bestand definieert de lijst met kenmerken (in kolommen) en de bijbehorende gegevens typen. De koptekst kan ook meerdere opmerkings regels bevatten waarin de gegevens bron of andere notities worden beschreven.

% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}

Tip

Als de gegevensset die u converteert geen kolom namen heeft, gebruikt u de module meta gegevens bewerken om kolom namen toe te voegen voordat u de conversie naar ARFF gebruikt.

ARFF-gegevens

De gegevens sectie bestaat uit door komma's gescheiden waarden en lijkt veel op een CSV-bestand zonder kolom koppen.

@DATA 5.1,3.5,1.4,0.2,0

Ga voor meer informatie over deze bestands indeling naar de pagina Fridge wiki: ARFF (versie van ontwikkel aars).

Huidige ARFF-versie

Met Azure Machine Learning Studio (klassiek) worden ARFF-bestanden opgeslagen met de ARFF 3,0-indeling.

Verwachte invoer

Naam Type Beschrijving
Gegevensset Gegevens tabel Invoer gegevensset

Outputs

Naam Type Beschrijving
Gegevensset voor resultaten ARFF Uitvoer gegevensset

Zie ook

Conversies van gegevens indeling
Module lijst a-Z