Convert to ARFF

Wichtig

Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.

Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.

Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.

Konvertiert die Dateneingabe in das vom Weka-Toolset verwendete ARFF-Dateiformat

Kategorie: Datenformatkonvertierungen

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.

Modulübersicht

In diesem Artikel wird beschrieben, wie Sie das Modul Convert to ARFF in Machine Learning Studio (classic) verwenden, um Datasets zu konvertieren und ergebnisse in das vom Weka-Toolset verwendete Attributbeziehungsdateiformat zu konvertieren. Dieses Format wird als ARFF bezeichnet.

Die ARFF-Datenspezifikation für Weka unterstützt mehrere Machine Learning-Aufgaben, einschließlich Datenvorverarbeitung, Klassifizierung und Featureauswahl. In diesem Format sind Daten nach Deniten und ihren Attributen organisiert und in einer einzelnen Textdatei enthalten. Details zum Weka-Dateiformat finden Sie im Abschnitt Technische Hinweise .

Im Allgemeinen ist die Konvertierung in das Weka-Dateiformat nur erforderlich, wenn Sie sowohl Machine Learning als auch Weka verwenden und ihre Trainingsdaten zwischen ihnen hin- und her verschieben möchten.

Weitere Informationen zum Weka-Toolset finden Sie in diesem Wikipedia-Artikel: Weka (Machine Learning)

Warnung

Eine vorhandene ARFF-Datei kann in Azure Storage nicht überschrieben werden.

Verwenden von Convert to ARFF

  1. Fügen Sie Ihrem Experiment das Modul Convert to ARFF (In ARFF konvertieren) hinzu. Sie finden dieses Modul in der Kategorie Datenformatkonvertierungen in Machine Learning Studio (klassisch).

  2. Verbinden Sie es mit einem beliebigen Modul, das ein Dataset ausgibt.

  3. Führen Sie das Experiment aus, oder klicken Sie auf das Modul Convert to ARFF (In ARFF konvertieren ), und klicken Sie auf Run selected (Ausgewählte ausführen).

Ergebnisse

  • Um eine Kopie der Daten in einem lokalen Ordner zu erstellen, doppelklicken Sie auf die Ausgabe von In ARFF konvertieren, und wählen Sie die Option Herunterladen aus.

    Wenn Sie keinen Ordner angeben, wird ein Standarddateiname angewendet, und die Datei wird in der lokalen Bibliothek Downloads gespeichert.

Hinweis

Dieses Modul unterstützt keinen Export in Python- oder R-Code.

Beispiele

Es gibt keine spezifischen Beispiele für dieses Format in der Azure KI-Katalog. Diese Experimente veranschaulichen jedoch andere Arten der Formatkonvertierung:

  • Farbbasierte Bildkomprimierung: Exportiert die für jeden Teil der Analyse verwendeten Datasets zur Reproduzierbarkeit und Verwendung auf anderen Analyseplattformen in Dateien.

  • Beispiel für Kreuzvalidierung für binäre Klassifizierung: Exportiert die Ergebnisse der Kreuzvalidierung in Dateien, sodass die Ergebnisse für mehrere Modelle mithilfe eines Tools wie Excel.

Technische Hinweise

Dieser Abschnitt enthält Implementierungsdetails, Tipps und Antworten auf häufig gestellte Fragen.

Beispiel für das ARFF-Format

Dieser Abschnitt enthält ein Beispiel dafür, wie ein typisches Dataset aussehen würde, wenn es in ARFF konvertiert wird.

In der Regel besteht eine ARFF-Datendatei aus zwei Abschnitten: einem Header, der die Datenquelle und das Schema definiert, und dem Datenabschnitt, der die tatsächlichen Entitäten und ihre Attribute enthält.

ARFF-Header

Der Header für eine ARFF-Datei definiert die Liste der Attribute (in Spalten) und deren Datentypen. Der Header kann auch mehrere Kommentarzeilen enthalten, die die Datenquelle beschreiben, oder sonstige Notizen.

% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}

Tipp

Wenn das zu konvertierende Dataset keine Spaltennamen enthält, verwenden Sie das Modul Edit Metadata (Metadaten bearbeiten), um Spaltennamen hinzuzufügen, bevor Sie die Konvertierung in ARFF verwenden.

ARFF-Daten

Der Datenabschnitt besteht aus durch Komma getrennten Werten und sieht sehr ähnlich wie eine CSV-Datei ohne Spaltenüberschriften aus.

@DATA 5.1,3.5,1.4,0.2,0

Weitere Informationen zu diesem Dateiformat finden Sie auf der Weka Wiki-Seite: ARFF (Entwicklerversion).

Aktuelle ARFF-Version

Machine Learning Studio (klassisch) speichert ARFF-Dateien im ARFF 3.0-Format.

Erwartete Eingaben

Name Type Beschreibung
Dataset Datentabelle Eingabedataset

Ausgaben

Name Type Beschreibung
Ergebnisdataset Arff Ausgabedataset

Siehe auch

Datenformatkonvertierungen
Modulliste von A bis Z