Datentransformation

In diesem Artikel werden die Module aufgelistet, die in Azure Machine Learning Studio (klassisch) für die Datentransformation bereitgestellt werden. Bei Machine Learning umfasst die Datentransformation einige allgemeine Aufgaben, z. b. das Verbinden von Datasets oder das Ändern von Spaltennamen. Es umfasst aber auch viele Aufgaben, die für Maschinelles Lernen spezifisch sind, z. b. Normalisierung, Klassifizierung und Gruppierung und Rückschlüsse auf fehlende Werte.

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Dieser Inhalt bezieht sich nur auf Studio (klassisch). Ähnliche Drag & Drop-Module wurden Azure Machine Learning-Designer hinzugefügt. Weitere Informationen finden Sie in diesem Artikel zum Vergleich der beiden Versionen.

Wichtig

Daten, die Sie in Machine Learning Studio (klassisch) verwenden, werden in der Regel "sauber" erwartet, bevor Sie Sie in Machine Learning Studio (klassisch) importieren. Die Daten Vorbereitung kann z. b. sicherstellen, dass die Daten die korrekte Codierung verwenden und sicherstellen, dass die Daten über ein konsistentes Schema verfügen.

Mit Azure Machine Learning Workbench können Sie alle Arten von Daten transformieren und vorbereiten. Beispiele finden Sie unter "Beispiel für Daten Transformationen" in Machine Learning Workbench.

Module für die Datentransformation werden in die folgenden aufgabenbasierten Kategorien eingeteilt:

  • Erstellen von Filtern für die digitale Signalverarbeitung: digitale Signal Filter können auf numerische Daten angewendet werden, um Machine Learning-Aufgaben wie Bild Erkennung, Spracherkennung und Wellenform-Analyse zu unterstützen.
  • Erstellen und Verwenden von count-basierten Features: mithilfe von count-basierten featuresierungsmodulen können Sie kompakte Features entwickeln, die Sie in Machine Learning verwenden können.
  • Allgemeine Datenbearbeitung und-Vorbereitung: das Zusammenführen von Datasets, das Bereinigen fehlender Werte, das Gruppieren und Zusammenfassen von Daten, das Ändern von Spaltennamen und Datentypen oder das Angeben der Spalte ist eine Bezeichnung oder eine Funktion.
  • Sampling und Aufteilung von Datasets: unterteilen Sie die Daten in Trainings-und Testsätze, teilen Sie Datasets nach Prozentsatz oder einer Filterbedingung, oder führen Sie eine Stichprobenentnahme durch.
  • Skalieren und reduzieren von Daten: Vorbereiten numerischer Daten für die Analyse durch Anwenden von Normalisierung oder Skalierung. Klassifizieren von Daten in Gruppen, entfernen oder Ersetzen von Ausreißern oder Ausführen von Principal Component Analysis (PCA).

Liste der Module

Die folgenden Modul Kategorien sind in der Kategorie Daten Transformation enthalten:

Weitere Informationen