Machine Learning-Module in Azure Machine Learning Studio (klassisch)

Der typische Workflow für Machine Learning umfasst viele Phasen:

  • Identifizierung eines zu lösenden Problems und eine Metrik zum Messen der Ergebnisse.

  • Suchen, bereinigen und Vorbereiten der entsprechenden Daten.

  • Identifizierung der besten Features und neuen Features für die Entwicklung.

  • Entwickeln, auswerten und Optimieren von Modellen.

  • Verwenden von Modellen zum Generieren von Vorhersagen, Empfehlungen und anderen Ergebnissen.

Die Module in diesem Abschnitt stellen Tools für die abschließenden Phasen von Machine Learning bereit, in denen Sie einen Algorithmus auf Daten anwenden, um ein Modell zu trainieren. In diesen abschließenden Phasen generieren Sie auch Ergebnisse und bewerten dann die Genauigkeit und Nützlichkeit des Modells.

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Dieser Inhalt bezieht sich nur auf Studio (klassisch). Ähnliche Drag & Drop-Module wurden Azure Machine Learning-Designer hinzugefügt. Weitere Informationen finden Sie in diesem Artikel zum Vergleich der beiden Versionen.

Liste der Machine Learning-Aufgaben nach Kategorie

Eine ausführliche Beschreibung dieses experimentellen Workflows finden Sie in der exemplarischen Vorgehensweise zur Lösung für die Kreditrisiko Lösung.

Voraussetzungen

Bevor Sie die Arbeit mit dem Entwickeln eines Modells erreichen können, ist in der Regel eine hohe Vorbereitung erforderlich. Dieser Abschnitt enthält Links zu Tools in Machine Learning Studio (klassisch), mit denen Sie Ihre Daten bereinigen, die Qualität der Eingabe verbessern und Laufzeitfehler verhindern können.

Daten Untersuchung und Datenqualität

Stellen Sie sicher, dass es sich bei Ihren Daten um die richtige Art von Daten, die richtige Menge und die richtige Qualität für den von Ihnen ausgewählten Algorithmus handelt. Erfahren Sie, wie viele Daten Sie haben und wie Sie verteilt werden. Gibt es Ausreißer? Wie wurden diese generiert, und was bedeuten Sie? Sind doppelte Datensätze vorhanden?

Behandeln fehlender Werte

Fehlende Werte können sich in vielerlei Hinsicht auf Ihre Ergebnisse auswirken. So verwerfen beispielsweise fast alle statistischen Methoden Fälle, bei denen Werte fehlen. Standardmäßig befolgt Machine Learning diese Regeln, wenn Sie auf Zeilen mit fehlenden Werten stößt:

  • Werden zum Trainieren eines Modells Daten mit fehlenden Werten verwendet, werden alle Zeilen mit fehlenden Werten übersprungen.

  • Wenn Daten als Eingabe verwendet werden, wenn die Bewertung für ein Modell fehlende Werte aufweist, werden die fehlenden Werte als Eingaben verwendet, aber Nullen werden weitergegeben. Dies bedeutet in der Regel, dass in den Ergebnissen anstelle einer gültigen Vorhersage ein NULL-Wert eingefügt wird.

Stellen Sie sicher, dass Sie Ihre Daten vor dem trainieren des Modells überprüfen. Verwenden Sie dieses Modul, um die fehlenden Werte zu berechnen oder die Daten zu korrigieren:

Features auswählen und Dimensionalität verringern

Machine Learning Studio (klassisch) kann Ihnen helfen, Ihre Daten zu durchsuchen, um die nützlichsten Attribute zu finden.

Wählen Sie einen geeigneten Algorithmus aus.

Das zu lösende Problem bestimmt sowohl die Auswahl der für die Analyse zu verwendenden Daten als auch die Auswahl eines Algorithmus.

Weitere Informationen finden Sie unter Auswählen eines Algorithmus in Azure Machine Learning.

Beispiele

Beispiele für Machine Learning in Aktion finden Sie in der Azure AI Gallery.

Tipps und eine exemplarische Vorgehensweise für einige typische Aufgaben zur Datenbereitstellung finden Sie unter Exemplarische Vorgehensweisen zum Ausführen des Team Data Science-Prozesses.

Weitere Informationen