Machine Learning Train

In diesem Artikel werden die Module beschrieben, die in Azure Machine Learning Studio (klassisch) zum Trainieren eines Machine Learning-Modells bereitgestellt werden. Training ist der Prozess der Analyse von Eingabedaten mit den Parametern eines vordefinierten Modells. Aus dieser Analyse lernt das Modell die Muster und speichert Sie in Form eines trainierten Modells.

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Dieser Inhalt bezieht sich nur auf Studio (klassisch). Ähnliche Drag & Drop-Module wurden Azure Machine Learning-Designer hinzugefügt. Weitere Informationen finden Sie in diesem Artikel zum Vergleich der beiden Versionen.

In diesem Artikel wird auch der gesamte Prozess in Machine Learning Studio (klassisch) für das Erstellen, trainieren, evaluieren und bewerten von Modellen beschrieben.

Erstellen und Verwenden von Machine Learning-Modellen

Der typische Workflow für Machine Learning umfasst die folgenden Phasen:

  • Wählen Sie einen geeigneten Algorithmus aus, und legen Sie anfängliche Optionen fest.
  • Das Modell wird mit kompatiblen Daten trainiert.
  • Erstellen von Vorhersagen mithilfe neuer Daten auf Grundlage der Muster im Modell.
  • Auswerten des Modells, um zu bestimmen, ob die Vorhersagen genau sind, wie viel Fehler vorhanden sind und ob eine über Anpassung vorliegt.

Machine Learning Studio (klassisch) unterstützt ein flexibles, anpassbares Framework für Machine Learning. Jede Aufgabe in diesem Prozess wird von einem bestimmten Modultyp durchgeführt, der geändert, hinzugefügt oder entfernt werden kann, ohne den Rest des Experiments zu unterbrechen.

Die Module in dieser Kategorie unterstützen das Training für verschiedene Modelltypen. Während des Trainings werden die Daten vom Machine Learning-Algorithmus analysiert. Dieser Algorithmus analysiert die Verteilung und den Typ der Daten, kompiliert Statistiken und erstellt Muster, die später für Vorhersagen verwendet werden können.

Weitere Informationen zum Modell Training

Wenn Machine Learning ein Modell trainiert, werden Zeilen mit fehlenden Werten übersprungen. Wenn Sie die Werte daher manuell beheben möchten, verwenden Sie imputations oder eine andere Methode für die Behandlung fehlender Werte, verwenden Sie das Modul Clean Missing Data , bevor Sie das DataSet trainieren.

Es wird empfohlen, dass Sie das Modul Edit Metadata verwenden, um andere Probleme mit den Daten zu beheben. Möglicherweise müssen Sie die Bezeichnungs Spalte markieren, Datentypen ändern oder Spaltennamen korrigieren.

Informationen zu anderen häufigen Daten Bereinigungs Tasks, wie Normalisierung, Sampling, Klassifizierung und Skalierung, finden Sie in der Kategorie Daten Transformation .

Richtigen Trainer auswählen

Die Methode, die Sie zum Trainieren eines Modells verwenden, hängt vom Typ des Modells ab, das Sie erstellen, und von dem Datentyp, der für das Modell erforderlich ist. Beispielsweise stellt Machine Learning Module bereit, die speziell für das Training von anomalieerkennungsmodellen, Empfehlungs Modellen usw. bereit stehen.

Überprüfen Sie die Liste der Trainingsmodule , um zu bestimmen, welche für Ihr Szenario korrekt ist.

Wenn Sie sich nicht sicher sind, welche der besten Parameter beim Trainieren eines Modells verwendet werden sollen, verwenden Sie eines der Module, die für die Parameter-und Validierung bereitgestellt werden:

  • Optimieren von Modell hyperparametern können einen Parameter Sweep für fast alle Klassifizierungs-und Regressionsmodelle ausführen. Es trainiert mehrere Modelle und gibt dann das beste Modell zurück.

  • Das Sweep Clustering -Modul unterstützt die Optimierung von Modellen während des Trainingsprozesses und ist nur für die Verwendung mit Clustering-Modellen vorgesehen. Sie können einen Bereich von Schwerpunkten angeben und bei der automatischen Erkennung der besten Parameterdaten trainieren.

  • Das Modul Cross-Validate Model ist auch für die Modelloptimierung nützlich, gibt jedoch kein trainiertes Modell zurück. Stattdessen werden Metriken bereitgestellt, mit denen Sie das beste Modell ermitteln können.

Erneutes Trainieren von Modellen

Wenn Sie ein Produktionsmodell erneut trainieren müssen, können Sie das Experiment jederzeit erneut ausführen.

Sie können den Vorgang zum erneuten trainieren auch mithilfe von Webdiensten automatisieren. Eine exemplarische Vorgehensweise finden Sie unter Erneutes trainieren und Aktualisieren von Azure Machine Learning-Modellen mit Azure Data Factory.

Verwenden von vortrainierten Modellen

Machine Learning schließt einige Modelle ein, die vortrainiert werden, z. b. das Vortrainierte Cascade Image Classification -Modul. Sie können diese Modelle für die Bewertung ohne zusätzliche Dateneingabe verwenden.

Außerdem generieren einige Module (z. b. die Erkennung von Zeitreihen Anomalien) kein trainiertes Modell im ilearner-Format. Dabei werden jedoch Trainingsdaten erstellt und intern ein Modell erstellt, das dann zum Treffen von Vorhersagen verwendet werden kann. Um diese zu verwenden, konfigurieren Sie einfach die Parameter und stellen Daten bereit.

Speichern einer Momentaufnahme eines trainierten Modells

Wenn Sie das Modell speichern oder exportieren möchten, klicken Sie mit der rechten Maustaste auf das Trainings Modul, und wählen Sie als trainiertes Modell speichern aus. Das Modell wird in das ilearner-Format exportiert und in Ihrem Arbeitsbereich unter trainierte Modelle gespeichert. Trainierte Modelle können in anderen Experimenten wieder verwendet werden oder mit anderen Modulen zur Bewertung verbunden werden.

Sie können auch das Modul Load trainierte Model in einem Experiment verwenden, um ein gespeichertes Modell abzurufen.

Liste der Module

Die Kategorie Train umfasst die folgenden Module:

  • Sweep Clustering: führt einen Parameter Sweep für ein Clustering-Modell aus, um die optimalen Parametereinstellungen zu bestimmen, und trainiert das beste Modell.
  • Modell zum Trainieren der Anomalieerkennung: trainiert ein Modell für die Anomalieerkennung und bezeichnet Daten aus einem Trainings Satz
  • Train Clustering-Modell: trainiert ein Clusteringmodell und weist Daten aus dem Trainings Satz Clustern zu.
  • Train matchbox-Empfehlung: trainiert ein Bayes-Empfehlungs Programm mit dem matchbox-Algorithmus.
  • Train Model: trainiert ein Klassifizierungs-oder Regressionsmodell aus einem Trainings Satz.
  • Tune Model hyperparameters: führt einen Parameter Sweep für ein Regressions-oder Klassifizierungs Modell aus, um die optimalen Parametereinstellungen zu bestimmen, und trainiert das beste Modell.

Einige Module sind nicht in dieser Kategorie, da Sie ein spezielles Format erfordern oder für eine bestimmte Aufgabe angepasst sind:

Weitere Informationen