Trainieren eines Modells

Trainiert ein Klassifikations- oder Regressionsmodell unter Überwachung.

Kategorie: Machine Learning/Train

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Dieser Inhalt bezieht sich nur auf Studio (klassisch). Ähnliche Drag & Drop-Module wurden Azure Machine Learning-Designer hinzugefügt. Weitere Informationen finden Sie in diesem Artikel zum Vergleich der beiden Versionen.

Modulübersicht

In diesem Artikel wird beschrieben, wie Sie das Modul Train Model in Azure Machine Learning Studio (klassisch) zum Trainieren eines Klassifizierungs-oder Regressionsmodells verwenden. Das Training findet statt, nachdem Sie ein Modell definiert und die zugehörigen Parameter festgelegt haben. Für das Training werden markierte Daten benötigt. Darüber hinaus können Sie Train Model auch verwenden, um ein bestehendes Modell erneut anhand neuer Daten zu trainieren.

So funktioniert der Trainingsprozess

In Azure Machine Learning werden Machine Learning-Modelle in der Regel in einem dreistufigen Prozess erstellt und verwendet.

  1. Um ein Modell zu konfigurieren, wählen Sie einen bestimmten Algorithmustyp aus und definieren dann die zugehörigen Parameter oder Hyperparameter. Wählen Sie einen der folgenden Modelltypen:

    • Klassifizierungs Modelle, die auf neuronalen Netzwerken, Entscheidungsstrukturen und Entscheidungs Gesamtstrukturen basieren, sowie andere Algorithmen.
    • Regressionsmodelle, die eine lineare Standard Regression enthalten können oder andere Algorithmen verwenden, einschließlich neuronaler Netzwerke und bayscher Regression.
  2. Geben Sie ein Dataset an, das mit einer Bezeichnung versehen wurde und über Daten verfügt, die mit dem Algorithmus kompatibel sind. Verbinden Sie sowohl die Daten als auch das Modell mit Train Model.

    Welches Training erzeugt, ist ein spezifisches Binärformat, das ilearner, das die statistischen Muster kapselt, die aus den Daten gelernt wurden. Dieses Format kann nicht direkt geändert oder gelesen werden. andere Module in Studio (klassisch) können dieses trainierte Modell jedoch verwenden.

    Darüber hinaus können Sie die Eigenschaften des Modells anzeigen. Weitere Informationen finden Sie im Abschnitt " Ergebnisse ".

  3. Nach Abschluss des Trainings verwenden Sie das trainierte Modell mit einem der Bewertungsmodule, um Vorhersagen für neue Daten zu treffen.

Hinweis

Andere spezielle Machine Learning-Aufgaben erfordern unterschiedliche Schulungsmethoden, und Studio (klassisch) stellt separate Schulungsmodule für Sie bereit. Beispielsweise werden bei der Bild Erkennung, beim Clustering und bei der Anomalieerkennung benutzerdefinierte Trainingsmethoden verwendet. Train Model ist nur für die Verwendung mit Regressions-und Klassifizierungs Modellen vorgesehen.

Überwachtes und unbeaufsichtigtes Training

Vielleicht haben Sie die Begriffe überwachtes oder unbeaufsichtigtes Lernen gehört. Das Trainieren eines Klassifizierungs-oder Regressionsmodells mit Train Model ist ein klassisches Beispiel für überwachtes Maschinelles Lernen. Dies bedeutet, dass Sie ein DataSet bereitstellen müssen, das Verlaufs Daten enthält, aus denen Muster gelernt werden. Die Daten sollten sowohl das Ergebnis (Bezeichnung), das Sie vorhersagen möchten, als auch Verwandte Faktoren (Variablen) enthalten. Das Machine Learning-Modell benötigt die Ergebnisse, um die Features zu bestimmen, die die Ergebnisse am besten Vorhersagen.

Während des Trainingsprozesses werden die Daten nach Ergebnissen sortiert, und der Algorithmus extrahiert statistische Muster, um das Modell zu erstellen.

Nicht überwachtes Lernen gibt entweder an, dass das Ergebnis unbekannt ist, oder Sie entscheiden sich für die Verwendung bekannter Bezeichnungen. Clustering-Algorithmen verwenden z. b. in der Regel nicht überwachte Lernmethoden, können aber Bezeichnungen verwenden, falls verfügbar. Ein weiteres Beispiel ist die Themen Modellierung mit LDA. " Train Model " kann nicht mit diesen Algorithmen verwendet werden.

Tipp

Neu bei Machine Learning? In diesem Tutorial erfahren Sie Schritt für Schritt, wie Sie Daten erhalten, einen Algorithmus konfigurieren, trainieren und dann ein Modell verwenden: Erstellen Ihres ersten Machine Learning-Experiments

Verwenden von " Train Model "

  1. Konfigurieren Sie in Azure Machine Learning Studio (klassisch) ein Klassifizierungs Modell oder Regressionsmodell Modelle.

    Sie können auch ein benutzerdefiniertes Modell trainieren, das mithilfe von Create R Modelerstellt wurde.

  2. Fügen Sie dem Experiment das Modul Train Model hinzu. Sie finden dieses Modul unter der Kategorie Machine Learning. Erweitern Sie Train (Trainieren), und ziehen Sie das Modul Train Model dann in Ihr Experiment.

  3. Fügen Sie den untrainierten Modus an die linke Eingabe an. Fügen Sie das Trainingsdataset an die rechte Eingabe von Train Model an.

    Das Trainingsdataset muss eine Bezeichnungsspalte enthalten. Zeilen ohne Bezeichnung werden ignoriert.

  4. Klicken Sie für Label column (Bezeichnungsspalte) auf Launch column selector (Spaltenauswahl starten), und wählen Sie eine einzelne Spalte mit Ergebnissen aus, die vom Modell zu Trainingszwecken verwendet werden können.

    • Bei Klassifizierungsproblemen muss die Bezeichnungsspalte entweder kategorische oder diskrete Werte enthalten. Einige Beispiele sind: Ja/keine Bewertung, ein Code oder ein Name zur Klassifizierung von Krankheiten oder eine Gehaltsgruppe. Wenn Sie eine Spalte mit nicht kategorischen Werten auswählen, gibt das Modul während des Trainings einen Fehler zurück.

    • Bei Regressionsproblemen muss die Bezeichnungsspalte numerische Daten enthalten, die die Antwortvariable darstellen. Im Idealfall stellen die numerischen Daten eine fortlaufende Skala dar.

    Beispiele sind: eine Kreditrisikobewertung, die prognostizierte Zeit bis zum Ausfall einer Festplatte oder die vorausgesagte Anzahl von Call-Center-Anrufen an einem bestimmten Tag oder zu einer bestimmten Uhrzeit. Wenn Sie keine numerische Spalte auswählen, kann dies zu einem Fehler führen.

    • Wenn Sie die zu verwendende Bezeichnungsspalte nicht angeben, versucht Azure Machine Learning, die geeignete Bezeichnungsspalte anhand der Metadaten des Datasets abzuleiten. Wenn die falsche Spalte ausgewählt wird, korrigieren Sie dies mithilfe der Spaltenauswahl.

    Tipp

    Tipps zur richtigen Verwendung der Spaltenauswahl finden Sie im Artikel zum Auswählen von Spalten im Dataset. Dort werden einige häufige Szenarien beschrieben, und Sie erhalten Tipps zur Verwendung der Optionen WITH RULES und BY NAME.

  5. Führen Sie das Experiment aus. Wenn Sie über eine große Datenmenge verfügen, kann dies eine Weile dauern.

Ergebnisse

Nachdem das Modell trainiert wurde:

  • Um Modellparameter und Featuregewichtungen anzuzeigen, klicken Sie mit der rechten Maustaste auf die Ausgabe, und wählen Sie Visualize (Visualisieren) aus.

  • Um das Modell in weiteren Experimenten zu verwenden, klicken Sie mit der rechten Maustaste auf das Modell, und wählen Sie Save Model (Modell speichern) aus. Geben Sie einen Namen für das Modell ein.

    Dadurch wird das Modell als Momentaufnahme gespeichert, die durch wiederholte Ausführungen des Experiments aber nicht aktualisiert wird.

  • Um das Modell zur Vorhersage neuer Werte zu verwenden, verbinden Sie es mit dem Modul Score Model (Modell bewerten) sowie mit neuen Eingabedaten.

Wenn Sie einen Modelltyp trainieren müssen, der nicht vom Train Model unterstützt wird, gibt es mehrere Möglichkeiten:

  • Erstellen Sie eine benutzerdefinierte Bewertungsmethode mithilfe eines r-Skripts, oder verwenden Sie eines der vielen verfügbaren r-Bewertungs Pakete.

  • Schreiben Sie Ihr eigenes Python-Skript, um ein Modell zu trainieren und zu bewerten, oder verwenden Sie eine vorhandene Python-Bibliothek:

  • Modelle zur Erkennung von Anomalien

  • Empfehlungs Modelle

    • Wenn Ihr Modell die in Azure Machine Learning bereitgestellte matchbox verwendet, verwenden Sie das Modul Train matchbox Empfehlungs der .

    • Wenn Sie einen anderen Algorithmus für die Market Basket-Analyse oder-Empfehlung verwenden, verwenden Sie die Schulungsmethoden in R-Skripts oder python-Skripts.

  • Clustermodelle

Beispiele

Beispiele für die Verwendung des Moduls Train Model in Machine Learning-Experimenten finden Sie in den folgenden Experimenten in der Azure AI Gallery:

Erwartete Eingaben

Name Typ BESCHREIBUNG
Untrainiertes Modell ILearner-Schnittstelle Untrainierter Lerner
Dataset Datentabelle Trainingsdaten

Modulparameter

Name Range type Standard BESCHREIBUNG
Bezeichnungsspalte any ColumnSelection Auswählen der Spalte, die die Bezeichnung enthält, oder der Ergebnisspalte

Ausgaben

Name Typ BESCHREIBUNG
Trainiertes Modell ILearner-Schnittstelle Trainiertes Lernmodul

Ausnahmen

Eine Liste aller Modul Fehler finden Sie unter Modul Fehler Codes.

Ausnahme Beschreibung
Fehler 0032 Eine Ausnahme tritt auf, wenn das Argument keine Zahl ist.
Fehler 0033 Eine Ausnahme tritt auf, wenn das Argument „Infinity“ (Unendlich) ist.
Fehler 0083 Eine Ausnahme tritt auf, wenn das für das Training verwendete Dataset nicht für einen konkreten Learnertyp verwendet werden kann.
Fehler 0035 Eine Ausnahme tritt auf, wenn für einen bestimmten Benutzer oder ein bestimmtes Element keine Features bereitgestellt wurden.
Fehler 0003 Eine Ausnahme tritt auf, wenn mindestens eine Eingabe NULL oder leer ist.
Fehler 0020 Eine Ausnahme tritt auf, wenn die Anzahl der Spalten in einigen der an das Modul übergebenen Datasets zu klein ist.
Fehler 0021 Eine Ausnahme tritt auf, wenn die Anzahl der Zeilen in einigen der an das Modul übergebenen Datasets zu klein ist.
Fehler 0013 Die Ausnahme tritt auf, wenn das an das Modul übergebene Lernmodul einen ungültigen Typ hat.

Weitere Informationen

Modell auswerten
Modulliste von A bis Z