Two-Class Support Vector Machine

Erstellt ein binäres Klassifizierungsmodell mit dem Support Vector Machine-Algorithmus

Kategorie: Machine Learning/Modell/Klassifizierung initialisieren

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Dieser Inhalt bezieht sich nur auf Studio (klassisch). Ähnliche Drag & Drop-Module wurden Azure Machine Learning-Designer hinzugefügt. Weitere Informationen finden Sie in diesem Artikel zum Vergleich der beiden Versionen.

Modulübersicht

In diesem Artikel wird beschrieben, wie Sie das Modul Two-Class Support Vector Machine in Azure Machine Learning Studio (klassisch) verwenden, um ein Modell zu erstellen, das auf dem Support Vector Machine-Algorithmus basiert.

Support Vector Machines (SVMs) sind eine gut erforschte Klasse von überwachten Learning-Methoden. Diese spezielle Implementierung eignet sich zur Vorhersage von zwei möglichen Ergebnissen, die entweder auf kontinuierlichen oder kategorischen Variablen basieren.

Nachdem Sie die Modellparameter definiert haben, trainieren Sie das Modell, indem Sie eines der Trainingsmoduleverwenden und ein markiertes DataSet bereitstellen, das eine Bezeichnung oder eine Ergebnisspalte enthält.

Weitere Informationen zu Support Vector Machines

Support Vector Machines gehören zu den frühesten Machine Learning-Algorithmen, und SVM-Modelle wurden in vielen Anwendungen verwendet – von der Informationsbeschaffung bis zur Text- und Bildklassifizierung. SVMs können für sowohl Klassifizierungs-als auch Regressionsaufgaben verwendet werden.

Diese SVM-Modell ist ein überwachtes Learning-Modell, für das bezeichnete Daten erforderlich sind. Im Trainingsprozess analysiert der Algorithmus Eingabedaten und erkennt Muster in einem mehrdimensionalen Featureraum namens Hyperebene. Alle Eingabebeispiele werden in diesem Raum als Punkte dargestellt und auf Ausgabekategorien so abgebildet, dass Kategorien durch eine möglichst große Breite geteilt werden und eine Lücke schließen.

Für die Vorhersage ordnet der SVM-Algorithmus neue Beispiele der einen oder anderen Kategorie zu und ordnet sie dem gleichen Raum zu.

Konfigurieren Two-Class Vector Machine für die Unterstützung

Für diesen Modelltyp wird empfohlen, dass Sie den Datensatz normalisieren, bevor Sie ihn zum Trainieren des Klassifikators verwenden.

  1. Fügen Sie das Modul Two-Class Support Vector Machine zum Experiment in Studio (klassisch) hinzu.

  2. Geben Sie an, wie das Modell trainiert werden soll, indem Sie die Option Create trainer mode (Trainermodus erstellen) aktivieren.

    • Single Parameter (Einzelner Parameter): Wenn Sie wissen, wie Sie das Modell konfigurieren möchten, können Sie einen bestimmten Satz von Werten als Argumente angeben.

    • Parameter Bereich: Wenn Sie sich nicht sicher sind, welche Parameter am besten geeignet sind, können Sie die optimalen Parameter ermitteln, indem Sie mehrere Werte angeben und das Modul " Tune Model hyperparameters " verwenden, um die optimale Konfiguration zu ermitteln. Der-Trainer durchläuft mehrere Kombinationen der-Einstellungen und bestimmt die Kombination der Werte, die das beste Modell erzeugen.

  3. Geben Sie für Anzahl der Iterationen eine Zahl ein, die die Anzahl der beim Erstellen des Modells verwendeten Iterationen angibt.

    Dieser Parameter kann verwendet werden, um den Kompromiss zwischen Trainingsgeschwindigkeit und Genauigkeit zu steuern.

  4. Geben Sie für Lambda einen Wert ein, der als Gewichtung für die L1-Regularisierung verwendet werden soll.

    Dieser Regularisierungskoeffizient kann zur Optimierung des Modells verwendet werden. Größere Werte führen zu komplexeren Modellen.

  5. Wählen Sie die Option Features normalisieren, wenn Sie Features vor dem Training normalisieren möchten.

    Wenn Sie die Normalisierung anwenden, werden die Datenpunkte vor dem Training auf den Mittelwert zentriert und auf eine Einheit der Standardabweichung skaliert.

  6. Wählen Sie die Option In Einheitssphäre projizieren, um die Koeffizienten zu normalisieren.

    Das Projizieren von Werten zum Einheitsraum bedeutet, dass die Datenpunkte vor dem Training auf 0 zentriert und auf eine Einheit der Standardabweichung skaliert werden.

  7. Geben Sie unter Zufälliger Ausgangswert einen ganzzahligen Wert ein, der als Ausgangswert verwendet werden soll, wenn Sie die Reproduzierbarkeit über mehrere Ausführungen hinweg sicherstellen möchten. Andernfalls wird ein von der Systemuhr bereitgestellter Wert als Ausgangswert verwendet, was bei jeder Ausführung zu geringfügig unterschiedlichen Ergebnissen führen kann.

  8. Wählen Sie die Option unbekannte Kategorie zulassen aus, um eine Gruppe für unbekannte Werte in den Trainings-oder Validierungs Sätzen zu erstellen. In diesem Fall ist das Modell für bekannte Werte möglicherweise weniger präzise, kann jedoch bessere Vorhersagen für neue (unbekannte) Werte bereitstellen.

    Wenn Sie die Option deaktivieren, akzeptiert das Modell nur die Werte, die in den Trainingsdaten enthalten sind.

  9. Verbinden Sie ein DataSet mit Bezeichnung und eines der Trainingsmodule:

    • Wenn Sie Create trainer mode (Trainermodus erstellen) auf Single Parameter (Einzelner Parameter) festlegen, müssen Sie das Modul Train Model (Trainieren des Modells) verwenden.

    • Wenn Sie den Create Trainer-Modus auf Parameter Bereich festlegen, verwenden Sie die Tune Model hyperparameters.

    Hinweis

    Wenn Sie einen Parameter Bereich übergeben, um das Modell zu trainieren, wird nur der erste Wert in der Liste Parameter Bereich verwendet.

    Wenn Sie einen einzelnen Satz von Parameterwerten an das Modul " Tune Model hyperparameters " übergeben und eine Reihe von Einstellungen für jeden Parameter erwartet, werden die Werte ignoriert und die Standardwerte für den Lerner verwendet.

    Wenn Sie die Option Parameter Bereich auswählen und einen einzelnen Wert für einen beliebigen Parameter eingeben, wird dieser einzelne Wert, den Sie angegeben haben, während des Sweep verwendet, auch wenn andere Parameter in einem Wertebereich geändert werden.

  10. Führen Sie das Experiment aus.

Ergebnisse

Nach Abschluss des Trainings:

  • Klicken Sie mit der rechten Maustaste auf die Ausgabe des Moduls Train Model , und wählen Sie dann visualisieren aus, umeine Zusammenfassung der Parameter des Modells anzuzeigen, zusammen mit den Merkmals Gewichtungen, die aus dem Training gelernt wurden.

  • Um mit den trainierten Modellen Vorhersagen zu treffen, verbinden Sie das trainierte Modell mit dem Modul Modell bewerten.

  • Um eine Kreuz Validierung für ein bezeichnetes DataSet auszuführen, verbinden Sie das untrainierte Modell und das DataSet mit der Kreuz Validierung des Modells.

Beispiele

Beispiele zur Verwendung dieses Lernalgorithmus finden Sie in der Azure AI Gallery:

Technische Hinweise

Dieser Abschnitt enthält Implementierungsdetails, Tipps und Antworten auf häufig gestellte Fragen.

Verwendungstipps

Für diesen Modelltyp wird empfohlen, dass Sie den Datensatz normalisieren, bevor Sie ihn zum Trainieren des Klassifikators verwenden.

Obwohl die aktuelle Forschung Algorithmen mit höherer Genauigkeit entwickelt hat, kann dieser bei einfachen Datasets gut funktionieren, vor allem, wenn es Ihnen mehr auf Geschwindigkeit als auf Exaktheit ankommt. Wenn Sie mit Two-Class Support Vector Model nicht die gewünschten Ergebnisse erzielen, versuchen Sie es mit einer der folgenden Klassifizierungsmethoden.

Modulparameter

Name Range type Standard BESCHREIBUNG
Number of iterations >=1 Integer 1 Anzahl der Iterationen.
Lambda >=double.Epsilon Float 0,001 Gewichtung für L1-Regularisierung. Mit einem Wert ungleich Null wird eine Überanpassung des Modells an das Trainingsdataset vermieden.
Normalisieren von Merkmalen. Any Boolean True Bei "True" werden die Merkmale normalisiert.
Project to the unit-sphere Any Boolean False Bei "True" werden die Merkmale auf einen Einheitskreis projiziert.
Random number seed Any Integer Der Ausgangswert für den Zufallszahlen-Generator, der vom Modell verwendet wird Geben Sie keinen Wert an, um den Standardwert zu verwenden.
Allow unknown categorical levels Any Boolean True Bei "True" wird eine zusätzliche Ebene für jede Kategoriespalte erstellt. Alle Ebenen im Testdataset, die nicht im Trainingsdataset zur Verfügung stehen, werden dieser zusätzlichen Ebene zugeordnet.

Output

Name Typ BESCHREIBUNG
Untrainiertes Modell Datentabelle Ein untrainiertes binäres Klassifizierungsmodell.

Weitere Informationen

Ordnung
Modulliste von A bis Z