Ordinal Regression

Wichtig

Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.

Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.

Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.

Erstellt ein ordinales Regressionsmodell

Kategorie: Machine Learning/Initialize Model/Regression

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.

Modulübersicht

In diesem Artikel wird beschrieben, wie Sie das Modul Ordinal Regression in Machine Learning Studio (klassisch) verwenden, um ein Regressionsmodell zu erstellen, mit dem bewertete Werte vorhergesagt werden können.

Einige Beispiele für bewertete Werte:

  • Umfrageantworten, die die bevorzugten Marken des Benutzers im Maßstab 1 bis 5 erfassen
  • Die Reihenfolge der Finisher in einem Race
  • URLs in den Suchergebnissen nach Rang

Weitere Informationen zur Ordinalregression

Die Ordinalregression wird verwendet, wenn die Bezeichnung oder Zielspalte Zahlen enthält, die Zahlen jedoch eine Rangfolge oder Reihenfolge anstelle einer numerischen Messung darstellen.

Die Vorhersage von Ordinalzahlen erfordert einen anderen Algorithmus als die Vorhersage der Werte von Zahlen auf einer kontinuierlichen Skala, da die Zahlen, die zur Darstellung der Rangfolge zugewiesen sind, keine systeminterne Skalierung haben.

Um beispielsweise die Testergebnisse von Studenten vorherzusagen, würden Sie ein Standardregressionsmodell verwenden, da die Testergebnisse der Kursteilnehmer in einem kontinuierlichen Maßstab variieren und gemessen werden können. Um die Klassenrangfolge vorherzusagen, müssen Sie jedoch ein Ordinalregressionsmodell verwenden.

Weitere Informationen zu den Untersuchungen hinter diesem Algorithmus finden Sie in diesem Dokument (pdf-Download): https://papers.nips.cc/paper/3125-ordinal-regression-by-extended-binary-classification.pdf

Konfigurieren der Ordinalregression

Dieses Modul löst ein Rangfolgeproblem als eine Reihe verwandter Klassifizierungsprobleme. Daher erstellt der Algorithmus eine Reihe erweiterter Trainingsbeispiele unter Verwendung eines binären Modells für jeden Rang und trainiert mit diesem erweiterten Satz. Dieser Vorgang kann rechenintensiv sein.

  1. Fügen Sie ihrem Experiment in Studio (klassisch) das Modul Ordinal Regression Model hinzu. Sie finden dieses Modul unter Machine Learning – Initialisieren in der Kategorie Regression.

  2. Fügen Sie ein Modul hinzu, das die binäre Klassifizierung unterstützt, und konfigurieren Sie das Modell. Es gibt mehrere zweiklassig-Module in der Klassifizierungskategorie .

  3. Verbinden das binäre Klassifizierungsmodell als Eingabe für das Modul Ordinal Regression Model (Ordinalregressionsmodell) an.

  4. Für das Ordinalregressionsmodell sind keine zusätzlichen Parameter erforderlich. Der Algorithmus wurde mit den effektivsten Parametern für die Lösung eines Rangfolgeproblems vorkonfiguriert.

  5. Verbinden eines Trainings-Datasets und des Moduls Train Model (Modell trainieren).

  6. Wählen Sie im Modul Train Model (Modell trainieren) die Spalte aus, die die Rangwerte enthält.

    Die Rangwerte müssen numerische Werte sein, aber sie müssen keine ganzen Zahlen oder positiven Zahlen sein, solange sie eine Sequenz darstellen.

    Für die Verarbeitung wird davon ausgegangen, dass die Ränge die Reihenfolge 1 bis K haben, wobei 1 der niedrigste Rang und K der höchste Rang ist. Das Modul Train Model kann jedoch auch dann funktionieren, wenn die Semantik Ihrer Skala umgekehrt ist.

    Wenn z. B. in Ihrer ursprünglichen Umfrage 1 die höchste Bewertung und 5 die niedrigste war, wirkt sich dies nicht auf die Verarbeitung des Modells aus.

  7. Führen Sie das Experiment aus.

Ergebnisse

Nach Abschluss des Trainings:

  • Um Vorhersagen zu treffen, verbinden Sie das trainierte Modell zusammen mit neuen Daten mit dem Modul Score Model .

  • Um eine Kreuzvalidierung für ein bezeichnetes DataSet durchzuführen, verbinden Sie das untrainierte Modell mit Cross-Validate Model.

Beispiele

Beispiele für die Verwendung der Ordinalregression beim maschinellen Lernen finden Sie im Azure KI-Katalog.

  • Predictive Maintenance – Schritt C: In diesem Beispiel wird ordinale Regression verwendet, um die von einem Klassifizierungsmodell ausgegebenen Werte zu rangieren. Dabei wird davon ausgegangen, dass der Wert den Schweregrad der Fehlerklassifizierung widerspiegelt.

Technische Hinweise

Die ordinale Regression wird durch die erweiterte binäre Klassifizierung implementiert, wie im Dokument mit dem Titel Ordinal Regression by Extended Binary Classification von Ling Li und Hsuan-Tien Lin in NIPS 2006 beschrieben.

Einschränkungen für Eingabedaten

Sie können jede numerische Spalte als Ziel eines Ordinalregressionsmodells verwenden. In der Praxis sollten Sie jedoch nur Daten verwenden, die eine Bestimmte Reihenfolge oder Rangfolge repräsentieren.

Die Intervalle zwischen den Rängen werden als unbekannt angenommen, und die Größe des Intervalls spielt für das Modell keine Rolle. Das Modell geht jedoch davon aus, dass die Rangfolge der natürlichen Reihenfolge der Zahlen folgt.

Das Modell selbst weist einer bestimmten Skala keine Bedeutung zu. Anders ausgedrückt: Sie können ein Modell erstellen, bei dem 1 ein guter Rang und 10 der schlechteste ist, und in einem anderen Modell davon ausgehen, dass 10 der gewünschte Rang und 1 der schlechteste ist.

Rangfolgealgorithmus

Der Trainingssatz (X,Y) besteht aus den Eingabevektoren x und den Bezeichnungen y. Die Bezeichnungen stellen Ränge im Bereich von 1 bis k nacheinander dar: 1,2, ... , K. Es wird davon ausgegangen, dass die Ränge so geordnet sind, dass 1 der niedrigste oder schlechteste Rang und K der beste oder höchste Rang ist.

Der Kern des Algorithmus besteht darin, die angegebenen Eingabefeatures X und die Bezeichnungen Y so zu ändern, dass erweiterte Beispiele verwendet werden. Anschließend wird ein binärer Klassifizierer verwendet, um das Ordinalregressionsproblem zu lösen. Der binäre Klassifizierer wird trainiert, um eine Ja/Nein-Antwort auf die Frage "Ist der Rang größer als r?" zu geben.

Beispielsweise gibt es für jeden Fall im Trainingssatz erweiterte K-1-Beispiele , und der maximale beobachtete Rang ist K. Die erweiterten Features werden gebildet, indem die i. Zeile einer K-1 x K-1-Identitätsmatrix an die Eingabefeatures für alle i angefügt wird. Die Bezeichnungen erhalten +1 für die ersten r-1 Zeilen, wenn ihr Rang r und -1 für den Rest ist.

Beispielberechnungen

Um die Funktionsweise zu veranschaulichen, soll x1 das Trainingsfeature sein, dessen Rang 3 ist, wobei der maximale beobachtete Rang 5 beträgt. Die erweiterten Beispiele für dieses Feature lauten wie folgt:

Fall Test Resultierende Bezeichnung
X11000 Ist der Rang größer als 1? Ja; daher +1
X10100 Ist der Rang größer als 2? Ja; daher +1
X10010 Ist der Rang größer als 3? Nein; daher kein zusätzliches Feature
X10001 Ist der Rang größer als 4? Nein; daher kein zusätzliches Feature

Erwartete Eingaben

Name Type Beschreibung
Untrainiertes, binäres Klassifizierungsmodell ILearner-Schnittstelle Ein untrainiertes binäres Klassifizierungsmodell

Ausgaben

Name Type BESCHREIBUNG
Untrainiertes Modell ILearner-Schnittstelle Ein untrainiertes ordinales Regressionsmodell

Siehe auch

Regression