Ordinal Regression

Erstellt ein ordinales Regressionsmodell

Kategorie: Machine Learning/Modell/Regression initialisieren

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Dieser Inhalt bezieht sich nur auf Studio (klassisch). Ähnliche Drag & Drop-Module wurden Azure Machine Learning-Designer hinzugefügt. Weitere Informationen finden Sie in diesem Artikel zum Vergleich der beiden Versionen.

Modulübersicht

In diesem Artikel wird beschrieben, wie Sie das Ordinal Regression -Modul in Azure Machine Learning Studio (klassisch) verwenden, um ein Regressionsmodell zu erstellen, das zum Vorhersagen von Rang Werten verwendet werden kann.

Einige Beispiele für Rang Werte:

  • Umfrage Antworten, die die bevorzugten Marken von Benutzern auf einer 1 bis 5 Skala erfassen
  • Die Reihenfolge der Finisher in einem Race
  • URLs in Rang Folge Suchergebnissen

Weitere Informationen zur ordinalen Regression

Die ordinale Regression wird verwendet, wenn die Bezeichnung oder die Ziel Spalte Zahlen enthält, aber die Zahlen stellen eine Rangfolge oder eine Reihenfolge anstelle einer numerischen Messung dar.

Die Vorhersage von Ordinalzahlen erfordert einen anderen Algorithmus als das Vorhersagen der Werte von Zahlen in einer kontinuierlichen Skala, da die Zahlen, die zur Darstellung der Rangfolge zugewiesen sind, keine systeminterne Skalierung aufweisen.

Wenn Sie z. b. die Testergebnisse der Studenten vorhersagen möchten, verwenden Sie ein Standard Regressionsmodell, da die Testergebnisse der Schüler und Studenten auf einer kontinuierlichen Skala variieren und gemessen werden können. Sie müssen jedoch ein ordinales Regressionsmodell verwenden, um die Rangfolge der Klasse vorherzusagen.

Weitere Informationen zur Untersuchung dieses Algorithmus finden Sie in diesem Whitepaper (PDF-Datei herunterladen): https://papers.nips.cc/paper/3125-ordinal-regression-by-extended-binary-classification.pdf

Konfigurieren der ordinalen Regression

Dieses Modul löst ein Rang folgeproblem als eine Reihe verwandter Klassifizierungs Probleme. Daher erstellt der Algorithmus eine Reihe von erweiterten Schulungs Beispielen, wobei ein binäres Modell für jeden Rang verwendet wird, und trainiert für diese erweiterte Menge. Dieser Vorgang kann Rechen intensiv sein.

  1. Fügen Sie das Modul Ordinal Regression Model zu Ihrem Experiment in Studio (klassisch) hinzu. Sie finden dieses Modul unter Machine Learning-Initialize in der Kategorie Regression .

  2. Fügen Sie ein Modul hinzu, das die binäre Klassifizierung unterstützt, und konfigurieren Sie das Modell. Es gibt mehrere zweiklassige Module in der Klassifizierungs Kategorie.

  3. Verbinden Sie das binäre Klassifizierungs Modell als Eingabe für das Modul " Ordinal Regression Model ".

  4. Im ordinalen Regressionsmodell sind keine zusätzlichen Parameter erforderlich. der Algorithmus wurde mit den effektivsten Parametern zum Lösen eines Rang Folge Problems vorkonfiguriert.

  5. Verbinden eines Trainings Datasets und des Moduls Train Model .

  6. Wählen Sie im Modul Train Model die Spalte aus, die die Rang Werte enthält.

    Die Rang Werte müssen numerische Werte sein, Sie müssen jedoch keine Ganzzahlen oder positiven Zahlen sein, solange Sie eine Sequenz darstellen.

    Bei der Verarbeitung wird angenommen, dass die Ränge die Reihenfolge 1 bis K aufweisen, wobei 1 der niedrigste Rang und K der höchste Rang ist. Das Modul Train Model kann jedoch auch dann funktionieren, wenn die Semantik Ihrer Skala umgekehrt wird.

    Wenn z. b. in der ursprünglichen Umfrage 1 das höchste Ergebnis und 5 der niedrigste Wert ist, wirkt sich dies nicht auf die Verarbeitung des Modells aus.

  7. Führen Sie das Experiment aus.

Ergebnisse

Nach Abschluss des Trainings:

  • Verbinden Sie das trainierte Modell zusammen mit neuen Daten mit dem Modul Score Model , um Vorhersagen zu treffen.

  • Um eine Kreuz Validierung für ein bezeichnetes DataSet auszuführen, verbinden Sie das untrainierte Modell mit Cross-Validate Model.

Beispiele

Beispiele für die Verwendung der ordinalen Regression in Machine Learning finden Sie in der Azure AI Gallery.

  • Predictive Maintenance-Schritt C: in diesem Beispiel wird die ordinale Regression verwendet, um Werte, die von einem Klassifizierungs Modell ausgegeben werden, zu ordnen. dabei wird davon ausgegangen, dass der Wert den Schweregrad der Fehler Klassifizierung widerspiegelt.

Technische Hinweise

Die ordinale Regression wird durch die erweiterte binäre Klassifizierung implementiert, wie im Dokument mit dem Titel Ordinal Regression by Extended Binary Classification von Ling Li und Hsuan-Tien Lin in NIPS 2006 beschrieben.

Einschränkungen für Eingabedaten

Sie können eine beliebige numerische Spalte als Ziel eines ordinalen Regressionsmodells verwenden. in der Praxis sollten Sie jedoch nur Daten verwenden, die eine Sortierreihenfolge oder Rangfolge darstellen.

Die Intervalle zwischen den Reihen werden als unbekannt angesehen, und die Größe des Intervalls ist für das Modell nicht von Bedeutung. beim Modell wird jedoch davon ausgegangen, dass die Reihenfolge der Ränge der natürlichen Reihenfolge der Zahlen entspricht.

Das Modell selbst weist einer bestimmten Skala keine Bedeutung zu. Anders ausgedrückt: Sie können ein Modell erstellen, bei dem 1 ein guter Rang und 10 das schlechteste ist, und in einem anderen Modell wird angenommen, dass 10 der gewünschte Rang und 1 der schlechteste Wert ist.

Rang folgen Algorithmus

Der Trainings Satz (X, Y) besteht aus Eingabe Vektoren X und Bezeichnungen Y. Die Bezeichnungen repräsentieren die Ränge von 1 bis k in der folgenden Reihenfolge: 1, 2,... , K. Es wird davon ausgegangen, dass die Ränge geordnet sind, sodass 1 der niedrigste oder schlechteste Rang ist und K der beste oder höchste Rang ist.

Der Kernpunkt des Algorithmus besteht darin, die angegebenen Eingabe Features X und die Bezeichnungen Y so zu ändern, dass Erweiterte Beispiele verwendet werden. Anschließend wird ein binärer Klassifizierer verwendet, um das Problem bei der ordinalen Regression zu lösen Der binäre Klassifizierer wird so trainiert, dass er eine Ja/Nein-Antwort auf die Frage "ist der Rang größer als r?" gibt.

Für jeden Fall im Trainings Satz gibt es z. b. k-1 Erweiterte Beispiele, und der maximal beobachtete Rang ist k. Die erweiterten Funktionen werden gebildet, indem die i th -Zeile einer k-1 x k-1-Identitätsmatrix an die Eingabe Features für alle i angehängt wird. Die Bezeichnungen erhalten für die ersten r-1 Zeilen den Wert + 1, wenn der Rang r ist, und-1 für den Rest.

Beispiel Berechnungen

Um die Funktionsweise zu veranschaulichen, muss x1 das Trainings Feature sein, dessen Rang 3 ist, bei dem der maximale beobachtete Rang 5 ist. Die folgenden erweiterten Beispiele entsprechen diesem Feature:

Fall Test Resultierende Bezeichnung
X11000 Ist der Rang größer als 1? Zwar daher + 1
X10100 Ist der Rang größer als 2? Zwar daher + 1
X10010 Ist der Rang größer als 3? Gar daher keine zusätzliche Funktion
X10001 Ist der Rang größer als 4? Gar daher keine zusätzliche Funktion

Erwartete Eingaben

Name Typ BESCHREIBUNG
Untrainiertes, binäres Klassifizierungsmodell ILearner-Schnittstelle Ein untrainiertes binäres Klassifizierungsmodell

Ausgaben

Name Typ BESCHREIBUNG
Untrainiertes Modell ILearner-Schnittstelle Ein untrainiertes ordinales Regressionsmodell

Weitere Informationen

Regression