Ordinale regressie

Hiermee maakt u een regressie model

Categorie: model/regressie machine learning/initialiseren

Notitie

Van toepassing op : machine learning Studio (klassiek)

Deze inhoud is alleen van toepassing op Studio (klassiek). Er zijn Vergelijk bare modules voor slepen en neerzetten toegevoegd aan Azure Machine Learning Designer. In dit artikel vindt u meer informatie over de twee versies.

Module overzicht

In dit artikel wordt beschreven hoe u de module Ordinale regressie gebruikt in azure machine learning Studio (klassiek) om een regressie model te maken dat kan worden gebruikt om gerangschikte waarden te voors pellen.

Enkele voor beelden van gerangschikte waarden:

  • Enquête-antwoorden waarmee de voorkeurs merken van de gebruiker op een schaal van 1 tot 5 worden vastgelegd
  • De volg orde van finishers in een race
  • Url's in geclassificeerde Zoek resultaten

Meer informatie over Ordinale regressie

Ordinale regressie wordt gebruikt wanneer de kolom Label of doel getallen bevat, maar de getallen vertegenwoordigen een rang schikking of volg orde in plaats van een numerieke waarde.

Voor het voors pellen van rang nummers is een ander algoritme nodig dan voor het voors pellen van de waarden van getallen op een continue schaal, omdat de nummers die zijn toegewezen aan de rang orde vertegenwoordigen geen intrinsieke schaal hebben.

Als u bijvoorbeeld de test scores van studenten wilt voors pellen, gebruikt u een standaard regressie model, omdat de test scores van studenten variëren op een continue schaal en kunnen worden gemeten. Als u echter de classificatie van de klasse wilt voors pellen, moet u een regressie model gebruiken.

Zie dit artikel (Download bare PDF) voor meer informatie over het onderzoek achter dit algoritme: https://papers.nips.cc/paper/3125-ordinal-regression-by-extended-binary-classification.pdf

Een ordinale regressie configureren

Met deze module kunt u een probleem met een classificatie oplossen als een reeks gerelateerde classificatie problemen. Daarom maakt de algoritme een reeks uitgebreide trainings voorbeelden met behulp van een binair model voor elke positie en treinen tegen die uitgebreide set. Deze bewerking kan kostbaar zijn.

  1. Voeg de module voor het Ordinale regressie model toe aan uw experiment in Studio (klassiek). U kunt deze module vinden onder machine learning-Initializein de categorie regressie .

  2. Voeg een module toe die binaire classificatie ondersteunt en configureer het model. Er zijn verschillende twee klassen modules in de classificatie categorie.

  3. Verbind het binaire classificatie model als invoer voor de module voor het Ordinale regressie model .

  4. Er zijn geen aanvullende para meters vereist voor het herregressie model van het rang telwoord; het algoritme is vooraf geconfigureerd met de meest efficiënte para meters voor het oplossen van een probleem met de classificatie.

  5. Verbind een trainings gegevensset en de module Train model .

  6. Selecteer in de module Train model de kolom die de rang waarden bevat.

    De rang waarden moeten numerieke waarden zijn, maar ze moeten geen gehele getallen of positieve getallen bevatten, zolang ze een reeks vertegenwoordigen.

    Voor de verwerking wordt ervan uitgegaan dat de volg orde 1 tot en met K, waarbij 1 de laagste rang heeft, en K de hoogste positie is. De Train model -module kan echter wel werken, zelfs als de semantiek van uw schaal wordt omgekeerd.

    Als in uw oorspronkelijke enquête bijvoorbeeld 1 de hoogste score is en 5 de laagste is, is dit niet van invloed op de verwerking van het model.

  7. Voer het experiment uit.

Resultaten

Nadat de training is voltooid:

  • Als u voor spellingen wilt doen, verbindt u het getrainde model samen met de nieuwe gegevens in de module score model .

  • Als u kruis validatie wilt uitvoeren op een gegevensgestuurde gegevensset, verbindt u het niet- trainde model om het model te valideren.

Voorbeelden

Zie de Azure AI Galleryvoor voor beelden van de manier waarop Ordinale regressie wordt gebruikt in machine learning.

  • Voor speld onderhoud-stap C: in dit voor beeld wordt gebruikgemaakt van Ordinale regressie voor het classificeren van de waarden die worden uitgevoerd door een classificatie model, op basis van de veronderstelling dat de waarde de ernst van de fout classificatie weerspiegelt.

Technische opmerkingen

Het Ordinale regressie algoritme dat in deze leerer wordt gebruikt, wordt geïmplementeerd door een uitgebreide binaire classificatie, zoals wordt beschreven in het document met de naam van het gebreide nummer regressie door middel van uitgebreide binaire classificatie, namelijk Li en Hsuan-Tiene, in NIPS 2006.

Beperkingen voor invoer gegevens

U kunt een wille keurige numerieke kolom gebruiken als het doel van een rangord regressie model, maar in de praktijk moet u alleen gegevens gebruiken die een bepaalde sorteer volgorde of rang schikking vertegenwoordigen.

De intervallen tussen de rangingen worden geacht onbekend te zijn en de grootte van het interval is niet van belang voor het model. het model veronderstelt echter dat de volg orde van de rang schikkingen de natuurlijke volg orde van getallen volgt.

Het model zelf wijst geen betekenis toe aan een bepaalde schaal. Met andere woorden, u kunt één model maken waarin 1 een goede positie is en 10 het slechtste is, en in een ander model wordt ervan uitgegaan dat 10 de gewenste positie is en 1 het slechtste is.

Classificatie algoritme

De set met trainingen (X, Y) bestaat uit invoer vectoren X en labels Y. De labels vertegenwoordigen de rang schikking van 1 tot en met k in volg orde: 1, 2,... , K. Er wordt van uitgegaan dat 1 de laagste of de slechtste positie is en K de beste of hoogste positie is.

De erom van het algoritme is het wijzigen van de gegeven invoer functies X en de labels Y voor het gebruik van uitgebreide voor beelden, en vervolgens een binaire classificatie gebruiken om het opvolgings probleem van de regressie te verhelpen. De binaire classificatie is getraind om een Ja/geen antwoord te geven op de vraag, "is de positie groter dan r?"

Voor elk geval in de Trainingsset zijn er bijvoorbeeld k-1 uitgebreide voor beelden en de Maxi maal waargenomen positie K. De uitgebreide functies worden gevormd door de i-rij van een identiteits matrix van een k-1 x k-1 toe te voegen aan de invoer functies voor alle i. De labels worden opgegeven op + 1 voor de eerste r-1-rijen als de positie r en-1 voor de rest is.

Voorbeeld berekeningen

Als u wilt zien hoe het werkt, laat u x1 de trainings functie waarvan de rang orde 3 is, waarbij de Maxi maal waargenomen positie 5 is. De uitgebreide voor beelden die overeenkomen met deze functie zijn als volgt:

Case Testen Resulterende label
X11000 Is de positie groter dan 1? Klikt Daarom + 1
X10100 Is de positie groter dan 2? Klikt Daarom + 1
X10010 Is de positie groter dan 3? Geen Daarom is er geen extra functie
X10001 Is de positie groter dan 4? Geen Daarom is er geen extra functie

Verwachte invoer

Naam Type Beschrijving
Niet-getraind binair classificatie model ILearner-interface Een niet-getraind binair classificatie model

Outputs

Naam Type Beschrijving
Niet-traind model ILearner-interface Een niet-traind regressie model

Zie ook

Regressie