Classificatiemodellen met meerdere klassen maken

Voltooid

Het is ook mogelijk om classificatiemodellen met meerdere klassen te maken, waarin meer dan twee mogelijke klassen zijn. De gezondheidskliniek kan bijvoorbeeld het diabetesmodel uitbreiden om patiënten te classificeren als:

  • Niet-diabetisch
  • Type-1 diabetisch
  • Type-2 diabetisch

De individuele klasse waarschijnlijkheidswaarden zouden nog steeds oplopen tot een totaal van 1, omdat de patiënt zich zeker in slechts één van de drie klassen bevindt en de meest waarschijnlijke klasse zou worden voorspeld door het model.

Classificatiemodellen met meerdere klassen gebruiken

Classificatie met meerdere klassen kan worden beschouwd als een combinatie van meerdere binaire classificaties. Er zijn twee manieren waarop u het probleem aanpakt:

  • Een vs Rest (OVR) waarin een classificatie wordt gemaakt voor elke mogelijke klassewaarde, met een positief resultaat voor gevallen waarin de voorspelling deze klasse is en negatieve voorspellingen voor gevallen waarin de voorspelling een andere klasse is. Een classificatieprobleem met vier mogelijke shapeklassen (vierkant, cirkel, driehoek, zeshoek) vereist bijvoorbeeld vier classificaties die voorspellen:
    • vierkant of niet
    • cirkel of niet
    • driehoek of niet
    • zeshoek of niet
  • Eén versus één (OVO) waarin een classificatie voor elk mogelijk paar klassen wordt gemaakt. Voor het classificatieprobleem met vier shapeklassen zijn de volgende binaire classificaties vereist:
    • vierkant of cirkel
    • vierkant of driehoek
    • vierkant of zeshoek
    • cirkel of driehoek
    • cirkel of zeshoek
    • driehoek of zeshoek

In beide benaderingen moet het algemene model rekening houden met al deze voorspellingen om te bepalen tot welke categorie het item behoort.

Gelukkig is in de meeste machine learning-frameworks, waaronder Scikit-Learn, het implementeren van een classificatiemodel met meerdere klassen niet aanzienlijk complexer dan binaire classificatie. In de meeste gevallen ondersteunen de schattingen die worden gebruikt voor binaire classificatie impliciet classificatie van meerdere klassen door een OVR-algoritme, een OVO-algoritme te abstracteren of door een keuze van beide toe te staan.