创建多类分类模型

已完成

还可创建多类分类模型,其中可能的类大于两个。 例如,健康临床可能会扩展糖尿病模型,将患者分类为:

  • 非糖尿病
  • 1 型糖尿病
  • 2 型糖尿病

每个类概率值相加仍为 1(由于患者只可能是这三类中的一种),模型会预测得出概率最大的类。

使用多类分类模型

可以将多类分类视为多个二元分类器的组合。 有两种方法可以解决此问题:

  • 一对其余 (OVR),其中,将针对每个可能的类值创建分类器,在预测为此类的情况下为正结果,对预测为任何其他类的情况创建负预测。 例如,四个可能的形状类(方形、圆形、三角形、六边形)的分类问题要使用四个分类器来预测:
    • 正方形或非正方形
    • 圆形或非圆形
    • 三角形或非三角形
    • 六边形或非六边形
  • 一对一 (OVO),其中创建了每个可能的类对的分类器。 四个形状类的分类问题需要以下二元分类器:
    • 正方形或圆形
    • 正方形或三角形
    • 正方形或六边形
    • 圆形或三角形
    • 圆形或六边形
    • 三角形或六边形

在两种方法中,整个模型都必须考虑所有这些预测,以确定项所属的单个类别。

幸运的是,在大多数机器学习框架(包括 scikit-learn)中,实现多类分类模型并不比二元分类复杂很多,并且在大多数情况下,用于二元分类的估算器可通过抽象 OVR 算法、OVO 算法或允许选择两者之一来隐式支持多类分类。