One-vs-All Multiclass

Cet article décrit comment utiliser le composant One-vs-All Multiclass dans le concepteur Azure Machine Learning. L’objectif est de créer un modèle de classification capable de prédire plusieurs classes, en utilisant l’approche One-versus-All (un contre tous).

Ce composant est utile pour créer des modèles qui prédisent trois résultats possibles, lorsque le résultat dépend de variables de prédiction continues ou catégoriques. Cette méthode vous permet également d’utiliser des méthodes de classification binaire pour les problèmes qui requièrent plusieurs classes de sortie.

En savoir plus sur les modèles One-versus-All

Certains algorithmes de classification permettent d’utiliser plus de deux classes par conception. D’autres limitent les résultats possibles à l’une des deux valeurs (modèle binaire ou à deux classes). Toutefois, même les algorithmes de classification binaire peuvent être adaptés aux tâches de classification multiclasse via diverses stratégies.

Ce composant implémente la méthode One-versus-All, dans laquelle un modèle binaire est créé pour chacune des multiples classes de sortie. Le composant évalue chacun de ces modèles binaires pour les classes individuelles par rapport à son complément (toutes les autres classes du modèle) comme s’il s’agissait d’un problème de classification binaire. Outre son efficacité de calcul (seuls les classifieurs n_classes sont nécessaires), l’un des avantages de cette approche est son interprétabilité. Étant donné que chaque classe est représentée par un seul et unique classifieur, il est possible d’obtenir des informations sur la classe en inspectant son classifieur correspondant. Il s’agit de la stratégie la plus couramment utilisée pour la classification multiclasse. C’est un choix par défaut équitable. Le composant effectue ensuite une prédiction en exécutant ces classifieurs binaires et en choisissant la prédiction dotée du plus haut score de confiance.

En résumé, le composant crée un ensemble de modèles individuels et fusionne ensuite les résultats afin de créer un modèle unique qui prédit toutes les classes. Tout classifieur binaire peut être utilisé comme base pour un modèle One-versus-All.

Par exemple, supposons que vous configurez un modèle Machine à vecteurs de support à deux classes et que vous le fournissez en entrée au composant One-vs-All Multiclass. Le composant crée des modèles de machine à vecteurs de support à deux classes pour tous les membres de la classe de sortie. Il applique ensuite la méthode One-versus-All pour combiner les résultats de toutes les classes.

Le composant utilise OneVsRestClassifier de sklearn. Pour plus d’informations, cliquez ici.

Comment configurer le classifieur One-vs-All Multiclass

Ce composant crée un ensemble de modèles de classification binaire pour analyser plusieurs classes. Pour utiliser ce composant, vous devez tout d’abord configurer et entraîner un modèle de classification binaire.

Vous connectez le modèle binaire au composant One-vs-All Multiclass. Ensuite, vous entraînez l’ensemble des modèles en utilisant Entraîner le modèle avec un jeu de données d’entraînement étiqueté.

Lorsque vous combinez les modèles, le module One-vs-All Multiclass crée plusieurs modèles de classification binaire, optimise l’algorithme pour chaque classe, puis fusionne les modèles. Le composant effectue ces tâches même si le jeu de données d’entraînement peut avoir plusieurs valeurs de classe.

  1. Ajoutez le composant One-vs-All Multiclass à votre pipeline dans le concepteur. Vous pouvez trouver ce composant sous Machine Learning - Initialiser, dans la catégorie Classification.

    Le classifieur One-vs-All Multiclass ne comprend pas de paramètres configurables. Toutes les personnalisations doivent être effectuées dans le modèle de classification binaire fourni comme entrée.

  2. Ajoutez un modèle de classification binaire au pipeline et configurez ce modèle. Par exemple, vous pouvez utiliser Machine à vecteurs de support à deux classes ou Arbre de décision optimisé à deux classes.

  3. Ajoutez le composant Entraîner le modèle à votre pipeline. Connectez le classifieur non entraîné qui correspond à la sortie du module One-vs-All Multiclass.

  4. Sur l’autre entrée du module Entraîner le modèle, connectez un jeu de données d’entraînement étiqueté qui comprend plusieurs valeurs de classe.

  5. Envoyez le pipeline.

Résultats

Une fois l’entraînement terminé, vous pouvez utiliser le modèle pour effectuer des prédictions multiclasses.

Vous pouvez également transmettre le classifieur non entraîné au module Modèle de validation croisée pour une validation croisée par rapport à un jeu de données de validation étiqueté.

Étapes suivantes

Consultez les composants disponibles pour Azure Machine Learning.