Analyse et simulation de contrefactuels

Les contrefactuels de simulation répondent à la question « qu’est-ce que le modèle prédirait si vous changiez l’entrée d’action ». Ils permettent de comprendre et de déboguer un modèle Machine Learning au niveau de la façon dont il réagit aux changements d’entrée (caractéristique).

Les techniques d’interprétabilité standard se rapprochent d’un modèle Machine Learning ou classent les caractéristiques par leur importance prédictive. Par contre, l’analyse de contrefactuels « interroge » un modèle pour déterminer quelles modifications sur un point de données particulier renverseraient la décision du modèle.

Une telle analyse permet de démêler l'impact de différentes caractéristiques corrélées isolément. Elle vous permet aussi d’acquérir une compréhension plus nuancée du degré de changement de caractéristique nécessaire pour voir un renversement de décision pour des modèles de classification et un changement de décision pour des modèles de régression.

Le composant Analyse et simulation de contrefactuels du tableau de bord IA responsable a deux fonctions :

  • Générer un ensemble d’exemples avec des modifications minimales d’un point particulier de manière à changer la prédiction du modèle (montrant les points de données les plus proches avec des prédictions de modèle opposées).
  • Permettre aux utilisateurs de générer leurs propres perturbations de simulation pour comprendre comment le modèle réagit à des changements de caractéristiques.

L’une des principales différences du composant Analyse de contrefactuels du tableau de bord IA responsable est le fait que vous pouvez identifier les caractéristiques à modifier et les marges autorisées pour des exemples de contrefactuels valides et logiques.

Les fonctionnalités de ce composant viennent du package DiCE.

Utilisez des contrefactuels de simulation lorsque vous devez :

  • Examiner des critères d'impartialité et de fiabilité en tant qu'évaluateur de décision, en perturbant des attributs sensibles tels que le genre, l’origine ethnique, puis en observant si les prédictions du modèle changent.
  • Déboguer en profondeur des instances d’entrée spécifiques.
  • Fournir des solutions aux utilisateurs et déterminer ce qu'ils peuvent faire pour obtenir un résultat souhaitable du modèle.

Comment les exemples contrefactuels sont-ils générés ?

Pour générer des contrefactuels, DiCE implémente quelques techniques indépendantes du modèle. Ces méthodes s'appliquent à tout classificateur ou régresseur de boîte opaque. Elles sont basées sur un échantillonnage de points proches d'un point d'entrée, tout en optimisant une fonction de perte basée sur la proximité (et éventuellement la densité, la diversité et la faisabilité). Les méthodes actuellement prises en charge sont les suivantes :

  • Recherche aléatoire : Cette méthode échantillonne de manière aléatoire des points proches d’un point de requête et retourne des contrefactuels comme points dont l’étiquette prédite est la classe désirée.
  • Recherche génétique : Cette méthode échantillonne des points en utilisant un algorithme génétique, avec l’objectif combiné d’optimiser la proximité du point de requête, en changeant le moins de caractéristiques possible et en cherchant une diversité parmi les contrefactuels générés.
  • Recherche d’arborescence KD : Cet algorithme retourne des contrefactuels du jeu de données d’entraînement. Il construit une arborescence KD sur les points de données d’entraînement reposant sur une fonction de distance, puis retourne les points les plus proches d’un point de requête particulier qui génère l’étiquette prédite souhaitée.

Étapes suivantes