Two-Class Bayes Point Machine

Important

Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.

À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.

La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.

Crée un modèle de classification binaire Bayes Point Machine

catégorie : Machine Learning/initialiser le modèle/la Classification

Notes

s’applique à: Machine Learning Studio (classic) uniquement

Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.

Vue d’ensemble du module

cet article explique comment utiliser le module Two-Class Bayes Point Machine dans Machine Learning Studio (classic) pour créer un modèle de classification binaire non formé.

L’algorithme de ce module utilise une approche bayésienne de la classification linéaire appelée « machine à points Bayes ». Cet algorithme se rapproche efficacement de la moyenne bayésienne théoriquement optimale des classifieurs linéaires (en termes de performances de généralisation) en choisissant un classifieur « moyen », le point de Bayes. Dans la mesure où Bayes Point Machine est un modèle de classification bayésien, il n'est pas sujet à un surajustement aux données d'apprentissage.

pour plus d’informations, consultez le billet de Chris Bishop sur le blog de Microsoft Machine Learning : adoption de l' incertitude-inférence probabiliste.

Comment configurer Two-Class machine à points de Bayes

  1. dans Machine Learning Studio (classic), ajoutez le module Two-Class Bayes Point Machine à votre expérience. vous pouvez trouver le module sous Machine Learning, initialiser le modèle, Classification.

  2. Pour nombre d’itérations d’apprentissage, tapez un nombre pour spécifier la fréquence à laquelle l’algorithme de transmission de messages itère au sein des données d’apprentissage. En général, le nombre d'itérations doit être compris entre 5 et 100.

    Plus le nombre d'itérations d'apprentissage est élevé, plus les prédictions sont précises ; toutefois, l'apprentissage sera plus lent.

    Pour la plupart des jeux de données, le paramètre par défaut de 30 itérations d'apprentissage est suffisant pour que l'algorithme effectue des prédictions précises. Des prédictions précises peuvent parfois être effectuées à l'aide de moins d'itérations. Pour les jeux de données avec des fonctionnalités hautement corrélées, il peut être avantageux d'indiquer un plus grand nombre d'itérations d'apprentissage.

  3. Sélectionnez l’option inclure le décalagesi vous souhaitez ajouter une fonctionnalité constante ou un écart à chaque instance dans l’apprentissage et la prédiction.

    L'inclusion d'un décalage est nécessaire lorsque les données ne contiennent pas déjà une fonctionnalité constante.

  4. Sélectionnez l’option autoriser les valeurs inconnues dans les fonctionnalités catégoriquespour créer un groupe de valeurs inconnues.

    Si cette option est désélectionnée, le modèle n’accepte que les valeurs contenues dans les données d’apprentissage.

    Si vous sélectionnez cette option et que vous autorisez des valeurs inconnues, le modèle peut être moins précis pour les valeurs connues, mais il peut fournir de meilleures prédictions pour les nouvelles valeurs (inconnues).

  5. Ajoutez une instance du module former le modèle et vos données d’apprentissage.

  6. Connecter les données d’apprentissage et la sortie du module Two-Class Bayes Point Machine dans le module former le modèle , puis choisissez la colonne étiquette.

  7. Exécutez l’expérience.

Résultats

Une fois l’apprentissage terminé, cliquez avec le bouton droit sur la sortie du module former le modèle pour afficher les résultats :

  • Pour afficher un résumé des paramètres du modèle, ainsi que les poids des fonctionnalités tirées de la formation, sélectionnez visualiser.

  • Pour enregistrer le modèle en vue d’une utilisation ultérieure, cliquez avec le bouton droit sur la sortie du modèle de formation, puis sélectionnez enregistrer en tant que modèle formé.

  • Pour effectuer des prédictions, utilisez le modèle formé comme entrée dans le module noter le modèle .

    Le modèle non formé peut également être passé au modèle de validation croisée pour la validation croisée par rapport à un jeu de données étiqueté.

Exemples

Pour voir comment l’ordinateur Two-Class Bayes point est utilisé dans Machine Learning, consultez les exemples d’expériences suivants dans la Azure ai Gallery:

Notes techniques

Cette section contient des détails sur l’implémentation et des questions fréquemment posées sur cet algorithme.

Les détails de la théorie de recherche d’origine et de la théorie sous-jacente sont disponibles dans ce document (PDF) : Bayes point machines, par Herbert, Graepe et Campbell

Toutefois, cette implémentation améliore l’algorithme d’origine de plusieurs façons :

Ces améliorations rendent le modèle de classification Bayes Point Machine plus robuste et plus facile à utiliser, et vous permettent d'ignorer l'étape laborieuse de réglage des paramètres.

Paramètres du module

Nom Plage Type Default Description
Nombre d’itérations d’entraînement >=1 Integer 30 Spécifier le nombre d'itérations à utiliser lors de l'apprentissage
Inclure le décalage Quelconque Boolean True Indiquer si une fonction constante ou un décalage doit être ajouté à chaque instance
Autoriser les valeurs inconnues dans les fonctionnalités catégorielles Quelconque Boolean True Si la valeur est true, un niveau supplémentaire est créé pour chaque colonne catégorielle. Tous les niveaux du jeu de données de test qui ne sont pas disponibles dans le jeu de données d'apprentissage sont mappés à ce niveau supplémentaire.

Output

Nom Type Description
Untrained model (Modèle non entraîné) Interface ILearner Modèle de classification binaire non formé

Voir aussi

Liste de modules classification A-Z