Entraîner le modèle

Article
05/06/2019

Important

Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.

À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.

Consultez les informations sur le déplacement des projets de machine learning de ML Studio (classique) à Azure Machine Learning.
En savoir plus sur Azure Machine Learning.

La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.

Forme un modèle de classification ou de régression de manière supervisée

catégorie : Machine Learning/Train

Notes

s’applique à: Machine Learning Studio (classic) uniquement

Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.

Vue d’ensemble du module

cet article explique comment utiliser le module former le modèle dans Machine Learning Studio (classic) pour former un modèle de classification ou de régression. La formation a lieu une fois que vous avez défini un modèle et ses paramètres et nécessite des données avec balises. Vous pouvez également utiliser le module Train Model (Entraîner le modèle) pour effectuer l’apprentissage d’un modèle existant avec de nouvelles données.

Fonctionnement du processus de formation

dans Machine Learning, la création et l’utilisation d’un modèle de Machine Learning est généralement un processus en trois étapes.

Vous configurez un modèle en choisissant un type d’algorithme particulier et en définissant ses paramètres ou hyperparamètres. Choisissez l’un des types de modèles suivants :
- Modèles de classification, basés sur les réseaux neuronaux, les arbres de décision et les forêts de décision, ainsi que d’autres algorithmes.
- Les modèles de régression, qui peuvent inclure la régression linéaire standard, ou qui utilisent d’autres algorithmes, y compris les réseaux neuronaux et la régression des baies.
Fournissez un jeu de données doté d’une étiquette et dont les données sont compatibles avec l’algorithme. Connectez les données et le modèle au module Train Model (Entraîner le modèle).

Ce que produit la formation est un format binaire spécifique, iLearner, qui encapsule les modèles statistiques appris à partir des données. Vous ne pouvez pas modifier ou lire directement ce format. Toutefois, les autres modules de Studio (Classic) peuvent utiliser ce modèle formé.

Vous pouvez également afficher les propriétés du modèle. Pour plus d’informations, consultez la section résultats .
Une fois la formation terminée, utilisez le modèle formé avec l’un des modules de notation pour effectuer des prédictions sur de nouvelles données.

Notes

D’autres tâches de Machine Learning spécialisées nécessitent différentes méthodes de formation, et Studio (Classic) fournit des modules de formation distincts. Par exemple, la détection d’images, le clustering et les detction d’anomalies utilisent tous des méthodes d’apprentissage personnalisées. L' apprentissage du modèle est destiné à une utilisation avec des modèles de régression et de classification uniquement.

Formation surveillée et non supervisée

Vous avez peut-être entendu parler de l’apprentissage supervisé ou non supervisé . L’apprentissage d’un modèle de classification ou de régression avec train Model est un exemple classique de machine learning supervisé. Cela signifie que vous devez fournir un jeu de données qui contient des données historiques à partir desquelles apprendre des modèles. Les données doivent contenir à la fois le résultat (étiquette) que vous essayez de prédire et les facteurs associés (variables). Le modèle de Machine Learning a besoin des résultats pour déterminer les fonctionnalités qui prédisent le mieux les résultats.

Pendant le processus d’apprentissage, les données sont triées par résultats et l’algorithme extrait des modèles statistiques pour générer le modèle.

L' apprentissage non supervisé indique soit que le résultat est inconnu, soit que vous choisissez de ne pas utiliser d’étiquettes connues. Par exemple, les algorithmes de clustering utilisent généralement des méthodes d’apprentissage non supervisées, mais peuvent utiliser des étiquettes si elles sont disponibles. Un autre exemple est la modélisation de rubrique à l’aide de thèmes LDA. Vous ne pouvez pas utiliser train Model avec ces algorithmes.

Conseil

Vous débutez avec Machine Learning ? Ce didacticiel vous guide tout au long du processus d’obtention des données, de configuration d’un algorithme, de formation et d’utilisation d’un modèle : créer votre première expérience machine learning

Comment utiliser l' apprentissage du modèle

dans Machine Learning Studio (classic), configurez un modèle de classification ou des modèles de modèle de régression .

Vous pouvez également effectuer l’apprentissage d’un modèle personnalisé créé à l’aide de Create R Model.
Ajoutez le module Train Model (Entraîner le modèle) à l’expérience. Ce module figure dans la catégorie Machine Learning. Développez la section Former, puis faites glisser le module Train Model (Entraîner le modèle) dans votre expérience.
Sous l’entrée de gauche, joignez le modèle non formé. Joignez le jeu de données d’apprentissage à l’entrée droite du module Train Model (Entraîner le modèle).

Le jeu de données d’apprentissage doit contenir une colonne d’étiquette. Toutes les lignes sans étiquette sont ignorées.
Pour Étiqueter la colonne, cliquez sur Launch column selector (Lancer le sélecteur de colonne), puis choisissez une seule colonne contenant les résultats que le modèle peut utiliser pour la formation.
- Pour les problèmes de classification, la colonne d’étiquette doit contenir des valeurs catégorielles ou discrètes. Il peut s’agir, par exemple, d’une évaluation oui/non, d’un code ou nom de classification de maladie ou d’un groupe de revenus. Si vous choisissez une colonne non catégorielle, le module renverra une erreur pendant la formation.
- Pour les problèmes de régression, la colonne d’étiquette doit contenir des données numériques qui représentent la variable de réponse. Dans l’idéal, les données numériques représentent une échelle continue.
Il peut s’agir, par exemple, de l’évaluation du risque de crédit, du temps entre deux pannes escompté pour un disque dur ou du nombre prévu d’appels à un centre d’appels sur une journée ou à une heure donnée. Si vous ne choisissez pas une colonne numérique, une erreur peut se produire.
- si vous ne spécifiez pas la colonne d’étiquette à utiliser, Machine Learning essaiera de déduire la colonne d’étiquette appropriée, à l’aide des métadonnées du jeu de données. S’il choisit la mauvaise colonne, utilisez le sélecteur de colonne pour résoudre ce problème.
Conseil

Si vous avez des difficultés à utiliser le sélecteur de colonne, consultez l’article Sélectionner des colonnes dans le jeu de données pour obtenir des conseils. Il décrit quelques scénarios courants et fournit des conseils pour utiliser les options WITH RULES (Avec règles) et BY NAME (Par nom).
Exécutez l’expérience. Si vous avez une grande quantité de données, cela peut prendre un certain temps.

Résultats

Une fois le modèle formé :

Pour afficher les paramètres et pondérations de fonctionnalités du modèle, cliquez avec le bouton droit sur la sortie, puis sélectionnez Visualiser.
Pour utiliser le modèle dans d’autres expériences, cliquez avec le bouton droit sur le modèle et sélectionnez Enregistrer le modèle. Tapez le nom du modèle.

Le modèle est enregistré en tant qu’instantané non mis à jour par les exécutions répétées de l’expérience.
Afin d’utiliser le modèle pour la prédiction de nouvelles valeurs, connectez-le au module Score Model (Noter le modèle) avec les nouvelles données d’entrée.

Si vous devez effectuer l’apprentissage d’un type de modèle non pris en charge par train Model, il existe plusieurs options :

Créez une méthode de calcul de score personnalisée à l’aide du script R ou utilisez l’un des nombreux packages de score R disponibles.
- Create R Model
- Exécuter un script R
Écrivez votre propre script Python pour effectuer l’apprentissage et le score d’un modèle, ou utilisez une bibliothèque python existante :
- Exécuter un script Python
Modèles de détection d’anomalie
- L' apprentissage du modèle de détection d’anomalies prend en charge les modules de détection d’anomalies dans Studio (Classic).
Modèles de recommandation
- si votre modèle utilise le Matchbox recommandé fourni dans Machine Learning, utilisez le module former Matchbox recommender .
- Si vous utilisez un algorithme différent pour l’analyse du panier d’un marché ou une recommandation, utilisez ses méthodes de formation, dans un script R ou un script Python.
Modèles de clustering
- Utilisez le modèle train clustering pour l’algorithme K-means inclus.
- Pour les autres modèles de clustering, utilisez des modules de script R ou python pour configurer et effectuer l’apprentissage des modèles.

Exemples

Pour obtenir des exemples d’utilisation du module former le modèle dans machine learning expériences, consultez les expériences suivantes dans le Azure ai Gallery:

Prévision de la vente au détail: montre comment créer, former et comparer plusieurs modèles.
Prédiction des retards de vol: montre comment former plusieurs modèles de classification associés.

Entrées attendues

Nom	Type	Description
Untrained model (Modèle non entraîné)	Interface ILearner	Apprenant non formé
Dataset	Table de données	Données de formation

Paramètres du module

Nom	Plage	Type	Default	Description
Colonne d'étiquette	n'importe laquelle	ColumnSelection		Sélectionnez la colonne qui contient le libellé ou la colonne de résultat

Sorties

Nom	Type	Description
Modèle entraîné	Interface ILearner	Apprenant formé

Exceptions

Pour obtenir la liste de toutes les erreurs de module, consultez codes d’erreur de module.

Exception	Description
Erreur 0032	Une exception se produit si l’argument n’est pas numérique.
Erreur 0033	Une exception se produit si l’argument est une valeur infinie (Infinity).
Erreur 0083	Une exception se produit si le jeu de données utilisé pour la formation n’est pas compatible avec un type concret d’apprenant.
Erreur 0035	Une exception se produit si aucune fonctionnalité n’est fournie pour un utilisateur ou un élément donné.
Erreur 0003	Cette exception se produit si une ou plusieurs entrées sont null ou vide.
Erreur 0020	Une exception se produit si le nombre de colonnes de certains jeux de données transmis au module est trop faible.
Erreur 0021	Une exception se produit si le nombre de lignes de certains jeux de données transmis au module est trop faible.
Erreur 0013	Une exception se produit si la transmission à l'apprenant du module a un type non valide.

Voir aussi

Évaluer le modèle
Liste alphabétique des modules

Share via

Entraîner le modèle

Vue d’ensemble du module

Fonctionnement du processus de formation

Formation surveillée et non supervisée

Comment utiliser l' apprentissage du modèle

Résultats

Exemples

Entrées attendues

Paramètres du module

Sorties

Exceptions

Voir aussi

Ressources supplémentaires

Share via

Entraîner le modèle

Vue d’ensemble du module

Fonctionnement du processus de formation

Formation surveillée et non supervisée

Comment utiliser l' apprentissage du modèle

Résultats

Tâches associées

Exemples

Entrées attendues

Paramètres du module

Sorties

Exceptions

Voir aussi

Ressources supplémentaires