Créer, examiner et déployer des modèles de machine learning automatisé avec Azure Machine LearningCreate, review, and deploy automated machine learning models with Azure Machine Learning

Dans cet article, vous allez apprendre à créer, à explorer et à déployer des modèles de machine learning automatisé sans la moindre ligne de code dans le studio Azure Machine Learning.In this article, you learn how to create, explore, and deploy automated machine learning models without a single line of code in Azure Machine Learning studio.

Le machine learning automatisé est un processus dans lequel le meilleur algorithme de machine learning à utiliser pour vos données spécifiques est automatiquement sélectionné.Automated machine learning is a process in which the best machine learning algorithm to use for your specific data is selected for you. Ce processus vous permet de générer rapidement des modèles Machine Learning.This process enables you to generate machine learning models quickly. Apprenez-en davantage sur Machine Learning automatisé.Learn more about automated machine learning.

Pour obtenir un exemple de bout en bout, consultez le tutoriel sur la création d’un modèle de classification avec l’interface de ML automatisé d’Azure Machine Learning.For an end to end example, try the tutorial for creating a classification model with Azure Machine Learning's automated ML interface.

Pour une expérience basée sur du code Python, configurez vos expériences de machine learning automatisé avec le SDK Azure Machine Learning.For a Python code-based experience, configure your automated machine learning experiments with the Azure Machine Learning SDK.

PrérequisPrerequisites

Bien démarrerGet started

  1. Connectez-vous à Azure Machine Learning Studio.Sign in to Azure Machine Learning studio.

  2. Sélectionnez votre abonnement et votre espace de travail.Select your subscription and workspace.

  3. Accédez au volet gauche.Navigate to the left pane. Sélectionnez Automated ML (ML automatisé) sous la section Author (Auteur).Select Automated ML under the Author section.

Volet de navigation d’Azure Machine Learning StudioAzure Machine Learning studio navigation pane

S’il s’agit de votre première expérience, vous verrez une liste vide et des liens vers la documentation.If this is your first time doing any experiments, you'll see an empty list and links to documentation.

Dans le cas contraire, vous verrez une liste de vos expériences récentes Machine Learning automatisé, y compris celles créées avec le kit de développement logiciel (SDK).Otherwise, you'll see a list of your recent automated machine learning experiments, including those created with the SDK.

Créer et exécuter une expérienceCreate and run experiment

  1. Sélectionnez + Nouvelle exécution de ML automatisé et remplissez le formulaire.Select + New automated ML run and populate the form.

  2. Sélectionnez un jeu de données à partir de votre conteneur de stockage ou créez un nouveau jeu de données.Select a dataset from your storage container, or create a new dataset. Les jeux de données peuvent être créés à partir de fichiers locaux, d’URL Web, de magasins de données ou de Azure Open Datasets.Datasets can be created from local files, web urls, datastores, or Azure open datasets. En savoir plus sur la création de jeux de données.Learn more about dataset creation.

    Important

    Configuration requise pour les données de formation :Requirements for training data:

    • Les données doivent être sous forme tabulaire.Data must be in tabular form.
    • La valeur que vous souhaitez prédire (colonne cible) doit être présente dans les données.The value you want to predict (target column) must be present in the data.
    1. Pour créer un jeu de données à partir d’un fichier sur votre ordinateur local, sélectionnez +Créer un jeu de données, puis sélectionnez À partir d’un fichier local.To create a new dataset from a file on your local computer, select +Create dataset and then select From local file.

    2. Dans le formulaire Informations de base, donnez un nom unique à votre jeu de données et indiquez éventuellement une description.In the Basic info form, give your dataset a unique name and provide an optional description.

    3. Sélectionnez Suivant pour ouvrir le formulaire Sélection d’un magasin de données et de fichiers.Select Next to open the Datastore and file selection form. Sur ce formulaire, vous sélectionnez l’emplacement où charger votre jeu de données : choisissez le conteneur de stockage par défaut qui est automatiquement créé avec votre espace de travail ou un conteneur de stockage que vous voulez utiliser pour l’expérience.On this form you select where to upload your dataset; the default storage container that's automatically created with your workspace, or choose a storage container that you want to use for the experiment.

      1. Si vos données se trouvent derrière un réseau virtuel, vous devez activer la fonction permettant d’ignorer la validation pour vous assurer que l’espace de travail peut accéder à vos données.If your data is behind a virtual network, you need to enable the skip the validation function to ensure that the workspace can access your data. Pour plus d’informations, consultez Utiliser Azure Machine Learning Studio dans un réseau virtuel Azure.For more information, see Use Azure Machine Learning studio in an Azure virtual network.
    4. Sélectionnez Parcourir pour charger le fichier de données de votre jeu de données.Select Browse to upload the data file for your dataset.

    5. Vérifiez l’exactitude du formulaire Settings and preview (Paramètres et aperçu).Review the Settings and preview form for accuracy. Le formulaire est rempli intelligemment en fonction du type de fichier.The form is intelligently populated based on the file type.

      ChampField DescriptionDescription
      Format de fichierFile format Définit la disposition et le type des données stockées dans un fichier.Defines the layout and type of data stored in a file.
      DélimiteurDelimiter Un ou plusieurs caractères utilisés pour spécifier la limite entre des régions indépendantes et séparées dans du texte brut ou d’autres flux de données.One or more characters for specifying the boundary between separate, independent regions in plain text or other data streams.
      EncodageEncoding Identifie la table de schéma bits/caractères à utiliser pour lire votre jeu de données.Identifies what bit to character schema table to use to read your dataset.
      En-têtes de colonneColumn headers Indique la façon dont les éventuels en-têtes du jeu de données sont traités.Indicates how the headers of the dataset, if any, will be treated.
      Ignorer les lignesSkip rows Indique le nombre éventuel de lignes ignorées dans le jeu de données.Indicates how many, if any, rows are skipped in the dataset.

      Sélectionnez Suivant.Select Next.

    6. Le formulaire Schéma est rempli intelligemment en fonction des sélections effectuées dans le formulaire Paramètres et aperçu.The Schema form is intelligently populated based on the selections in the Settings and preview form. Ici, configurez le type de données pour chaque colonne, passez en revue les noms des colonnes et sélectionnez celles à ne pas inclure dans votre expérience.Here configure the data type for each column, review the column names, and select which columns to Not include for your experiment.

      Sélectionnez Next (Suivant).Select Next.

    7. Le formulaire Confirmer les détails est un résumé des informations précédemment renseignées sur les formulaires Informations de base et Paramètres et aperçu.The Confirm details form is a summary of the information previously populated in the Basic info and Settings and preview forms. Vous avez également la possibilité de créer un profil de données pour votre jeu de données à l’aide d’un calcul activé pour le profilage.You also have the option to create a data profile for your dataset using a profiling enabled compute. En savoir plus sur le profilage des données.Learn more about data profiling.

      Sélectionnez Suivant.Select Next.

  3. Sélectionnez votre jeu de données récemment créé une fois qu’il apparaît.Select your newly created dataset once it appears. Vous pouvez également afficher un aperçu du jeu de données et des exemples de statistiques.You are also able to view a preview of the dataset and sample statistics.

  4. Dans le formulaire Configurer l’exécution, sélectionnez Créer , puis entrez didacticiel-automl-deploy pour le nom de l’expérience.On the Configure run form, select Create new and enter Tutorial-automl-deploy for the experiment name.

  5. Sélectionnez une colonne cible ; il s’agit de la colonne sur laquelle vous voulez effectuer des prédictions.Select a target column; this is the column that you would like to do predictions on.

  6. Sélectionnez un calcul pour le profilage de données et le travail de formation.Select a compute for the data profiling and training job. Vos calculs existants sont disponibles dans la liste déroulante.A list of your existing computes is available in the dropdown. Pour créer un calcul, suivez les instructions de l’étape 7.To create a new compute, follow the instructions in step 7.

  7. Sélectionnez Créer un nouveau calcul afin de configurer votre contexte de calcul pour cette expérience.Select Create a new compute to configure your compute context for this experiment.

    ChampField DescriptionDescription
    Nom du calculCompute name Entrez un nom unique qui identifie votre contexte de calcul.Enter a unique name that identifies your compute context.
    Priorité de machine virtuelleVirtual machine priority Les machines virtuelles basse priorité sont moins chères, mais ne garantissent pas les nœuds de calcul.Low priority virtual machines are cheaper but don't guarantee the compute nodes.
    Type de machine virtuelleVirtual machine type Sélectionnez l’UC ou le GPU pour le type de machine virtuelle.Select CPU or GPU for virtual machine type.
    Taille de la machine virtuelleVirtual machine size Sélectionnez la taille de la machine virtuelle pour votre calcul.Select the virtual machine size for your compute.
    Nombre minimal/maximal de nœudsMin / Max nodes Pour profiler des données, vous devez spécifier un ou plusieurs nœuds.To profile data, you must specify 1 or more nodes. Entrez le nombre maximal de nœuds pour votre calcul.Enter the maximum number of nodes for your compute. La valeur par défaut est de 6 nœuds pour un calcul AML.The default is 6 nodes for an AML Compute.
    Paramètres avancésAdvanced settings Ces paramètres vous permettent de configurer un compte d’utilisateur et un réseau virtuel existant pour votre expérience.These settings allow you to configure a user account and existing virtual network for your experiment.

    Sélectionnez Create (Créer).Select Create. La création d’un calcul peut prendre quelques minutes.Creation of a new compute can take a few minutes.

    Notes

    Le nom de votre calcul indique si le profilage est activé pour le calcul que vous sélectionnez/créez.Your compute name will indicate if the compute you select/create is profiling enabled. (Pour plus d’informations, consultez la section sur le profilage des données).(See the section data profiling for more details).

    Sélectionnez Suivant.Select Next.

  8. Dans le formulaire Type de tâche et paramètres, sélectionnez le type de tâche : classification, régression ou prévision.On the Task type and settings form, select the task type: classification, regression, or forecasting. Pour plus d’informations, consultez Types de tâches pris en charge.See supported task types for more information.

    1. Pour la classification, vous pouvez également activer le deep learning.For classification, you can also enable deep learning.

      Si le deep learning est activé, la validation est limitée à la division train_validation.If deep learning is enabled, validation is limited to train_validation split. Découvrez-en plus sur les options de validation.Learn more about validation options.

    2. Pour les prévisions :For forecasting you can,

      1. Activez le deep learning.Enable deep learning.

      2. Sélectionnez la colonne d'heure : cette colonne contient les données d'heure à utiliser.Select time column: This column contains the time data to be used.

      3. Sélectionnez l'horizon de prévision : Indiquez le nombre d’unités de temps (minutes/heures/jours/semaines/mois/années) que le modèle sera en mesure de prédire.Select forecast horizon: Indicate how many time units (minutes/hours/days/weeks/months/years) will the model be able to predict to the future. Plus le modèle doit prédire dans un avenir lointain, moins il sera précis.The further the model is required to predict into the future, the less accurate it will become. En savoir plus sur les prévisions et l'horizon de prévision.Learn more about forecasting and forecast horizon.

  9. (Facultatif) Voir des paramètres de configuration supplémentaires : paramètres supplémentaires que vous pouvez utiliser pour mieux contrôler la tâche d’entraînement.(Optional) View addition configuration settings: additional settings you can use to better control the training job. Sinon, les valeurs par défaut sont appliquées en fonction de la sélection de l’expérience et des données.Otherwise, defaults are applied based on experiment selection and data.

    Configurations supplémentairesAdditional configurations DescriptionDescription
    Métrique principalePrimary metric Métrique principale utilisée pour évaluer votre modèle.Main metric used for scoring your model. En savoir plus sur les métriques du modèle.Learn more about model metrics.
    Expliquer le meilleur modèleExplain best model Sélectionnez cette option pour activer ou désactiver l’affichage d’explications du meilleur modèle recommandé.Select to enable or disable, in order to show explanations for the recommended best model.
    Cette fonctionnalité n’est actuellement pas disponible pour certains algorithmes de prévision.This functionality is not currently available for certain forecasting algorithms.
    Algorithme bloquéBlocked algorithm Sélectionnez les algorithmes que vous souhaitez exclure du travail de formation.Select algorithms you want to exclude from the training job.

    L’autorisation des algorithmes est disponible uniquement pour les expériences SDK.Allowing algorithms is only available for SDK experiments.
    Consultez les modèles pris en charge pour chaque type de tâche.See the supported models for each task type.
    Critère de sortieExit criterion Quand l’un de ces critères est satisfait, le travail d’entraînement s’arrête.When any of these criteria are met, the training job is stopped.
    Durée du travail de formation (heures)  : Délai d'exécution du travail de formation.Training job time (hours): How long to allow the training job to run.
    Seuil de score de métrique : Score de métrique minimal pour tous les pipelines.Metric score threshold: Minimum metric score for all pipelines. Ainsi, si vous avez défini une métrique cible que vous souhaitez atteindre, vous ne passez pas plus de temps sur le travail de formation que nécessaire.This ensures that if you have a defined target metric you want to reach, you do not spend more time on the training job than necessary.
    ValidationValidation Sélectionnez une des options de validation croisée à utiliser dans le travail de formation.Select one of the cross validation options to use in the training job.
    En savoir plus sur la validation croisée.Learn more about cross validation.

    Les prévisions prennent uniquement en charge la validation croisée k-fold.Forecasting only supports k-fold cross validation.
    Accès concurrentielConcurrency Nombre maximal d'itérations simultanées : Nombre maximal de pipelines (itérations) à tester dans le travail de formation.Max concurrent iterations: Maximum number of pipelines (iterations) to test in the training job. Le travail ne s'exécutera pas au-delà du nombre d’itérations spécifié.The job will not run more than the specified number of iterations. Apprenez-en davantage sur la manière dont le Machine Learning automatisé effectue plusieurs exécutions enfants sur des clusters.Learn more about how automated ML performs multiple child runs on clusters.
  10. (Facultatif) Afficher les paramètres de caractérisation : si vous choisissez d’activer Caractérisation automatique dans le formulaire Paramètres de configuration supplémentaires formulaire, les techniques caractérisation par défaut sont appliquées.(Optional) View featurization settings: if you choose to enable Automatic featurization in the Additional configuration settings form, default featurization techniques are applied. Dans Afficher les paramètres de caractérisation, vous pouvez modifier ces valeurs par défaut et les personnaliser en conséquence.In the View featurization settings you can change these defaults and customize accordingly. Découvrez comment personnaliser la caractérisation.Learn how to customize featurizations.

    Capture d’écran représentant la boîte de dialogue Sélectionner le type de tâche dans laquelle l’option View featurization settings (Voir les paramètres de caractérisation) est affichée.

Personnaliser la caractérisationCustomize featurization

Dans le formulaire Caractérisation, vous pouvez activer/désactiver la caractérisation automatique et personnaliser les paramètres correspondants pour votre expérience.In the Featurization form, you can enable/disable automatic featurization and customize the automatic featurization settings for your experiment. Pour ouvrir ce formulaire, reportez-vous à l’étape 10 de la section Créer et exécuter une expérience.To open this form, see step 10 in the Create and run experiment section.

Le tableau suivant récapitule les personnalisations actuellement disponibles via le studio.The following table summarizes the customizations currently available via the studio.

ColonneColumn PersonnalisationCustomization
InclusIncluded Spécifie les colonnes à inclure pour la formation.Specifies which columns to include for training.
Type de caractéristiqueFeature type Modifiez le type valeur de la colonne sélectionnée.Change the value type for the selected column.
Imputer avecImpute with Sélectionnez la valeur à imputer aux valeurs manquantes dans vos données.Select what value to impute missing values with in your data.

Caractérisation personnalisée d’Azure Machine Learning Studio

Exécuter une expérience et afficher les résultatsRun experiment and view results

Sélectionnez Terminer pour exécuter votre expérience.Select Finish to run your experiment. Le processus de préparation de l’expérience peut prendre jusqu’à 10 minutes.The experiment preparing process can take up to 10 minutes. Les travaux de formation peuvent prendre 2 à 3 minutes supplémentaires pour que chaque pipeline se termine.Training jobs can take an additional 2-3 minutes more for each pipeline to finish running.

Notes

Les algorithmes utilisés par le ML automatisé présentent un fonctionnement aléatoire inhérent qui peut provoquer de légères variations dans un score de métrique final de modèle recommandé, comme la précision.The algorithms automated ML employs have inherent randomness that can cause slight variation in a recommended model's final metrics score, like accuracy. Le ML automatisé exécute également des opérations au niveau des données, telles que le fractionnement de test de formation, le fractionnement de validation de formation ou la validation croisée, le cas échéant.Automated ML also performs operations on data such as train-test split, train-validation split or cross-validation when necessary. Par conséquent, si vous exécutez plusieurs fois une expérience avec les mêmes paramètres de configuration et la même métrique principale, vous constaterez probablement des variations dans chaque score de métrique finale d’expériences, en raison de ces facteurs.So if you run an experiment with the same configuration settings and primary metric multiple times, you'll likely see variation in each experiments final metrics score due to these factors.

Afficher les détails de l'expérienceView experiment details

L’écran Détails de l’exécution ouvre l’onglet Détails. Cet écran vous montre un récapitulatif de l’exécution de l’expérience, notamment une barre d’état en haut à côté du numéro de l’exécution.The Run Detail screen opens to the Details tab. This screen shows you a summary of the experiment run including a status bar at the top next to the run number.

L’onglet Modèles contient une liste des modèles créés affichés selon leur score de métrique.The Models tab contains a list of the models created ordered by the metric score. Par défaut, le modèle qui obtient la valeur la plus élevée d’après la métrique choisie figure en haut de la liste.By default, the model that scores the highest based on the chosen metric is at the top of the list. À mesure que le travail de formation essaie plus de modèles, ceux-ci sont ajoutés à la liste.As the training job tries out more models, they are added to the list. Utilisez cela pour obtenir une comparaison rapide des métriques des modèles déjà produits.Use this to get a quick comparison of the metrics for the models produced so far.

Détails de l’exécution

Afficher les détails de l'exécution de formationView training run details

Explorez les modèles terminés pour voir les détails de l’exécution de la formation, par exemple un résumé du modèle sous l’onglet Modèle ou les graphiques des mesures de performance sous l’onglet Mesures. En savoir plus sur les graphiques.Drill down on any of the completed models to see training run details, like a model summary on the Model tab or performance metric charts on the Metrics tab. Learn more about charts.

Détails de l’itérationIteration details

Explications de modèleModel explanations

Pour mieux comprendre votre modèle, identifiez les caractéristiques de données (brutes ou traitées) qui ont influencé les prédictions du modèle avec le tableau de bord des explications de modèle.To better understand your model, see which data features (raw or engineered) influenced the model's predictions with the model explanations dashboard.

Le tableau de bord des explications de modèle fournit une analyse globale du modèle qui a fait l'objet de l'apprentissage, avec ses prédictions et explications.The model explanations dashboard provides an overall analysis of the trained model along with its predictions and explanations. Il vous permet également d'explorer un point de données particulier et l'importance des caractéristiques individuelles.It also lets you drill into an individual data point and its individual feature importances. En savoir plus sur les visualisations du tableau de bord des explications et les tracés spécifiques.Learn more about the explanation dashboard visualizations and specific plots.

Pour obtenir des explications sur un modèle particulier :To get explanations for a particular model,

  1. Dans l'onglet Modèles, sélectionnez le modèle que vous souhaitez utiliser.On the Models tab, select the model you want to use.

  2. Sélectionnez le bouton Expliquer le modèle et fournissez un calcul utilisable pour générer les explications.Select the Explain model button and provide a compute that can be used to generate the explanations.

  3. Consultez l'état dans l'onglet Exécutions enfants.Check the Child runs tab for the status.

  4. Accédez ensuite à l'onglet Explications (préversion) qui contient le tableau de bord des explications.Once complete, navigate to the Explanations (preview) tab which contains the explanations dashboard.

    Tableau de bord des explications de modèle

Déployer votre modèleDeploy your model

Une fois le meilleur modèle disponible, déployez-le en tant que service web pour prédire de nouvelles données.Once you have the best model at hand, it is time to deploy it as a web service to predict on new data.

Conseil

Si vous cherchez à déployer un modèle qui a été généré par le biais du package automl avec le Kit de développement logiciel (SDK) Python, vous devez enregistrer votre modèle dans l’espace de travail.If you are looking to deploy a model that was generated via the automl package with the Python SDK, you must register your model to the workspace.

Une fois que vous avez enregistré le modèle, recherchez-le dans Studio en sélectionnant Modèles dans le volet gauche.Once you're model is registered, find it in the studio by selecting Models on the left pane. Une fois que vous avez ouvert votre modèle, vous pouvez sélectionner le bouton Déployer en haut de l’écran, puis suivre les instructions décrites à l’étape 2 de la section Déployer votre modèle.Once you open your model, you can select the Deploy button at the top of the screen, and then follow the instructions as described in step 2 of the Deploy your model section.

Machine Learning automatisé vous aide à déployer le modèle sans écrire de code :Automated ML helps you with deploying the model without writing code:

  1. Vous disposez de plusieurs options pour le déploiement.You have a couple options for deployment.

    • Option 1 : Déployez le meilleur modèle en fonction des critères de mesure que vous avez définis.Option 1: Deploy the best model, according to the metric criteria you defined.

      1. Une fois l’expérience terminée, revenez à la page d’exécution du parent en sélectionnant Exécution 1 en haut de votre écran.After the experiment is complete, navigate to the parent run page by selecting Run 1 at the top of the screen.
      2. Sélectionnez le modèle figurant dans la section Résumé du meilleur modèle.Select the model listed in the Best model summary section.
      3. Sélectionnez Déployer en haut à gauche de la fenêtre.Select Deploy on the top left of the window.
    • Option n°2 : Pour déployer une itération de modèle spécifique à partir de cette expérience.Option 2: To deploy a specific model iteration from this experiment.

      1. Sélectionner le modèle souhaité sous l’onglet ModèlesSelect the desired model from the Models tab
      2. Sélectionnez Déployer en haut à gauche de la fenêtre.Select Deploy on the top left of the window.
  2. Renseignez le volet Déployer le modèle.Populate the Deploy model pane.

    ChampField ValeurValue
    NomName Entrez un nom unique pour votre déploiement.Enter a unique name for your deployment.
    DescriptionDescription Entrez une description pour mieux identifier le but de ce déploiement.Enter a description to better identify what this deployment is for.
    Type de capacité de calculCompute type Sélectionnez le type de point de terminaison que vous voulez déployer : Azure Kubernetes Service (AKS) ou Azure Container Instance (ACI) .Select the type of endpoint you want to deploy: Azure Kubernetes Service (AKS) or Azure Container Instance (ACI).
    Nom du calculCompute name S’applique uniquement à AKS : Sélectionnez le nom du cluster AKS sur lequel vous voulez effectuer le déploiement.Applies to AKS only: Select the name of the AKS cluster you wish to deploy to.
    Activer l’authentificationEnable authentication Sélectionnez cette option pour l’authentification basée sur des jetons ou sur des clés.Select to allow for token-based or key-based authentication.
    Utiliser les ressources d’un déploiement personnaliséUse custom deployment assets Activez cette fonctionnalité si vous voulez télécharger votre propre script de scoring et votre propre fichier d’environnement.Enable this feature if you want to upload your own scoring script and environment file. Découvrez plus d’informations sur les scripts de scoring.Learn more about scoring scripts.

    Important

    Les noms de fichiers sont limités à 32 caractères et doivent commencer et se terminer par des caractères alphanumériques.File names must be under 32 characters and must begin and end with alphanumerics. Ils peuvent inclure des tirets, des traits de soulignement, des points et des caractères alphanumériques.May include dashes, underscores, dots, and alphanumerics between. Les espaces ne sont pas autorisés.Spaces are not allowed.

    Le menu Avancé offre des fonctionnalités de déploiement par défaut, comme la collecte de données et des paramètres d’utilisation des ressources.The Advanced menu offers default deployment features such as data collection and resource utilization settings. Si vous souhaitez remplacer ces valeurs par défaut, faites-le dans ce menu.If you wish to override these defaults do so in this menu.

  3. Sélectionnez Déployer.Select Deploy. Le déploiement peut prendre environ 20 minutes.Deployment can take about 20 minutes to complete. Une fois le déploiement commencé, l’onglet Résumé du modèle s’affiche.Once deployment begins, the Model summary tab appears. Consultez la progression du déploiement sous la section État du déploiement.See the deployment progress under the Deploy status section.

Vous disposez maintenant d’un service web opérationnel pour générer des prédictions !Now you have an operational web service to generate predictions! Vous pouvez tester les prédictions en interrogeant le service à partir du support Azure Machine Learning intégré de Power BI.You can test the predictions by querying the service from Power BI's built in Azure Machine Learning support.

Étapes suivantesNext steps