Qu’est-ce que le Machine Learning automatisé (AutoML) ?What is automated machine learning (AutoML)?

Le Machine Learning automatisé, également appelé ML automatisé ou AutoML, est le processus d’automatisation des tâches fastidieuses et itératives de développement de modèle Machine Learning.Automated machine learning, also referred to as automated ML or AutoML, is the process of automating the time consuming, iterative tasks of machine learning model development. Il permet aux chercheurs de données, analystes et développeurs de créer des modèles ML à grande échelle, efficaces et productifs, tout en maintenant la qualité du modèle.It allows data scientists, analysts, and developers to build ML models with high scale, efficiency, and productivity all while sustaining model quality. L’apprentissage automatique automatisé dans Azure Machine Learning se base sur une innovation de notre division Microsoft Research.Automated ML in Azure Machine Learning is based on a breakthrough from our Microsoft Research division.

Le développement de modèle Machine Learning traditionnel consomme beaucoup de ressources, nécessitant une connaissance significative du domaine et du temps pour produire et comparer des dizaines de modèles.Traditional machine learning model development is resource-intensive, requiring significant domain knowledge and time to produce and compare dozens of models. Le Machine Learning automatisé permet de réduire le temps nécessaire pour obtenir des modèles ML prêts pour la production avec une facilité et une efficacité extraordinaires.With automated machine learning, you'll accelerate the time it takes to get production-ready ML models with great ease and efficiency.

AutoML dans Azure Machine LearningAutoML in Azure Machine Learning

Azure Machine Learning offre deux expériences pour utiliser le machine learning automatisé :Azure Machine Learning offers two experiences for working with automated ML:

Quand utiliser AutoML : classification, régression et prévisionWhen to use AutoML: classify, regression, & forecast

Appliquez le Machine Learning automatisé lorsque vous souhaitez qu’Azure Machine Learning effectue l’apprentissage d’un modèle et le règle à votre place à l’aide de la métrique cible que vous spécifiez.Apply automated ML when you want Azure Machine Learning to train and tune a model for you using the target metric you specify. Le ML automatisé démocratise le processus de développement de modèle Machine Learning et permet à ses utilisateurs, quel que soit leur expertise en matière de science des données, d’identifier un pipeline de Machine Learning de bout en bout pour tout problème.Automated ML democratizes the machine learning model development process, and empowers its users, no matter their data science expertise, to identify an end-to-end machine learning pipeline for any problem.

Les scientifiques des données, analystes et développeurs de différents secteurs peuvent utiliser le Machine Learning automatisé pour ce qui suit :Data scientists, analysts, and developers across industries can use automated ML to:

  • Implémenter des solutions ML sans disposer d’une connaissance approfondie de la programmation.Implement ML solutions without extensive programming knowledge
  • Économiser du temps et des ressources.Save time and resources
  • Tirer parti des meilleures pratiques en matière de science des données.Leverage data science best practices
  • Fournir une résolution de problème agile.Provide agile problem-solving

classification ;Classification

La classification est une tâche Machine Learning courante.Classification is a common machine learning task. Il s’agit d’un type d’apprentissage supervisé dans lequel des modèles apprennent à utiliser des données d’apprentissage et appliquent ces apprentissages à de nouvelles données.Classification is a type of supervised learning in which models learn using training data, and apply those learnings to new data. Azure Machine Learning offre des caractérisations spécifiquement pour ces tâches, telles que des caractériseurs de réseau neuronal profond pour la classification.Azure Machine Learning offers featurizations specifically for these tasks, such as deep neural network text featurizers for classification. Apprenez-en davantage sur les optons de caractérisation.Learn more about featurization options.

L’objectif principal des modèles de classification est de prédire les catégories dans lesquelles les nouvelles données seront classées, sur la base des apprentissages de leurs données d’apprentissage.The main goal of classification models is to predict which categories new data will fall into based on learnings from its training data. Les exemples de classification courants incluent la détection des fraudes, la reconnaissance de l’écriture manuscrite et la détection d’objets.Common classification examples include fraud detection, handwriting recognition, and object detection. Pour plus d’informations et voir un exemple, consultez Créer un modèle de classification avec ML automatisé.Learn more and see an example at Create a classification model with automated ML.

Pour obtenir des exemples de classification et de Machine Learning automatisé, consultez les notebooks Python suivants : Détection des fraudes, Prédictions marketing et Classification des données de groupe de discussionSee examples of classification and automated machine learning in these Python notebooks: Fraud Detection, Marketing Prediction, and Newsgroup Data Classification

régression ;Regression

À l’instar de la classification, les tâches de régression sont également une tâche d’apprentissage supervisé courante.Similar to classification, regression tasks are also a common supervised learning task. Azure Machine Learning offre des caractérisations spécifiquement pour ces tâches.Azure Machine Learning offers featurizations specifically for these tasks.

À la différence d’une classification dans laquelle les valeurs de sortie prédites sont catégoriques, les modèles de régression prédisent des valeurs de sortie numériques en fonction de prédictions indépendantes.Different from classification where predicted output values are categorical, regression models predict numerical output values based on independent predictors. Dans une régression, l’objectif est d’aider à établir la relation entre ces variables de prédiction indépendantes en estimant l’impact d’une variable sur les autres.In regression, the objective is to help establish the relationship among those independent predictor variables by estimating how one variable impacts the others. Par exemple, le coût de l’automobile basé sur des caractéristiques telles que la consommation de carburant, la cote de sécurité, etc.For example, automobile price based on features like, gas mileage, safety rating, etc. Apprenez-en davantage et découvrez un exemple de Régression avec Machine Learning automatisé.Learn more and see an example of regression with automated machine learning.

Pour obtenir des exemples de régression et de Machine Learning automatisé pour les prédictions, consultez les notebooks Python suivants : Prédiction des performances du processeurSee examples of regression and automated machine learning for predictions in these Python notebooks: CPU Performance Prediction,

Prévision de série chronologiqueTime-series forecasting

L’établissement de prévisions fait partie intégrante de toute entreprise, qu’il s’agisse du chiffre d’affaires, de l’inventaire, des ventes ou de la demande des clients.Building forecasts is an integral part of any business, whether it's revenue, inventory, sales, or customer demand. Vous pouvez utiliser le Machine Learning automatisé pour combiner des techniques et approches, et obtenir une prévision de série chronologique recommandée de haute qualité.You can use automated ML to combine techniques and approaches and get a recommended, high-quality time-series forecast. Pour en savoir plus, consultez Machine Learning automatisé pour la prévision de séries chronologiques.Learn more with this how-to: automated machine learning for time series forecasting.

Une expérience de série chronologique automatisée est traitée comme un problème de régression multivariable.An automated time-series experiment is treated as a multivariate regression problem. Les valeurs de série chronologique passées « pivotent » afin de devenir des dimensions supplémentaires pour le régresseur, avec d’autres prédicteurs.Past time-series values are "pivoted" to become additional dimensions for the regressor together with other predictors. Contrairement aux méthodes de séries chronologiques classique, cette méthode présente l’avantage d’incorporer naturellement plusieurs variables contextuelles et leurs relations entre elles pendant l’apprentissage.This approach, unlike classical time series methods, has an advantage of naturally incorporating multiple contextual variables and their relationship to one another during training. Le Machine Learning automatisé effectue l’apprentissage d’un modèle unique, mais souvent ramifié en interne, pour tous les éléments du jeu de données et les horizons de prédiction.Automated ML learns a single, but often internally branched model for all items in the dataset and prediction horizons. Plus de données sont ainsi disponibles pour estimer les paramètres du modèle et la généralisation en séries invisibles devient possible.More data is thus available to estimate model parameters and generalization to unseen series becomes possible.

La configuration de prévisions avancée inclut les éléments suivants :Advanced forecasting configuration includes:

  • détection et personnalisation de congéholiday detection and featurization
  • série chronologique et apprenants DNN (Auto-ARIMA, Prophet, ForecastTCN)time-series and DNN learners (Auto-ARIMA, Prophet, ForecastTCN)
  • prise en charge de plusieurs modèles via le regroupementmany models support through grouping
  • validation croisée d’originerolling-origin cross validation
  • décalages configurablesconfigurable lags
  • caractéristiques des agrégations des fenêtres dynamiquesrolling window aggregate features

Pour obtenir des exemples de régression et de Machine Learning automatisé pour les prédictions, consultez les notebooks Python suivants : Prévision des ventes, Prévision de la demande et Prévision de la production de boissons.See examples of regression and automated machine learning for predictions in these Python notebooks: Sales Forecasting, Demand Forecasting, and Beverage Production Forecast.

Fonctionnement du Machine Learning automatiséHow automated ML works

Pendant l’entraînement, Azure Machine Learning crée un certain nombre de pipelines en parallèle qui testent différents algorithmes et paramètres pour vous.During training, Azure Machine Learning creates a number of pipelines in parallel that try different algorithms and parameters for you. Le service effectue des itérations dans les algorithmes de Machine Learning associés aux sélections de fonctionnalités, où chaque itération produit un modèle avec un score d’apprentissage.The service iterates through ML algorithms paired with feature selections, where each iteration produces a model with a training score. Plus le score est élevé, plus le modèle est considéré comme « adapté » à vos données.The higher the score, the better the model is considered to "fit" your data. Il s’arrête une fois qu’il réunit les critères de sortie définis dans l’expérience.It will stop once it hits the exit criteria defined in the experiment.

Azure Machine Learning vous permet de concevoir et d’exécuter vos expériences d’entraînement de Machine Learning automatisé en effectuant les étapes suivantes :Using Azure Machine Learning, you can design and run your automated ML training experiments with these steps:

  1. Identifier le problème de Machine Learning à résoudre : classification, prévision ou régression.Identify the ML problem to be solved: classification, forecasting, or regression

  2. Indiquez si vous souhaitez utiliser le SDK Python ou l’expérience web Studio : apprenez-en davantage sur la parité entre le SDK Python et l’expérience web Studio.Choose whether you want to use the Python SDK or the studio web experience: Learn about the parity between the Python SDK and studio web experience.

  3. Spécifier la source et le format des données d’apprentissage étiquetées : tableaux NumPy ou cadre de données Pandas.Specify the source and format of the labeled training data: Numpy arrays or Pandas dataframe

  4. Configurer la cible de calcul pour l’apprentissage du modèle : ordinateur local, calculs Azure Machine Learning, machines virtuelles à distance ou Azure Databricks.Configure the compute target for model training, such as your local computer, Azure Machine Learning Computes, remote VMs, or Azure Databricks.

  5. Configurer les paramètres de Machine Learning automatisé qui déterminent le nombre d’itérations sur les différents modèles, les réglages d’hyperparamètre, le prétraitement et la personnalisation avancés, ainsi que les métriques à examiner lors du choix du meilleur modèle.Configure the automated machine learning parameters that determine how many iterations over different models, hyperparameter settings, advanced preprocessing/featurization, and what metrics to look at when determining the best model.

  6. Lancer l’exécution de l’apprentissage.Submit the training run.

  7. Passer en revue les résultatsReview the results

Le diagramme suivant illustre ce processus.The following diagram illustrates this process. Machine learning automatiséAutomated Machine learning

Vous pouvez également inspecter les informations d’exécution journalisées qui contiennent les métriques collectées pendant l’exécution.You can also inspect the logged run information, which contains metrics gathered during the run. L’exécution de l’apprentissage produit un objet sérialisé Python (fichier .pkl) contenant le modèle et le prétraitement des données.The training run produces a Python serialized object (.pkl file) that contains the model and data preprocessing.

Bien que la création de modèles soit automatisée, vous pouvez également découvrir l’importance ou la pertinence des fonctionnalités pour les modèles générés.While model building is automated, you can also learn how important or relevant features are to the generated models.

Ingénierie des caractéristiquesFeature engineering

L’ingénierie des caractéristiques est le processus qui consiste à utiliser la connaissance du domaine des données pour créer des fonctionnalités qui aident les algorithmes de ML à améliorer leur apprentissage.Feature engineering is the process of using domain knowledge of the data to create features that help ML algorithms learn better. Dans Azure Machine Learning, des techniques de mise à l’échelle et de normalisation sont appliquées pour faciliter l’ingénierie de caractéristiques.In Azure Machine Learning, scaling and normalization techniques are applied to facilitate feature engineering. Collectivement, ces techniques et l’ingénierie de caractéristiques sont appelées caractérisation.Collectively, these techniques and feature engineering are referred to as featurization.

Pour les expériences de Machine Learning automatisé, la caractérisation s’applique automatiquement, mais peut également être personnalisée en fonction de vos données.For automated machine learning experiments, featurization is applied automatically, but can also be customized based on your data. En savoir plus sur la personnalisation incluse.Learn more about what featurization is included.

Notes

Les étapes de caractérisation du Machine Learning automatisé (normalisation des fonctionnalités, gestion des données manquantes, conversion de texte en valeurs numériques, etc.) font partie du modèle sous-jacent.Automated machine learning featurization steps (feature normalization, handling missing data, converting text to numeric, etc.) become part of the underlying model. Lorsque vous utilisez le modèle pour des prédictions, les étapes de caractérisation qui sont appliquées pendant la formation sont appliquées automatiquement à vos données d’entrée.When using the model for predictions, the same featurization steps applied during training are applied to your input data automatically.

Caractérisation automatique (standard)Automatic featurization (standard)

Dans chaque expérience de Machine Learning automatisé, vos données sont automatiquement mises à l’échelle et normalisées pour faciliter la bonne exécution des algorithmes.In every automated machine learning experiment, your data is automatically scaled or normalized to help algorithms perform well. Pendant l’apprentissage du modèle, l’une des techniques suivantes de mise à l’échelle ou de normalisation est appliquée à chaque modèle.During model training, one of the following scaling or normalization techniques will be applied to each model. Découvrez comment AutoML permet d’empêcher le surajustement et le déséquilibre des données dans vos modèles.Learn how AutoML helps prevent over-fitting and imbalanced data in your models.

Traitement & de la mise à l’échelleScaling & processing DescriptionDescription
StandardScaleWrapperStandardScaleWrapper Normaliser les fonctionnalités en supprimant la moyenne et en mettant à l’échelle de l’écart d’unité.Standardize features by removing the mean and scaling to unit variance
MinMaxScalarMinMaxScalar Transformer les fonctionnalités en les mettant à l’échelle des valeurs minimale et maximale de cette colonne.Transforms features by scaling each feature by that column's minimum and maximum
MaxAbsScalerMaxAbsScaler Mettre à l’échelle chaque fonctionnalité en fonction de sa valeur absolue maximale.Scale each feature by its maximum absolute value
RobustScalarRobustScalar Ce processus de mise à l’échelle opère par plage de quantiles.This Scaler features by their quantile range
PCAPCA Réduction de dimensionnalité linéaire à l’aide d’une décomposition de valeur singulière des données afin de les projeter vers un espace dimensionnel inférieur.Linear dimensionality reduction using Singular Value Decomposition of the data to project it to a lower dimensional space
TruncatedSVDWrapperTruncatedSVDWrapper Ce transformateur effectue une réduction de dimensionnalité linéaire au moyen d’une décomposition de valeur singulière tronquée.This transformer performs linear dimensionality reduction by means of truncated singular value decomposition (SVD). Contrairement à PCA, cet estimateur ne centre pas les données avant de calculer la décomposition de valeur singulière, ce qui signifie qu’il peut travailler efficacement avec des matrices scipy.sparse.Contrary to PCA, this estimator does not center the data before computing the singular value decomposition, which means it can work with scipy.sparse matrices efficiently
SparseNormalizerSparseNormalizer Chaque exemple (autrement dit, chaque ligne de la matrice de données) avec au moins un composant différent de zéro est remis à l’échelle indépendamment des autres exemples afin que sa norme (l1 ou l2) soit égale à un.Each sample (that is, each row of the data matrix) with at least one non-zero component is rescaled independently of other samples so that its norm (l1 or l2) equals one

Personnaliser la caractérisationCustomize featurization

Des techniques de caractérisation supplémentaires, telles que l’encodage et les transformations, sont également disponibles.Additional feature engineering techniques such as, encoding and transforms are also available.

Activez ce paramètre avec :Enable this setting with:

  • Azure Machine Learning Studio : Activez Caractérisation automatique dans la section Afficher des configurations supplémentaires en suivant ces étapes.Azure Machine Learning studio: Enable Automatic featurization in the View additional configuration section with these steps.

  • Kit de développement logiciel (SDK) Python : Spécifiez "feauturization": 'auto' / 'off' / 'FeaturizationConfig' dans votre objet AutoMLConfig.Python SDK: Specify "feauturization": 'auto' / 'off' / 'FeaturizationConfig' in your AutoMLConfig object. En savoir plus sur l’activation de la caractérisation.Learn more about enabling featurization.

Modèles ensemblistesEnsemble models

Le Machine Learning automatisé prend en charge les modèles ensemblistes, qui sont activés par défaut.Automated machine learning supports ensemble models, which are enabled by default. L’apprentissage ensembliste améliore les résultats de Machine Learning et les performances prédictives en combinant plusieurs modèles.Ensemble learning improves machine learning results and predictive performance by combining multiple models as opposed to using single models. Les itérations d’ensembles apparaissent comme les dernières itérations de votre exécution.The ensemble iterations appear as the final iterations of your run. Le Machine Learning automatisé utilise des méthodes ensemblistes de vote et d’empilement pour combiner les modèles :Automated machine learning uses both voting and stacking ensemble methods for combining models:

  • Vote : prédictions basées sur la moyenne pondérée des probabilités de classe prédites (pour les tâches de classification) ou des cibles de régression prédites (pour les tâches de régression).Voting: predicts based on the weighted average of predicted class probabilities (for classification tasks) or predicted regression targets (for regression tasks).
  • Empilement : l’empilement combine des modèles hétérogènes et entraîne un métamodèle basé sur la sortie de différents modèles.Stacking: stacking combines heterogenous models and trains a meta-model based on the output from the individual models. Actuellement, les métamodèles par défaut sont LogisticRegression pour les tâches de classification, et ElasticNet pour les tâches de régression et de prévision.The current default meta-models are LogisticRegression for classification tasks and ElasticNet for regression/forecasting tasks.

L’algorithme de sélection d’ensemble Caruana, avec initialisation des ensembles triés, est utilisé pour déterminer les modèles qui doivent être utilisés au sein de l’ensemble.The Caruana ensemble selection algorithm with sorted ensemble initialization is used to decide which models to use within the ensemble. Pour résumer, cet algorithme initialise l’ensemble avec un maximum de cinq modèles ayant obtenu les meilleurs scores, puis vérifie que ces scores se situent dans une marge de plus ou moins 5 % par rapport au meilleur score, afin d’éviter un ensemble de niveau médiocre.At a high level, this algorithm initializes the ensemble with up to five models with the best individual scores, and verifies that these models are within 5% threshold of the best score to avoid a poor initial ensemble. Ensuite, pour chaque itération d’ensemble, un nouveau modèle est ajouté à l’ensemble existant et le score est calculé.Then for each ensemble iteration, a new model is added to the existing ensemble and the resulting score is calculated. Si un nouveau modèle a amélioré le score existant de l’ensemble, l’ensemble est mis à jour pour inclure le nouveau modèle.If a new model improved the existing ensemble score, the ensemble is updated to include the new model.

Pour savoir comment modifier les paramètres par défaut de l’ensemble au niveau du Machine Learning automatisé, consultez cette procédure.See the how-to for changing default ensemble settings in automated machine learning.

Conseils concernant les cibles de calcul de Machine Learning managées locales et distantesGuidance on local vs. remote managed ML compute targets

L’interface web pour le Machine Learning automatisé utilise toujours une cible de calcul distante.The web interface for automated ML always uses a remote compute target. Toutefois, lorsque vous utilisez le Kit de développement logiciel (SDK) Python, vous devez choisir une cible de calcul locale ou distante pour un apprentissage de Machine Learning automatisé.But when you use the Python SDK, you will choose either a local compute or a remote compute target for automated ML training.

  • Calcul local : l’apprentissage se produit sur votre ordinateur portable ou votre machine virtuelle locaux.Local compute: Training occurs on your local laptop or VM compute.
  • Calcul distant : l’apprentissage se produit sur des clusters de calcul Machine Learning.Remote compute: Training occurs on Machine Learning compute clusters.

Choisir une cible de calculChoose compute target

Lors du choix de votre cible de calcul, considérez les facteurs suivants :Consider these factors when choosing your compute target:

  • Choisir un calcul local : si votre scénario concerne des explorations initiales ou des démonstrations utilisant des données de petite taille et des apprentissages courts (de quelques secondes à quelques minutes par exécution enfant), un apprentissage sur votre ordinateur local peut constituer un meilleur choix.Choose a local compute: If your scenario is about initial explorations or demos using small data and short trains (i.e. seconds or a couple of minutes per child run), training on your local computer might be a better choice. Il n’y a pas de temps de configuration. Les ressources d’infrastructure (votre PC ou votre machine virtuelle) sont directement disponibles.There is no setup time, the infrastructure resources (your PC or VM) are directly available.
  • Choisir un cluster de calcul de Machine Learning distant : si vous effectuez un apprentissage avec des jeux de données plus volumineux, tel un apprentissage de production créant des modèles nécessitant des apprentissages plus longs, un calcul distant offre des performances de temps de bout en bout bien meilleures, car AutoML parallélise les apprentissages dans les nœuds du cluster.Choose a remote ML compute cluster: If you are training with larger datasets like in production training creating models which need longer trains, remote compute will provide much better end-to-end time performance because AutoML will parallelize trains across the cluster's nodes. Sur un calcul distant, le temps de démarrage de l’infrastructure interne ajoute environ 1,5 minute par exécution enfant, et des minutes supplémentaires pour l’infrastructure du cluster si les machines virtuelles ne sont pas encore opérationnelles.On a remote compute, the start-up time for the internal infrastructure will add around 1.5 minutes per child run, plus additional minutes for the cluster infrastructure if the VMs are not yet up and running.

Avantages et inconvénientsPros and cons

Tenez compte des avantages et des inconvénients suivants lorsque au moment de choisir entre le calcul local ou distant.Consider these pros and cons when choosing to use local vs. remote.

Avantages (avantages)Pros (Advantages) Inconvénients (handicaps)Cons (Handicaps)
Cible de calcul localeLocal compute target
  • Aucune heure de démarrage de l’environnementNo environment start-up time
  • Sous-ensemble de fonctionnalitésSubset of features
  • Impossible de paralléliser les exécutionsCan't parallelize runs
  • Pire pour des données volumineusesWorse for large data.
  • Aucune diffusion de données pendant l’apprentissageNo data streaming while training
  • Aucun caractérisation basée sur DNNNo DNN-based featurization
  • Kit de développement logiciel (SDK) Python uniquementPython SDK only
  • Clusters de calcul ML distantsRemote ML compute clusters
  • Ensemble complet de fonctionnalitésFull set of features
  • Parallélisation des exécutions enfantsParallelize child runs
  • Prise en charge de données volumineusesLarge data support
  • Caractérisation basée sur DNNDNN-based featurization
  • Extensibilité dynamique du cluster de calcul à la demandeDynamic scalability of compute cluster on demand
  • Expérience sans code (interface utilisateur web) également disponibleNo-code experience (web UI) also available
  • Temps de démarrage pour les nœuds de clusterStart-up time for cluster nodes
  • Temps de démarrage pour chaque exécution enfantStart-up time for each child run
  • Disponibilité des fonctionnalitésFeature availability

    D’autres fonctionnalités sont disponibles lorsque vous utilisez le calcul distant, comme indiqué dans le tableau ci-dessous.More features are available when you use the remote compute, as shown in the table below.

    FonctionnalitéFeature RemoteRemote LocalLocal
    Streaming de données (prise en charge de données volumineuses jusqu’à 100 Go)Data streaming (Large data support, up to 100 GB)
    Caractérisation de texte et apprentissage basés sur DNN-BERTDNN-BERT-based text featurization and training
    Prise en charge de GPU prêt à l’emploi (apprentissage et inférence)Out-of-the-box GPU support (training and inference)
    Prise en charge de la classification d’image et de l’étiquetageImage Classification and Labeling support
    Modèles auto-ARIMA, Prophet et ForecastTCN pour les prévisionsAuto-ARIMA, Prophet and ForecastTCN models for forecasting
    Exécutions/itérations multiples en parallèleMultiple runs/iterations in parallel
    Créer des modèles avec interprétabilité dans l’interface utilisateur de l’expérience web du studio AutoMLCreate models with interpretability in AutoML studio web experience UI
    Personnalisation de l’ingénierie des fonctionnalités dans l’interface utilisateur de l’expérience web du studioFeature engineering customization in studio web experience UI
    Optimisation des hyperparamètres d’Azure Machine LearningAzure ML hyperparameter tuning
    Prise en charge des flux de travail du pipeline Azure Machine LearningAzure ML Pipeline workflow support
    Continuer une exécutionContinue a run
    PrévisionsForecasting
    Créer et exécuter des expériences dans des blocs-notesCreate and run experiments in notebooks
    Inscrire et visualiser les informations et les métriques de l’expérience dans l’interface utilisateurRegister and visualize experiment's info and metrics in UI
    Garde-fous des donnéesData guardrails

    Nombreux modèlesMany models

    L’accélérateur de solution de nombreux modèles (préversion) s’appuie sur Azure Machine Learning et vous permet d’utiliser le Machine Learning automatisé pour effectuer la formation, l’utilisation et la gestion de centaines, voire de milliers de modèles Machine Learning.The Many Models Solution Accelerator (preview) builds on Azure Machine Learning and enables you to use automated ML to train, operate, and manage hundreds or even thousands of machine learning models.

    Par exemple, la création d’un modèle pour chaque instance ou chaque individu dans les scénarios suivants peut mener à des résultats améliorés :For example, building a model for each instance or individual in the following scenarios can lead to improved results:

    • Prédiction des ventes pour chaque magasin individuelPredicting sales for each individual store
    • Maintenance prédictive pour des centaines de puits de pétrolePredictive maintenance for hundreds of oil wells
    • Personnalisation d’une expérience pour des utilisateurs individuelsTailoring an experience for individual users.

    Paramètres de l’expérienceExperiment settings

    Les paramètres suivants vous permettent de configurer votre expérience de machine learning automatisé.The following settings allow you to configure your automated ML experiment.

    SDK PythonThe Python SDK L’expérience web StudioThe studio web experience
    Division des données en jeux d’entraînement/de validationSplit data into train/validation sets
    Prise en charge des tâches de Machine Learning : classification, régression et prévisionSupports ML tasks: classification, regression, and forecasting
    Optimisation basée sur une métrique principaleOptimizes based on primary metric
    Prise en charge du calcul Azure ML en tant que cible de calculSupports Azure ML compute as compute target
    Configuration de l’horizon de prévision, des décalages de cibles et de la fenêtre dynamiqueConfigure forecast horizon, target lags & rolling window
    Définition des critères de sortieSet exit criteria
    Définition des itérations simultanéesSet concurrent iterations
    Suppression de colonnesDrop columns
    Blocage des algorithmesBlock algorithms
    Validation croiséeCross validation
    Prise en charge de la formation sur les clusters Azure DatabricksSupports training on Azure Databricks clusters
    Affichage des noms de caractéristiques traitésView engineered feature names
    Résumé de la caractérisationFeaturization summary
    Caractérisation des congésFeaturization for holidays
    Niveaux de verbosité des fichiers journauxLog file verbosity levels

    Paramètres du modèleModel settings

    Ces paramètres peuvent être appliqués au meilleur modèle à la suite de votre expérience de machine learning automatisé.These settings can be applied to the best model as a result of your automated ML experiment.

    SDK PythonThe Python SDK L’expérience web StudioThe studio web experience
    Inscription, déploiement et description du meilleur modèleBest model registration, deployment, explainability
    Activation des modèles de l’ensemble de vote et de l’ensemble d’empilementEnable voting ensemble & stack ensemble models
    Affichage du meilleur modèle selon une métrique non principaleShow best model based on non-primary metric
    Activation/désactivation de la compatibilité du modèle ONNXEnable/disable ONNX model compatibility
    Tester le modèleTest the model

    Paramètres de contrôle d’exécutionRun control settings

    Ces paramètres vous permettent d’examiner et de contrôler les exécutions de votre expérience et ses exécutions enfants.These settings allow you to review and control your experiment runs and its child runs.

    SDK PythonThe Python SDK L’expérience web StudioThe studio web experience
    Exécuter le tableau récapitulatifRun summary table
    Annuler les exécutions et les exécutions enfantsCancel runs & child runs
    Obtenir des garde-fousGet guardrails
    Mettre en pause et reprendre les exécutionsPause & resume runs

    AutoML et ONNXAutoML & ONNX

    Avec Azure Machine Learning, vous pouvez utiliser le Machine Learning automatisé pour générer un modèle Python et le convertir au format ONNX.With Azure Machine Learning, you can use automated ML to build a Python model and have it converted to the ONNX format. Une fois que les modèles sont au format ONNX, ils peuvent s’exécuter sur une multitude de plateformes et d’appareils.Once the models are in the ONNX format, they can be run on a variety of platforms and devices. Apprenez-en davantage sur l’accélération des modèles ML avec ONNX.Learn more about accelerating ML models with ONNX.

    Découvrez comment convertir au format ONNX dans cet exemple de notebook Jupyter.See how to convert to ONNX format in this Jupyter notebook example. Découvrez quels sont les algorithmes pris en charge dans ONNX.Learn which algorithms are supported in ONNX.

    Le runtime ONNX prenant également en charge C#, vous pouvez utiliser le modèle généré automatiquement dans vos applications C# sans avoir besoin de recodage ou des latences réseau introduites par les points de terminaison REST.The ONNX runtime also supports C#, so you can use the model built automatically in your C# apps without any need for recoding or any of the network latencies that REST endpoints introduce. En savoir plus sur l’utilisation d’un modèle ONNX AutoML dans une application .NET avec ML.NET et sur l’inférence de modèles ONNX avec l’API C# du runtime ONNX.Learn more about using an AutoML ONNX model in a .NET application with ML.NET and inferencing ONNX models with the ONNX runtime C# API.

    Étapes suivantesNext steps

    Plusieurs ressources sont disponibles pour vous aider à utiliser AutoML.There are multiple resources to get you up and running with AutoML.

    Tutoriels et guides pratiquesTutorials/ how-tos

    Les tutoriels sont des exemples illustrant de bout en bout des scénarios d’utilisation d’AutoML.Tutorials are end-to-end introductory examples of AutoML scenarios.

    Des articles de guide pratique fournissent des détails supplémentaires sur les fonctionnalités d’AutoML.How to articles provide additional detail into what functionality AutoML offers. Par exemple,For example,

    • Configurez les paramètres pour des expériences d’entraînement automatiqueConfigure the settings for automatic training experiments

    • Découvrez comment effectuer l’apprentissage automatique à l’aide de données de série chronologique en procédant comme suit.Learn how to auto train using time series data, with these steps.

    Exemples de blocs-notes JupyterJupyter notebook samples

    Passez en revue les exemples de code détaillé et les cas d’usage disponibles dans le dépôt GitHub d’exemples de blocs-notes pour le Machine Learning automatisé.Review detailed code examples and use cases in the GitHub notebook repository for automated machine learning samples.

    Référence du Kit de développement logiciel (SDK) PythonPython SDK reference

    Approfondissez votre expertise des modèles de conception de Kit de développement logiciel (SDK) et des spécifications de classe avec la documentation de référence sur la classe AutoML.Deepen your expertise of SDK design patterns and class specifications with the AutoML class reference documentation.

    Notes

    Des fonctionnalités de machine learning automatisé sont également disponible dans d’autres solutions Microsoft telles que ML.NET, HDInsight, Power BI et SQL ServerAutomated machine learning capabilities are also available in other Microsoft solutions such as, ML.NET, HDInsight, Power BI and SQL Server