Was ist automatisiertes maschinelles Lernen (AutoML)?What is automated machine learning (AutoML)?

Automatisiertes maschinelles Lernen, auch als automatisiertes ML oder AutoML bezeichnet, ist der Prozess des Automatisierens der zeitaufwändigen, iterativen Aufgaben der Entwicklung eines Machine Learning-Modells.Automated machine learning, also referred to as automated ML or AutoML, is the process of automating the time consuming, iterative tasks of machine learning model development. Es versetzt Data Scientists, Analysten und Entwickler in die Lage, ML-Modelle mit hoher Skalierbarkeit, Effizienz und Produktivität zu erstellen und gleichzeitig die Modellqualität zu erhalten.It allows data scientists, analysts, and developers to build ML models with high scale, efficiency, and productivity all while sustaining model quality. Automatisiertes maschinelles Lernen in Azure Machine Learning basiert auf einem Durchbruch der Microsoft Research-Abteilung.Automated ML in Azure Machine Learning is based on a breakthrough from our Microsoft Research division.

Die Entwicklung traditioneller Machine Learning-Modelle ist ressourcenintensiv und erfordert viel Fachwissen und Zeit, um Dutzende von Modellen zu erstellen und zu vergleichen.Traditional machine learning model development is resource-intensive, requiring significant domain knowledge and time to produce and compare dozens of models. Mit automatisiertem maschinellem Lernen verkürzen Sie die Zeit, die benötigt wird, um produktionsbereite ML-Modelle mit großer Leichtigkeit und Effizienz zu erhalten.With automated machine learning, you'll accelerate the time it takes to get production-ready ML models with great ease and efficiency.

Verwendung von AutoML: Klassifizieren, Regression und PrognoseWhen to use AutoML: classify, regression, & forecast

Sie arbeiten mit automatisiertem ML, wenn Sie möchten, dass Azure Machine Learning mit der von Ihnen angegebenen Zielmetrik ein Modell für Sie trainiert und optimiert.Apply automated ML when you want Azure Machine Learning to train and tune a model for you using the target metric you specify. Automatisiertes ML demokratisiert den Entwicklungsprozess eines Machine Learning-Modells und befähigt seine Benutzer, unabhängig von deren Data Science-Kenntnissen, eine durchgängige Machine Learning-Pipeline für jedes Problem zu bestimmen.Automated ML democratizes the machine learning model development process, and empowers its users, no matter their data science expertise, to identify an end-to-end machine learning pipeline for any problem.

Data Scientists, Analysten und Entwickler aus den verschiedensten Branchen können automatisiertes ML für Folgendes verwenden:Data scientists, analysts, and developers across industries can use automated ML to:

  • Implementieren von ML-Lösungen ohne umfangreiche ProgrammierkenntnisseImplement ML solutions without extensive programming knowledge
  • Sparen von Zeit und RessourcenSave time and resources
  • Nutzen von bewährten Methoden aus der Data ScienceLeverage data science best practices
  • Bereitstellen flexibler ProblemlösungenProvide agile problem-solving

KlassifizierungClassification

Die Klassifizierung ist ein gängiger Machine Learning-Task.Classification is a common machine learning task. Klassifizierung ist eine Art des überwachten Lernens, bei der Modelle anhand von Trainingsdaten lernen und diese Erkenntnisse auf neue Daten anwenden.Classification is a type of supervised learning in which models learn using training data, and apply those learnings to new data. Azure Machine Learning bietet Featurebereitstellungen speziell für diese Aufgaben, z. B. Textfeaturizer für Deep Neural Network zur Klassifizierung.Azure Machine Learning offers featurizations specifically for these tasks, such as deep neural network text featurizers for classification. Erfahren Sie mehr über die Optionen für die Featurebereitstellung.Learn more about featurization options.

Das Hauptziel von Klassifizierungsmodellen besteht darin, auf der Grundlage der Erkenntnisse aus den Trainingsdaten vorherzusagen, in welche Kategorien neue Daten fallen werden.The main goal of classification models is to predict which categories new data will fall into based on learnings from its training data. Zu den gängigen Klassifizierungsbeispielen gehören Betrugserkennung, Handschrifterkennung und Objekterkennung.Common classification examples include fraud detection, handwriting recognition, and object detection. Weitere Informationen und ein Beispiel finden Sie unter Erstellen eines Klassifizierungsmodells mit automatisiertem maschinellem Lernen.Learn more and see an example at Create a classification model with automated ML.

Weitere Beispiele für Klassifizierung und automatisiertes Machine Learning finden Sie in den folgenden Python-Notebooks: Fraud Detection (Betrugserkennung), Marketing Prediction (Marketingprognose) und Newsgroup Data Classification (Klassifizierung von Diskussionsgruppendaten)See examples of classification and automated machine learning in these Python notebooks: Fraud Detection, Marketing Prediction, and Newsgroup Data Classification

RegressionRegression

Ähnlich der Klassifizierung sind Regressionsaufgaben auch ein gängiger überwachter Lerntask.Similar to classification, regression tasks are also a common supervised learning task. Azure Machine Learning bietet spezielle Featurisierungen für diesen Task.Azure Machine Learning offers featurizations specifically for these tasks.

Anders als bei der Klassifizierung, bei der die vorhergesagten Ausgabewerte kategorisch sind, sagen Regressionsmodelle numerische Ausgabewerte auf der Grundlage unabhängiger Vorhersagefaktoren voraus.Different from classification where predicted output values are categorical, regression models predict numerical output values based on independent predictors. Bei der Regression besteht das Ziel darin, die Beziehung zwischen diesen unabhängigen Vorhersagevariablen herzustellen, indem geschätzt wird, wie eine Variable die anderen beeinflusst.In regression, the objective is to help establish the relationship among those independent predictor variables by estimating how one variable impacts the others. Beispiel: Der Fahrzeugpreis basierend auf Merkmalen wie Kraftstoffverbrauch, Sicherheitseinstufung, usw.For example, automobile price based on features like, gas mileage, safety rating, etc. Hier erhalten Sie weitere Informationen und ein Beispiel für die Regression mit automatisiertem maschinellen Lernen.Learn more and see an example of regression with automated machine learning.

Weitere Beispiele für Regression und automatisiertes Machine Learning für Vorhersagen finden Sie in den folgenden Python-Notebooks: CPU-Leistungsvorhersage,See examples of regression and automated machine learning for predictions in these Python notebooks: CPU Performance Prediction,

ZeitreihenvorhersagenTime-series forecasting

Die Erstellung von Vorhersagen ist ein integraler Bestandteil jedes Unternehmens, unabhängig davon, ob es sich um Einnahmen, Lagerbestände, Umsätze oder Kundennachfrage handelt.Building forecasts is an integral part of any business, whether it's revenue, inventory, sales, or customer demand. Sie können automatisiertes maschinelles Lernen verwenden, um verschiedene Techniken und Ansätze zu kombinieren. Außerdem erhalten Sie dabei eine beliebte und hochwertige Zeitreihenprognose.You can use automated ML to combine techniques and approaches and get a recommended, high-quality time-series forecast. Hier erhalten Sie weitere Informationen zur Vorgehensweise: Automatisches Trainieren eines Modells für die Zeitreihenprognose.Learn more with this how-to: automated machine learning for time series forecasting.

Automatisierte Zeitreihenexperimente werden als multivariate Regressionsprobleme behandelt.An automated time-series experiment is treated as a multivariate regression problem. Zeitreihenwerte aus der Vergangenheit werden „pivotiert“ und dienen so zusammen mit anderen Vorhersageelementen als zusätzliche Dimensionen für den Regressor.Past time-series values are "pivoted" to become additional dimensions for the regressor together with other predictors. Dieser Ansatz hat im Gegensatz zu klassischen Zeitreihenmethoden den Vorteil, dass mehrere kontextbezogene Variablen und deren Beziehungen zueinander beim Training auf natürliche Weise integriert werden.This approach, unlike classical time series methods, has an advantage of naturally incorporating multiple contextual variables and their relationship to one another during training. Beim automatisierten maschinellen Lernen wird ein zwar einfaches, aber häufig in interne Verzweigungen unterteiltes Modell für alle Elemente im Dataset und in den Vorhersagehorizonten erlernt.Automated ML learns a single, but often internally branched model for all items in the dataset and prediction horizons. Dadurch sind mehr Daten verfügbar, um Modellparameter zu schätzen, und die Generalisierung von unbekannten Reihen wird möglich.More data is thus available to estimate model parameters and generalization to unseen series becomes possible.

Die erweiterte Vorhersagekonfiguration umfasst Folgendes:Advanced forecasting configuration includes:

  • Feiertagserkennung und Erstellen zusätzlicher Merkmale (Featurization)holiday detection and featurization
  • Zeitreihen und DNN-Lernmodule (Auto-ARIMA, Prophet, ForecastTCN)time-series and DNN learners (Auto-ARIMA, Prophet, ForecastTCN)
  • Unterstützung vieler Modelle mithilfe von Gruppierungenmany models support through grouping
  • Kreuzvalidierung mit rollierendem Ursprung (Rolling Origin Validation)rolling-origin cross validation
  • Konfigurierbare Verzögerungen (Lags)configurable lags
  • Aggregierte Zeitfenstermerkmale (Rolling Window Features)rolling window aggregate features

Weitere Beispiele für Regression und automatisiertes Machine Learning für Vorhersagen finden Sie in den folgenden Python-Notebooks: Sales Forecasting (Verkaufsprognose), Demand Forecasting (Nachfrageprognose) und Beverage Production Forecast (Getränkeproduktionsprognose).See examples of regression and automated machine learning for predictions in these Python notebooks: Sales Forecasting, Demand Forecasting, and Beverage Production Forecast.

Funktionsweise von automatisiertem MLHow automated ML works

Während des Trainings erstellt Azure Machine Learning parallel eine Reihe von Pipelines, die unterschiedliche Algorithmen und Parameter für Sie ausprobieren.During training, Azure Machine Learning creates a number of pipelines in parallel that try different algorithms and parameters for you. Der Dienst durchläuft die ML-Algorithmen iterativ im Zusammenspiel mit der jeweiligen Featureauswahl, wobei für jede Iteration ein Modell mit einer Trainingsbewertung erzeugt wird.The service iterates through ML algorithms paired with feature selections, where each iteration produces a model with a training score. Je höher die Bewertung ist, desto besser wird das Modell als „passend“ für Ihre Daten angesehen.The higher the score, the better the model is considered to "fit" your data. Die Ausführung wird beendet, sobald die im Experiment definierten Beendigungskriterien erreicht werden.It will stop once it hits the exit criteria defined in the experiment.

Mithilfe von Azure Machine Learning können Sie automatisierte ML-Trainingsexperimente mit den folgenden Schritten entwerfen und ausführen:Using Azure Machine Learning, you can design and run your automated ML training experiments with these steps:

  1. Identifizieren des ML-Problems, das gelöst werden soll: Klassifizierung, Vorhersage oder Regression.Identify the ML problem to be solved: classification, forecasting, or regression

  2. Wählen Sie, ob Sie das Python SDK oder die Studioweboberfläche verwenden möchten: Erfahren Sie mehr über die Parität zwischen dem Python SDK und der Studioweboberfläche.Choose whether you want to use the Python SDK or the studio web experience: Learn about the parity between the Python SDK and studio web experience.

  3. Angeben der Quelle und des Formats der bezeichneten Trainingsdaten: NumPy-Arrays oder Pandas-Datenrahmen.Specify the source and format of the labeled training data: Numpy arrays or Pandas dataframe

  4. Konfigurieren des Computeziels für das Modelltraining, z.B. lokaler Computer, Azure Machine Learning Computes, Remote-VMs oder Azure Databricks.Configure the compute target for model training, such as your local computer, Azure Machine Learning Computes, remote VMs, or Azure Databricks. Weitere Informationen zu automatisiertem Training für eine Remoteressource.Learn about automated training on a remote resource.

  5. Konfigurieren der automatisierten Machine Learning-Parameter, die die Anzahl der Iterationen über verschiedene Modelle, die Hyperparametereinstellungen, erweiterte Vorverarbeitung/Featurebereitstellung und die Metriken bestimmen, die bei der Ermittlung des besten Modells zu berücksichtigen sind.Configure the automated machine learning parameters that determine how many iterations over different models, hyperparameter settings, advanced preprocessing/featurization, and what metrics to look at when determining the best model.

  6. Übermitteln der Trainingsausführung.Submit the training run.

  7. Überprüfen der ErgebnisseReview the results

Dieser Prozess wird anhand des folgenden Diagramms veranschaulicht.The following diagram illustrates this process. Automatisiertes maschinelles LernenAutomated Machine learning

Sie können die protokollierten Ausführungsinformationen auch untersuchen. Sie enthalten die während der Ausführung erfassten Metriken.You can also inspect the logged run information, which contains metrics gathered during the run. Bei der Trainingsausführung wird ein serialisiertes Python-Objekt (.pkl-Datei) generiert, das die Vorabverarbeitung des Modells und der Daten enthält.The training run produces a Python serialized object (.pkl file) that contains the model and data preprocessing.

Obwohl die Modellerstellung automatisiert ist, können Sie auch ermitteln, wie wichtig oder relevant Features für die generierten Modelle sind.While model building is automated, you can also learn how important or relevant features are to the generated models.

Erfahren Sie, wie Sie ein Remotecomputeziel verwenden.Learn how to use a remote compute target.

FeatureentwicklungFeature engineering

Beim Feature Engineering werden Domänenkenntnisse der Daten zum Erstellen von Features verwendet, mit denen ML-Algorithmen besser lernen können.Feature engineering is the process of using domain knowledge of the data to create features that help ML algorithms learn better. In Azure Machine Learning werden für das Feature Engineering Skalierungs- und Normalisierungstechniken angewendet.In Azure Machine Learning, scaling and normalization techniques are applied to facilitate feature engineering. Zusammen werden diese Techniken und das Feature Engineering als Featurisierung bezeichnet.Collectively, these techniques and feature engineering are referred to as featurization.

Bei automatisierten Machine Learning-Experimenten wird die Featurisierung automatisch angewendet, sie kann aber auch basierend auf Ihren Daten angepasst werden.For automated machine learning experiments, featurization is applied automatically, but can also be customized based on your data. Weitere Informationen zur enthaltenen Featurebereitstellung.Learn more about what featurization is included.

Hinweis

Die Schritte zur Featurebereitstellung bei automatisiertem maschinellen Lernen (Featurenormalisierung, Behandlung fehlender Daten, Umwandlung von Text in numerische Daten usw.) werden Teil des zugrunde liegenden Modells.Automated machine learning featurization steps (feature normalization, handling missing data, converting text to numeric, etc.) become part of the underlying model. Bei Verwendung des Modells für Vorhersagen werden die während des Trainings angewendeten Schritte zur Featurebereitstellung automatisch auf Ihre Eingabedaten angewendet.When using the model for predictions, the same featurization steps applied during training are applied to your input data automatically.

Automatische Featurisierung (Standard)Automatic featurization (standard)

In jedem automatisierten Machine Learning-Experiment werden Ihre Daten automatisch skaliert oder normalisiert, damit die Algorithmen gut funktionieren.In every automated machine learning experiment, your data is automatically scaled or normalized to help algorithms perform well. Während des Modelltrainings wird eine der folgenden Skalierungs- oder Normalisierungstechniken auf jedes Modell angewendet.During model training, one of the following scaling or normalization techniques will be applied to each model. Erfahren Sie, wie AutoML dazu beiträgt, die Überanpassung und Unausgeglichenheit von Daten in Ihren Modellen zu vermeiden.Learn how AutoML helps prevent over-fitting and imbalanced data in your models.

Skalierung & NormalisierungScaling & normalization BESCHREIBUNGDescription
StandardScaleWrapperStandardScaleWrapper Standardisieren von Features durch Entfernen des Mittelwerts und Skalierung auf Einheitenvarianz.Standardize features by removing the mean and scaling to unit variance
MinMaxScalarMinMaxScalar Transformieren von Features durch Skalieren jedes Features anhand des Mindest- und Maximalwerts dieser Spalte.Transforms features by scaling each feature by that column's minimum and maximum
MaxAbsScalerMaxAbsScaler Skalieren jedes Features anhand seines maximalen Absolutwerts.Scale each feature by its maximum absolute value
RobustScalarRobustScalar Diese Skalarfunktionen skaliert Features nach ihren Quantilbereich.This Scaler features by their quantile range
PCAPCA Lineare Dimensionalitätsreduzierung unter Verwendung von Singulärwertzerlegung der Daten, um sie auf einen niedrigeren Dimensionsbereich zu projizieren.Linear dimensionality reduction using Singular Value Decomposition of the data to project it to a lower dimensional space
TruncatedSVDWrapperTruncatedSVDWrapper Diese Transformation führt Dimensionalitätsreduzierung durch abgeschnittene Singulärwertzerlegung (SVD) durch.This transformer performs linear dimensionality reduction by means of truncated singular value decomposition (SVD). Im Gegensatz zu PCA zentriert diese Schätzfunktion die Daten nicht vor der Berechnung der Singulärwertzerlegung, d. h., dass scipy.sparse-Matrizen effizient verwendet werden können.Contrary to PCA, this estimator does not center the data before computing the singular value decomposition, which means it can work with scipy.sparse matrices efficiently
SparseNormalizerSparseNormalizer Jede Stichprobe (d.h. jede Zeile der Datenmatrix) mit mindestens einer Komponente ungleich Null wird unabhängig von anderen Stichproben neu skaliert, sodass ihre Norm (l1 oder l2) gleich eins ist.Each sample (that is, each row of the data matrix) with at least one non-zero component is rescaled independently of other samples so that its norm (l1 or l2) equals one

Anpassen der FeaturisierungCustomize featurization

Es stehen auch weitere Feature Engineering-Techniken wie etwa Codierung und Transformationen zur Verfügung.Additional feature engineering techniques such as, encoding and transforms are also available.

Diese Einstellung kann aktiviert werden über:Enable this setting with:

  • Azure Machine Learning Studio: Aktivieren Sie die Automatische Merkmalserstellung im Abschnitt Konfigurationsausführung mit diesen Schritten.Azure Machine Learning studio: Enable Automatic featurization in the View additional configuration section with these steps.

  • Python SDK: Geben Sie "feauturization": 'auto' / 'off' / 'FeaturizationConfig' in Ihrem Objekt vom Typ AutoMLConfig an.Python SDK: Specify "feauturization": 'auto' / 'off' / 'FeaturizationConfig' in your AutoMLConfig object. Weitere Informationen zur Aktivierung der Featurisierung.Learn more about enabling featurization.

EnsemblemodelleEnsemble models

Automatisiertes Machine Learning unterstützt Ensemblemodelle, die standardmäßig aktiviert sind.Automated machine learning supports ensemble models, which are enabled by default. Das Lernen mit Ensembles verbessert die Ergebnisse des maschinellen Lernens und die Vorhersageleistung, da nicht einzelne Modelle verwendet, sondern mehrere Modelle kombiniert werden.Ensemble learning improves machine learning results and predictive performance by combining multiple models as opposed to using single models. Die Ensemble-Iterationen erfolgen als abschließende Iterationen Ihrer Ausführung.The ensemble iterations appear as the final iterations of your run. Automatisiertes Machine Learning verwendet die beiden Ensemble-Methoden „voting“ (Abstimmen) und „stacking“ (Stapeln) gemeinsam, um Modelle zu kombinieren:Automated machine learning uses both voting and stacking ensemble methods for combining models:

  • Voting: Trifft Vorhersagen auf Grundlage des gewichteten Durchschnitts der vorhergesagten Klassenwahrscheinlichkeiten (für Klassifizierungsaufgaben) oder auf Grundlage der vorhergesagten Regressionsziele (für Regressionsaufgaben).Voting: predicts based on the weighted average of predicted class probabilities (for classification tasks) or predicted regression targets (for regression tasks).
  • Stacking: Stacking kombiniert heterogene Modelle und trainiert ein Metamodell, basierend auf der Ausgabe der einzelnen Modelle.Stacking: stacking combines heterogenous models and trains a meta-model based on the output from the individual models. Die aktuellen Standardmetamodelle sind LogisticRegression für Klassifizierungsaufgaben und ElasticNet für Regressions-/Vorhersageaufgaben.The current default meta-models are LogisticRegression for classification tasks and ElasticNet for regression/forecasting tasks.

Der Caruana-Algorithmus für die Ensembleauswahl mit sortierter Ensembleinitialisierung wird verwendet, um zu entscheiden, welche Modell innerhalb des Ensembles verwendet werden sollen.The Caruana ensemble selection algorithm with sorted ensemble initialization is used to decide which models to use within the ensemble. Generell initialisiert dieser Algorithmus das Ensemble mit bis zu fünf Modellen mit den besten Einzelbewertungen und überprüft, ob diese Modelle innerhalb des 5 %-Schwellenwerts der besten Bewertung liegen, um ein schlechtes Ausgangsensemble zu vermeiden.At a high level, this algorithm initializes the ensemble with up to five models with the best individual scores, and verifies that these models are within 5% threshold of the best score to avoid a poor initial ensemble. Dann wird für jede Ensemble-Iteration ein neues Modell zum vorhandenen Ensemble hinzugefügt, und die resultierende Bewertung wird berechnet.Then for each ensemble iteration, a new model is added to the existing ensemble and the resulting score is calculated. Wenn ein neues Modell die vorhandene Ensemblebewertung verbessert hat, wird das Ensemble so aktualisiert, dass es das neue Modell aufnimmt.If a new model improved the existing ensemble score, the ensemble is updated to include the new model.

Informationen zum Ändern der Standard-Ensembleeinstellungen beim automatisierten Machine Learning finden Sie unter Gewusst wie:.See the how-to for changing default ensemble settings in automated machine learning.

Leitfaden zu lokal verwalteten ML-Computezielen im Vergleich zu remote verwalteten ML-ComputezielenGuidance on local vs. remote managed ML compute targets

Die Weboberfläche für automatisiertes ML verwendet immer ein Remotecomputeziel.The web interface for automated ML always uses a remote compute target. Wenn Sie jedoch das Python SDK verwenden, wählen Sie entweder ein lokales Computeziel oder ein Remotecomputeziel für automatisiertes ML-Training aus.But when you use the Python SDK, you will choose either a local compute or a remote compute target for automated ML training.

  • Lokales Computeziel: Das Training erfolgt auf Ihrem lokalen Computer oder VM-Compute.Local compute: Training occurs on your local laptop or VM compute.
  • Remotecomputeziel: Das Training erfolgt auf Azure Machine Learning-Computeclustern.Remote compute: Training occurs on Machine Learning compute clusters.

Auswählen eines ComputezielsChoose compute target

Berücksichtigen Sie die folgenden Faktoren bei der Auswahl Ihres Computeziels:Consider these factors when choosing your compute target:

  • Wählen Sie ein lokales Computeziel aus: Wenn Ihr Szenario anfängliche Untersuchungen oder Demos mithilfe weniger Daten und kurzen Trainingsprozessen (d. h. Sekunden oder wenige Minuten pro untergeordnete Ausführung) umfasst, kann sich das Training auf Ihrem lokalen Computer als besser erweisen.Choose a local compute: If your scenario is about initial explorations or demos using small data and short trains (i.e. seconds or a couple of minutes per child run), training on your local computer might be a better choice. Es gibt keine Einrichtungszeit, die Infrastrukturressourcen (Ihr Computer oder Ihre VM) sind sofort verfügbar.There is no setup time, the infrastructure resources (your PC or VM) are directly available.
  • Wählen Sie ein Remote-ML-Computecluster aus: Wenn Sie wie beim Erstellen von Modellen für Produktionstraining Training mit größeren Datasets durchführen, die längere Trainingszeiträume erfordern, bietet ein Remotecomputeziel eine bessere Gesamtdauer, da AutoML Trainingsprozesse über Clusterknoten hinweg parallelisiert.Choose a remote ML compute cluster: If you are training with larger datasets like in production training creating models which need longer trains, remote compute will provide much better end-to-end time performance because AutoML will parallelize trains across the cluster's nodes. Auf einem Remotecomputeziel werden etwa 1,5 Minuten pro untergeordnete Ausführung durch die Startzeit für die interne Infrastruktur hinzugefügt. Außerdem werden weitere Minuten für die Clusterinfrastruktur addiert, wenn die VMs noch nicht ausgeführt werden.On a remote compute, the start-up time for the internal infrastructure will add around 1.5 minutes per child run, plus additional minutes for the cluster infrastructure if the VMs are not yet up and running.

Vor- und NachteilePros and cons

Wägen Sie die folgenden Vor- und Nachteile gegeneinander ab, wenn Sie zwischen einem lokalen und einem Remotecomputeziel entscheiden.Consider these pros and cons when choosing to use local vs. remote.

VorteilePros (Advantages) NachteileCons (Handicaps)
Lokales ComputezielLocal compute target
  • Keine Startzeit für die UmgebungNo environment start-up time
  • Teilmenge der FeaturesSubset of features
  • Keine Parallelisierung der AusführungenCan't parallelize runs
  • Schlechter für große DatenmengenWorse for large data.
  • Kein Datenstreaming während des TrainingsNo data streaming while training
  • Keine DNN-basierte FeaturisierungNo DNN-based featurization
  • Nur Python SDKPython SDK only
  • Remote-ML-ComputeclusterRemote ML compute clusters
  • Alle FeaturesFull set of features
  • Parallelisierung untergeordneter AusführungenParallelize child runs
  • Unterstützung großer DatasetsLarge data support
  • DNN-basierte FeaturisierungDNN-based featurization
  • Dynamische Skalierbarkeit von Computeclustern nach BedarfDynamic scalability of compute cluster on demand
  • Webbenutzeroberfläche zur Verwendung ohne ProgrammiererfahrungNo-code experience (web UI) also available
  • Startzeit für ClusterknotenStart-up time for cluster nodes
  • Startzeit für jede untergeordnete AusführungStart-up time for each child run
  • Verfügbarkeit von FunktionenFeature availability

    Wie in der folgenden Tabelle gezeigt stehen Ihnen mehr Features zur Verfügung, wenn Sie Remotecompute verwenden.More features are available when you use the remote compute, as shown in the table below.

    FunktionFeature RemoteRemote LokalLocal
    Datenstreaming (Unterstützung großer Datenmengen, bis zu 100 GB)Data streaming (Large data support, up to 100 GB)
    DNN-BERT-basierte Textfeaturisierung und -trainingDNN-BERT-based text featurization and training
    Direkt einsatzbereite GPU-Unterstützung (Training und Rückschlüsse)Out-of-the-box GPU support (training and inference)
    Unterstützung von Bildklassifizierung und BezeichnungenImage Classification and Labeling support
    Auto-ARIMA-, Prophet- und ForecastTCN-Modelle für VorhersagenAuto-ARIMA, Prophet and ForecastTCN models for forecasting
    Mehrere parallele Ausführungen/IterationenMultiple runs/iterations in parallel
    Erstellen von Modellen mit Interpretierbarkeit in der AutoML Studio-WebbenutzeroberflächeCreate models with interpretability in AutoML studio web experience UI
    Anpassung des Feature Engineering in der AutoML Studio-WebbenutzeroberflächeFeature engineering customization in studio web experience UI
    Azure ML-HyperparameteroptimierungAzure ML hyperparameter tuning
    Unterstützung von Azure ML-PipelineworkflowsAzure ML Pipeline workflow support
    Fortsetzen einer AusführungContinue a run
    VorhersagenForecasting
    Erstellen und Ausführen von Experimenten in NotebooksCreate and run experiments in notebooks
    Registrieren und Visualisieren der Informationen und Metriken von Experimenten auf der BenutzeroberflächeRegister and visualize experiment's info and metrics in UI
    Schutzmaßnahmen für DatenData guardrails

    Viele ModelleMany models

    Der Many Models Solution Accelerator (Preview) (Projektmappenbeschleuniger für viele Modelle (Vorschau)) baut auf Azure Machine Learning auf und ermöglicht Ihnen die Verwendung des automatisierten maschinellen Lernens für Training, Betrieb und Verwaltung von hunderten oder sogar tausenden von Machine Learning-Modellen.The Many Models Solution Accelerator (preview) builds on Azure Machine Learning and enables you to use automated ML to train, operate, and manage hundreds or even thousands of machine learning models.

    Die Erstellung eines Modells für jede Instanz oder jede Einzelperson kann in den folgenden Szenarien z. B. zu verbesserten Ergebnissen führen:For example, building a model for each instance or individual in the following scenarios can lead to improved results:

    • Vorhersage der Umsätze für jedes einzelne GeschäftPredicting sales for each individual store
    • Vorausschauende Wartung für Hunderte von ÖlquellenPredictive maintenance for hundreds of oil wells
    • Anpassen einer Erfahrung für einzelne BenutzerTailoring an experience for individual users.

    AutoML in Azure Machine LearningAutoML in Azure Machine Learning

    Azure Machine Learning bietet zwei Möglichkeiten für die Arbeit mit automatisiertem maschinellen Lernen:Azure Machine Learning offers two experiences for working with automated ML:

    Einstellungen für das ExperimentExperiment settings

    Mit den folgenden Einstellungen können Sie Ihr Experiment für automatisiertes maschinelles Lernen konfigurieren.The following settings allow you to configure your automated ML experiment.

    Python SDKThe Python SDK Die StudioweboberflächeThe studio web experience
    Aufteilen der Daten in Trainings-/ValidierungssätzeSplit data into train/validation sets
    Unterstützt Aufgaben für maschinelles Lernen: Klassifizierung, Regression und VorhersageSupports ML tasks: classification, regression, and forecasting
    Optimiert auf Grundlage der primären MetrikOptimizes based on primary metric
    Unterstützt Azure ML-Compute als ComputezielSupports Azure ML compute as compute target
    Konfigurieren des Vorhersagehorizonts, der Zielverzögerungen und des rollierenden FenstersConfigure forecast horizon, target lags & rolling window
    Festlegen der BeendigungskriterienSet exit criteria
    Festlegen gleichzeitiger IterationenSet concurrent iterations
    Löschen von SpaltenDrop columns
    Blockieren von AlgorithmenBlock algorithms
    Kreuzvalidierung im VergleichCross validation
    Unterstützt das Training für Azure Databricks-ClusterSupports training on Azure Databricks clusters
    Anzeigen der Namen der technischen FeaturesView engineered feature names
    FeaturezusammenfassungFeaturization summary
    Featurisierung für FeiertageFeaturization for holidays
    Ausführlichkeitsgrade der ProtokolldateiLog file verbosity levels

    ModelleinstellungenModel settings

    Diese Einstellungen können auf das beste Modell als Ergebnis Ihres Experiments für das automatisierte maschinelle Lernen angewendet werden.These settings can be applied to the best model as a result of your automated ML experiment.

    Python SDKThe Python SDK Die StudioweboberflächeThe studio web experience
    Registrierung, Bereitstellung, Erklärbarkeit des besten ModellsBest model registration, deployment, explainability
    Aktivieren von Abstimmungsensemble- und Stapelensemble-ModellenEnable voting ensemble & stack ensemble models
    Anzeigen des besten Modells auf der Basis von nicht primärer MetrikShow best model based on non-primary metric
    Aktivieren/Deaktivieren der Kompatibilität des ONNX-ModellsEnable/disable ONNX model compatibility
    Testen des ModellsTest the model

    Ausführen der SteuerelementeinstellungenRun control settings

    Mit diesen Einstellungen können Sie Ihre Experimentausführungen und die Ausführungen der ihnen untergeordneten Elemente überprüfen und steuern.These settings allow you to review and control your experiment runs and its child runs.

    Python SDKThe Python SDK Die StudioweboberflächeThe studio web experience
    Ausführen der ZusammenfassungstabelleRun summary table
    Abbrechen von Ausführungen und untergeordneten AusführungenCancel runs & child runs
    Abrufen von SchutzmaßnahmenGet guardrails
    Anhalten und Fortsetzen von AusführungenPause & resume runs

    AutoML und ONNXAutoML & ONNX

    Mit Azure Machine Learning können Sie automatisiertes ML verwenden, um ein Python-Modell zu erstellen und in das ONNX-Format zu konvertieren.With Azure Machine Learning, you can use automated ML to build a Python model and have it converted to the ONNX format. Sobald die Modelle im ONNX-Format vorliegen, können sie auf einer Vielzahl von Plattformen und Geräten ausgeführt werden.Once the models are in the ONNX format, they can be run on a variety of platforms and devices. Erfahren Sie mehr über das Beschleunigen von ML-Modellen mit ONNX.Learn more about accelerating ML models with ONNX.

    Informationen zum Konvertieren in das ONNX-Format finden Sie in diesem Jupyter Notebook-Beispiel.See how to convert to ONNX format in this Jupyter notebook example. Erfahren Sie, welche Algorithmen in ONNX unterstützt werden.Learn which algorithms are supported in ONNX.

    Die ONNX-Runtime unterstützt auch C#, sodass Sie das erstellte Modell automatisch in Ihren C#-Apps verwenden können, ohne es neu codieren oder die Netzwerklatenzen in Kauf nehmen zu müssen, die REST-Endpunkte mit sich bringen.The ONNX runtime also supports C#, so you can use the model built automatically in your C# apps without any need for recoding or any of the network latencies that REST endpoints introduce. Erfahren Sie mehr über die Verwendung eines AutoML ONNX-Modells in einer .NET-Anwendung mit ML.NET und das Rückschließen von ONNX-Modellen mit der C#-API für die ONNX-Runtime.Learn more about using an AutoML ONNX model in a .NET application with ML.NET and inferencing ONNX models with the ONNX runtime C# API.

    Nächste SchritteNext steps

    Es gibt mehrere Ressourcen, um Sie mit AutoML vertraut zu machen.There are multiple resources to get you up and running with AutoML.

    Tutorials/AnleitungenTutorials/ how-tos

    Tutorials sind einführende End-to-End-Beispiele für AutoML-Szenarien.Tutorials are end-to-end introductory examples of AutoML scenarios.

    Anleitungsartikel bieten zusätzliche Informationen zu den Funktionen von AutoML.How to articles provide additional detail into what functionality AutoML offers. Beispiel:For example,

    Jupyter Notebook-BeispieleJupyter notebook samples

    Überprüfen Sie detaillierte Codebeispiele und Anwendungsfälle im GitHub-Notebook-Repository für Beispiele zum automatisierten maschinellen Lernen.Review detailed code examples and use cases in the GitHub notebook repository for automated machine learning samples.

    Referenz zum Python SDKPython SDK reference

    Vertiefen Sie Ihre Kenntnisse über SDK-Entwurfsmuster und Klassenspezifikationen mit der AutoML-Klassenreferenzdokumentation.Deepen your expertise of SDK design patterns and class specifications with the AutoML class reference documentation.

    Hinweis

    Die Funktionen des automatisierten maschinellen Lernens sind auch in anderen Lösungen von Microsoft verfügbar: ML.NET, HDInsight, Power BI und SQL ServerAutomated machine learning capabilities are also available in other Microsoft solutions such as, ML.NET, HDInsight, Power BI and SQL Server