Share via


automl Paket

Enthält automatisierte Machine Learning-Klassen für Azure Machine Learning SDKv2.

Zu den Hauptbereichen gehört die Verwaltung von AutoML-Aufgaben.

Klassen

ClassificationJob

Konfiguration für AutoML-Klassifizierungsauftrag.

Initialisieren Sie einen neuen AutoML-Klassifizierungstask.

ColumnTransformer

Spaltentransformatoreinstellungen.

ForecastingJob

Konfiguration für AutoML-Vorhersagetask.

Initialisieren Sie einen neuen AutoML-Prognosetask.

ForecastingSettings

Vorhersageeinstellungen für einen AutoML-Auftrag.

ImageClassificationJob

Konfiguration für Den AutoML-Auftrag für die Imageklassifizierung mit mehreren Klassen.

Initialisieren Sie einen neuen AutoML-Imageklassifizierungsauftrag mit mehreren Klassen.

ImageClassificationMultilabelJob

Konfiguration für Den AutoML-Auftrag für die Imageklassifizierung mit mehreren Bezeichnungen.

Initialisieren Sie einen neuen AutoML-Imageklassifizierungsauftrag mit mehreren Bezeichnungen.

ImageClassificationSearchSpace

Suchen Sie den Speicherplatz nach Aufgaben der AutoML-Bildklassifizierung und der Bildklassifizierung mit mehreren Bezeichnungen.

ImageInstanceSegmentationJob

Konfiguration für AutoML-Imageinstanzsegmentierungsauftrag.

Initialisieren Sie einen neuen AutoML Image Instance Segmentation-Auftrag.

ImageLimitSettings

Einschränken von Einstellungen für AutoML Image Verticals.

ImageLimitSettings ist eine Klasse, die die folgenden Parameter enthält: max_concurrent_trials, max_trials und timeout_minutes.

Dies ist eine optionale Konfigurationsmethode zum Konfigurieren von Grenzwerten für Parameter wie Timeouts usw.

Hinweis

Die Anzahl der gleichzeitigen Läufe wird durch die im angegebenen Computeziel verfügbaren Ressourcen beschränkt.

Stellen Sie sicher, dass das Computeziel die verfügbaren Ressourcen für die gewünschte Parallelität aufweist.

Tipp

Es empfiehlt sich, max_concurrent_trials Anzahl mit der Anzahl der Knoten im Cluster abzugleichen.

Wenn Sie beispielsweise über einen Cluster mit vier Knoten verfügen, legen Sie max_concurrent_trials auf 4 fest.

Beispielsyntax

Konfiguration von ImageLimitSettings


   from azure.ai.ml import automl

   # Create the AutoML job with the related factory-function.
   image_instance_segmentation_job = automl.image_instance_segmentation(
       compute=compute_name,
       experiment_name=exp_name,
       training_data=my_training_data_input,
       validation_data=my_validation_data_input,
       target_column_name="label",
       primary_metric="MeanAveragePrecision",
       tags={"my_custom_tag": "custom value"},
   )
   # Set the limits for the AutoML job.
   image_instance_segmentation_job.set_limits(
       max_trials=10,
       max_concurrent_trials=2,
   )
   # Submit the AutoML job.
   image_instance_segmentation_job.submit()

Initialisieren Sie ein ImageLimitSettings-Objekt.

Konstruktor für ImageLimitSettings für AutoML Image Verticals.

ImageModelSettingsClassification

Modelleinstellungen für AutoML-Bildklassifizierungsaufgaben.

ImageModelSettingsObjectDetection

Modelleinstellungen für autoML Image Object Detection Task.

ImageObjectDetectionJob

Konfiguration für den AutoML-Imageobjekterkennungsauftrag.

Initialisieren Sie einen neuen AutoML Image Object Detection-Auftrag.

ImageObjectDetectionSearchSpace

Suchen Sie den Speicherplatz für Die AutoML-Bildobjekterkennung und die Segmentierung von Bildinstanzen.

ImageSweepSettings

Sweepeinstellungen für alle AutoML Image Verticals.

NlpFeaturizationSettings

Featurisierungseinstellungen für alle AutoML-NLP-Vertikalen.

NlpFixedParameters

Objekt, um feste Parameter für NLP-Aufträge zu beherbergen.

NlpLimitSettings

Einschränken der Einstellungen für alle AutoML-NLP-Vertikalen.

NlpSearchSpace

Suchen Sie nach AutoML NLP-Aufgaben.

NlpSweepSettings

Sweepeinstellungen für alle AutoML-NLP-Aufgaben.

RegressionJob

Konfiguration für AutoML-Regressionsauftrag.

Initialisieren Sie einen neuen AutoML-Regressionstask.

SearchSpace

SearchSpace-Klasse für AutoML-Vertikals.

StackEnsembleSettings

Erweiterte Einstellung zum Anpassen der StackEnsemble-Ausführung.

TabularFeaturizationSettings

Featurisierungseinstellungen für einen AutoML-Auftrag.

TabularLimitSettings

Einschränken der Einstellungen für eine AutoML-Tabellen verticals.

TextClassificationJob

Konfiguration für AutoML-Textklassifizierungsauftrag.

Initialisiert einen neuen AutoML-Textklassifizierungstask.

TextClassificationMultilabelJob

Konfiguration für AutoML-Textklassifizierungsauftrag mit mehreren Bezeichnungen.

Initialisiert einen neuen AutoML-Textklassifizierungs-Multilabel-Task.

TextNerJob

Konfiguration für AutoML-Text-NER-Auftrag.

Initialisiert einen neuen AutoML-Text-NER-Task.

TrainingSettings

TrainingSettings-Klasse für Azure Machine Learning.

TrainingSettings-Klasse für Azure Machine Learning.

Enumerationen

BlockedTransformers

Enumeration für alle klassifizierungsmodelle, die von AutoML unterstützt werden.

ClassificationModels

Enumeration für alle klassifizierungsmodelle, die von AutoML unterstützt werden.

ClassificationMultilabelPrimaryMetrics

Primäre Metriken für Klassifizierungsaufgaben mit mehreren Bezeichnungen.

ClassificationPrimaryMetrics

Primäre Metriken für Klassifizierungsaufgaben.

FeaturizationMode

Featurisierungsmodus: Bestimmt den Datenfeaturisierungsmodus.

ForecastHorizonMode

Aufzählung, um den Auswahlmodus für den Vorhersagehorizont zu bestimmen.

ForecastingModels

Enumeration für alle Vorhersagemodelle, die von AutoML unterstützt werden.

ForecastingPrimaryMetrics

Primäre Metriken für den Vorhersagetask.

InstanceSegmentationPrimaryMetrics

Primäre Metriken für InstanceSegmentation-Aufgaben.

LearningRateScheduler

Aufzählung der Lernratenplanung.

LogTrainingMetrics

Enthält automatisierte Machine Learning-Klassen für Azure Machine Learning SDKv2.

Zu den Hauptbereichen gehört die Verwaltung von AutoML-Aufgaben.

LogValidationLoss

Enthält automatisierte Machine Learning-Klassen für Azure Machine Learning SDKv2.

Zu den Hauptbereichen gehört die Verwaltung von AutoML-Aufgaben.

NCrossValidationsMode

Bestimmt, wie der Wert der N-Kreuzüberprüfungen bestimmt wird.

ObjectDetectionPrimaryMetrics

Primäre Metriken für den Task Image ObjectDetection.

RegressionModels

Enumeration für alle Regressionsmodelle, die von AutoML unterstützt werden.

RegressionPrimaryMetrics

Primäre Metriken für regressionstask.

SamplingAlgorithmType

Enthält automatisierte Machine Learning-Klassen für Azure Machine Learning SDKv2.

Zu den Hauptbereichen gehört die Verwaltung von AutoML-Aufgaben.

ShortSeriesHandlingConfiguration

Der Parameter definiert, wie kurze Zeitreihen beim automatisierten maschinellen Lernen verarbeitet werden.

StochasticOptimizer

Stochastischer Optimierer für Bildmodelle.

TargetAggregationFunction

Zielaggregatfunktion.

TargetLagsMode

Zielverzögerungsmodi.

TargetRollingWindowSizeMode

Größenmodus für rollende Fenster als Ziel.

UseStl

Konfigurieren Sie die STL-Aufschlüsselung der Zeitreihen-Zielspalte.

ValidationMetricType

Metrikberechnungsmethode, die für Validierungsmetriken in Bildaufgaben verwendet werden soll.

Functions

classification

Funktion zum Erstellen eines Klassifizierungsauftrags.

Ein Klassifizierungsauftrag wird verwendet, um ein Modell zu trainieren, das die Klasse eines Datenbeispiels am besten vorhersagt. Mit den Trainingsdaten werden verschiedene Modelle trainiert. Das Modell mit der besten Leistung für die Validierungsdaten basierend auf der primären Metrik wird als endgültiges Modell ausgewählt.

classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob

Parameter

training_data
Input

Die Trainingsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Bezeichnungsspalte (optional eine Spalte mit Stichprobengewichtungen) enthalten.

target_column_name
str

Der Name der Bezeichnungsspalte. Dieser Parameter gilt für training_dataParameter und validation_datatest_data

primary_metric

Die Metrik, die vom automatisierten maschinellen Lernen für die Modellauswahl optimiert wird. Beim automatisierten maschinellen Lernen werden mehr Metriken erfasst als optimiert werden können. Weitere Informationen zur Berechnung von Metriken finden Sie unter https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Zulässige Werte: Genauigkeit, AUC_weighted, norm_macro_recall, average_precision_score_weighted und precision_score_weighted Standardwerte auf Genauigkeit

enable_model_explainability
bool

Gibt an, ob die Erläuterung des besten AutoML-Modells am Ende aller AutoML-Trainingsiterationen aktiviert werden soll. Der Standardwert ist „None“. Weitere Informationen finden Sie unter Interpretierbarkeit: Modellerklärungen beim automatisierten maschinellen Lernen.

weight_column_name
str

Der Name der Spalte mit Stichprobengewichtungen. Das automatisierte maschinelle Lernen unterstützt eine gewichtete Spalte als Eingabe, wodurch Zeilen in den Daten eine höhere oder niedrigere Gewichtung erhalten. Wenn die Eingabedaten aus einem pandas.DataFrame stammen, der über keine Spaltennamen verfügt, können stattdessen als ganze Zahlen ausgedrückte Spaltenindizes verwendet werden.

Dieser Parameter gilt für training_data Parameter und validation_data

validation_data
Input

Die Validierungsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Bezeichnungsspalte (optional eine Spalte mit Stichprobengewichtungen) enthalten.

Standardwert auf "Keine"

validation_data_size
float

Der Teil der Daten, der für die Validierung zurückbehalten werden soll, wenn keine Benutzervalidierungsdaten angegeben werden. Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen.

Geben Sie validation_data an, um Validierungsdaten anzugeben, andernfalls legen Sie n_cross_validations oder validation_data_size fest, um Validierungsdaten aus den angegebenen Trainingsdaten zu extrahieren. Verwenden Sie für einen benutzerdefinierten Kreuzvalidierungsfold cv_split_column_names.

Weitere Informationen finden Sie unter Konfigurieren von Datenaufteilung und Kreuzvalidierung im automatisierten maschinellen Lernen.

Standardwert auf "Keine"

n_cross_validations
Union[str, int]

Gibt an, wie viele Kreuzvalidierungen durchzuführen sind, wenn keine Benutzervalidierungsdaten angegeben sind.

Geben Sie validation_data an, um Validierungsdaten anzugeben, andernfalls legen Sie n_cross_validations oder validation_data_size fest, um Validierungsdaten aus den angegebenen Trainingsdaten zu extrahieren. Verwenden Sie für einen benutzerdefinierten Kreuzvalidierungsfold cv_split_column_names.

Weitere Informationen finden Sie unter Konfigurieren von Datenaufteilung und Kreuzvalidierung im automatisierten maschinellen Lernen.

Standardwert auf "Keine"

cv_split_column_names
List[str]

Liste der Namen der Spalten mit benutzerdefinierter Kreuzvalidierungsaufteilung. Jede der CV-Aufteilungsspalten stellt eine CV-Aufteilung dar, wobei jede Zeile mit 1 für Training oder 0 für Validierung markiert ist.

Standardwert auf "Keine"

test_data
Input

Das Modelltestfeature, das Testdatasets oder Testdatenaufteilungen verwendet, befindet sich in der Vorschau und kann sich jederzeit ändern. Die Testdaten, die für einen Testlauf verwendet werden sollen, der nach Abschluss des Modelltrainings automatisch gestartet wird. Der Testlauf erhält Vorhersagen mithilfe des besten Modells und berechnet anhand dieser Vorhersagen entsprechende Metriken.

Wenn dieser Parameter oder der Parameter test_data_size nicht angegeben ist, wird nach Abschluss des Modelltrainings kein Testlauf automatisch ausgeführt. Testdaten sollten sowohl Features als auch Bezeichnungsspalten enthalten. Wenn test_data angegeben wird, muss der Parameter target_column_name angegeben werden.

Standardwert auf "Keine"

test_data_size
float

Das Modelltestfeature, das Testdatasets oder Testdatenaufteilungen verwendet, befindet sich in der Vorschau und kann sich jederzeit ändern. Der Teil der Trainingsdaten, der für Testdaten für einen Testlauf zurückbehalten werden soll, der nach Abschluss des Modelltrainings automatisch gestartet wird. Der Testlauf erhält Vorhersagen mithilfe des besten Modelle und berechnet anhand dieser Vorhersagen entsprechende Metriken.

Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen. Wenn test_data_size zur gleichen Zeit wie validation_data_sizeangegeben wird, werden die Testdaten von training_data getrennt, bevor die Validierungsdaten getrennt werden. Wenn beispielsweise validation_data_size=0.1 und test_data_size=0.1 angegeben werden und die ursprünglichen Trainingsdaten 1000 Zeilen enthalten, enthalten die Testdaten 100 Zeilen, die Validierungsdaten 90 Zeilen und die Trainingsdaten 810 Zeilen.

Für regressionsbasierte Aufgaben werden zufällige Stichproben genommen. Für Klassifizierungsaufgaben werden geschichtete Stichproben genommen. Die Vorhersage unterstützt derzeit nicht die Angabe eines Testdatensatzes mit einer Aufteilung in Training und Test.

Wenn dieser Parameter oder der Parameter test_data nicht angegeben ist, wird nach Abschluss des Modelltrainings kein Testlauf automatisch ausgeführt.

Standardwert auf "Keine"

Gibt zurück

Ein Auftragsobjekt, das zur Ausführung an eine Azure ML-Compute-Instanz übermittelt werden kann.

Rückgabetyp

forecasting

Funktion zum Erstellen eines Vorhersageauftrags.

Ein Vorhersagetask wird verwendet, um Zielwerte für einen zukünftigen Zeitraum basierend auf den Verlaufsdaten vorherzusagen. Mit den Trainingsdaten werden verschiedene Modelle trainiert. Das Modell mit der besten Leistung für die Validierungsdaten basierend auf der primären Metrik wird als endgültiges Modell ausgewählt.

forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob

Parameter

training_data
Input

Die Trainingsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Bezeichnungsspalte (optional eine Spalte mit Stichprobengewichtungen) enthalten.

target_column_name
str

Der Name der Bezeichnungsspalte. Dieser Parameter gilt für training_dataParameter und validation_datatest_data

primary_metric

Die Metrik, die vom automatisierten maschinellen Lernen für die Modellauswahl optimiert wird. Beim automatisierten maschinellen Lernen werden mehr Metriken erfasst als optimiert werden können. Weitere Informationen zur Berechnung von Metriken finden Sie unter https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Zulässige Werte: r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error Standardwerte auf normalized_root_mean_squared_error

enable_model_explainability
bool

Gibt an, ob die Erläuterung des besten AutoML-Modells am Ende aller AutoML-Trainingsiterationen aktiviert werden soll. Der Standardwert ist „None“. Weitere Informationen finden Sie unter Interpretierbarkeit: Modellerklärungen beim automatisierten maschinellen Lernen.

weight_column_name
str

Der Name der Spalte mit Stichprobengewichtungen. Das automatisierte maschinelle Lernen unterstützt eine gewichtete Spalte als Eingabe, wodurch Zeilen in den Daten eine höhere oder niedrigere Gewichtung erhalten. Wenn die Eingabedaten aus einem pandas.DataFrame stammen, der über keine Spaltennamen verfügt, können stattdessen als ganze Zahlen ausgedrückte Spaltenindizes verwendet werden.

Dieser Parameter gilt für training_data Parameter und validation_data

validation_data
Input

Die Validierungsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Bezeichnungsspalte (optional eine Spalte mit Stichprobengewichtungen) enthalten.

Standardwert auf "Keine"

validation_data_size
float

Der Teil der Daten, der für die Validierung zurückbehalten werden soll, wenn keine Benutzervalidierungsdaten angegeben werden. Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen.

Geben Sie validation_data an, um Validierungsdaten anzugeben, andernfalls legen Sie n_cross_validations oder validation_data_size fest, um Validierungsdaten aus den angegebenen Trainingsdaten zu extrahieren. Verwenden Sie für einen benutzerdefinierten Kreuzvalidierungsfold cv_split_column_names.

Weitere Informationen finden Sie unter Konfigurieren von Datenaufteilung und Kreuzvalidierung im automatisierten maschinellen Lernen.

Standardwert auf "Keine"

n_cross_validations
Union[str, int]

Gibt an, wie viele Kreuzvalidierungen durchzuführen sind, wenn keine Benutzervalidierungsdaten angegeben sind.

Geben Sie validation_data an, um Validierungsdaten anzugeben, andernfalls legen Sie n_cross_validations oder validation_data_size fest, um Validierungsdaten aus den angegebenen Trainingsdaten zu extrahieren. Verwenden Sie für einen benutzerdefinierten Kreuzvalidierungsfold cv_split_column_names.

Weitere Informationen finden Sie unter Konfigurieren von Datenaufteilung und Kreuzvalidierung im automatisierten maschinellen Lernen.

Standardwert auf "Keine"

cv_split_column_names
List[str]

Liste der Namen der Spalten mit benutzerdefinierter Kreuzvalidierungsaufteilung. Jede der CV-Aufteilungsspalten stellt eine CV-Aufteilung dar, wobei jede Zeile mit 1 für Training oder 0 für Validierung markiert ist.

Standardwert auf "Keine"

test_data
Input

Das Modelltestfeature, das Testdatasets oder Testdatenaufteilungen verwendet, befindet sich in der Vorschau und kann sich jederzeit ändern. Die Testdaten, die für einen Testlauf verwendet werden sollen, der nach Abschluss des Modelltrainings automatisch gestartet wird. Der Testlauf erhält Vorhersagen mithilfe des besten Modells und berechnet anhand dieser Vorhersagen entsprechende Metriken.

Wenn dieser Parameter oder der Parameter test_data_size nicht angegeben ist, wird nach Abschluss des Modelltrainings kein Testlauf automatisch ausgeführt. Testdaten sollten sowohl Features als auch Bezeichnungsspalten enthalten. Wenn test_data angegeben wird, muss der Parameter target_column_name angegeben werden.

Standardwert auf "Keine"

test_data_size
float

Die Modelltestfunktion, die Testdatasets oder Testdatenaufteilungen verwendet, befindet sich in der Vorschau und kann sich jederzeit ändern. Der Teil der Trainingsdaten, der für Testdaten für einen Testlauf zurückbehalten werden soll, der nach Abschluss des Modelltrainings automatisch gestartet wird. Der Testlauf erhält Vorhersagen mithilfe des besten Modells und berechnet anhand dieser Vorhersagen entsprechende Metriken.

Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen. Wenn test_data_size zur gleichen Zeit wie validation_data_sizeangegeben wird, werden die Testdaten von training_data getrennt, bevor die Validierungsdaten getrennt werden. Wenn beispielsweise validation_data_size=0.1 und test_data_size=0.1 angegeben werden und die ursprünglichen Trainingsdaten 1000 Zeilen enthalten, enthalten die Testdaten 100 Zeilen, die Validierungsdaten 90 Zeilen und die Trainingsdaten 810 Zeilen.

Für regressionsbasierte Aufgaben werden zufällige Stichproben genommen. Für Klassifizierungsaufgaben werden geschichtete Stichproben genommen. Die Vorhersage unterstützt derzeit nicht die Angabe eines Testdatensatzes mit einer Aufteilung in Training und Test.

Wenn dieser Parameter oder der Parameter test_data nicht angegeben ist, wird nach Abschluss des Modelltrainings kein Testlauf automatisch ausgeführt.

Standardwert auf "Keine"

forecasting_settings
ForecastingSettings

Die Einstellungen für den Vorhersagetask

Gibt zurück

Ein Auftragsobjekt, das zur Ausführung an eine Azure ML-Compute-Instanz übermittelt werden kann.

Rückgabetyp

image_classification

Erstellt ein -Objekt für den AutoML-Image-Multiklassenklassifizierungsauftrag.

image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob

Parameter

training_data
Input

Die Trainingsdaten, die im Experiment verwendet werden sollen.

target_column_name
str

Der Name der Bezeichnungsspalte. Dieser Parameter gilt für die Parameter training_data und validation_data.

primary_metric

Die Metrik, die vom automatisierten maschinellen Lernen für die Modellauswahl optimiert wird. Beim automatisierten maschinellen Lernen werden mehr Metriken erfasst als optimiert werden können. Weitere Informationen zur Berechnung von Metriken finden Sie unter https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Zulässige Werte: Genauigkeit, AUC_weighted, norm_macro_recall, average_precision_score_weighted und precision_score_weighted Standardwerte auf Genauigkeit.

validation_data
Input

Die Validierungsdaten, die im Experiment verwendet werden sollen.

validation_data_size
float

Der Teil der Daten, der für die Validierung zurückbehalten werden soll, wenn keine Benutzervalidierungsdaten angegeben werden. Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen.

Geben Sie an validation_data , um Validierungsdaten bereitzustellen, andernfalls festgelegt validation_data_size , um Validierungsdaten aus den angegebenen Trainingsdaten zu extrahieren.

Standardwert auf .2

kwargs
dict

Ein Wörterbuch mit zusätzlichen Konfigurationsparametern.

Gibt zurück

Bildklassifizierungsauftragsobjekt, das zur Ausführung an eine Azure ML-Compute-Instanz übermittelt werden kann.

Rückgabetyp

image_classification_multilabel

Erstellt ein -Objekt für den AutoML-Image-Klassifizierungsauftrag mit mehreren Bezeichnungen.

image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob

Parameter

training_data
Input

Die Trainingsdaten, die im Experiment verwendet werden sollen.

target_column_name
str

Der Name der Bezeichnungsspalte. Dieser Parameter gilt für die Parameter training_data und validation_data.

primary_metric

Die Metrik, die vom automatisierten maschinellen Lernen für die Modellauswahl optimiert wird. Beim automatisierten maschinellen Lernen werden mehr Metriken erfasst als optimiert werden können. Weitere Informationen zur Berechnung von Metriken finden Sie unter https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Zulässige Werte: Genauigkeit, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted und Iou Defaults to Iou.

validation_data
Input

Die Validierungsdaten, die im Experiment verwendet werden sollen.

validation_data_size
float

Der Teil der Daten, der für die Validierung zurückbehalten werden soll, wenn keine Benutzervalidierungsdaten angegeben werden. Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen.

Geben Sie an validation_data , um Validierungsdaten bereitzustellen, andernfalls festgelegt validation_data_size , um Validierungsdaten aus den angegebenen Trainingsdaten zu extrahieren.

Standardwert: .2

kwargs
dict

Ein Wörterbuch mit zusätzlichen Konfigurationsparametern.

Gibt zurück

Image eines Auftragsobjekts mit mehreren Bezeichnungen, das zur Ausführung an eine Azure ML-Compute-Instanz übermittelt werden kann.

Rückgabetyp

image_instance_segmentation

Erstellt ein -Objekt für den AutoML Image Instance Segmentation-Auftrag.

image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob

Parameter

training_data
Input

Die Trainingsdaten, die im Experiment verwendet werden sollen.

target_column_name
str

Der Name der Bezeichnungsspalte. Dieser Parameter gilt für die Parameter training_data und validation_data.

primary_metric

Die Metrik, die vom automatisierten maschinellen Lernen für die Modellauswahl optimiert wird. Beim automatisierten maschinellen Lernen werden mehr Metriken erfasst als optimiert werden können. Weitere Informationen zur Berechnung von Metriken finden Sie unter https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Zulässige Werte: MeanAveragePrecision Defaults to MeanAveragePrecision.

validation_data
Input

Die Validierungsdaten, die im Experiment verwendet werden sollen.

validation_data_size
float

Der Teil der Daten, der für die Validierung zurückbehalten werden soll, wenn keine Benutzervalidierungsdaten angegeben werden. Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen.

Geben Sie an validation_data , um Validierungsdaten bereitzustellen, andernfalls festgelegt validation_data_size , um Validierungsdaten aus den angegebenen Trainingsdaten zu extrahieren.

Standardwert: .2

kwargs
dict

Ein Wörterbuch mit zusätzlichen Konfigurationsparametern.

Gibt zurück

Image instance Segmentierungsauftrag

Rückgabetyp

image_object_detection

Erstellt ein -Objekt für den AutoML-Auftrag zur Bildobjekterkennung.

image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob

Parameter

training_data
Input

Die Trainingsdaten, die im Experiment verwendet werden sollen.

target_column_name
str

Der Name der Bezeichnungsspalte. Dieser Parameter gilt für die Parameter training_data und validation_data.

primary_metric

Die Metrik, die vom automatisierten maschinellen Lernen für die Modellauswahl optimiert wird. Beim automatisierten maschinellen Lernen werden mehr Metriken erfasst als optimiert werden können. Weitere Informationen zur Berechnung von Metriken finden Sie unter https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Zulässige Werte: MeanAveragePrecision Defaults to MeanAveragePrecision.

validation_data
Input

Die Validierungsdaten, die im Experiment verwendet werden sollen.

validation_data_size
float

Der Teil der Daten, der für die Validierung zurückbehalten werden soll, wenn keine Benutzervalidierungsdaten angegeben werden. Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen.

Geben Sie an validation_data , um Validierungsdaten bereitzustellen, andernfalls festgelegt validation_data_size , um Validierungsdaten aus den angegebenen Trainingsdaten zu extrahieren.

Standardwert: .2

kwargs
dict

Ein Wörterbuch mit zusätzlichen Konfigurationsparametern.

Gibt zurück

Auftragsobjekt der Bildobjekterkennung, das zur Ausführung an eine Azure ML-Compute-Instanz übermittelt werden kann.

Rückgabetyp

regression

Funktion zum Erstellen eines Regressionsauftrags.

Ein Regressionsauftrag wird verwendet, um ein Modell zu trainieren, um fortlaufende Werte einer Zielvariable aus einem Dataset vorherzusagen. Mit den Trainingsdaten werden verschiedene Modelle trainiert. Das Modell mit der besten Leistung für die Validierungsdaten basierend auf der primären Metrik wird als endgültiges Modell ausgewählt.

regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob

Parameter

training_data
Input

Die Trainingsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Bezeichnungsspalte (optional eine Spalte mit Stichprobengewichtungen) enthalten.

target_column_name
str

Der Name der Bezeichnungsspalte. Dieser Parameter gilt für die training_dataParameter , validation_data und test_data

primary_metric

Die Metrik, die vom automatisierten maschinellen Lernen für die Modellauswahl optimiert wird. Beim automatisierten maschinellen Lernen werden mehr Metriken erfasst als optimiert werden können. Weitere Informationen zur Berechnung von Metriken finden Sie unter https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Zulässige Werte: spearman_correlation, r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error. Standardmäßig normalized_root_mean_squared_error

enable_model_explainability
bool

Gibt an, ob die Erläuterung des besten AutoML-Modells am Ende aller AutoML-Trainingsiterationen aktiviert werden soll. Der Standardwert ist „None“. Weitere Informationen finden Sie unter Interpretierbarkeit: Modellerklärungen beim automatisierten maschinellen Lernen.

weight_column_name
str

Der Name der Spalte mit Stichprobengewichtungen. Das automatisierte maschinelle Lernen unterstützt eine gewichtete Spalte als Eingabe, wodurch Zeilen in den Daten eine höhere oder niedrigere Gewichtung erhalten. Wenn die Eingabedaten aus einem pandas.DataFrame stammen, der über keine Spaltennamen verfügt, können stattdessen als ganze Zahlen ausgedrückte Spaltenindizes verwendet werden.

Dieser Parameter gilt für training_data parameter und validation_data

validation_data
Input

Die Validierungsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Bezeichnungsspalte (optional eine Spalte mit Stichprobengewichtungen) enthalten.

Der Standardwert ist "None".

validation_data_size
float

Der Teil der Daten, der für die Validierung zurückbehalten werden soll, wenn keine Benutzervalidierungsdaten angegeben werden. Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen.

Geben Sie validation_data an, um Validierungsdaten anzugeben, andernfalls legen Sie n_cross_validations oder validation_data_size fest, um Validierungsdaten aus den angegebenen Trainingsdaten zu extrahieren. Verwenden Sie für einen benutzerdefinierten Kreuzvalidierungsfold cv_split_column_names.

Weitere Informationen finden Sie unter Konfigurieren von Datenaufteilung und Kreuzvalidierung im automatisierten maschinellen Lernen.

Der Standardwert ist "None".

n_cross_validations
Union[str, int]

Gibt an, wie viele Kreuzvalidierungen durchzuführen sind, wenn keine Benutzervalidierungsdaten angegeben sind.

Geben Sie validation_data an, um Validierungsdaten anzugeben, andernfalls legen Sie n_cross_validations oder validation_data_size fest, um Validierungsdaten aus den angegebenen Trainingsdaten zu extrahieren. Verwenden Sie für einen benutzerdefinierten Kreuzvalidierungsfold cv_split_column_names.

Weitere Informationen finden Sie unter Konfigurieren von Datenaufteilung und Kreuzvalidierung im automatisierten maschinellen Lernen.

Der Standardwert ist "None".

cv_split_column_names
List[str]

Liste der Namen der Spalten mit benutzerdefinierter Kreuzvalidierungsaufteilung. Jede der CV-Aufteilungsspalten stellt eine CV-Aufteilung dar, wobei jede Zeile mit 1 für Training oder 0 für Validierung markiert ist.

Der Standardwert ist "None".

test_data
Input

Die Modelltestfunktion, die Testdatasets oder Testdatenaufteilungen verwendet, befindet sich in der Vorschau und kann sich jederzeit ändern. Die Testdaten, die für einen Testlauf verwendet werden sollen, der nach Abschluss des Modelltrainings automatisch gestartet wird. Der Testlauf erhält Vorhersagen mithilfe des besten Modells und berechnet anhand dieser Vorhersagen entsprechende Metriken.

Wenn dieser Parameter oder der Parameter test_data_size nicht angegeben ist, wird nach Abschluss des Modelltrainings kein Testlauf automatisch ausgeführt. Testdaten sollten sowohl Features als auch Bezeichnungsspalten enthalten. Wenn test_data angegeben wird, muss der Parameter target_column_name angegeben werden.

Der Standardwert ist "None".

test_data_size
float

Die Modelltestfunktion, die Testdatasets oder Testdatenaufteilungen verwendet, befindet sich in der Vorschau und kann sich jederzeit ändern. Der Teil der Trainingsdaten, der für Testdaten für einen Testlauf zurückbehalten werden soll, der nach Abschluss des Modelltrainings automatisch gestartet wird. Der Testlauf erhält Vorhersagen mithilfe des besten Modells und berechnet anhand dieser Vorhersagen entsprechende Metriken.

Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen. Wenn test_data_size zur gleichen Zeit wie validation_data_sizeangegeben wird, werden die Testdaten von training_data getrennt, bevor die Validierungsdaten getrennt werden. Wenn beispielsweise validation_data_size=0.1 und test_data_size=0.1 angegeben werden und die ursprünglichen Trainingsdaten 1000 Zeilen enthalten, enthalten die Testdaten 100 Zeilen, die Validierungsdaten 90 Zeilen und die Trainingsdaten 810 Zeilen.

Für regressionsbasierte Aufgaben werden zufällige Stichproben genommen. Für Klassifizierungsaufgaben werden geschichtete Stichproben genommen. Die Vorhersage unterstützt derzeit nicht die Angabe eines Testdatensatzes mit einer Aufteilung in Training und Test.

Wenn dieser Parameter oder der Parameter test_data nicht angegeben ist, wird nach Abschluss des Modelltrainings kein Testlauf automatisch ausgeführt.

Der Standardwert ist "None".

Gibt zurück

Ein Auftragsobjekt, das zur Ausführung an eine Azure ML-Compute-Instanz übermittelt werden kann.

Rückgabetyp

text_classification

Funktion zum Erstellen eines TextClassificationJobs.

Ein Textklassifizierungsauftrag wird verwendet, um ein Modell zu trainieren, das die Klasse/Kategorie einer Textdaten vorhersagen kann. Eingabetrainingsdaten sollten eine Zielspalte enthalten, die den Text in genau eine Klasse klassifiziert.

text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob

Parameter

training_data
Input

Die Trainingsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Zielspalte enthalten.

target_column_name
str

Name der Zielspalte.

validation_data
Input

Die Validierungsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Zielspalte enthalten.

primary_metric
Union[str, ClassificationPrimaryMetrics]

Primäre Metrik für die Aufgabe. Zulässige Werte: Genauigkeit, AUC_weighted, precision_score_weighted

log_verbosity
str

Protokoll-Ausführlichkeitsebene.

kwargs
dict

Ein Wörterbuch mit zusätzlichen Konfigurationsparametern.

Gibt zurück

Das TextClassificationJob-Objekt.

Rückgabetyp

text_classification_multilabel

Funktion zum Erstellen eines TextClassificationMultilabelJobs.

Ein Textklassifizierungsauftrag mit mehreren Bezeichnungen wird verwendet, um ein Modell zu trainieren, das die Klassen/Kategorien einer Textdaten vorhersagen kann. Eingabetrainingsdaten sollten eine Zielspalte enthalten, die den Text in Klassen klassifiziert. Weitere Informationen zum Format von Mehrzeichendaten finden Sie unter: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label

text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob

Parameter

training_data
Input

Die Trainingsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Zielspalte enthalten.

target_column_name
str

Name der Zielspalte.

validation_data
Input

Die Validierungsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Zielspalte enthalten.

primary_metric
str

Primäre Metrik für die Aufgabe. Akzeptable Werte: Genauigkeit

log_verbosity
str

Protokoll-Ausführlichkeitsebene.

kwargs
dict

Ein Wörterbuch mit zusätzlichen Konfigurationsparametern.

Gibt zurück

Das TextClassificationMultilabelJob-Objekt.

Rückgabetyp

text_ner

Funktion zum Erstellen eines TextNerJobs.

Ein Textauftrag für die Erkennung von Entitäten wird verwendet, um ein Modell zu trainieren, das die benannten Entitäten im Text vorhersagen kann. Eingabetrainingsdaten sollten eine Textdatei im CoNLL-Format sein. Weitere Informationen zum Format von Text-NER-Daten finden Sie unter: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner

text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob

Parameter

training_data
Input

Die Trainingsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Zielspalte enthalten.

validation_data
Input

Die Validierungsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Zielspalte enthalten.

primary_metric
str

Primäre Metrik für die Aufgabe. Akzeptable Werte: Genauigkeit

log_verbosity
str

Protokoll-Ausführlichkeitsebene.

kwargs
dict

Ein Wörterbuch mit zusätzlichen Konfigurationsparametern.

Gibt zurück

Das TextNerJob-Objekt.

Rückgabetyp