automl Paket

Referenz

Enthält automatisierte Machine Learning-Klassen für Azure Machine Learning SDKv2.

Zu den Hauptbereichen gehört die Verwaltung von AutoML-Aufgaben.

Klassen

ClassificationJob	Konfiguration für AutoML-Klassifizierungsauftrag. Initialisieren Sie einen neuen AutoML-Klassifizierungstask.
ColumnTransformer	Spaltentransformatoreinstellungen.
ForecastingJob	Konfiguration für AutoML-Vorhersagetask. Initialisieren Sie einen neuen AutoML-Prognosetask.
ForecastingSettings	Vorhersageeinstellungen für einen AutoML-Auftrag.
ImageClassificationJob	Konfiguration für Den AutoML-Auftrag für die Imageklassifizierung mit mehreren Klassen. Initialisieren Sie einen neuen AutoML-Imageklassifizierungsauftrag mit mehreren Klassen.
ImageClassificationMultilabelJob	Konfiguration für Den AutoML-Auftrag für die Imageklassifizierung mit mehreren Bezeichnungen. Initialisieren Sie einen neuen AutoML-Imageklassifizierungsauftrag mit mehreren Bezeichnungen.
ImageClassificationSearchSpace	Suchen Sie den Speicherplatz nach Aufgaben der AutoML-Bildklassifizierung und der Bildklassifizierung mit mehreren Bezeichnungen.
ImageInstanceSegmentationJob	Konfiguration für AutoML-Imageinstanzsegmentierungsauftrag. Initialisieren Sie einen neuen AutoML Image Instance Segmentation-Auftrag.
ImageLimitSettings	Einschränken von Einstellungen für AutoML Image Verticals. ImageLimitSettings ist eine Klasse, die die folgenden Parameter enthält: max_concurrent_trials, max_trials und timeout_minutes. Dies ist eine optionale Konfigurationsmethode zum Konfigurieren von Grenzwerten für Parameter wie Timeouts usw. Hinweis Die Anzahl der gleichzeitigen Läufe wird durch die im angegebenen Computeziel verfügbaren Ressourcen beschränkt. Stellen Sie sicher, dass das Computeziel die verfügbaren Ressourcen für die gewünschte Parallelität aufweist. Tipp Es empfiehlt sich, max_concurrent_trials Anzahl mit der Anzahl der Knoten im Cluster abzugleichen. Wenn Sie beispielsweise über einen Cluster mit vier Knoten verfügen, legen Sie max_concurrent_trials auf 4 fest. Beispielsyntax Konfiguration von ImageLimitSettings from azure.ai.ml import automl # Create the AutoML job with the related factory-function. image_instance_segmentation_job = automl.image_instance_segmentation( compute=compute_name, experiment_name=exp_name, training_data=my_training_data_input, validation_data=my_validation_data_input, target_column_name="label", primary_metric="MeanAveragePrecision", tags={"my_custom_tag": "custom value"}, ) # Set the limits for the AutoML job. image_instance_segmentation_job.set_limits( max_trials=10, max_concurrent_trials=2, ) # Submit the AutoML job. image_instance_segmentation_job.submit() Initialisieren Sie ein ImageLimitSettings-Objekt. Konstruktor für ImageLimitSettings für AutoML Image Verticals.
ImageModelSettingsClassification	Modelleinstellungen für AutoML-Bildklassifizierungsaufgaben.
ImageModelSettingsObjectDetection	Modelleinstellungen für autoML Image Object Detection Task.
ImageObjectDetectionJob	Konfiguration für den AutoML-Imageobjekterkennungsauftrag. Initialisieren Sie einen neuen AutoML Image Object Detection-Auftrag.
ImageObjectDetectionSearchSpace	Suchen Sie den Speicherplatz für Die AutoML-Bildobjekterkennung und die Segmentierung von Bildinstanzen.
ImageSweepSettings	Sweepeinstellungen für alle AutoML Image Verticals.
NlpFeaturizationSettings	Featurisierungseinstellungen für alle AutoML-NLP-Vertikalen.
NlpFixedParameters	Objekt, um feste Parameter für NLP-Aufträge zu beherbergen.
NlpLimitSettings	Einschränken der Einstellungen für alle AutoML-NLP-Vertikalen.
NlpSearchSpace	Suchen Sie nach AutoML NLP-Aufgaben.
NlpSweepSettings	Sweepeinstellungen für alle AutoML-NLP-Aufgaben.
RegressionJob	Konfiguration für AutoML-Regressionsauftrag. Initialisieren Sie einen neuen AutoML-Regressionstask.
SearchSpace	SearchSpace-Klasse für AutoML-Vertikals.
StackEnsembleSettings	Erweiterte Einstellung zum Anpassen der StackEnsemble-Ausführung.
TabularFeaturizationSettings	Featurisierungseinstellungen für einen AutoML-Auftrag.
TabularLimitSettings	Einschränken der Einstellungen für eine AutoML-Tabellen verticals.
TextClassificationJob	Konfiguration für AutoML-Textklassifizierungsauftrag. Initialisiert einen neuen AutoML-Textklassifizierungstask.
TextClassificationMultilabelJob	Konfiguration für AutoML-Textklassifizierungsauftrag mit mehreren Bezeichnungen. Initialisiert einen neuen AutoML-Textklassifizierungs-Multilabel-Task.
TextNerJob	Konfiguration für AutoML-Text-NER-Auftrag. Initialisiert einen neuen AutoML-Text-NER-Task.
TrainingSettings	TrainingSettings-Klasse für Azure Machine Learning. TrainingSettings-Klasse für Azure Machine Learning.

Enumerationen

BlockedTransformers	Enumeration für alle klassifizierungsmodelle, die von AutoML unterstützt werden.
ClassificationModels	Enumeration für alle klassifizierungsmodelle, die von AutoML unterstützt werden.
ClassificationMultilabelPrimaryMetrics	Primäre Metriken für Klassifizierungsaufgaben mit mehreren Bezeichnungen.
ClassificationPrimaryMetrics	Primäre Metriken für Klassifizierungsaufgaben.
FeaturizationMode	Featurisierungsmodus: Bestimmt den Datenfeaturisierungsmodus.
ForecastHorizonMode	Aufzählung, um den Auswahlmodus für den Vorhersagehorizont zu bestimmen.
ForecastingModels	Enumeration für alle Vorhersagemodelle, die von AutoML unterstützt werden.
ForecastingPrimaryMetrics	Primäre Metriken für den Vorhersagetask.
InstanceSegmentationPrimaryMetrics	Primäre Metriken für InstanceSegmentation-Aufgaben.
LearningRateScheduler	Aufzählung der Lernratenplanung.
LogTrainingMetrics	Enthält automatisierte Machine Learning-Klassen für Azure Machine Learning SDKv2. Zu den Hauptbereichen gehört die Verwaltung von AutoML-Aufgaben.
LogValidationLoss	Enthält automatisierte Machine Learning-Klassen für Azure Machine Learning SDKv2. Zu den Hauptbereichen gehört die Verwaltung von AutoML-Aufgaben.
NCrossValidationsMode	Bestimmt, wie der Wert der N-Kreuzüberprüfungen bestimmt wird.
ObjectDetectionPrimaryMetrics	Primäre Metriken für den Task Image ObjectDetection.
RegressionModels	Enumeration für alle Regressionsmodelle, die von AutoML unterstützt werden.
RegressionPrimaryMetrics	Primäre Metriken für regressionstask.
SamplingAlgorithmType	Enthält automatisierte Machine Learning-Klassen für Azure Machine Learning SDKv2. Zu den Hauptbereichen gehört die Verwaltung von AutoML-Aufgaben.
ShortSeriesHandlingConfiguration	Der Parameter definiert, wie kurze Zeitreihen beim automatisierten maschinellen Lernen verarbeitet werden.
StochasticOptimizer	Stochastischer Optimierer für Bildmodelle.
TargetAggregationFunction	Zielaggregatfunktion.
TargetLagsMode	Zielverzögerungsmodi.
TargetRollingWindowSizeMode	Größenmodus für rollende Fenster als Ziel.
UseStl	Konfigurieren Sie die STL-Aufschlüsselung der Zeitreihen-Zielspalte.
ValidationMetricType	Metrikberechnungsmethode, die für Validierungsmetriken in Bildaufgaben verwendet werden soll.

Functions

classification

Funktion zum Erstellen eines Klassifizierungsauftrags.

Ein Klassifizierungsauftrag wird verwendet, um ein Modell zu trainieren, das die Klasse eines Datenbeispiels am besten vorhersagt. Mit den Trainingsdaten werden verschiedene Modelle trainiert. Das Modell mit der besten Leistung für die Validierungsdaten basierend auf der primären Metrik wird als endgültiges Modell ausgewählt.

classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob

Parameter

training_data: Input

Die Trainingsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Bezeichnungsspalte (optional eine Spalte mit Stichprobengewichtungen) enthalten.

target_column_name: str

Der Name der Bezeichnungsspalte. Dieser Parameter gilt für training_dataParameter und validation_datatest_data

primary_metric

Die Metrik, die vom automatisierten maschinellen Lernen für die Modellauswahl optimiert wird. Beim automatisierten maschinellen Lernen werden mehr Metriken erfasst als optimiert werden können. Weitere Informationen zur Berechnung von Metriken finden Sie unter https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Zulässige Werte: Genauigkeit, AUC_weighted, norm_macro_recall, average_precision_score_weighted und precision_score_weighted Standardwerte auf Genauigkeit

enable_model_explainability: bool

Gibt an, ob die Erläuterung des besten AutoML-Modells am Ende aller AutoML-Trainingsiterationen aktiviert werden soll. Der Standardwert ist „None“. Weitere Informationen finden Sie unter Interpretierbarkeit: Modellerklärungen beim automatisierten maschinellen Lernen.

weight_column_name: str

Der Name der Spalte mit Stichprobengewichtungen. Das automatisierte maschinelle Lernen unterstützt eine gewichtete Spalte als Eingabe, wodurch Zeilen in den Daten eine höhere oder niedrigere Gewichtung erhalten. Wenn die Eingabedaten aus einem pandas.DataFrame stammen, der über keine Spaltennamen verfügt, können stattdessen als ganze Zahlen ausgedrückte Spaltenindizes verwendet werden.

Dieser Parameter gilt für training_data Parameter und validation_data

validation_data: Input

Die Validierungsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Bezeichnungsspalte (optional eine Spalte mit Stichprobengewichtungen) enthalten.

Standardwert auf "Keine"

validation_data_size: float

Der Teil der Daten, der für die Validierung zurückbehalten werden soll, wenn keine Benutzervalidierungsdaten angegeben werden. Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen.

Geben Sie validation_data an, um Validierungsdaten anzugeben, andernfalls legen Sie n_cross_validations oder validation_data_size fest, um Validierungsdaten aus den angegebenen Trainingsdaten zu extrahieren. Verwenden Sie für einen benutzerdefinierten Kreuzvalidierungsfold cv_split_column_names.

Weitere Informationen finden Sie unter Konfigurieren von Datenaufteilung und Kreuzvalidierung im automatisierten maschinellen Lernen.

Standardwert auf "Keine"

n_cross_validations: Union[str, int]

Gibt an, wie viele Kreuzvalidierungen durchzuführen sind, wenn keine Benutzervalidierungsdaten angegeben sind.

Weitere Informationen finden Sie unter Konfigurieren von Datenaufteilung und Kreuzvalidierung im automatisierten maschinellen Lernen.

Standardwert auf "Keine"

cv_split_column_names: List[str]

Liste der Namen der Spalten mit benutzerdefinierter Kreuzvalidierungsaufteilung. Jede der CV-Aufteilungsspalten stellt eine CV-Aufteilung dar, wobei jede Zeile mit 1 für Training oder 0 für Validierung markiert ist.

Standardwert auf "Keine"

test_data: Input

Das Modelltestfeature, das Testdatasets oder Testdatenaufteilungen verwendet, befindet sich in der Vorschau und kann sich jederzeit ändern. Die Testdaten, die für einen Testlauf verwendet werden sollen, der nach Abschluss des Modelltrainings automatisch gestartet wird. Der Testlauf erhält Vorhersagen mithilfe des besten Modells und berechnet anhand dieser Vorhersagen entsprechende Metriken.

Wenn dieser Parameter oder der Parameter test_data_size nicht angegeben ist, wird nach Abschluss des Modelltrainings kein Testlauf automatisch ausgeführt. Testdaten sollten sowohl Features als auch Bezeichnungsspalten enthalten. Wenn test_data angegeben wird, muss der Parameter target_column_name angegeben werden.

Standardwert auf "Keine"

test_data_size: float

Das Modelltestfeature, das Testdatasets oder Testdatenaufteilungen verwendet, befindet sich in der Vorschau und kann sich jederzeit ändern. Der Teil der Trainingsdaten, der für Testdaten für einen Testlauf zurückbehalten werden soll, der nach Abschluss des Modelltrainings automatisch gestartet wird. Der Testlauf erhält Vorhersagen mithilfe des besten Modelle und berechnet anhand dieser Vorhersagen entsprechende Metriken.

Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen. Wenn test_data_size zur gleichen Zeit wie validation_data_sizeangegeben wird, werden die Testdaten von training_data getrennt, bevor die Validierungsdaten getrennt werden. Wenn beispielsweise validation_data_size=0.1 und test_data_size=0.1 angegeben werden und die ursprünglichen Trainingsdaten 1000 Zeilen enthalten, enthalten die Testdaten 100 Zeilen, die Validierungsdaten 90 Zeilen und die Trainingsdaten 810 Zeilen.

Für regressionsbasierte Aufgaben werden zufällige Stichproben genommen. Für Klassifizierungsaufgaben werden geschichtete Stichproben genommen. Die Vorhersage unterstützt derzeit nicht die Angabe eines Testdatensatzes mit einer Aufteilung in Training und Test.

Wenn dieser Parameter oder der Parameter test_data nicht angegeben ist, wird nach Abschluss des Modelltrainings kein Testlauf automatisch ausgeführt.

Standardwert auf "Keine"

Gibt zurück

Ein Auftragsobjekt, das zur Ausführung an eine Azure ML-Compute-Instanz übermittelt werden kann.

Rückgabetyp

ClassificationJob

forecasting

Funktion zum Erstellen eines Vorhersageauftrags.

Ein Vorhersagetask wird verwendet, um Zielwerte für einen zukünftigen Zeitraum basierend auf den Verlaufsdaten vorherzusagen. Mit den Trainingsdaten werden verschiedene Modelle trainiert. Das Modell mit der besten Leistung für die Validierungsdaten basierend auf der primären Metrik wird als endgültiges Modell ausgewählt.

forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob

Parameter

training_data: Input

Die Trainingsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Bezeichnungsspalte (optional eine Spalte mit Stichprobengewichtungen) enthalten.

target_column_name: str

Der Name der Bezeichnungsspalte. Dieser Parameter gilt für training_dataParameter und validation_datatest_data

primary_metric

Zulässige Werte: r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error Standardwerte auf normalized_root_mean_squared_error

enable_model_explainability: bool

weight_column_name: str

Dieser Parameter gilt für training_data Parameter und validation_data

validation_data: Input

Die Validierungsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Bezeichnungsspalte (optional eine Spalte mit Stichprobengewichtungen) enthalten.

Standardwert auf "Keine"

validation_data_size: float

Der Teil der Daten, der für die Validierung zurückbehalten werden soll, wenn keine Benutzervalidierungsdaten angegeben werden. Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen.

Weitere Informationen finden Sie unter Konfigurieren von Datenaufteilung und Kreuzvalidierung im automatisierten maschinellen Lernen.

Standardwert auf "Keine"

n_cross_validations: Union[str, int]

Gibt an, wie viele Kreuzvalidierungen durchzuführen sind, wenn keine Benutzervalidierungsdaten angegeben sind.

Weitere Informationen finden Sie unter Konfigurieren von Datenaufteilung und Kreuzvalidierung im automatisierten maschinellen Lernen.

Standardwert auf "Keine"

cv_split_column_names: List[str]

Standardwert auf "Keine"

test_data: Input

Standardwert auf "Keine"

test_data_size: float

Die Modelltestfunktion, die Testdatasets oder Testdatenaufteilungen verwendet, befindet sich in der Vorschau und kann sich jederzeit ändern. Der Teil der Trainingsdaten, der für Testdaten für einen Testlauf zurückbehalten werden soll, der nach Abschluss des Modelltrainings automatisch gestartet wird. Der Testlauf erhält Vorhersagen mithilfe des besten Modells und berechnet anhand dieser Vorhersagen entsprechende Metriken.

Wenn dieser Parameter oder der Parameter test_data nicht angegeben ist, wird nach Abschluss des Modelltrainings kein Testlauf automatisch ausgeführt.

Standardwert auf "Keine"

forecasting_settings: ForecastingSettings

Die Einstellungen für den Vorhersagetask

Gibt zurück

Ein Auftragsobjekt, das zur Ausführung an eine Azure ML-Compute-Instanz übermittelt werden kann.

Rückgabetyp

ForecastingJob

image_classification

Erstellt ein -Objekt für den AutoML-Image-Multiklassenklassifizierungsauftrag.

image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob

Parameter

training_data: Input

Die Trainingsdaten, die im Experiment verwendet werden sollen.

target_column_name: str

Der Name der Bezeichnungsspalte. Dieser Parameter gilt für die Parameter training_data und validation_data.

primary_metric

Zulässige Werte: Genauigkeit, AUC_weighted, norm_macro_recall, average_precision_score_weighted und precision_score_weighted Standardwerte auf Genauigkeit.

validation_data: Input

Die Validierungsdaten, die im Experiment verwendet werden sollen.

validation_data_size: float

Der Teil der Daten, der für die Validierung zurückbehalten werden soll, wenn keine Benutzervalidierungsdaten angegeben werden. Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen.

Geben Sie an validation_data , um Validierungsdaten bereitzustellen, andernfalls festgelegt validation_data_size , um Validierungsdaten aus den angegebenen Trainingsdaten zu extrahieren.

Standardwert auf .2

kwargs: dict

Ein Wörterbuch mit zusätzlichen Konfigurationsparametern.

Gibt zurück

Bildklassifizierungsauftragsobjekt, das zur Ausführung an eine Azure ML-Compute-Instanz übermittelt werden kann.

Rückgabetyp

ImageClassificationJob

image_classification_multilabel

Erstellt ein -Objekt für den AutoML-Image-Klassifizierungsauftrag mit mehreren Bezeichnungen.

image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob

Parameter

training_data: Input

Die Trainingsdaten, die im Experiment verwendet werden sollen.

target_column_name: str

Der Name der Bezeichnungsspalte. Dieser Parameter gilt für die Parameter training_data und validation_data.

primary_metric

Zulässige Werte: Genauigkeit, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted und Iou Defaults to Iou.

validation_data: Input

Die Validierungsdaten, die im Experiment verwendet werden sollen.

validation_data_size: float

Der Teil der Daten, der für die Validierung zurückbehalten werden soll, wenn keine Benutzervalidierungsdaten angegeben werden. Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen.

Geben Sie an validation_data , um Validierungsdaten bereitzustellen, andernfalls festgelegt validation_data_size , um Validierungsdaten aus den angegebenen Trainingsdaten zu extrahieren.

Standardwert: .2

kwargs: dict

Ein Wörterbuch mit zusätzlichen Konfigurationsparametern.

Gibt zurück

Image eines Auftragsobjekts mit mehreren Bezeichnungen, das zur Ausführung an eine Azure ML-Compute-Instanz übermittelt werden kann.

Rückgabetyp

ImageClassificationMultilabelJob

image_instance_segmentation

Erstellt ein -Objekt für den AutoML Image Instance Segmentation-Auftrag.

image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob

Parameter

training_data: Input

Die Trainingsdaten, die im Experiment verwendet werden sollen.

target_column_name: str

Der Name der Bezeichnungsspalte. Dieser Parameter gilt für die Parameter training_data und validation_data.

primary_metric

Zulässige Werte: MeanAveragePrecision Defaults to MeanAveragePrecision.

validation_data: Input

Die Validierungsdaten, die im Experiment verwendet werden sollen.

validation_data_size: float

Der Teil der Daten, der für die Validierung zurückbehalten werden soll, wenn keine Benutzervalidierungsdaten angegeben werden. Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen.

Geben Sie an validation_data , um Validierungsdaten bereitzustellen, andernfalls festgelegt validation_data_size , um Validierungsdaten aus den angegebenen Trainingsdaten zu extrahieren.

Standardwert: .2

kwargs: dict

Ein Wörterbuch mit zusätzlichen Konfigurationsparametern.

Gibt zurück

Image instance Segmentierungsauftrag

Rückgabetyp

ImageInstanceSegmentationJob

image_object_detection

Erstellt ein -Objekt für den AutoML-Auftrag zur Bildobjekterkennung.

image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob

Parameter

training_data: Input

Die Trainingsdaten, die im Experiment verwendet werden sollen.

target_column_name: str

Der Name der Bezeichnungsspalte. Dieser Parameter gilt für die Parameter training_data und validation_data.

primary_metric

Zulässige Werte: MeanAveragePrecision Defaults to MeanAveragePrecision.

validation_data: Input

Die Validierungsdaten, die im Experiment verwendet werden sollen.

validation_data_size: float

Der Teil der Daten, der für die Validierung zurückbehalten werden soll, wenn keine Benutzervalidierungsdaten angegeben werden. Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen.

Geben Sie an validation_data , um Validierungsdaten bereitzustellen, andernfalls festgelegt validation_data_size , um Validierungsdaten aus den angegebenen Trainingsdaten zu extrahieren.

Standardwert: .2

kwargs: dict

Ein Wörterbuch mit zusätzlichen Konfigurationsparametern.

Gibt zurück

Auftragsobjekt der Bildobjekterkennung, das zur Ausführung an eine Azure ML-Compute-Instanz übermittelt werden kann.

Rückgabetyp

ImageObjectDetectionJob

regression

Funktion zum Erstellen eines Regressionsauftrags.

Ein Regressionsauftrag wird verwendet, um ein Modell zu trainieren, um fortlaufende Werte einer Zielvariable aus einem Dataset vorherzusagen. Mit den Trainingsdaten werden verschiedene Modelle trainiert. Das Modell mit der besten Leistung für die Validierungsdaten basierend auf der primären Metrik wird als endgültiges Modell ausgewählt.

regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob

Parameter

training_data: Input

Die Trainingsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Bezeichnungsspalte (optional eine Spalte mit Stichprobengewichtungen) enthalten.

target_column_name: str

Der Name der Bezeichnungsspalte. Dieser Parameter gilt für die training_dataParameter , validation_data und test_data

primary_metric

Zulässige Werte: spearman_correlation, r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error. Standardmäßig normalized_root_mean_squared_error

enable_model_explainability: bool

weight_column_name: str

Dieser Parameter gilt für training_data parameter und validation_data

validation_data: Input

Die Validierungsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Bezeichnungsspalte (optional eine Spalte mit Stichprobengewichtungen) enthalten.

Der Standardwert ist "None".

validation_data_size: float

Der Teil der Daten, der für die Validierung zurückbehalten werden soll, wenn keine Benutzervalidierungsdaten angegeben werden. Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen.

Weitere Informationen finden Sie unter Konfigurieren von Datenaufteilung und Kreuzvalidierung im automatisierten maschinellen Lernen.

Der Standardwert ist "None".

n_cross_validations: Union[str, int]

Gibt an, wie viele Kreuzvalidierungen durchzuführen sind, wenn keine Benutzervalidierungsdaten angegeben sind.

Weitere Informationen finden Sie unter Konfigurieren von Datenaufteilung und Kreuzvalidierung im automatisierten maschinellen Lernen.

Der Standardwert ist "None".

cv_split_column_names: List[str]

Der Standardwert ist "None".

test_data: Input

Die Modelltestfunktion, die Testdatasets oder Testdatenaufteilungen verwendet, befindet sich in der Vorschau und kann sich jederzeit ändern. Die Testdaten, die für einen Testlauf verwendet werden sollen, der nach Abschluss des Modelltrainings automatisch gestartet wird. Der Testlauf erhält Vorhersagen mithilfe des besten Modells und berechnet anhand dieser Vorhersagen entsprechende Metriken.

Der Standardwert ist "None".

test_data_size: float

Wenn dieser Parameter oder der Parameter test_data nicht angegeben ist, wird nach Abschluss des Modelltrainings kein Testlauf automatisch ausgeführt.

Der Standardwert ist "None".

Gibt zurück

Ein Auftragsobjekt, das zur Ausführung an eine Azure ML-Compute-Instanz übermittelt werden kann.

Rückgabetyp

RegressionJob

text_classification

Funktion zum Erstellen eines TextClassificationJobs.

Ein Textklassifizierungsauftrag wird verwendet, um ein Modell zu trainieren, das die Klasse/Kategorie einer Textdaten vorhersagen kann. Eingabetrainingsdaten sollten eine Zielspalte enthalten, die den Text in genau eine Klasse klassifiziert.

text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob

Parameter

training_data: Input

Die Trainingsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Zielspalte enthalten.

target_column_name: str

Name der Zielspalte.

validation_data: Input

Die Validierungsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Zielspalte enthalten.

primary_metric: Union[str, ClassificationPrimaryMetrics]

Primäre Metrik für die Aufgabe. Zulässige Werte: Genauigkeit, AUC_weighted, precision_score_weighted

log_verbosity: str

Protokoll-Ausführlichkeitsebene.

kwargs: dict

Ein Wörterbuch mit zusätzlichen Konfigurationsparametern.

Gibt zurück

Das TextClassificationJob-Objekt.

Rückgabetyp

TextClassificationJob

text_classification_multilabel

Funktion zum Erstellen eines TextClassificationMultilabelJobs.

Ein Textklassifizierungsauftrag mit mehreren Bezeichnungen wird verwendet, um ein Modell zu trainieren, das die Klassen/Kategorien einer Textdaten vorhersagen kann. Eingabetrainingsdaten sollten eine Zielspalte enthalten, die den Text in Klassen klassifiziert. Weitere Informationen zum Format von Mehrzeichendaten finden Sie unter: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label

text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob

Parameter

training_data: Input

Die Trainingsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Zielspalte enthalten.

target_column_name: str

Name der Zielspalte.

validation_data: Input

Die Validierungsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Zielspalte enthalten.

primary_metric: str

Primäre Metrik für die Aufgabe. Akzeptable Werte: Genauigkeit

log_verbosity: str

Protokoll-Ausführlichkeitsebene.

kwargs: dict

Ein Wörterbuch mit zusätzlichen Konfigurationsparametern.

Gibt zurück

Das TextClassificationMultilabelJob-Objekt.

Rückgabetyp

TextClassificationMultilabelJob

text_ner

Funktion zum Erstellen eines TextNerJobs.

Ein Textauftrag für die Erkennung von Entitäten wird verwendet, um ein Modell zu trainieren, das die benannten Entitäten im Text vorhersagen kann. Eingabetrainingsdaten sollten eine Textdatei im CoNLL-Format sein. Weitere Informationen zum Format von Text-NER-Daten finden Sie unter: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner

text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob

Parameter

training_data: Input

Die Trainingsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Zielspalte enthalten.

validation_data: Input

Die Validierungsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Zielspalte enthalten.

primary_metric: str

Primäre Metrik für die Aufgabe. Akzeptable Werte: Genauigkeit

log_verbosity: str

Protokoll-Ausführlichkeitsebene.

kwargs: dict

Ein Wörterbuch mit zusätzlichen Konfigurationsparametern.

Gibt zurück

Das TextNerJob-Objekt.

Rückgabetyp

TextNerJob

Share via

automl Paket

Klassen

Enumerationen

Functions

classification

Parameter

Gibt zurück

Rückgabetyp

forecasting

Parameter

Gibt zurück

Rückgabetyp

image_classification

Parameter

Gibt zurück

Rückgabetyp

image_classification_multilabel

Parameter

Gibt zurück

Rückgabetyp

image_instance_segmentation

Parameter

Gibt zurück

Rückgabetyp

image_object_detection

Parameter

Gibt zurück

Rückgabetyp

regression

Parameter

Gibt zurück

Rückgabetyp

text_classification

Parameter

Gibt zurück

Rückgabetyp

text_classification_multilabel

Parameter

Gibt zurück

Rückgabetyp

text_ner

Parameter

Gibt zurück

Rückgabetyp

Feedback

Zusätzliche Ressourcen