steps Paket

Enthält vordefinierte Schritte, die in einer Azure Machine Learning-Pipeline ausgeführt werden können.

Azure ML-Pipelineschritte können zusammen konfiguriert werden, um eine Pipeline zu erstellen, die einen gemeinsam nutzbaren und wiederverwendbaren Azure Machine Learning-Workflow darstellt. Jeder Schritt einer Pipeline kann so konfiguriert werden, dass die vorherigen Ausführungsergebnisse wiederverwendet werden können, wenn die Schrittinhalte (Skripts und Abhängigkeiten) sowie Eingaben und Parameter unverändert bleiben.

Die Klassen in diesem Paket werden in der Regel zusammen mit den Klassen im core-Paket verwendet. Das core-Paket enthält Klassen zum Konfigurieren von Daten (PipelineData), zum Planen (Schedule) und zum Verwalten der Ausgabe von Schritten (StepRun).

Die vordefinierten Schritte in diesem Paket decken zahlreiche gängige Szenarien in Workflows für maschinelles Lernen ab. Informationen zu den ersten Schritten mit vordefinierten Pipelineschritten finden Sie hier:

Module

adla_step

Enthält Funktionen zum Erstellen eines Azure ML Pipeline-Schritts zum Ausführen eines U-SQL Skripts mit Azure Data Lake Analytics.

automl_step

Enthält Funktionen zum Hinzufügen und Verwalten eines automatisierten ML-Pipelineschritts in Azure Machine Learning.

azurebatch_step

Enthält Funktionen zum Erstellen eines Azure ML-Pipelineschritts, der eine ausführbare Windows in Azure Batch.

command_step

Enthält Funktionen zum Erstellen eines Azure ML-Pipelineschritts, in dem Befehle Skript ausgeführt werden.

data_transfer_step

Enthält Funktionen zum Erstellen eines Azure ML-Pipelineschritts, der Daten zwischen Speicheroptionen überträgt.

databricks_step

Enthält Funktionen zum Erstellen eines Azure ML-Pipelineschritts zum Ausführen eines Databricks-Notebooks oder Python-Skripts in DBFS.

estimator_step

Enthält Funktionen zum Erstellen eines Pipelineschritts, mit dem ein Estimator für das Training eines ML-Modells ausgeführt wird.

hyper_drive_step

Enthält Funktionen zum Erstellen und Verwalten von Azure ML-Pipelineschritten zum Ausführen der Hyperparameteroptimierung.

kusto_step

Enthält Funktionen zum Erstellen eines Azure ML-Pipelineschritts zum Ausführen eines Kusto-Notebooks.

module_step

Enthält Funktionen zum Hinzufügen eines Azure Machine Learning Pipelineschritts mit einer vorhandenen Version eines Moduls.

mpi_step

Enthält Funktionen zum Hinzufügen eines Azure ML-Pipelineschritts zum Ausführen eines MPI-Auftrags für Machine Learning Modelltrainings.

parallel_run_config

Enthält Funktionen zum Konfigurieren eines ParallelRunStep.

parallel_run_step

Enthält Funktionen zum Hinzufügen eines Schritts zum Ausführen eines Benutzerskripts im parallelen Modus auf mehreren AmlCompute-Zielen.

python_script_step

Enthält Funktionalität zum Erstellen eines Azure ML-Pipelineschritts, in dem das Python-Skript ausgeführt wird.

r_script_step

Enthält Funktionen zum Erstellen eines Azure ML-Pipelineschritts, in dem das R-Skript ausgeführt wird.

synapse_spark_step

Enthält Funktionen zum Erstellen eines Azure ML-Synapse-Schritts zum Ausführen des Python-Skripts.

Klassen

AdlaStep

Erstellt einen Azure ML-Pipelineschritt zum Ausführen eines U-SQL-Skripts mit Azure Data Lake Analytics.

Ein Beispiel für die Verwendung von AutoMLStep finden Sie im Notebook https://aka.ms/pl-adla.

Erstellen Sie einen Azure ML Pipeline-Schritt, um ein U-SQL-Skript mit Azure Data Lake Analytics auszuführen.

AutoMLStep

Erstellt einen Azure ML-Pipelineschritt, der eine automatisierte ML-Ausführung kapselt.

Ein Beispiel für die Verwendung von AutoMLStep finden Sie im Notebook https://aka.ms/pl-automl.

Initialisieren Sie autoMLStep.

AutoMLStepRun

Enthält Informationen zu einer Experimentausführung des automatisierten maschinellen Lernens und Methoden zum Abrufen von Standardausgaben.

Die AutoMLStepRun-Klasse wird verwendet, um den Status zu verwalten und zu überprüfen sowie Ausführungsdetails abzurufen, sobald eine Ausführung des automatisierten maschinellen Lernens in einer Pipeline übermittelt wird. Darüber hinaus kann diese Klasse verwendet werden, um die Standardausgabe von AutoMLStep über die StepRun-Klasse zu erhalten.

Initialisieren Sie eine Automl-Schrittausführung.

AzureBatchStep

Erstellt einen Azure ML-Pipelineschritt zum Übermitteln von Aufträgen an Azure Batch.

Hinweis: Dieser Schritt unterstützt nicht das Hoch-/Herunterladen von Verzeichnissen und deren Inhalt.

Ein Beispiel für die Verwendung von AzureBatchStep finden Sie im Notebook https://aka.ms/pl-azbatch.

Erstellen Sie einen Azure ML Pipeline-Schritt zum Übermitteln von Aufträgen an Azure Batch.

CommandStep

Erstellen Sie einen Azure ML-Pipelineschritt, in dem ein Befehl ausgeführt wird.

Erstellen Sie einen Azure ML-Pipelineschritt, in dem ein Befehl ausgeführt wird.

DataTransferStep

Erstellt einen Azure ML-Pipelineschritt, der Daten zwischen Speicheroptionen überträgt.

DataTransferStep unterstützt gängige Speichertypen wie Azure Blob Storage und Azure Data Lake als Quellen und Senken. Weitere Informationen finden Sie im Abschnitt Hinweise.

Ein Beispiel für die Verwendung von DatabricksTransferStep finden Sie im Notebook https://aka.ms/pl-data-trans.

Erstellen Sie einen Azure ML Pipeline-Schritt, der Daten zwischen Speicheroptionen überträgt.

DatabricksStep

Erstellt einen Azure ML-Pipelineschritt, um ein DataBricks-Notebook, ein Python-Skript oder eine JAR-Datei als Knoten hinzuzufügen.

Ein Beispiel für die Verwendung von DatabricksStep finden Sie im Notebook https://aka.ms/pl-databricks.

Erstellen Sie einen Azure ML Pipeline-Schritt, um ein DataBricks-Notebook, Python-Skript oder JAR als Knoten hinzuzufügen.

Ein Beispiel für die Verwendung von DatabricksStep finden Sie im Notebook https://aka.ms/pl-databricks.

:p aram python_script_name:[Erforderlich] Der Name eines Python-Skripts relativ zu source_directory. Wenn das Skript Eingaben und Ausgaben verwendet, werden diese als Parameter an das Skript übergeben. Wenn python_script_name angegeben ist, muss source_directory ebenfalls angegeben sein.

Geben Sie genau eines von notebook_path, python_script_pathpython_script_name, oder anmain_class_name.

Wenn Sie ein DataReference-Objekt als Eingabe mit data_reference_name=input1 und ein PipelineData-Objekt als Ausgabe mit name=output1 angeben, werden die Eingaben und Ausgaben als Parameter an das Skript übergeben. So sehen sie aus, und Sie müssen die Argumente in Ihrem Skript analysieren, um auf die Pfade jeder Eingabe und Ausgabe zu zugreifen: "-input1", "wasbs://test@storagename.blob.core.windows.net/test", "-output1", "wasbs://test@storagename.blob.core.windows.net/b3e26de1-87a4-494d-a20f-1988d22b81a2/output1"

Darüber hinaus sind die folgenden Parameter im Skript verfügbar:

  • AZUREML_RUN_TOKEN: Das AML für die Authentifizierung mit Azure Machine Learning.
  • AZUREML_RUN_TOKEN_EXPIRY: Die AML Ablaufzeit des Tokens.
  • AZUREML_RUN_ID: Azure Machine Learning Ausführungs-ID für diese Ausführung.
  • AZUREML_ARM_SUBSCRIPTION: Azure-Abonnement für Ihren AML Arbeitsbereich.
  • AZUREML_ARM_RESOURCEGROUP: Azure-Ressourcengruppe für Ihren Azure Machine Learning Arbeitsbereich.
  • AZUREML_ARM_WORKSPACE_NAME: Name Ihres Azure Machine Learning Arbeitsbereichs.
  • AZUREML_ARM_PROJECT_NAME: Name Ihres Azure Machine Learning Experiments.
  • AZUREML_SERVICE_ENDPOINT: Die Endpunkt-URL für AML Dienste.
  • AZUREML_WORKSPACE_ID: ID Ihres Azure Machine Learning-Arbeitsbereichs.
  • AZUREML_EXPERIMENT_ID: ID Ihres Azure Machine Learning-Experiments.
  • AZUREML_SCRIPT_DIRECTORY_NAME: Verzeichnispfadstruktur in DBFS, wobei source_directory kopiert wurde.
  (This parameter is only populated when `python_script_name` is used.  See more details below.)

Wenn Sie ein Python-Skript von Ihrem lokalen Computer auf Databricks mithilfe der DatabricksStep-Parameter source_directoryund python_script_name, wird Ihr source_directory in DBFS kopiert, und der Verzeichnisstrukturpfad in DBFS wird als Parameter an Ihr Skript übergeben, wenn es mit der Ausführung beginnt. Dieser Parameter wird bezeichnet als --AZUREML_SCRIPT_DIRECTORY_NAME. Sie müssen ihr die Zeichenfolge "dbfs:/" voran stellen. oder "/dbfs/", um auf das Verzeichnis in DBFS zu zugreifen.

EstimatorStep

VERALTET. Erstellt einen Pipelineschritt, der Estimator für das Training eines Azure ML-Modells ausführt.

Erstellen Sie einen Azure ML Pipeline-Schritt, um das Estimator for Machine Learning-Modelltraining auszuführen.

VERALTET. Verwenden Sie stattdessen CommandStep. Ein Beispiel finden Sie unter How to run ML training in pipelines with CommandStep (Ausführen von ML-Trainings in Pipelines mit CommandStep).

HyperDriveStep

Erstellt einen Azure ML-Pipelineschritt zum Ausführen der Hyperparameteroptimierung für Trainings von Machine Learning-Modellen.

Ein Beispiel für die Verwendung von HyperDriveStep finden Sie im Notebook https://aka.ms/pl-hyperdrive.

Erstellen Sie einen Azure ML Pipeline-Schritt, um hyperparametertunning für das Machine Learning-Modelltraining auszuführen.

HyperDriveStepRun

Verwalten, Überprüfen des Status und Abrufen von Ausführungsdetails für einen HyperDriveStep-Pipelineschritt.

HyperDriveStepRun bietet die Funktionalität von HyperDriveRun mit zusätzlicher Unterstützung von StepRun. Die HyperDriveStepRun-Klasse ermöglicht das Verwalten, Überprüfen des Status und Abrufen von Ausführungsdetails für die HyperDrive-Ausführung und jede der generierten untergeordneten Ausführungen. Mit der StepRun-Klasse können Sie dies tun, nachdem die übergeordnete Pipeline ausgeführt wurde und die Pipeline die Schrittläufe übermittelt hat.

Initialisieren Sie hyperDriveStepRun.

HyperDriveStepRun bietet die Funktionalität von HyperDriveRun mit zusätzlicher Unterstützung von StepRun. Mit der HyperDriveRun-Klasse können Sie die Ausführungsdetails für die HyperDrive-Ausführung und jede der generierten untergeordneten Ausführungen verwalten, überprüfen status und abrufen. Mit der StepRun-Klasse können Sie dies tun, nachdem die übergeordnete Pipeline ausgeführt wurde und die Pipeline die Schrittläufe übermittelt hat.

KustoStep

KustoStep ermöglicht die Ausführung von Kusto-Abfragen auf einem Kusto-Zielcluster in Azure ML Pipelines.

Initialisieren Sie KustoStep.

ModuleStep

Erstellt einen Azure Machine Learning-Pipelineschritt zum Ausführen einer bestimmten Version eines Moduls.

Module-Objekte definieren wiederverwendbare Berechnungen, z. B. Skripts oder ausführbare Dateien, die in verschiedenen Machine Learning-Szenarios und von verschiedenen Benutzer*innen verwendet werden können. Um eine bestimmte Version eines Moduls in einer Pipeline zu verwenden, erstellen Sie einen ModuleStep. Ein ModuleStep ist ein Schritt in der Pipeline, der eine vorhandene ModuleVersion verwendet.

Ein Beispiel für die Verwendung von ModuleStep finden Sie im Notebook https://aka.ms/pl-modulestep.

Erstellen Sie einen Azure ML-Pipelineschritt, um eine bestimmte Version eines Moduls auszuführen.

MpiStep

Erstellt einen Azure ML-Pipelineschritt zum Ausführen eines MPI-Auftrags.

Ein Beispiel für die Verwendung von MpiStep finden Sie im Notebook https://aka.ms/pl-style-trans.

Erstellen Sie einen Azure ML-Pipelineschritt, um einen MPI-Auftrag auszuführen.

VERALTET. Verwenden Sie stattdessen CommandStep. Ein Beispiel finden Sie unter Ausführen des verteilten Trainings in Pipelines mit CommandStep.

ParallelRunConfig

Definiert die Konfiguration für ein ParallelRunStep-Objekt.

Ein Beispiel für die Verwendung von ParallelRunStep finden Sie im Notebook https://aka.ms/batch-inference-notebooks.

Einen Leitfaden zur Problembehandlung finden Sie unter https://aka.ms/prstsg. Weitere Referenzen finden Sie hier.

Initialisieren Sie das Config-Objekt.

ParallelRunStep

Erstellt einen Azure Machine Learning-Pipelineschritt, um große Datenmengen asynchron und parallel zu verarbeiten.

Ein Beispiel für die Verwendung von „ParallelRunStep“ finden Sie im Notebook https://aka.ms/batch-inference-notebooks.

Einen Leitfaden zur Problembehandlung finden Sie unter https://aka.ms/prstsg. Weitere Referenzen finden Sie hier.

Erstellen Sie einen Azure ML-Pipelineschritt, um große Datenmengen asynchron und parallel zu verarbeiten.

Ein Beispiel für die Verwendung von ParallelRunStep finden Sie im Notebooklink https://aka.ms/batch-inference-notebooks.

PythonScriptStep

Erstellt einen Azure ML-Pipelineschritt, in dem das Python-Skript ausgeführt wird.

Ein Beispiel für die Verwendung von PythonScriptStep finden Sie im Notebook https://aka.ms/pl-get-started.

Erstellen Sie einen Azure ML-Pipelineschritt, in dem ein Python-Skript ausgeführt wird.

RScriptStep

Hinweis

Dies ist eine experimentelle Klasse, die jederzeit geändert werden kann. Unter https://aka.ms/azuremlexperimental finden Sie weitere Informationen.

Erstellt einen Azure ML-Pipelineschritt, in dem ein R-Skript ausgeführt wird.

Erstellen Sie einen Azure ML-Pipelineschritt, der ein R-Skript ausführt.

VERALTET. Verwenden Sie stattdessen CommandStep. Ein Beispiel finden Sie unter How to run R scripts in pipelines with CommandStep (Ausführen von R-Skripts in Pipelines mit CommandStep).

SynapseSparkStep

Hinweis

Dies ist eine experimentelle Klasse, die jederzeit geändert werden kann. Unter https://aka.ms/azuremlexperimental finden Sie weitere Informationen.

Erstellt einen Azure ML Synapse-Schritt zum Übermitteln und Ausführen von Python-Skripts.

Erstellen Sie einen Azure ML-Pipelineschritt, der einen Spark-Auftrag im synapse Spark-Pool ausführt.