OutputPortBinding クラス

リファレンス

パイプラインステップの名前付き出力を定義します。

OutputPortBinding を使用して、ステップによって生成されるデータの型と、データの生成方法を指定できます。 InputPortBinding と共に使用して、ステップの出力が別のステップの必須の入力であることを指定できます。

OutputPortBinding を初期化します。

継承: builtins.object

OutputPortBinding

コンストラクター

OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)

パラメーター

name: str

必須

文字、数字、アンダースコアのみを含めることができる OutputPortBinding オブジェクトの名前。

datastore: Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]

既定値: None

PipelineData が置かれるデータストア。

output_name: str

既定値: None

None の名前が使用されている場合は、出力の名前。文字、数字、アンダースコアのみを含めることができます。

bind_mode: str

既定値: mount

生成ステップでデータにアクセスするために "upload"、"mount"、または "hdfs" のどのメソッドを使用するかを指定します。

path_on_compute: str

既定値: None

"upload" モードの場合、モジュールが出力を書き込むパス。

is_directory: bool

既定値: None

出力がディレクトリかまたは単一のファイルかを示します。

overwrite: bool

既定値: None

"upload" モードの場合、既存のデータを上書きするかどうかを示します。

data_type: str

既定値: None

任意。データ型を使用すると、予想される出力の型を指定したり、使用ステップでのデータの使用方法の詳細を指定したりできます。任意のユーザー定義文字列を指定できます。

pipeline_output_name: str

既定値: None

指定した場合、この出力はPipelineRun.get_pipeline_output() を使用して利用できます。パイプラインの出力名は、パイプライン内で一意である必要があります。

training_output: TrainingOutput

既定値: None

トレーニング結果の出力を定義します。これは、メトリックやモデルなどの異なる種類の出力を生成する、特定のトレーニングに対してのみ必要です。たとえば、AutoMLStep はメトリックとモデルを生成します。また、最適なモデルを取得するために使用される、特定のトレーニングイテレーションまたはメトリックを定義することもできます。 HyperDriveStep では、出力に含める特定のモデルファイルを定義することもできます。

dataset_registration: DatasetRegistration

既定値: None

任意。これは内部パラメーターです。代わりに PipelineData.as_dataset を使用する必要があります。

dataset_output: OutputDatasetConfig

既定値: None

任意。これは内部パラメーターです。代わりに OutputFileDatasetConfig を使用する必要があります。

name: str

必須

文字、数字、アンダースコアのみを含めることができる OutputPortBinding オブジェクトの名前。

datastore: Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]

必須

PipelineData が置かれるデータストア。

output_name: str

必須

None の名前が使用されている場合は、出力の名前。文字、数字、アンダースコアのみを含めることができます。

bind_mode: str

必須

生成ステップでデータにアクセスするために "upload"、"mount"、または "hdfs" のどのメソッドを使用するかを指定します。

path_on_compute: str

必須

"upload" モードの場合、モジュールが出力を書き込むパス。

is_directory: bool

必須

出力がディレクトリの場合

overwrite: bool

必須

"upload" モードの場合、既存のデータを上書きするかどうかを示します。

data_type: str

必須

pipeline_output_name: str

必須

training_output: TrainingOutput

必須

dataset_registration: DatasetRegistration

必須

任意。これは内部パラメーターです。代わりに PipelineData.as_dataset を使用する必要があります。

dataset_output: OutputDatasetConfig

必須

任意。これは内部パラメーターです。代わりに OutputFileDatasetConfig を使用する必要があります。

注釈

パイプラインを構築してステップの入力と出力を指定する場合、 PipelineData と同様の方法で OutputPortBinding を使用できます。違いは、別のステップへの入力として使用するには、OutputPortBinding を InputPortBinding と組み合わせて使用する必要があることです。

OutputPortBinding を使用してパイプラインを構築する例を次に示します。


   from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
   from azureml.pipeline.steps import PythonScriptStep

   step_1_output = OutputPortBinding("output", datastore=datastore)

   step_1 = PythonScriptStep(
       name='process data',
       script_name="process_data.py",
       compute_target=compute,
       arguments=["--output", step_1_output],
       outputs=[step_1_output]
   )

   step_2_input = InputPortBinding("input", bind_object=step_1_output)

   step_2 = PythonScriptStep(
       name='train',
       script_name="train.py",
       compute_target=compute,
       arguments=["--input", step_2_input],
       inputs=[step_2_input]
   )

   pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])

ここでは、2 つの手順でパイプラインを作成します。最初にプロセスステップが実行され、その完了後にトレーニングステップが実行されます。 Azure ML では、OutputPortBinding オブジェクトで説明されているように、プロセスステップによって生成されるた出力をトレーニングステップに提供します。

TrainingOutput

OutputPortBinding クラス

コンストラクター

パラメーター

注釈

属性

bind_mode

戻り値

の戻り値の型 :

data_type

戻り値

の戻り値の型 :

dataset_registration

戻り値

の戻り値の型 :

datastore

戻り値

の戻り値の型 :

is_directory

戻り値

の戻り値の型 :

name

戻り値

の戻り値の型 :

overwrite

戻り値

の戻り値の型 :

path_on_compute

戻り値

の戻り値の型 :

pipeline_output_name

戻り値

の戻り値の型 :

training_output

戻り値

の戻り値の型 :

フィードバック

フィードバック

その他のリソース