PipelineOutputTabularDataset クラス

Azure Machine Learning 表形式データセットに昇格された中間パイプライン データを表します。

中間データを Azure Machine Learning データセットに昇格すると、後続の手順で DataReference ではなく Dataset としても使用されます。

Azure Machine Learning データセットに昇格させる中間データを作成します。

継承
PipelineOutputTabularDataset

コンストラクター

PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)

パラメーター

pipeline_output_dataset
PipelineOutputFileDataset
必須

表形式データセットに変換される中間出力を表すファイル データセット。

additional_transformations
<xref:azureml.dataprep.Dataflow>
必須

ファイル データセットに適用される追加の変換。

pipeline_output_dataset
PipelineOutputFileDataset
必須

表形式データセットに変換される中間出力を表すファイル データセット。

additional_transformations
<xref:azureml.dataprep.Dataflow>
必須

ファイル データセットに適用される追加の変換。

メソッド

create_input_binding

入力バインドを作成します。

drop_columns

指定された列をデータセットから削除します。

keep_columns

指定された列を残し、その他すべての列をデータセットから削除します。

random_split

データセット内のレコードを、指定されたおおよその割合でランダムに 2 つの部分に分割します。

create_input_binding

入力バインドを作成します。

create_input_binding()

戻り値

この PipelineData をソースとする InputPortBinding。

の戻り値の型 :

drop_columns

指定された列をデータセットから削除します。

drop_columns(columns)

パラメーター

columns
str または list[str]
必須

削除する列の名前または名前のリスト。

戻り値

指定された列だけが削除された新しい中間データを返します。

の戻り値の型 :

keep_columns

指定された列を残し、その他すべての列をデータセットから削除します。

keep_columns(columns)

パラメーター

columns
str または list[str]
必須

列に保持される名前または名前のリスト。

戻り値

指定された列だけが保持された新しい中間データを返します。

の戻り値の型 :

random_split

データセット内のレコードを、指定されたおおよその割合でランダムに 2 つの部分に分割します。

random_split(percentage, seed=None)

パラメーター

percentage
float
必須

データセットを分割するおおよその割合。 これには、0.0 から 1.0 までの数値を指定する必要があります。

seed
int
既定値: None

乱数ジェネレーターに使用するオプションのシード。

戻り値

分割後の 2 つのデータセットを表す新しい TabularDataset オブジェクトのタプルを返します。

の戻り値の型 :