PipelineOutputTabularDataset Kelas

Tunjukkan data alur perantara yang dipromosikan ke Himpunan Data Tabular Azure Machine Learning.

Setelah data perantara dipromosikan ke Himpunan Data Azure Machine Learning, data tersebut juga akan digunakan sebagai Himpunan Data, bukan DataReference di langkah berikutnya.

Buat data perantara yang akan dipromosikan ke Himpunan Data Azure Machine Learning.

Warisan
PipelineOutputTabularDataset

Konstruktor

PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)

Parameter

pipeline_output_dataset
PipelineOutputFileDataset
Diperlukan

Himpunan data file yang menunjukkan output perantara yang akan diubah menjadi Himpunan data tabular.

additional_transformations
<xref:azureml.dataprep.Dataflow>
Diperlukan

Transformasi tambahan yang akan diterapkan di atas himpunan data file.

pipeline_output_dataset
PipelineOutputFileDataset
Diperlukan

Himpunan data file yang menunjukkan output perantara yang akan diubah menjadi Himpunan data tabular.

additional_transformations
<xref:azureml.dataprep.Dataflow>
Diperlukan

Transformasi tambahan yang akan diterapkan di atas himpunan data file.

Metode

create_input_binding

Buat pengikatan input.

drop_columns

Hilangkan kolom tertentu dari himpunan data.

keep_columns

Simpan kolom yang ditentukan dan hapus semua kolom lainnya dari himpunan data.

random_split

Bagi catatan dalam himpunan data menjadi dua bagian secara acak dan kira-kira berdasarkan persentase yang ditentukan.

create_input_binding

Buat pengikatan input.

create_input_binding()

Mengembalikan

InputPortBinding dengan PipelineData ini sebagai sumbernya.

Tipe hasil

drop_columns

Hilangkan kolom tertentu dari himpunan data.

drop_columns(columns)

Parameter

columns
str atau list[str]
Diperlukan

Nama atau daftar nama untuk kolom yang akan dihilangkan.

Mengembalikan

Mengembalikan data perantara baru dengan hanya kolom tertentu yang dihapus.

Tipe hasil

keep_columns

Simpan kolom yang ditentukan dan hapus semua kolom lainnya dari himpunan data.

keep_columns(columns)

Parameter

columns
str atau list[str]
Diperlukan

Nama atau daftar nama untuk kolom yang akan disimpan.

Mengembalikan

Mengembalikan data perantara baru dengan hanya kolom tertentu yang disimpan.

Tipe hasil

random_split

Bagi catatan dalam himpunan data menjadi dua bagian secara acak dan kira-kira berdasarkan persentase yang ditentukan.

random_split(percentage, seed=None)

Parameter

percentage
float
Diperlukan

Persentase perkiraan untuk membagi himpunan data. Ini harus berupa angka antara 0,0 dan 1,0.

seed
int
nilai default: None

Seed opsional yang akan digunakan untuk generator acak.

Mengembalikan

Mengembalikan tuple objek TabularDataset baru yang mewakili dua himpunan data setelah pemisahan.

Tipe hasil