PipelineOutputTabularDataset Kelas

Referensi

Tunjukkan data alur perantara yang dipromosikan ke Himpunan Data Tabular Azure Machine Learning.

Setelah data perantara dipromosikan ke Himpunan Data Azure Machine Learning, data tersebut juga akan digunakan sebagai Himpunan Data, bukan DataReference di langkah berikutnya.

Buat data perantara yang akan dipromosikan ke Himpunan Data Azure Machine Learning.

Warisan: PipelineOutputAbstractDataset

PipelineOutputTabularDataset

Konstruktor

PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)

Parameter

pipeline_output_dataset: PipelineOutputFileDataset

Diperlukan

Himpunan data file yang menunjukkan output perantara yang akan diubah menjadi Himpunan data tabular.

additional_transformations: <xref:azureml.dataprep.Dataflow>

Diperlukan

Transformasi tambahan yang akan diterapkan di atas himpunan data file.

pipeline_output_dataset: PipelineOutputFileDataset

Diperlukan

Himpunan data file yang menunjukkan output perantara yang akan diubah menjadi Himpunan data tabular.

additional_transformations: <xref:azureml.dataprep.Dataflow>

Diperlukan

Transformasi tambahan yang akan diterapkan di atas himpunan data file.

Metode

create_input_binding	Buat pengikatan input.
drop_columns	Hilangkan kolom tertentu dari himpunan data.
keep_columns	Simpan kolom yang ditentukan dan hapus semua kolom lainnya dari himpunan data.
random_split	Bagi catatan dalam himpunan data menjadi dua bagian secara acak dan kira-kira berdasarkan persentase yang ditentukan.

create_input_binding

Buat pengikatan input.

create_input_binding()

Mengembalikan

InputPortBinding dengan PipelineData ini sebagai sumbernya.

Tipe hasil

InputPortBinding

drop_columns

Hilangkan kolom tertentu dari himpunan data.

drop_columns(columns)

Parameter

columns: str atau list[str]

Diperlukan

Nama atau daftar nama untuk kolom yang akan dihilangkan.

Mengembalikan

Mengembalikan data perantara baru dengan hanya kolom tertentu yang dihapus.

Tipe hasil

PipelineOutputTabularDataset

keep_columns

Simpan kolom yang ditentukan dan hapus semua kolom lainnya dari himpunan data.

keep_columns(columns)

Parameter

columns: str atau list[str]

Diperlukan

Nama atau daftar nama untuk kolom yang akan disimpan.

Mengembalikan

Mengembalikan data perantara baru dengan hanya kolom tertentu yang disimpan.

Tipe hasil

PipelineOutputTabularDataset

random_split

Bagi catatan dalam himpunan data menjadi dua bagian secara acak dan kira-kira berdasarkan persentase yang ditentukan.

random_split(percentage, seed=None)

Parameter

percentage: float

Diperlukan

Persentase perkiraan untuk membagi himpunan data. Ini harus berupa angka antara 0,0 dan 1,0.

seed: int

nilai default: None

Seed opsional yang akan digunakan untuk generator acak.

Mengembalikan

Mengembalikan tuple objek TabularDataset baru yang mewakili dua himpunan data setelah pemisahan.

Tipe hasil

(TabularDataset, TabularDataset)

PipelineOutputTabularDataset Kelas

Konstruktor

Parameter

Metode

create_input_binding

Mengembalikan

Tipe hasil

drop_columns

Parameter

Mengembalikan

Tipe hasil

keep_columns

Parameter

Mengembalikan

Tipe hasil

random_split

Parameter

Mengembalikan

Tipe hasil

Saran dan Komentar

Saran dan Komentar

Sumber Daya Tambahan: