OutputTabularDatasetConfig Kelas

Mewakili cara menyalin output dari proses dan dipromosikan sebagai TabularDataset.

Menginisialisasi OutputTabularDatasetConfig.

Warisan
OutputTabularDatasetConfig

Konstruktor

OutputTabularDatasetConfig(**kwargs)

Keterangan

Anda tidak boleh memanggil konstruktor ini secara langsung, tetapi sebaliknya harus membuat OutputFileDatasetConfig lalu memanggil metode read_* yang sesuai untuk mengubahnya menjadi OutputTabularDatasetConfig.

Cara output akan disalin ke tujuan untuk OutputTabularDatasetConfig sama dengan OutputFileDatasetConfig. Perbedaan di antara mereka adalah bahwa Dataset yang dibuat akan menjadi TabularDataset yang berisi semua transformasi yang ditentukan.

Metode

as_input

Tentukan cara menggunakan output sebagai input dalam langkah alur berikutnya.

as_mount

Atur mode output untuk dipasang.

Untuk mode pemasangan, direktori output akan menjadi direktori terpasang FUSE. File yang ditulis ke direktori yang terpasang akan diunggah saat file ditutup.

as_upload

Atur mode output untuk diunggah.

Untuk mode pengunggahan, file yang ditulis ke direktori output akan diunggah di akhir pekerjaan. Jika pekerjaan gagal atau dibatalkan, maka direktori output tidak akan diunggah.

drop_columns

Hilangkan kolom yang ditentukan dari Himpunan Data.

keep_columns

Pertahankan kolom yang ditentukan dan hilangkan semua kolom lainnya dari Himpunan Data.

random_split

Pisahkan catatan dalam himpunan data menjadi dua bagian secara acak dan perkiraan berdasarkan persentase yang ditentukan.

Konfigurasi output yang dihasilkan akan diubah namanya, yang pertama akan menambahkan _1 ke nama dan yang kedua akan menambahkan _2 ke nama. Jika itu akan menyebabkan tabrakan nama atau Anda ingin menentukan nama khusus, harap atur namanya secara manual.

as_input

Tentukan cara menggunakan output sebagai input dalam langkah alur berikutnya.

as_input(name=None)

Parameter

name
str
Diperlukan

Nama input khusus untuk eksekusi.

Mengembalikan

Instans DatasetConsumptionConfig menjelaskan cara mengirimkan data input.

Tipe hasil

as_mount

Atur mode output untuk dipasang.

Untuk mode pemasangan, direktori output akan menjadi direktori terpasang FUSE. File yang ditulis ke direktori yang terpasang akan diunggah saat file ditutup.

as_mount()

Mengembalikan

Instans OutputTabularDatasetConfig dengan mode yang diatur untuk dipasang.

Tipe hasil

as_upload

Atur mode output untuk diunggah.

Untuk mode pengunggahan, file yang ditulis ke direktori output akan diunggah di akhir pekerjaan. Jika pekerjaan gagal atau dibatalkan, maka direktori output tidak akan diunggah.

as_upload(overwrite=False, source_globs=None)

Parameter

overwrite
bool
Diperlukan

Apakah akan menimpa file yang sudah ada di tujuan atau tidak.

source_globs
list[str]
Diperlukan

Pola glob digunakan untuk memfilter file yang akan diunggah.

Mengembalikan

Instans OutputTabularDatasetConfig dengan mode yang diatur untuk diunggah.

Tipe hasil

drop_columns

Hilangkan kolom yang ditentukan dari Himpunan Data.

drop_columns(columns)

Parameter

columns
Union[str, list[str]]
Diperlukan

Nama atau daftar nama untuk kolom yang akan dihilangkan.

Mengembalikan

Instans OutputTabularDatasetConfig dengan kolom mana yang akan dihilangkan.

Tipe hasil

keep_columns

Pertahankan kolom yang ditentukan dan hilangkan semua kolom lainnya dari Himpunan Data.

keep_columns(columns)

Parameter

columns
Union[str, list[str]]
Diperlukan

Nama atau daftar nama untuk kolom yang akan disimpan.

Mengembalikan

Instans OutputTabularDatasetConfig dengan kolom mana yang akan disimpan.

Tipe hasil

random_split

Pisahkan catatan dalam himpunan data menjadi dua bagian secara acak dan perkiraan berdasarkan persentase yang ditentukan.

Konfigurasi output yang dihasilkan akan diubah namanya, yang pertama akan menambahkan _1 ke nama dan yang kedua akan menambahkan _2 ke nama. Jika itu akan menyebabkan tabrakan nama atau Anda ingin menentukan nama khusus, harap atur namanya secara manual.

random_split(percentage, seed=None)

Parameter

percentage
float
Diperlukan

Persentase perkiraan untuk membagi himpunan data. Ini harus berupa angka antara 0,0 dan 1,0.

seed
int
Diperlukan

Nilai awal opsional untuk digunakan untuk generator acak.

Mengembalikan

Tampilkan tupel dari dua objek OutputTabularDatasetConfig yang mewakili dua Himpunan Data setelah pemisahan.

Tipe hasil

tuple(<xref:azureml.data.output_dataset_config.OutputTabularDatasetConfig,azureml.data.output_dataset_config.OutputTabularDatasetConfig>)