OutputTabularDatasetConfig Kelas

Mewakili cara menyalin output dari proses dan dipromosikan sebagai TabularDataset.

Menginisialisasi OutputTabularDatasetConfig.

Warisan
OutputTabularDatasetConfig

Konstruktor

OutputTabularDatasetConfig(**kwargs)

Keterangan

Anda tidak boleh memanggil konstruktor ini secara langsung, tetapi sebaliknya harus membuat OutputFileDatasetConfig lalu memanggil metode read_* yang sesuai untuk mengubahnya menjadi OutputTabularDatasetConfig.

Cara output akan disalin ke tujuan untuk OutputTabularDatasetConfig sama dengan OutputFileDatasetConfig. Perbedaan di antara mereka adalah bahwa Dataset yang dibuat akan menjadi TabularDataset yang berisi semua transformasi yang ditentukan.

Metode

as_input

Tentukan cara menggunakan output sebagai input dalam langkah alur berikutnya.

as_mount

Atur mode output untuk dipasang.

Untuk mode pemasangan, direktori output akan menjadi direktori terpasang FUSE. File yang ditulis ke direktori yang terpasang akan diunggah saat file ditutup.

as_upload

Atur mode output untuk diunggah.

Untuk mode pengunggahan, file yang ditulis ke direktori output akan diunggah di akhir pekerjaan. Jika pekerjaan gagal atau dibatalkan, maka direktori output tidak akan diunggah.

drop_columns

Hilangkan kolom yang ditentukan dari Himpunan Data.

keep_columns

Pertahankan kolom yang ditentukan dan hilangkan semua kolom lainnya dari Himpunan Data.

random_split

Pisahkan catatan dalam himpunan data menjadi dua bagian secara acak dan perkiraan berdasarkan persentase yang ditentukan.

Konfigurasi output yang dihasilkan akan diubah namanya, yang pertama akan menambahkan _1 ke nama dan yang kedua akan menambahkan _2 ke nama. Jika itu akan menyebabkan tabrakan nama atau Anda ingin menentukan nama khusus, harap atur namanya secara manual.

as_input

Tentukan cara menggunakan output sebagai input dalam langkah alur berikutnya.

as_input(name=None)

Parameter

Nama Deskripsi
name
Diperlukan
str

Nama input khusus untuk eksekusi.

Mengembalikan

Jenis Deskripsi

Instans DatasetConsumptionConfig menjelaskan cara mengirimkan data input.

as_mount

Atur mode output untuk dipasang.

Untuk mode pemasangan, direktori output akan menjadi direktori terpasang FUSE. File yang ditulis ke direktori yang terpasang akan diunggah saat file ditutup.

as_mount()

Mengembalikan

Jenis Deskripsi

Instans OutputTabularDatasetConfig dengan mode yang diatur untuk dipasang.

as_upload

Atur mode output untuk diunggah.

Untuk mode pengunggahan, file yang ditulis ke direktori output akan diunggah di akhir pekerjaan. Jika pekerjaan gagal atau dibatalkan, maka direktori output tidak akan diunggah.

as_upload(overwrite=False, source_globs=None)

Parameter

Nama Deskripsi
overwrite
Diperlukan

Apakah akan menimpa file yang sudah ada di tujuan atau tidak.

source_globs
Diperlukan

Pola glob digunakan untuk memfilter file yang akan diunggah.

Mengembalikan

Jenis Deskripsi

Instans OutputTabularDatasetConfig dengan mode yang diatur untuk diunggah.

drop_columns

Hilangkan kolom yang ditentukan dari Himpunan Data.

drop_columns(columns)

Parameter

Nama Deskripsi
columns
Diperlukan

Nama atau daftar nama untuk kolom yang akan dihilangkan.

Mengembalikan

Jenis Deskripsi

Instans OutputTabularDatasetConfig dengan kolom mana yang akan dihilangkan.

keep_columns

Pertahankan kolom yang ditentukan dan hilangkan semua kolom lainnya dari Himpunan Data.

keep_columns(columns)

Parameter

Nama Deskripsi
columns
Diperlukan

Nama atau daftar nama untuk kolom yang akan disimpan.

Mengembalikan

Jenis Deskripsi

Instans OutputTabularDatasetConfig dengan kolom mana yang akan disimpan.

random_split

Pisahkan catatan dalam himpunan data menjadi dua bagian secara acak dan perkiraan berdasarkan persentase yang ditentukan.

Konfigurasi output yang dihasilkan akan diubah namanya, yang pertama akan menambahkan _1 ke nama dan yang kedua akan menambahkan _2 ke nama. Jika itu akan menyebabkan tabrakan nama atau Anda ingin menentukan nama khusus, harap atur namanya secara manual.

random_split(percentage, seed=None)

Parameter

Nama Deskripsi
percentage
Diperlukan

Persentase perkiraan untuk membagi himpunan data. Ini harus berupa angka antara 0,0 dan 1,0.

seed
Diperlukan
int

Nilai awal opsional untuk digunakan untuk generator acak.

Mengembalikan

Jenis Deskripsi

Tampilkan tupel dari dua objek OutputTabularDatasetConfig yang mewakili dua Himpunan Data setelah pemisahan.