OutputTabularDatasetConfig Kelas
Mewakili cara menyalin output dari proses dan dipromosikan sebagai TabularDataset.
Menginisialisasi OutputTabularDatasetConfig.
- Warisan
-
OutputTabularDatasetConfig
Konstruktor
OutputTabularDatasetConfig(**kwargs)
Keterangan
Anda tidak boleh memanggil konstruktor ini secara langsung, tetapi sebaliknya harus membuat OutputFileDatasetConfig lalu memanggil metode read_* yang sesuai untuk mengubahnya menjadi OutputTabularDatasetConfig.
Cara output akan disalin ke tujuan untuk OutputTabularDatasetConfig sama dengan OutputFileDatasetConfig. Perbedaan di antara mereka adalah bahwa Dataset yang dibuat akan menjadi TabularDataset yang berisi semua transformasi yang ditentukan.
Metode
as_input |
Tentukan cara menggunakan output sebagai input dalam langkah alur berikutnya. |
as_mount |
Atur mode output untuk dipasang. Untuk mode pemasangan, direktori output akan menjadi direktori terpasang FUSE. File yang ditulis ke direktori yang terpasang akan diunggah saat file ditutup. |
as_upload |
Atur mode output untuk diunggah. Untuk mode pengunggahan, file yang ditulis ke direktori output akan diunggah di akhir pekerjaan. Jika pekerjaan gagal atau dibatalkan, maka direktori output tidak akan diunggah. |
drop_columns |
Hilangkan kolom yang ditentukan dari Himpunan Data. |
keep_columns |
Pertahankan kolom yang ditentukan dan hilangkan semua kolom lainnya dari Himpunan Data. |
random_split |
Pisahkan catatan dalam himpunan data menjadi dua bagian secara acak dan perkiraan berdasarkan persentase yang ditentukan. Konfigurasi output yang dihasilkan akan diubah namanya, yang pertama akan menambahkan _1 ke nama dan yang kedua akan menambahkan _2 ke nama. Jika itu akan menyebabkan tabrakan nama atau Anda ingin menentukan nama khusus, harap atur namanya secara manual. |
as_input
Tentukan cara menggunakan output sebagai input dalam langkah alur berikutnya.
as_input(name=None)
Parameter
Nama | Deskripsi |
---|---|
name
Diperlukan
|
Nama input khusus untuk eksekusi. |
Mengembalikan
Jenis | Deskripsi |
---|---|
Instans DatasetConsumptionConfig menjelaskan cara mengirimkan data input. |
as_mount
Atur mode output untuk dipasang.
Untuk mode pemasangan, direktori output akan menjadi direktori terpasang FUSE. File yang ditulis ke direktori yang terpasang akan diunggah saat file ditutup.
as_mount()
Mengembalikan
Jenis | Deskripsi |
---|---|
Instans OutputTabularDatasetConfig dengan mode yang diatur untuk dipasang. |
as_upload
Atur mode output untuk diunggah.
Untuk mode pengunggahan, file yang ditulis ke direktori output akan diunggah di akhir pekerjaan. Jika pekerjaan gagal atau dibatalkan, maka direktori output tidak akan diunggah.
as_upload(overwrite=False, source_globs=None)
Parameter
Nama | Deskripsi |
---|---|
overwrite
Diperlukan
|
Apakah akan menimpa file yang sudah ada di tujuan atau tidak. |
source_globs
Diperlukan
|
Pola glob digunakan untuk memfilter file yang akan diunggah. |
Mengembalikan
Jenis | Deskripsi |
---|---|
Instans OutputTabularDatasetConfig dengan mode yang diatur untuk diunggah. |
drop_columns
Hilangkan kolom yang ditentukan dari Himpunan Data.
drop_columns(columns)
Parameter
Nama | Deskripsi |
---|---|
columns
Diperlukan
|
Nama atau daftar nama untuk kolom yang akan dihilangkan. |
Mengembalikan
Jenis | Deskripsi |
---|---|
Instans OutputTabularDatasetConfig dengan kolom mana yang akan dihilangkan. |
keep_columns
Pertahankan kolom yang ditentukan dan hilangkan semua kolom lainnya dari Himpunan Data.
keep_columns(columns)
Parameter
Nama | Deskripsi |
---|---|
columns
Diperlukan
|
Nama atau daftar nama untuk kolom yang akan disimpan. |
Mengembalikan
Jenis | Deskripsi |
---|---|
Instans OutputTabularDatasetConfig dengan kolom mana yang akan disimpan. |
random_split
Pisahkan catatan dalam himpunan data menjadi dua bagian secara acak dan perkiraan berdasarkan persentase yang ditentukan.
Konfigurasi output yang dihasilkan akan diubah namanya, yang pertama akan menambahkan _1 ke nama dan yang kedua akan menambahkan _2 ke nama. Jika itu akan menyebabkan tabrakan nama atau Anda ingin menentukan nama khusus, harap atur namanya secara manual.
random_split(percentage, seed=None)
Parameter
Nama | Deskripsi |
---|---|
percentage
Diperlukan
|
Persentase perkiraan untuk membagi himpunan data. Ini harus berupa angka antara 0,0 dan 1,0. |
seed
Diperlukan
|
Nilai awal opsional untuk digunakan untuk generator acak. |
Mengembalikan
Jenis | Deskripsi |
---|---|
Tampilkan tupel dari dua objek OutputTabularDatasetConfig yang mewakili dua Himpunan Data setelah pemisahan. |
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk