Bagikan melalui


OneHotEncodingEstimator Kelas

Definisi

Mengonversi satu atau beberapa kolom input dari nilai kategoris menjadi kolom output sebanyak vektor yang dikodekan one-hot.

public sealed class OneHotEncodingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.OneHotEncodingTransformer>
type OneHotEncodingEstimator = class
    interface IEstimator<OneHotEncodingTransformer>
Public NotInheritable Class OneHotEncodingEstimator
Implements IEstimator(Of OneHotEncodingTransformer)
Warisan
OneHotEncodingEstimator
Penerapan

Keterangan

Karakteristik Estimator

Apakah estimator ini perlu melihat data untuk melatih parameternya? Ya
Jenis data kolom input Vektor atau skalar jenis numerik, boolean, teks, DateTime atau kunci .
Jenis data kolom output Skalar atau vektor kunci, atau vektor jenis Single .
Dapat diekspor ke ONNX Ya

membangun OneHotEncodingEstimator kamus nilai unik yang muncul di kolom input. Hasilnya OneHotEncodingTransformer mengonversi satu atau beberapa kolom input menjadi kolom output sebanyak vektor yang dikodekan one-hot.

OneHotEncodingEstimator sering digunakan untuk mengonversi data kategoris menjadi bentuk yang dapat diberikan ke algoritma pembelajaran mesin.

Output dari transformasi ini ditentukan oleh OneHotEncodingEstimator.OutputKind:

  • Indicator menghasilkan vektor indikator. Setiap slot dalam vektor ini sesuai dengan kategori dalam kamus, sehingga panjangnya adalah ukuran kamus bawaan. Jika nilai tidak ditemukan dalam diktioray, outputnya adalah vektor nol.

  • Bag menghasilkan satu vektor sehingga setiap slot menyimpan jumlah kemunculan nilai yang sesuai dalam vektor input. Setiap slot dalam vektor ini sesuai dengan nilai dalam kamus, sehingga panjangnya adalah ukuran kamus yang dibangun. Indicator dan Bag berbeda hanya dalam bagaimana bit-vektor yang dihasilkan dari slot individu di kolom input diagregasi: untuk Indikator mereka digabungkan dan untuk Tas mereka ditambahkan. Ketika kolom sumber adalah Skalar, opsi Indikator dan Tas identik.

  • Key menghasilkan kunci dalam KeyDataViewType kolom. Jika kolom input adalah vektor, output berisi jenis kunci vektor, di mana setiap slot vektor sesuai dengan masing-masing slot vektor input. Jika kategori tidak ditemukan dalam kamus bulit, kategori akan diberi nilai nol.

  • Binary menghasilkan vektor yang dikodekan biner untuk mewakili nilai yang ditemukan dalam kamus yang ada di kolom input. Jika nilai dalam kolom input tidak ditemukan dalam kamus, outputnya adalah vektor nol.

OneHotEncodingTransformer dapat diterapkan ke satu atau beberapa kolom, dalam hal ini membangun dan menggunakan kamus terpisah untuk setiap kolom tempat kolom diterapkan.

Periksa bagian Lihat Juga untuk tautan ke contoh penggunaan.

Metode

Fit(IDataView)

Melatih dan mengembalikan OneHotEncodingTransformer.

GetOutputSchema(SchemaShape)

Mengembalikan SchemaShape skema yang akan diproduksi oleh transformator. Digunakan untuk propagasi dan verifikasi skema dalam alur.

Metode Ekstensi

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Tambahkan 'titik pemeriksaan penembolokan' ke rantai estimator. Ini akan memastikan bahwa estimator hilir akan dilatih terhadap data cache. Sangat membantu untuk memiliki titik pemeriksaan penembolokan sebelum pelatih yang mengambil beberapa data berlalu.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Mengingat estimator, kembalikan objek pembungkus yang akan memanggil delegasi setelah Fit(IDataView) dipanggil. Seringkali penting bagi estimator untuk mengembalikan informasi tentang apa yang cocok, itulah sebabnya Fit(IDataView) metode mengembalikan objek yang ditik secara khusus, bukan hanya umum ITransformer. Namun, pada saat yang sama, IEstimator<TTransformer> sering dibentuk menjadi alur dengan banyak objek, jadi kita mungkin perlu membangun rantai estimator melalui EstimatorChain<TLastTransformer> tempat estimator yang ingin kita dapatkan transformator dikubur di suatu tempat dalam rantai ini. Untuk skenario itu, kita dapat melalui metode ini melampirkan delegasi yang akan dipanggil setelah pas dipanggil.

Berlaku untuk

Lihat juga