Komponen Mesin Vektor Dukungan Dua Kelas

Artikel ini menjelaskan komponen dalam perancang Azure Machine Learning.

Gunakan komponen ini untuk membuat model yang didasarkan pada algoritma mesin vektor dukungan.

Komputer vektor pendukung (SVM) adalah kelas metode pembelajaran yang diawasi dengan baik. Implementasi khusus ini cocok untuk prediksi dua kemungkinan hasil, berdasarkan variabel berkelanjutan atau kategoris.

Setelah menentukan parameter model, latih model dengan menggunakan komponen pelatihan, dan sediakan himpunan data yang diberi tag yang menyertakan label atau kolom hasil.

Tentang komputer vektor dukungan

Komputer vektor pendukung adalah salah satu algoritma pembelajaran mesin paling awal, dan model SVM telah digunakan dalam banyak aplikasi, dari pengambilan informasi hingga klasifikasi teks dan gambar. SVM dapat digunakan untuk tugas klasifikasi dan regresi.

Model SVM ini adalah model pembelajaran yang diawasi yang membutuhkan data berlabel. Dalam proses pelatihan, algoritma menganalisis data input dan mengenali pola dalam ruang fitur multi-dimensi yang disebut hyperplane. Semua contoh input ditunjukkan sebagai titik-titik dalam ruang ini, dan dipetakan ke kategori output sedemikian rupa sehingga kategori dibagi dengan lebar dan menghapus celah mungkin.

Untuk prediksi, algoritma SVM menetapkan contoh baru ke dalam satu kategori atau yang lain, memetakannya ke dalam ruang yang sama.

Cara mengonfigurasi

Untuk jenis model ini, disarankan agar Anda menormalkan himpunan data sebelum menggunakannya untuk melatih pengklasifikasi.

  1. Tambahkan komponen Mesin Vektor Dukungan Dua Kelas ke alur Anda.

  2. Tentukan bagaimana Anda ingin modul ini akan dilatih, dengan mengatur opsi Buat mode pelatih.

    • Satu Parameter: Jika mengetahui bagaimana Anda ingin mengonfigurasikan model, Anda dapat menyediakan kumpulan nilai tertentu sebagai argumen.

    • Rentang Parameter: Jika tidak yakin dengan parameter terbaik, Anda dapat menemukan parameter optimal dengan menggunakan komponen Tune Model Hyperparameters. Anda menyediakan beberapa rentang nilai, dan pelatih melakukan pengulangan di atas beberapa kombinasi pengaturan untuk menentukan kombinasi nilai yang menghasilkan hasil terbaik.

  3. Untuk Jumlah perulangan, ketikkan angka yang menunjukkan jumlah pengulangan yang digunakan saat membuat model.

    Parameter ini dapat digunakan untuk mengontrol pertukaran antara kecepatan dan akurasi pelatihan.

  4. Untuk Lambda, ketik nilai untuk digunakan sebagai bobot regularisasi L1.

    Koefisien regularisasi ini dapat digunakan untuk menyetel model. Nilai yang lebih besar memengaruhi model yang lebih kompleks.

  5. Pilih opsi, Normalisasi fitur, jika Anda ingin menormalkan fitur sebelum pelatihan.

    Jika Anda menerapkan normalisasi, sebelum pelatihan, titik data dipusatkan pada rerata dan diskalakan untuk memiliki satu unit simpangan baku.

  6. Pilih opsi, Proyek ke lingkup unit, untuk menormalkan koefisien.

    Memproyeksikan nilai ke ruang unit berarti bahwa sebelum pelatihan, titik data berpusat pada 0 dan diskalakan untuk memiliki satu unit simpangan baku.

  7. Dalam Seed angka acak, ketikkan nilai bilangan bulat untuk digunakan sebagai seed jika Anda ingin memastikan reproduksi di seluruh eksekusi. Jika tidak, nilai jam sistem digunakan sebagai seed, yang dapat menghasilkan hasil yang sedikit berbeda di seluruh eksekusi.

  8. Sambungkan himpunan data berlabel, dan latih model:

    • Jika Anda mengatur Buat mode pelatih ke Parameter Tunggal, hubungkan himpunan data yang diberi tag dan komponen Latih Model.

    • Jika Anda mengatur Buat mode pelatih ke Rentang Parameter, sambungkan himpunan data yang ditandai dan latih model menggunakan Setel Model Hyperparameter.

    Catatan

    Jika Anda meneruskan rentang parameter ke Latih Model, rentang tersebut hanya akan menggunakan nilai default dalam satu daftar parameter.

    Jika Anda meneruskan satu set nilai parameter ke komponen Tune Model Hyperparameters, saat mengharapkan rentang pengaturan untuk setiap parameter, komponen akan mengabaikan nilai, dan menggunakan nilai default untuk pelajar.

    Jika Anda memilih opsi Rentang Parameter dan memasukkan nilai tunggal untuk parameter apa pun, nilai tunggal yang Anda tentukan akan digunakan di seluruh sapuan, bahkan jika parameter lain berubah di berbagai nilai.

  9. Kirimkan alur.

Hasil

Setelah pelatihan selesai:

  • Untuk menyimpan cuplikan dari model terlatih, pilih tab Output di panel kanan komponen Model pelatihan. Pilih ikon Daftarkan himpunan data untuk menyimpan model sebagai komponen yang dapat digunakan kembali.

  • Untuk menggunakan model penilaian, tambahkan komponen Model Penilaian ke alur.

Langkah berikutnya

Lihat set komponen yang tersedia untuk Azure Machine Learning.