Komponen Regresi Logistik Multikelas

Artikel ini menjelaskan komponen dalam perancang Azure Machine Learning.

Gunakan komponen ini untuk membuat model regresi logistik yang dapat digunakan untuk memprediksi beberapa nilai.

Klasifikasi menggunakan regresi logistik adalah metode pembelajaran yang diawasi, dan karenanya memerlukan himpunan data berlabel. Anda melatih model dengan menyediakan model dan himpunan data berlabel sebagai input ke komponen seperti Latih Model. Model terlatih kemudian dapat digunakan untuk memprediksi nilai untuk contoh input baru.

Azure Machine Learning juga menyediakan komponen Regresi Logistik Dua Kelas, yang cocok untuk klasifikasi variabel biner atau dikotomis.

Tentang regresi logistik multi-kelas

Regresi logistik adalah metode terkenal dalam statistik yang digunakan untuk memprediksi peluang hasil, dan populer untuk tugas klasifikasi. Algoritma memprediksi peluang terjadinya suatu peristiwa dengan memasang data ke fungsi logistik.

Dalam regresi logistik multi-kelas, pengklasifikasi dapat digunakan untuk memprediksi beberapa hasil.

Mengonfigurasi regresi logistik multi-kelas

  1. Tambahkan komponen Regresi Logistik Multikelas ke alur.

  2. Tentukan bagaimana Anda ingin model dilatih dengan mengatur opsi Buat mode pelatih.

    • Parameter Tunggal: Gunakan opsi ini jika Anda tahu bagaimana Anda ingin mengonfigurasi model, dan memberikan set nilai tertentu sebagai argumen.

    • Rentang Parameter: Pilih opsi ini jika Anda tidak yakin dengan parameter terbaik, dan ingin menjalankan sapuan parameter. Pilih rentang nilai yang akan diulang, dan Tune Model Hyperparameters mengulangi semua kemungkinan kombinasi pengaturan yang Anda berikan untuk menentukan hyperparameter yang menghasilkan hasil optimal.

  3. Toleransi pengoptimalan, tentukan nilai ambang batas untuk konvergensi pengoptimal. Jika perbaikan antara perulangan kurang dari ambang batas, algoritma akan berhenti dan mengembalikan model saat ini.

  4. Bobot regularisasi L1, Bobot regularisasi L2: Ketikkan nilai yang akan digunakan untuk parameter regularisasi L1 dan L2. Nilai bukan nol direkomendasikan untuk keduanya.

    Regularisasi adalah metode untuk mencegah fitting berlebihan dengan membebankan model dengan nilai koefisien ekstrem. Regularisasi bekerja dengan menambahkan penalti yang terkait dengan nilai koefisien ke kesalahan hipotesis. Model yang akurat dengan nilai koefisien ekstrem akan dikenakan sanksi lebih banyak, tetapi model yang kurang akurat dengan nilai yang lebih konservatif akan dikenakan sanksi lebih sedikit.

    Regularisasi L1 dan L2 memiliki efek dan kegunaan yang berbeda. L1 dapat diterapkan pada model yang jarang, yang berguna saat bekerja dengan data berdimensi tinggi. Sebaliknya, regularisasi L2 lebih disukai untuk data yang tidak jarang. Algoritma ini mendukung kombinasi linier dari nilai regularisasi L1 dan L2: yaitu, jika x = L1 dan y = L2, ax + by = c mendefinisikan rentang linier dari istilah regularisasi.

    Kombinasi linier yang berbeda dari istilah L1 dan L2 telah dirancang untuk model regresi logistik, seperti regularisasi bersih elastis.

  5. Turunan angka acak: Ketik nilai bilangan bulat untuk digunakan sebagai turunan untuk algoritma jika Anda ingin hasilnya dapat diulangi saat dijalankan. Jika tidak, nilai jam sistem digunakan sebagai turunan, yang dapat menghasilkan hasil yang sedikit berbeda dalam menjalankan alur yang sama.

  6. Sambungkan himpunan data berlabel, dan latih model:

    • Jika Anda mengatur Buat mode pelatih ke Parameter Tunggal, hubungkan himpunan data yang diberi tag dan komponen Latih Model.

    • Jika Anda mengatur Buat mode pelatih ke Rentang Parameter, sambungkan himpunan data yang ditandai dan latih model menggunakan Setel Model Hyperparameter.

    Catatan

    Jika Anda meneruskan rentang parameter ke Latih Model, rentang tersebut hanya akan menggunakan nilai default dalam satu daftar parameter.

    Jika Anda meneruskan satu set nilai parameter ke komponen Tune Model Hyperparameters, saat mengharapkan rentang pengaturan untuk setiap parameter, komponen akan mengabaikan nilai, dan menggunakan nilai default untuk pelajar.

    Jika Anda memilih opsi Rentang Parameter dan memasukkan nilai tunggal untuk parameter apa pun, nilai tunggal yang Anda tentukan akan digunakan di seluruh sapuan, bahkan jika parameter lain berubah di berbagai nilai.

  7. Kirimkan alur.

Langkah berikutnya

Lihat set komponen yang tersedia untuk Azure Machine Learning.