Pentingnya Fitur Permutasi

Artikel ini menjelaskan cara menggunakan komponen Pentingnya Fitur Permutasi dalam perancang Azure Machine Learning, untuk menghitung sekumpulan skor penting fitur untuk himpunan data Anda. Anda menggunakan skor ini untuk membantu Anda menentukan fitur terbaik untuk digunakan dalam model.

Dalam komponen ini, nilai fitur dikocok secara acak, satu kolom pada satu waktu. Performa model diukur sebelum dan sesudah. Anda dapat memilih salah satu metrik standar untuk mengukur performa.

Skor yang ditampilkan komponen mewakili perubahan performa model terlatih, setelah permutasi. Fitur penting biasanya lebih sensitif terhadap proses pengocokan, sehingga akan menghasilkan skor yang lebih penting.

Artikel ini memberikan gambaran umum tentang fitur permutasi, dasar teoritisnya, dan aplikasinya dalam pembelajaran mesin: Pentingnya Fitur Permutasi.

Cara menggunakan Pentingnya Fitur Permutasi

Membuat serangkaian skor fitur mengharuskan Anda memiliki model yang sudah dilatih serta himpunan data pengujian.

  1. Tambahkan komponen Pentingnya Fitur Permutasi ke alur Anda. Anda dapat menemukan komponen ini dalam kategori Pilihan Fitur.

  2. Sambungkan model terlatih ke input kiri. Modelnya harus model regresi atau model klasifikasi.

  3. Di input kanan, sambungkan himpunan data. Sebaiknya, pilih salah satu yang berbeda dari himpunan data yang Anda gunakan untuk melatih model. Himpunan data ini digunakan untuk memberikan nilai berdasarkan model yang sudah dilatih. Ini juga digunakan untuk mengevaluasi model setelah nilai fitur berubah.

  4. Untuk Nilai awal acak, masukkan nilai yang akan digunakan sebagai nilai awal untuk pengacakan. Jika Anda menentukan 0 (default), angka dihasilkan berdasarkan jam sistem.

    Nilai awal bersifat opsional tetapi Anda harus memberikan nilai jika Anda ingin reproduktifitas di seluruh proses alur yang sama.

  5. Untuk Metrik untuk mengukur performa, pilih satu metrik untuk digunakan saat Anda menghitung kualitas model setelah permutasi.

    Perancang Azure Machine Learning mendukung metrik berikut, bergantung pada apakah Anda sedang mengevaluasi model klasifikasi atau regresi:

    • Klasifikasi

      Akurasi, Presisi, Pengenalan

    • Regresi

      Presisi, Pengenalan, Kesalahan Mutlak Rata-rata, Kesalahan Kuadrat Akar Rata-rata, Kesalahan Relatif Mutlak, Kesalahan Kuadrat Relatif, Koefisien Determinasi

    Untuk deskripsi lebih rinci tentang metrik evaluasi ini dan cara menghitungnya, lihat Mengevaluasi Model.

  6. Kirim alurnya.

  7. Komponen ini menghasilkan daftar kolom fitur dan skor yang terkait dengan komponen. Daftar ini diberi peringkat dalam urutan menurun dari skor.

Catatan teknis

Pentingnya Fitur Permutasi bekerja dengan mengubah nilai setiap kolom fitur secara acak, satu kolom pada satu waktu. Kemudian mengevaluasi model.

Peringkat yang disediakan komponen seringkali berbeda dari yang Anda dapatkan dari Pemilihan Fitur Berbasis Filter. Pemilihan Fitur Berbasis Filter menghitung skor sebelum model dibuat.

Alasan perbedaannya adalah bahwa Pentingnya Fitur Permutasi tidak mengukur hubungan antara fitur dan nilai target. Sebaliknya, ia menangkap seberapa banyak pengaruh setiap fitur pada prediksi dari model.

Langkah berikutnya

Lihat set komponen yang tersedia untuk Azure Machine Learning.