Regresi Kuantil Hutan Cepat

Artikel ini menjelaskan modul dalam perancang Azure Machine Learning.

Gunakan komponen ini untuk membuat model regresi kuantik hutan ceoat dalam alur. Regresi kuantil hutan cepat berguna jika Anda ingin memahami lebih lanjut tentang distribusi nilai yang diprediksi, daripada mendapatkan nilai prediksi rata-rata tunggal. Metode ini memiliki banyak aplikasi, termasuk:

  • Memprediksi harga

  • Memperkirakan performa siswa atau menerapkan grafik pertumbuhan untuk menilai perkembangan anak

  • Menemukan hubungan prediktif dalam kasus di mana hanya ada hubungan lemah antar variabel

Algoritma regresi ini adalah metode pembelajaran yang diawasi, yang berarti ini memerlukan himpunan data dengan tag yang menyertakan kolom label. Karena ini adalah algoritma regresi, kolom label harus hanya berisi nilai numerik.

Lebih lanjut tentang regresi kuantil

Terdapat banyak jenis regresi yang berbeda. Sederhananya, regresi berarti menyesuaikan model dengan target yang dinyatakan sebagai vektor numerik. Namun, ahli statistik telah mengembangkan metode untuk regresi yang semakin maju.

Definisi paling sederhana dari kuantil adalah nilai yang membagi set data menjadi grup berukuran sama; dengan demikian, nilai kuantitatif menandai batas antar grup. Secara statistik, kuantil adalah nilai yang diambil pada interval berkala dari inversi fungsi distribusi kumulatif (CDF) dari variabel acak.

Sedangkan model regresi linear mencoba untuk memprediksi nilai variabel numerik menggunakan perkiraan tunggal, rata-rata, kadang-kadang Anda perlu memprediksi rentang atau seluruh distribusi variabel target. Teknik seperti regresi Bayesian dan regresi kuantil telah dikembangkan untuk tujuan ini.

Regresi kuantil membantu Anda memahami distribusi nilai yang diprediksi. Model regresi kuantil berbasis pohon, seperti yang digunakan dalam komponen ini, memiliki keuntungan tambahan untuk dapat digunakan dalam memprediksi distribusi non-parametrik.

Cara mengkonfigurasi Regresi Kuantil Hutan Cepat

  1. Tambahkan komponen Regresi Kuantil Hutan Cepat ke alur Anda di perancang. Anda dapat menemukan komponen ini di Algoritma Pembelajaran Mesin dalam kategori Regresi.

  2. Di panel kanan komponen Regresi Kuantil Hutan Cepat, tentukan bagaimana Anda ingin model dilatih, dengan mengatur opsi Buat mode pelatih.

    • Parameter Tunggal: Jika Anda tahu bagaimana Anda ingin mengonfigurasi model, berikan serangkaian nilai tertentu sebagai argumen. Saat Anda melatih model, gunakan Model Kereta Api.

    • Rentang Parameter: Jika Anda tidak yakin dengan parameter terbaik, lakukan sapuan parameter menggunakan komponen Setel Hyperparameter Model. Pelatih melakukan iterasi atas beberapa nilai yang Anda tentukan untuk menemukan konfigurasi optimal.

  3. Jumlah Pohon, ketik jumlah maksimum pohon yang dapat dibuat di ansambel. Jika Anda membuat lebih banyak pohon, umumnya mengarah pada akurasi yang lebih besar, tetapi dengan waktu pelatihan yang lebih lama.

  4. Jumlah Daun, ketik jumlah maksimum daun, atau simpul terminal, yang dapat dibuat di pohon apa pun.

  5. Jumlah minimum instans pelatihan yang diperlukan untuk membentuk daun, tentukan jumlah minimum contoh yang diperlukan untuk membuat simpul terminal (daun) di pohon.

    Dengan meningkatkan nilai ini, Anda meningkatkan ambang batas untuk membuat aturan baru. Misalnya, dengan nilai default 1, bahkan satu kasus dapat menyebabkan aturan baru dibuat. Jika Anda meningkatkan nilai menjadi 5, data pelatihan harus berisi setidaknya 5 kasus yang memenuhi kondisi yang sama.

  6. Pecahan bagging, tentukan angka antara 0 dan 1 yang mewakili pecahan sampel untuk digunakan saat membangun masing-masing kelompok kuantil. Sampel dipilih secara acak, dengan penggantian.

  7. Pecahan split, ketik angka antara 0 dan 1 yang mewakili pecahan fitur untuk digunakan dalam setiap split pada pohon. Fitur yang digunakan selalu dipilih secara acak.

  8. Kuantil yang diperkirakan, ketik daftar kuantil yang dipisahkan titik koma dari kuantil yang Anda inginkan untuk melatih model dan membuat prediksi.

    Misalnya, jika Anda ingin membuat model yang memperkirakan kuartil, Anda akan mengetik 0.25; 0.5; 0.75.

  9. Secara opsional, ketik nilai untuk Biji angka acak untuk menyemai generator angka acak yang digunakan oleh model. Defaultnya adalah 0, yang berarti benih acak dipilih.

    Anda harus memberikan nilai jika Anda perlu mereproduksi hasil di seluruh eksekusi berturut-turut pada data yang sama.

  10. Sambungkan himpunan data pelatihan dan model yang tidak terlatih ke salah satu komponen pelatihan:

    • Jika Anda mengatur Buat mode pelatih keParameter Tunggal, gunakan komponen Latih Model.

    • Jika Anda mengatur Buat mode pelatih ke Rentang Parameter, gunakan komponen Setel Hyperparameter Model.

    Peringatan

    • Jika Anda meneruskan rentang parameter ke Train Model, hanya nilai default yang akan digunakan pada daftar parameter tunggal.

    • Jika Anda meneruskan satu set nilai parameter ke komponen Setel Hyperparameter Model, saat mengharapkan rentang pengaturan untuk setiap parameter, komponen akan mengabaikan nilai, dan menggunakan nilai default untuk pelajar.

    • Jika Anda memilih opsi Rentang Parameter dan memasukkan satu nilai untuk parameter apa saja, nilai tunggal yang Anda tentukan akan digunakan di seluruh pembersihan, bahkan jika parameter lain berubah di berbagai nilai.

  11. Kirim alur.

Hasil

Setelah pelatihan selesai:

  • Untuk menyimpan salinan bayangan model terlatih, pilih komponen pelatihan, lalu alihkan ke tab Output di panel sebelah kanan. Klik ikon Daftarkan himpunan data. Anda dapat menemukan model yang disimpan sebagai komponen di pohon komponen.

Metrik evaluasi

Anda dapat menggunakan komponen Evaluasi Model untuk mengevaluasi model terlatih. Untuk Regresi Kuantil Hutan Cepat, metriknya adalah sebagai berikut.

  • Kehilangan Kuantil: Ini adalah ukuran kesalahan untuk kuantil tertentu dalam model Anda.
  • Kerugian Kuantil Rata-rata: Ini hanyalah rata-rata nilai Kerugian Kuantil di semua kuantil yang dipertimbangkan dalam model. Ini memberikan ukuran keseluruhan seberapa baik performa model di semua kuantil.

Langkah berikutnya

Lihat kumpulan komponen yang tersedia untuk Azure Machine Learning.