Pohon Keputusan Multiclass Boosted

Artikel ini menjelaskan komponen dalam perancang Azure Machine Learning.

Gunakan komponen ini untuk membuat model pembelajaran mesin yang didasarkan pada algoritma pohon keputusan yang ditingkatkan.

Pohon keputusan yang ditingkatkan adalah metode pembelajaran ansambel di mana pohon kedua mengoreksi kesalahan pohon pertama, pohon ketiga mengoreksi kesalahan pohon pertama dan kedua, dan sebagainya. Prediksi didasarkan pada ansambel pohon bersama-sama.

Cara mengonfigurasi

Komponen ini membuat model klasifikasi yang tidak terlatih. Karena klasifikasi adalah metode pembelajaran yang diawasi, Anda memerlukan himpunan data berlabel yang menyertakan kolom label dengan nilai untuk semua baris.

Anda dapat melatih jenis model ini dengan menggunakan Model Latihan.

  1. Tambahkan komponen Pohon Keputusan Multi-Kelas yang Ditingkatkan ke alur Anda.

  2. Tentukan bagaimana Anda ingin model dilatih dengan mengatur opsi Buat mode pelatih.

    • Parameter Tunggal: Jika Anda tahu bagaimana Anda ingin mengonfigurasi model, berikan set nilai tertentu sebagai argumen.

    • Rentang Parameter: Pilih opsi ini jika Anda tidak yakin dengan parameter terbaik, dan ingin menjalankan pembersihan parameter. Pilih rentang nilai untuk diulangi, dan Tune Model Hyperparameters berulang-ulang atas semua kemungkinan kombinasi pengaturan yang Anda berikan untuk menentukan hyperparameter yang menghasilkan hasil optimal.

  3. Jumlah maksimum daun per pohon membatasi jumlah maksimum node terminal (daun) yang dapat dibuat di pohon apa pun.

    Dengan meningkatkan nilai ini, Anda berpotensi meningkatkan ukuran pohon dan mencapai presisi yang lebih tinggi, dengan risiko overfitting dan waktu pelatihan yang lebih lama.

  4. Jumlah minimum sampel per node daun menunjukkan jumlah kasus yang diperlukan untuk membuat node terminal (daun) di pohon.

    Dengan meningkatkan nilai ini, Anda meningkatkan ambang batas untuk membuat aturan baru. Misalnya, dengan nilai default 1, bahkan satu kasus dapat menyebabkan aturan baru dibuat. Jika Anda meningkatkan nilai menjadi 5, data pelatihan harus berisi setidaknya lima kasus yang memenuhi kondisi yang sama.

  5. Tingkat pembelajaran menentukan ukuran langkah saat belajar. Masukkan angka antara 0 dan 1.

    Tingkat pembelajaran menentukan seberapa cepat atau memperlambat pelajar bertemu dengan solusi yang optimal. Jika ukuran langkah terlalu besar, Anda mungkin melampaui solusi optimal. Jika ukuran langkah terlalu kecil, pelatihan membutuhkan waktu lebih lama untuk bertemu dengan solusi terbaik.

  6. Jumlah pohon yang dibangun menunjukkan jumlah total pohon keputusan untuk dibuat di ansambel. Dengan membuat lebih banyak pohon keputusan, Anda berpotensi mendapatkan cakupan yang lebih baik, tetapi waktu pelatihan akan meningkat.

  7. Seed angka acak secara opsional menetapkan bilangan bulat non-negatif untuk digunakan sebagai nilai seed acak. Menentukan seed memastikan reproduksi di seluruh eksekusi yang memiliki data dan parameter yang sama.

    Seed acak diatur secara default ke 42. Eksekusi berturut-turut menggunakan seed acak yang berbeda dapat memiliki hasil yang berbeda.

  8. Melatih model:

    • Jika Anda mengatur Buat mode pelatih ke Parameter Tunggal, hubungkan himpunan data yang ditandai dan komponen Model Pelatihan.

    • Jika Anda mengatur Buat mode pelatih ke Rentang Parameter, sambungkan himpunan data yang ditandai dan latih model menggunakan Setel Model Hyperparameter.

    Catatan

    Jika Anda meneruskan rentang parameter ke Latih Model, rentang tersebut hanya akan menggunakan nilai default dalam satu daftar parameter.

    Jika Anda meneruskan satu set nilai parameter ke komponen Tune Model Hyperparameters, saat mengharapkan rentang pengaturan untuk setiap parameter, komponen akan mengabaikan nilai, dan menggunakan nilai default untuk pelajar.

    Jika Anda memilih opsi Rentang Parameter dan memasukkan satu nilai untuk parameter apa saja, nilai tunggal yang Anda tentukan akan digunakan di seluruh pembersihan, bahkan jika parameter lain berubah di berbagai nilai.

Langkah berikutnya

Lihat set komponen yang tersedia untuk Azure Machine Learning.