Regresi Poisson

Artikel ini menjelaskan komponen dalam perancang Azure Machine Learning.

Gunakan komponen ini untuk membuat model regresi Poisson dalam alur. Regresi Poisson dimaksudkan untuk memprediksi nilai numerik, biasanya jumlah. Oleh karena itu, Anda sebaiknya menggunakan komponen ini untuk membuat model regresi Anda hanya jika nilai yang Anda coba prediksi sesuai dengan kondisi berikut:

  • Variabel respons memiliki distribusi Poisson.

  • Jumlah tidak boleh negatif. Metode ini akan gagal langsung jika Anda mencoba menggunakannya dengan label negatif.

  • Distribusi Poisson adalah distribusi diskrit; oleh karena itu, tidak akan relevan jika menggunakan metode ini bukan dengan bilangan bulat.

Tip

Jika target Anda bukan jumlah, regresi Poisson mungkin bukan metode yang tepat. Coba komponen regresi lain dalam perancang.

Setelah menyiapkan metode regresi, Anda harus melatih model menggunakan set data yang berisi contoh nilai yang ingin Anda prediksi. Model terlatih kemudian dapat digunakan untuk membuat prediksi.

Informasi lebih lanjut tentang regresi Poisson

Regresi Poisson adalah analisis regresi jenis khusus yang biasanya digunakan untuk membuat model jumlah. Misalnya, regresi Poisson akan berguna dalam skenario ini:

  • Membuat model jumlah kasus demam yang terkait dengan penerbangan pesawat

  • Memperkirakan jumlah panggilan layanan darurat dalam sebuah peristiwa

  • Memproyeksikan jumlah pertanyaan pelanggan setelah ada promosi

  • Membuat tabel kontinjensi

Karena variabel respons memiliki distribusi Poisson, model membuat asumsi yang berbeda tentang data dan distribusi probabilitasnya daripada, misalnya, regresi kuadrat terkecil. Oleh karena itu, model Poisson harus ditafsirkan berbeda dari model regresi lainnya.

Cara mengonfigurasi Poisson Regression

  1. Tambahkan komponen Regresi Poisson ke alur Anda di perancang. Anda dapat menemukan komponen ini di Algoritma Pembelajaran Mesin dalam kategori Regresi.

  2. Tambahkan himpunan data yang berisi data pelatihan dengan jenis yang benar.

    Kami menyarankan agar Anda menggunakan Normalisasi Data untuk menormalkan himpunan data input sebelum menggunakannya untuk melatih regresor.

  3. Di panel kanan komponen Regeresi Poisson, tentukan bagaimana Anda ingin model dilatih dengan mengatur opsi Buat mode pelatih.

    • Parameter Tunggal: Jika Anda tahu bagaimana Anda ingin mengkonfigurasi model, berikan set nilai tertentu sebagai argumen.

    • Rentang Parameter: Jika Anda tidak yakin dengan parameter terbaik, lakukan sapuan parameter menggunakan komponen Setel Hyperparameter Model. Pelatih melakukan iterasi atas beberapa nilai yang Anda tentukan untuk menemukan konfigurasi optimal.

  4. Toleransi pengoptimalan: Ketik nilai yang menentukan interval toleransi selama pengoptimalan. Semakin rendah nilainya, semakin lambat dan akurat pengukurannya.

  5. Bobot regularisasi L1 dan bobot regularisasi L2: Ketik nilai yang digunakan untuk regularisasi L1 dan L2. Regularisasi menambah batasan pada algoritma mengenai aspek model yang independen dari data pelatihan. Regularisasi umumnya digunakan untuk menghindari overfitting.

    • Regularisasi L1 berguna jika tujuannya adalah memiliki model yang setersebar mungkin.

      Regularisasi L1 dilakukan dengan mengurangi bobot L1 vektor bobot dari ekspresi yang hilang yang coba diminimalkan oleh pembelajar. Norma L1 adalah perkiraan yang baik untuk norma L0, yang merupakan jumlah koordinat non-nol.

    • Regularisasi L2 mencegah koordinat tunggal dalam vektor bobot agar tidak tumbuh terlalu banyak dalam hal ukuran. Regularisasi L2 berguna jika tujuannya adalah memiliki model dengan bobot keseluruhan kecil.

    Dalam komponen ini, Anda dapat menerapkan kombinasi regularisasi L1 dan L2. Dengan menggabungkan regularisasi L1 dan L2, Anda dapat menjatuhkan penalti pada besarnya nilai parameter. Pembelajar mencoba meminimalkan penalti, sebagai pertukaran dengan meminimalkan kehilangan.

    Untuk pembahasan yang lebih jelas tentang regularisasi L1 dan L2, lihat Regularisasi L1 dan L2 untuk Pembelajaran Mesin.

  6. Ukuran memori untuk L-BFGS: Tentukan jumlah memori yang dicadangkan untuk pemasangan dan pengoptimalan model.

    L-BFGS adalah metode khusus untuk pengoptimalan, berdasarkan algoritma Broyden–Fletcher–Goldfarb–Shanno (BFGS). Metode ini menggunakan jumlah memori terbatas (L) untuk mengomputasi arah langkah berikutnya.

    Dengan mengubah parameter ini, Anda dapat memengaruhi jumlah posisi dan gradien sebelumnya yang disimpan untuk komputasi langkah berikutnya.

  7. Sambungkan himpunan data pelatihan dan model yang tidak terlatih ke salah satu komponen pelatihan:

    • Jika Anda mengatur Buat mode pelatih keParameter Tunggal, gunakan komponen Latih Model.

    • Jika Anda mengatur Buat mode pelatih ke Rentang Parameter, gunakan komponen Setel Hyperparameter Model.

    Peringatan

    • Jika Anda meneruskan rentang parameter ke Model Kereta Api, ini hanya menggunakan nilai pertama dalam daftar rentang parameter.

    • Jika Anda meneruskan satu set nilai parameter ke komponen Setel Hyperparameter Model, saat mengharapkan rentang pengaturan untuk setiap parameter, komponen akan mengabaikan nilai, dan menggunakan nilai default untuk pelajar.

    • Jika Anda memilih opsi Rentang Parameter dan memasukkan nilai tunggal untuk parameter apa pun, nilai tunggal yang Anda tentukan akan digunakan di seluruh sapuan, bahkan jika parameter lain berubah di berbagai nilai.

  8. Kirimkan alur.

Hasil

Setelah pelatihan selesai:

  • Untuk menyimpan salinan bayangan model terlatih, pilih komponen pelatihan, lalu alihkan ke tab Output di panel sebelah kanan. Klik ikon Daftarkan himpunan data. Anda dapat menemukan model yang disimpan sebagai komponen di pohon komponen.

Langkah berikutnya

Lihat set komponen yang tersedia untuk Azure Machine Learning.