Poisson Regresyonu

Bu makalede Azure Machine Learning tasarımcısındaki bir bileşen açıklanmaktadır.

İşlem hattında Poisson regresyon modeli oluşturmak için bu bileşeni kullanın. Poisson regresyonu genellikle sayı olan sayısal değerleri tahmin etmek için tasarlanmıştır. Bu nedenle, yalnızca tahmin etmeye çalıştığınız değerler aşağıdaki koşullara uygunsa regresyon modelinizi oluşturmak için bu bileşeni kullanmanız gerekir:

  • Yanıt değişkeninin Poisson dağılımı vardır.

  • Sayılar negatif olamaz. Negatif etiketlerle kullanmayı denerseniz yöntemi hemen başarısız olur.

  • Poisson dağılımı ayrık bir dağılımdır; bu nedenle, bu yöntemin tam sayı olmayanlarla kullanılması anlamlı değildir.

İpucu

Hedefiniz bir sayı değilse Poisson regresyonu muhtemelen uygun bir yöntem değildir. Tasarımcıdaki diğer regresyon bileşenlerini deneyin.

Regresyon yöntemini ayarladıktan sonra, tahmin etmek istediğiniz değerin örneklerini içeren bir veri kümesi kullanarak modeli eğitmelisiniz. Eğitilen model daha sonra tahminlerde bulunmak için kullanılabilir.

Poisson regresyonu hakkında daha fazla bilgi

Poisson regresyonu, genellikle sayıları modellemek için kullanılan özel bir regresyon analizi türüdür. Örneğin, Poisson regresyonu şu senaryolarda yararlı olabilir:

  • Uçak uçuşlarıyla ilişkili soğuk algınlıklarının sayısını modelleme

  • Olay sırasında yapılan acil durum hizmet çağrılarının sayısını tahmin etme

  • Promosyondan sonraki müşteri sorgularının sayısını yansıtma

  • Acil durum tabloları oluşturma

Yanıt değişkeni bir Poisson dağılımına sahip olduğundan model, veriler ve olasılık dağılımı hakkında en küçük kareler regresyonundan farklı varsayımlarda bulunur. Bu nedenle Poisson modelleri diğer regresyon modellerinden farklı yorumlanmalıdır.

Poisson Regresyonu nasıl yapılandırılır?

  1. Poisson Regresyonu bileşenini tasarımcıdaki işlem hattınıza ekleyin. Bu bileşeni Makine Öğrenmesi Algoritmaları altında Regresyon kategorisinde bulabilirsiniz.

  2. Doğru türde eğitim verileri içeren bir veri kümesi ekleyin.

    Giriş veri kümesini regresörü eğitmek için kullanmadan önce normalleştirmek için Verileri Normalleştirme'yi kullanmanızı öneririz.

  3. Poisson Regresyon bileşeninin sağ bölmesinde Eğitmen modu oluştur seçeneğini ayarlayarak modelin nasıl eğitilmesini istediğinizi belirtin.

    • Tek Parametre: Modeli nasıl yapılandırmak istediğinizi biliyorsanız, bağımsız değişken olarak belirli bir değer kümesi sağlayın.

    • Parametre Aralığı: En iyi parametrelerden emin değilseniz, Model Hiper Parametreleri Ayarlama bileşenini kullanarak bir parametre süpürme işlemi yapın. Eğitmen, en uygun yapılandırmayı bulmak için belirttiğiniz birden çok değer üzerinde yinelenir.

  4. İyileştirme toleransı: İyileştirme sırasında tolerans aralığını tanımlayan bir değer yazın. Değer ne kadar düşük olursa, bağlantı o kadar yavaş ve daha doğru olur.

  5. L1 normalleştirme ağırlığı ve L2 normalleştirme ağırlığı: L1 ve L2 düzenlileştirme için kullanılacak tür değerleri. Düzenlileştirme , modelin eğitim verilerinden bağımsız yönleriyle ilgili algoritmaya kısıtlamalar ekler. Normalleştirme genellikle fazla uygunluktan kaçınmak için kullanılır.

    • L1 normalleştirmesi, amaç mümkün olduğunca seyrek bir modele sahip olmaksa yararlıdır.

      L1 normalleştirmesi, ağırlık vektörünün L1 ağırlığının, öğrencilerin en aza indirmeye çalıştığı kayıp ifadesinden çıkarılarak yapılır. L1 normu, sıfır olmayan koordinatların sayısı olan L0 normu için iyi bir yaklaşık değerdir.

    • L2 düzenlileştirmesi, ağırlık vektörlerindeki tek koordinatların çok fazla büyümesini önler. L2 normalleştirmesi, amaç küçük genel ağırlıklara sahip bir modele sahip olmaksa yararlıdır.

    Bu bileşende, L1 ve L2 düzenlileştirmelerinin bir bileşimini uygulayabilirsiniz. L1 ve L2 normalleştirmesini birleştirerek parametre değerlerinin büyüklüğüne ceza uygulayabilirsiniz. Öğrenci, kaybı en aza indirerek cezayı en aza indirmeye çalışır.

    L1 ve L2 düzenlileştirmesinin iyi bir tartışması için bkz. Makine Öğrenmesi için L1 ve L2 Normalleştirmesi.

  6. L-BFGS için bellek boyutu: Model sığdırma ve iyileştirme için ayrılan bellek miktarını belirtin.

    L-BFGS, Broyden–Fletcher–Goldfarb–Shanno (BFGS) algoritmasını temel alan belirli bir iyileştirme yöntemidir. yöntemi, bir sonraki adım yönünü hesaplamak için sınırlı miktarda bellek (L) kullanır.

    Bu parametreyi değiştirerek, bir sonraki adımın hesaplaması için depolanan geçmiş konumların ve gradyanların sayısını etkileyebilirsiniz.

  7. Eğitim veri kümesini ve eğitilmemiş modeli eğitim bileşenlerinden birine bağlayın:

    Uyarı

    • Modeli Eğitme'ye bir parametre aralığı geçirirseniz, parametre aralığı listesindeki yalnızca ilk değeri kullanır.

    • Model Hiper Parametreleri Ayarlama bileşenine tek bir parametre değeri kümesi geçirirseniz, her parametre için bir ayar aralığı beklediğinde değerleri yoksayar ve öğrenci için varsayılan değerleri kullanır.

    • Parametre Aralığı seçeneğini belirleyip herhangi bir parametre için tek bir değer girerseniz, diğer parametreler bir değer aralığında değişse bile, belirttiğiniz tek değer süpürme boyunca kullanılır.

  8. İşlem hattını gönderin.

Sonuçlar

Eğitim tamamlandıktan sonra:

  • Eğitilen modelin anlık görüntüsünü kaydetmek için eğitim bileşenini seçin, ardından sağ panelde Outputs+logs sekmesine geçin. Veri kümesini kaydet simgesine tıklayın. Kaydedilen modeli bileşen ağacında bileşen olarak bulabilirsiniz.

Sonraki adımlar

Bkz. Azure Machine Learning'de kullanılabilen bileşenler kümesi .