Poisson Regresyonu

Verilerin Poisson dağılımına sahip olduğunu varsayan bir regresyon modeli oluşturur

Kategori: Machine Learning / Modeli Başlatma / Regresyon

Not

Için geçerlidir: Machine Learning Studio (klasik)

Bu içerik yalnızca Studio (klasik) ile ilgili. Benzer sürükle ve bırak modülleri bir tasarımcıya Azure Machine Learning eklendi. İki sürümü karşılaştıran bu makalede daha fazla bilgi bulabilirsiniz.

Modüle genel bakış

Bu makalede, Poisson regresyon modeli oluşturmak için Azure Machine Learning Studio'da (klasik) Poisson Regresyon modülünün nasıl kullanımı açıklanmıştır.

Poisson regresyon, sayısal değerleri( genellikle sayıları) tahmin etmek için kullanılan regresyon modellerinde kullanılmak üzere tasarlanmıştır. Bu nedenle, regresyon modelinizi oluşturmak için bu modülü yalnızca aşağıdaki koşullar için tahmin etmeye çalıştığınız değerler varsa kullansanız gerekir:

  • Yanıt değişkeninin Poisson dağıtımı var.

  • Sayımlar negatif olamaz. Negatif etiketlerle kullanmayı denerse yöntemi tam olarak başarısız olur.

  • Poisson dağıtımı ayrık bir dağılımdır; Bu nedenle, bu yöntemi tam olmayan sayılarla kullanmak anlamlı değildir.

İpucu

Hedefiniz sayı değilse Poisson regresyonu muhtemelen uygun bir yöntem değildir. Bu kategorideki diğer modüllerden birini deneyin. Regresyon yöntemi seçme hakkında yardım için bkz. Azure machine Learning algoritması bilgi sayfası.

Regresyon yöntemini ayardikten sonra, tahmin etmek istediğiniz değerin örneklerini içeren bir veri kümesi kullanarak modeli eğitebilirsiniz. Eğitilen model daha sonra tahmin yapmak için kullanılabilir.

Poisson regresion hakkında daha fazla bilgi

Poisson regresyon, genellikle sayıları modellemek için kullanılan özel bir regresyon analizi t t'tir. Örneğin Poisson regresion şu senaryolarda yararlı olabilir:

  • Uçak fışıklarından ilişkili birlikte bulunan kods sayısını Modellendirme

  • Bir olay sırasında acil durum hizmeti çağrılarının sayısını tahmin etme

  • Bir promosyonu izleyen müşteri sorguları sayısını yansıtma

  • Yedek tablo oluşturma

Yanıt değişkeninin bir Poisson dağılımı olduğundan, model, en az kareler regresyonından, veriler ve olasılık dağılımı hakkında farklı varsayımlar yapar. Bu nedenle, Poisson modellerinin diğer regresyon modellerinden farklı yorumlanması gerekir.

Poisson gerilemesini yapılandırma

  1. .Net Studio 'daki denemenize Poisson regresyon modülünü ekleyin (klasik).

    Bu modülü, regresyon kategorisinde Machine Learning-Başlat altında bulabilirsiniz.

  2. Doğru türdeki eğitim verilerini içeren bir veri kümesi ekleyin.

    Gerileme işlemine eğleştirmek için kullanmadan önce giriş veri kümesini normalleştirmek üzere verileri normalleştirip kullanmanızı öneririz.

  3. Poıslik regresyon modülünün Özellikler bölmesinde, model oluşturma modu seçeneğini ayarlayarak modelin nasıl eğitilmesini istediğinizi belirtin.

    • Tek parametre: modeli nasıl yapılandırmak istediğinizi biliyorsanız bağımsız değişken olarak belirli bir değer kümesi sağlayın.

    • Parametre aralığı. En iyi parametrelerden emin değilseniz, model hiper parametreleri ayarla modülünü kullanarak bir parametre tarama işlemi yapın. En iyi yapılandırmayı bulmak için, eğitmen, belirttiğiniz birden çok değer üzerinde yinelenir.

  4. İyileştirme toleransı: iyileştirme sırasında tolerans aralığını tanımlayan bir değer yazın. Değer ne kadar düşükse, sığdırma daha yavaş ve daha doğru olur.

  5. L1 düzenleme Weight ve L2 düzenleme Weight: L1 ve L2 düzenleme için kullanılacak değerleri yazın. Düzenleme , eğitim verilerinden bağımsız olan modelin yönlerine yönelik kısıtlamalar ekler. Fazla kullanılabilirliği önlemek için düzenlileştirme yaygın olarak kullanılır.

    • Amaç mümkün olduğunca seyrek bir modele sahip olmaksa L1 düzenlileştirme yararlı olur.

      L1 normalleştirmesi, ağırlık vektörü L1 ağırlığının, öğrenicinin en aza indirmeye çalıştığı kayıp ifadesinden çıkararak yapılır. L1 normu, sıfır olmayan koordinatların sayısı olan L0 normu için iyi bir yaklaşık değerdir.

    • L2 düzenlileştirmesi, ağırlık vektörü içinde yer alan tek bir koordinatı çok fazla büyüklüğünün büyümesine engel olur. L2 düzenlileştirme, hedefin genel ağırlığı küçük olan bir modele sahip olmaksa yararlıdır.

    Bu modülde L1 ve L2 düzenlileştirmelerinin bir bileşimini uygulayabilirsiniz. L1 ve L2 düzenlileştirmeyi birleştirerek, parametre değerlerinin büyüklüğüne bir ceza dayatebilirsiniz. Öğrenciler, kaybı en aza indirerek cezayı en aza indirmeye çalışır.

    L1 ve L2 düzenlileştirmesi hakkında iyi bir tartışma için bkz. L1 ve L2'de Machine Learning.

  6. L-BFGS için bellek boyutu: Model sığdırma ve iyileştirme için yedekte tutulan bellek miktarını belirtin.

    L-BFGS, Broyden–Seo–Goldfarb–Rnono (BFGS) algoritmasını temel alan belirli bir iyileştirme yöntemidir. yöntemi, sonraki adım yönünü hesaplamak için sınırlı miktarda bellek (L) kullanır.

    Bu parametreyi değiştirerek, bir sonraki adımın hesaplaması için depolanan geçmiş konum ve gradyanların sayısını etkileyebileceksiniz.

  7. Eğitim veri kümelerini ve eğitilmemiş modeli eğitim modüllerinden biri ile birbirine bağlama:

    Uyarı

    • Modeli Eğit'e bir parametre aralığı iletirsiniz,parametre aralığı listesinde yalnızca ilk değeri kullanır.

    • Tek bir parametre değerleri kümesini ayarlama modeli hiper parametreleri modülüne geçirirseniz, her parametre için bir dizi ayar beklerken, değerleri yoksayar ve öğrenici için varsayılan değerleri kullanır.

    • Parametre aralığı seçeneğini belirleyip herhangi bir parametre için tek bir değer girerseniz, belirtilen tek değer, diğer parametrelerin bir değer aralığı üzerinde değişse bile, tarama boyunca kullanılır.

  8. Modeli eğmek için denemeyi çalıştırın.

Örnekler

Makine öğreniminde Poisson gerilemesinin nasıl kullanıldığı hakkında örnekler için Azure yapay zeka Galerisibakın.

Teknik notlar

Poısma gerileme, etiketin Poisson dağılımı olduğu varsayılarak, sayı verilerini modellemek için kullanılır. Örneğin, belirli bir günde müşteri destek merkezine yapılan çağrı sayısını tahmin etmek için bunu kullanabilirsiniz.

Bu algoritma için, bilinmeyen bir işlevin, bir Poisson dağıtımına sahip olduğu varsayılır. Poisson dağılımı aşağıdaki gibi tanımlanır:

X = (x0,..., xD-1) örneği verildiğinde, her k = 0, 1,... için, modül örneğin değerinin k olması olasılığını hesaplar.

Eğitim örnekleri kümesi verildiğinde, algoritma, parametrelerin günlük olma olasılığını en üst düzeye çıkarmaya çalışırken, θ0,..., θD-1 için en iyi değerleri bulmayı dener. Θ0,..., θD-1 parametrelerinin olasılığı, eğitim verilerinin bu parametrelerle bir dağıtım üzerinden örneklendiği olasılıktır.

Günlük olasılığı, log p(y = yi) olarak görüntülenebilir

Tahmin işlevi, söz konusu parametreli Poisson dağılımının beklenen değerini verir, özellikle: f w, b (x) = E [Y|x] = e wTx + b.

Daha fazla bilgi için Wikipedia'daki Poisson regresyon girdisini okuyun.

Modül parametreleri

Name Aralık Tür Varsayılan Description
İyileştirme toleransı >=double. Epsilon Float 0.0000001 İyileştirme yakınsama için bir tolerans değeri belirtin. Değer ne kadar düşük ise sığdırma o kadar yavaş ve daha doğru olur.
L1 düzenlileştirme ağırlığı >=0.0 Float 1.0 L1 normalleştirme ağırlığını belirtin. Modelin fazla uygun olması için sıfır olmayan bir değer kullanın.
L2 düzenlileştirme ağırlığı >=0.0 Float 1.0 L2 normalleştirme ağırlığını belirtin. Modelin fazla uygun olması için sıfır olmayan bir değer kullanın.
L-BFGS için bellek boyutu >=1 Tamsayı 20 L-BFGS iyileştiricisi için ne kadar bellek (MB) kullanılacı olduğunu gösterme. Daha az bellekle eğitim daha hızlıdır ancak eğitimde daha az doğru olur.
Rastgele sayı çekirdeği herhangi biri Tamsayı Model tarafından kullanılan rastgele sayı oluşturucusunun temel aldığı bir değer yazın. Varsayılan için boş bırakın.
Bilinmeyen kategorik düzeylerine izin ver herhangi biri Boole true Her kategorik sütun için ek bir düzeyin oluşturulup oluşturulmayacağını belirtin. Test veri kümesindeki tüm düzeyler eğitim veri kümesinde kullanılamıyor.

Çıkışlar

Ad Tür Description
Eğitilen model ILearner arabirimi Eğitilen regresyon modeli

Ayrıca bkz.

Regresyon
A-Z modül listesi