Poisson Regresyonu

Önemli

Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.

1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.

ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.

Verilerin Poisson dağılımı olduğunu varsayan bir regresyon modeli oluşturur

kategori: Model/gerileme Machine Learning/başlat

Not

uygulama hedefi: yalnızca Machine Learning Studio (klasik)

benzer sürükle ve bırak modülleri Azure Machine Learning tasarımcısındakullanılabilir.

Modüle genel bakış

bu makalede, bir poisson regresyon modeli oluşturmak için Machine Learning Studio 'da (klasik) poisson regresyon modülünün nasıl kullanılacağı açıklanır.

Podıson regresyon, sayısal değerleri tahmin etmek için kullanılan regresyon modellerinde kullanılmak üzere tasarlanmıştır, genellikle sayılır. Bu nedenle, yalnızca tahmin etmeye çalıştığınız değerler aşağıdaki koşullara uyması durumunda regresyon modelinizi oluşturmak için bu modülü kullanmanız gerekir:

  • Yanıt değişkeninin bir Poisson dağılımıvardır.

  • Sayımlar negatif olamaz. Bu yöntemi negatif etiketlerle kullanmayı denerseniz yöntem başarısız olur.

  • POISSON dağılımı ayrı bir dağıtımdır; Bu nedenle, bu yöntemin tam sayı olmadan kullanılması anlamlı değildir.

İpucu

Hedef bir sayı değilse, Poisson gerileme büyük olasılıkla uygun bir yöntem değildir. Bu kategorideki diğer modüllerden birini deneyin. gerileme yöntemi seçme konusunda yardım için Machine Learning algoritması oluşturma sayfasınabakın.

Regresyon yöntemini ayarladıktan sonra, tahmin etmek istediğiniz değerin örneklerini içeren bir veri kümesini kullanarak modeli eğmeniz gerekir. Daha sonra eğitilen model, tahminleri yapmak için kullanılabilir.

Poisson gerileme hakkında daha fazla bilgi

POISSON regresyon, genellikle sayıları modellemek için kullanılan özel bir gerileme Analizi türüdür. Örneğin, bu senaryolarda Poisson gerileme yararlı olacaktır:

  • Uçak fışıklarından ilişkili birlikte bulunan kods sayısını Modellendirme

  • Bir olay sırasında acil durum hizmeti çağrılarının sayısını tahmin etme

  • Bir promosyonu izleyen müşteri sorguları sayısını yansıtma

  • Yedek tablo oluşturma

Yanıt değişkeninin bir Poisson dağılımı olduğundan, model, en az kareler regresyonından, veriler ve olasılık dağılımı hakkında farklı varsayımlar yapar. Bu nedenle, Poisson modellerinin diğer regresyon modellerinden farklı yorumlanması gerekir.

Poisson gerilemesini yapılandırma

  1. .Net Studio 'daki denemenize Poisson regresyon modülünü ekleyin (klasik).

    bu modülü, regresyon kategorisinde Machine Learning-başlataltında bulabilirsiniz.

  2. Doğru türdeki eğitim verilerini içeren bir veri kümesi ekleyin.

    Gerileme işlemine eğleştirmek için kullanmadan önce giriş veri kümesini normalleştirmek üzere verileri normalleştirip kullanmanızı öneririz.

  3. Poıslik regresyon modülünün Özellikler bölmesinde, model oluşturma modu seçeneğini ayarlayarak modelin nasıl eğitilmesini istediğinizi belirtin.

    • Tek parametre: modeli nasıl yapılandırmak istediğinizi biliyorsanız bağımsız değişken olarak belirli bir değer kümesi sağlayın.

    • Parametre aralığı. En iyi parametrelerden emin değilseniz, model hiper parametreleri ayarla modülünü kullanarak bir parametre tarama işlemi yapın. En iyi yapılandırmayı bulmak için, eğitmen, belirttiğiniz birden çok değer üzerinde yinelenir.

  4. İyileştirme toleransı: iyileştirme sırasında tolerans aralığını tanımlayan bir değer yazın. Değer ne kadar düşükse, sığdırma daha yavaş ve daha doğru olur.

  5. L1 düzenleme Weight ve L2 düzenleme Weight: L1 ve L2 düzenleme için kullanılacak değerleri yazın. Düzenleme , eğitim verilerinden bağımsız olan modelin yönlerine yönelik kısıtlamalar ekler. Düzenleme, çok fazla yer olmaması için yaygın olarak kullanılır.

    • Hedef, mümkün olduğunca seyrek bir model olması halinde L1 düzenleme yararlıdır.

      L1 düzenleme, Learner 'in en aza indirmeye çalıştığı kayıp ifadesinden ağırlık vektörünün L1 ağırlığı çıkarılarak yapılır. L1 norm, sıfır olmayan Koordinat sayısı olan L0 normu için iyi bir seçimdir.

    • L2 düzenleme, ağırlık vektöründeki tüm tek koordinatları çok fazla büyümeye engel olur. Hedef, küçük Toplam ağırlıklarla bir modele sahip olmak için L2 düzenleme yararlıdır.

    Bu modülde, L1 ve L2 regularizations birleşimini uygulayabilirsiniz. L1 ve L2 düzenleme birleştiren parametre değerlerinin büyüklüğü hakkında bir ceza değeri getirebilirsiniz. Learner, kaybı en aza indirmek için zorunluluğunu getirir içinde ceza puanı en aza indirmeye çalışır.

    L1 ve L2 düzenleme hakkında iyi bir tartışma için bkz. L1 ve L2 düzenleme for Machine Learning.

  6. L-BFGS Için bellek boyutu: model sığdırma ve iyileştirme için ayrılacak bellek miktarını belirtin.

    L-BFGS, en iyi duruma getirme için özel bir yöntemdir: Brohden – FLET, – Goldfarb – shanno (BFGS) algoritmasını temel alır. Yöntemi, sonraki adım yönünü hesaplamak için sınırlı miktarda bellek (L) kullanır.

    Bu parametreyi değiştirerek, bir sonraki adımın hesaplaması için depolanan geçmiş konumların ve degradelerin sayısını etkileyebilirsiniz.

  7. eğitim veri kümesini ve eğitilen modeli eğitim modülleriyle birine Bağlan:

    Uyarı

    • Modeli Eğiteetmekiçin bir parametre aralığı geçirirseniz, parametre aralığı listesindeki yalnızca ilk değeri kullanır.

    • Tek bir parametre değerleri kümesini ayarlama modeli hiper parametreleri modülüne geçirirseniz, her parametre için bir dizi ayar beklerken, değerleri yoksayar ve öğrenici için varsayılan değerleri kullanır.

    • Parametre aralığı seçeneğini belirleyip herhangi bir parametre için tek bir değer girerseniz, belirtilen tek değer, diğer parametrelerin bir değer aralığı üzerinde değişse bile, tarama boyunca kullanılır.

  8. Modeli eğmek için denemeyi çalıştırın.

Örnekler

Makine öğreniminde Poisson gerilemesinin nasıl kullanıldığı hakkında örnekler için Azure yapay zeka Galerisibakın.

Teknik notlar

Poısma gerileme, etiketin Poisson dağılımı olduğu varsayılarak, sayı verilerini modellemek için kullanılır. Örneğin, belirli bir günde müşteri destek merkezine yapılan çağrı sayısını tahmin etmek için bunu kullanabilirsiniz.

Bu algoritma için, bilinmeyen bir işlevin, bir Poisson dağıtımına sahip olduğu varsayılır. Poisson dağılımı aşağıdaki gibi tanımlanır:

X = (x0,..., xD-1) örneği verildiğinde, her k = 0, 1,... için, modül örneğin değerinin k olması olasılığını hesaplar.

Eğitim örnekleri kümesi verildiğinde, algoritma, parametrelerin günlük olma olasılığını en üst düzeye çıkarmaya çalışırken, θ0,..., θD-1 için en iyi değerleri bulmayı dener. Θ0,..., θD-1 parametrelerinin olasılığı, eğitim verilerinin bu parametrelerle bir dağıtım üzerinden örneklendiği olasılıktır.

Günlük olasılığı, logp(y = yi) olarak görüntülenebilir

Tahmin işlevi, söz konusu parametreli Poisson dağılımının beklenen değerini verir, özellikle: fw, b (x) = E [Y | x] = ewTx + b.

Daha fazla bilgi için, Vikipedi 'da Poisson gerileme girişine bakın.

Modül parametreleri

Name Aralık Tür Varsayılan Description
İyileştirme toleransı >= Double. Upsilon Float 0,0000001 İyileştirme yakınsama için bir tolerans değeri belirtin. Değer ne kadar düşükse, sığdırma daha yavaş ve daha doğru olur.
L1 düzenleme ağırlığı >= 0,0 Float 1.0 L1 düzenleme ağırlığını belirtin. Modeli fazla sığdırmayı önlemek için sıfır olmayan bir değer kullanın.
L2 düzenleme ağırlığı >= 0,0 Float 1.0 L2 düzenleme ağırlığını belirtin. Modeli fazla sığdırmayı önlemek için sıfır olmayan bir değer kullanın.
L-BFGS için bellek boyutu >değer Tamsayı 20 L-BFGS İdealleştirici için kullanılacak bellek miktarını (MB cinsinden) belirtin. Daha az bellek sayesinde eğitim daha hızlıdır ancak eğitimin daha az doğru olmasını sağlar.
Rastgele sayı çekirdek herhangi biri Tamsayı Model tarafından kullanılan rastgele sayı oluşturucusunun temel aldığı bir değer yazın. Varsayılan için boş bırakın.
Bilinmeyen kategorik düzeylerine izin ver herhangi biri Boole true Her kategorik sütun için ek bir düzeyin oluşturulup oluşturulmayacağını belirtin. Test veri kümesindeki tüm düzeyler eğitim veri kümesinde kullanılamıyor.

Çıkışlar

Ad Tür Description
Eğitilen model ILearner arabirimi Eğitilen regresyon modeli

Ayrıca bkz.

Regresyon
A-Z modül listesi