Çizgisel Regresyon

Doğrusal regresyon modeli oluşturur

Kategori: model/gerileme Machine Learning/Başlat

Not

Uygulama hedefi: Machine Learning Studio (klasik)

Bu içerik yalnızca Studio (klasik) ile ilgilidir. Benzer sürükle ve bırak modülleri Azure Machine Learning tasarımcısına eklenmiştir. Bu makalede iki sürümü karşılaştırandaha fazla bilgi edinin.

Modüle genel bakış

Bu makalede, bir deneyde kullanılmak üzere doğrusal regresyon modeli oluşturmak için Azure Machine Learning Studio (klasik) ' de Doğrusal regresyon modülünün nasıl kullanılacağı açıklanır. Doğrusal regresyon bir veya daha fazla bağımsız değişken ile sayısal bir sonuç veya bağımlı değişken arasında doğrusal bir ilişki kurmaya çalışır.

Bu modülü, doğrusal bir regresyon yöntemi tanımlamak ve sonra etiketli bir veri kümesi kullanarak bir modeli eğitebilmeniz için kullanırsınız. Daha sonra eğitilen model, tahminleri yapmak için kullanılabilir. Alternatif olarak, bir etiketli veri kümesine karşı çapraz doğrulama için eğitimli olmayan model çapraz doğrulama modeline geçirilebilir.

Doğrusal regresyon hakkında daha fazla bilgi

Doğrusal regresyon, Machine Learning 'de benimsenen yaygın istatistiksel bir yöntemdir ve satır ve ölçü hatasına yönelik birçok yeni yöntemle geliştirilmiştir. En basit anlamda, regresyon bir sayısal hedefin tahminini ifade eder. Temel bir tahmine dayalı görev için çok basit bir model istediğinizde doğrusal regresyon hala iyi bir seçimdir. Doğrusal regresyon, yüksek boyutlu, karmaşıklık olmayan seyrek veri kümeleri üzerinde iyi çalışma eğilimi gösterir.

Azure Machine Learning Studio (klasik), doğrusal gerileme ek olarak çeşitli gerileme modellerini destekler. Ancak, "gerileme" terimi gevşek olarak yorumlanamaz ve diğer araçlarda sunulan bazı gerileme türleri Studio 'da (klasik) desteklenmez.

  • Klasik gerileme sorunu, tek bir bağımsız değişken ve bağımlı bir değişken içerir. Bu basit gerileme olarak adlandırılır. Bu modül basit gerileme destekler.

  • Birden çok doğrusal gerileme , tek bir bağımlı değişkene katkıda bulunan iki veya daha fazla bağımsız değişken içerir. Tek bir sayısal sonucu tahmin etmek için birden çok girişin kullanıldığı sorunlara çok sayıda doğrusal regresyon de denir.

    Bu sorunları, Studio 'daki diğer regresyon modüllerinin büyük bir bölümünü (klasik) de çözebileceği şekilde çözebilir.

  • Çoklu etiket gerileme , tek bir modelde birden çok bağımlı değişkeni tahmin etme görevleridir. Örneğin, çok etiketli lojistik regresyonda birden çok farklı etikete bir örnek atanabilir. (Bu, tek bir sınıf değişkeni içindeki birden çok düzeyi tahmin etme görevinden farklıdır.)

    Bu regresyon türü Azure Machine Learning desteklenmez. Birden çok değişkeni tahmin etmek için, tahmin etmek istediğiniz her bir çıktı için ayrı bir öğrenici oluşturun.

İstatistikçilerin yıllar için, gerileme için giderek gelişmiş gelişmiş yöntemler geliştirmiştir. Bu, doğrusal regresyon için de geçerlidir. Bu modül, hatayı ölçmek ve gerileme satırına uyması için iki yöntemi destekler: normal en az kareler yöntemi ve gradyan tanımı.

  • Gradyan tanımı , model eğitimi sürecinin her adımında hata miktarını en aza indiren bir yöntemdir. Gradara üzerinde birçok çeşitte ve çeşitli öğrenme sorunları için en iyi duruma getirme işlemi, kapsamlı araştırdık. Çözüm yöntemi için bu seçeneği belirlerseniz, adım boyutunu, öğrenme oranını ve benzerlerini denetlemek için çeşitli parametreler ayarlayabilirsiniz. Bu seçenek ayrıca tümleşik bir parametre süpürme kullanımını destekler.

  • Normal en az kareler , doğrusal Regresyondaki en yaygın olarak kullanılan tekniklerin biridir. Örneğin, en az kare, Microsoft Excel için analiz araç takımı 'nda kullanılan yöntemidir.

    Normal en az kareler, hatayı gerçek değerden tahmin edilen satıra kadar olan uzaklık karenin toplamı olarak hesaplayan kayıp işlevini ifade eder ve kare içinde hatayı en aza indirerek modele uyar. Bu yöntem, girişler ve bağımlı değişken arasında güçlü doğrusal bir ilişki olduğunu varsayar.

Doğrusal gerileme yapılandırma

Bu modül, çok farklı seçeneklerle bir gerileme modeline sığdırma için iki yöntemi destekler:

Normal en az kare kullanarak regresyon modeli oluşturma

  1. Studio 'daki denemenize Doğrusal regresyon modeli modülünü ekleyin (klasik).

    Bu modülü Machine Learning kategorisinde bulabilirsiniz. Modeli Başlat' ı genişletin, regresyon' i genişletin ve sonra Doğrusal regresyon modeli modülünü denemenize sürükleyin.

  2. Özellikler bölmesinde, çözüm yöntemi açılan listesinde, normal en az kareler' i seçin. Bu seçenek, regresyon çizgisini bulmak için kullanılan hesaplama yöntemini belirtir.

  3. L2 düzenleme ağırlığı' nda, L2 düzenleme için ağırlık olarak kullanılacak değeri yazın. Fazla sığdırmayı önlemek için sıfır olmayan bir değer kullanmanızı öneririz.

    Düzenleme model sığdırmayı nasıl etkilediği hakkında daha fazla bilgi edinmek için şu makaleye bakın: L1 ve L2 düzenleme Machine Learning

  4. Kesme terimini görüntülemek istiyorsanız, kesme terimini Ekle seçeneğini belirleyin.

    Regresyon formülünü gözden geçirmeniz gerekmiyorsa bu seçeneğin işaretini kaldırın.

  5. Rastgele sayı çekirdeği için, model tarafından kullanılan rastgele sayı oluşturucuyu temel alarak isteğe bağlı olarak bir değer yazabilirsiniz.

    Aynı denemenin farklı çalıştırmaları genelinde aynı sonuçların bakımını yapmak istiyorsanız, çekirdek değeri kullanmak faydalıdır. Aksi takdirde, varsayılan olarak sistem saatinden bir değer kullanılır.

  6. Eksik değerleri bir hata yükseltmek istiyorsanız, seçeneğin seçimini kaldırın.

    Bu seçenek işaretliyse, her kategorik sütun için ek bir düzey oluşturulur. Test veri kümesindeki eğitim veri kümesinde bulunmayan tüm düzeyler bu ek düzeyle eşlenir.

  7. Deneymenize model eğitme modülünü ekleyin ve etiketli bir veri kümesini bağlayın.

  8. Denemeyi çalıştırın.

Normal en az kareler modelinin sonuçları

Eğitim tamamlandıktan sonra:

  • Modelin parametrelerini görüntülemek için, eğitmen çıktısına sağ tıklayın ve Görselleştir' i seçin.

  • Tahmine dayalı hale getirmek için eğitilen modeli, yeni değerlerin bir veri kümesiyle birlikte puan modeli modülüne bağlayın.

  • Etiketli bir veri kümesine karşı çapraz doğrulama gerçekleştirmek için eğitilen modeli çapraz doğrulama modelinebağlayın.

Çevrimiçi degradeyi kullanarak regresyon modeli oluşturma

  1. Studio 'daki denemenize Doğrusal regresyon modeli modülünü ekleyin (klasik).

    Bu modülü Machine Learning kategorisinde bulabilirsiniz. Modeli Başlat' ı genişletin, regresyon' i genişletin ve Doğrusal regresyon modeli modülünü denemenize sürükleyin

  2. Özellikler bölmesinde, çözüm yöntemi açılan listesinde, regresyon çizgisini bulmak için kullanılan hesaplama yöntemi olarak çevrimiçi gradyan ' ı seçin.

  3. Oluşturma modu için, modeli önceden tanımlanmış bir parametre kümesiyle eğmek istediğinizi veya bir parametre süpürme kullanarak modeli iyileştirmek isteyip istemediğinizi belirtin.

    • Tek parametre: doğrusal regresyon ağını nasıl yapılandırmak istediğinizi biliyorsanız bağımsız değişken olarak belirli bir değer kümesi sağlayabilirsiniz.

    • Parametre aralığı: algoritmanın sizin için en iyi parametreleri bulmasını istiyorsanız parametre aralığına bir eğitmen modu oluşturun seçeneğini belirleyin. Daha sonra, algoritmanın denemek için birden çok değer belirtebilirsiniz.

  4. Öğrenme oranı için, stochastik gradyan için en iyi duruma getirme için ilk öğrenme oranını belirtin.

  5. Eğitim dönemlerinde sayısı için, algoritmanın örneklerle kaç kez yineolmayacağını belirten bir değer yazın. Az sayıda örneğe sahip veri kümelerinde bu sayı yakınsama için büyük olmalıdır.

  6. Özellikleri Normalleştir: modeli eğleştirmek için kullanılan sayısal verileri zaten normalleştirmeniz durumunda bu seçeneğin seçimini kaldırabilirsiniz. Varsayılan olarak, modül tüm sayısal girdileri 0 ile 1 arasında bir aralığa normalleştirir.

    Not

    Puanlama için kullanılan yeni verilere aynı normalleştirme yöntemini uygulamayı unutmayın.

  7. L2 düzenleme ağırlığı' nda, L2 düzenleme için ağırlık olarak kullanılacak değeri yazın. Fazla sığdırmayı önlemek için sıfır olmayan bir değer kullanmanızı öneririz.

    Düzenleme model sığdırmayı nasıl etkilediği hakkında daha fazla bilgi edinmek için şu makaleye bakın: L1 ve L2 düzenleme Machine Learning

  8. Son varsayımını ortalama olacak şekilde, Ortalama son varsayım seçeneğini belirleyin.

    Gerileme modellerinde varsayım testi, bir bağımlı ve bağımsız değişken arasında doğrusal bir bağıntı olmadığını belirten null varsayımın olasılığını değerlendirmek için bazı istatistiğin kullanılması anlamına gelir. Birçok gerileme sorununa, birden fazla değişken içeren bir varsayımını test etmeniz gerekir.

    Bu seçenek varsayılan olarak etkindir, yani algoritma iki veya daha fazla parametrenin bulunduğu parametrelerin birleşimini sınar.

  9. Öğrenme oranının yineleme ilerleme durumunu azaltmasını istiyorsanız, öğrenme oranını azalt seçeneğini belirleyin.

  10. Rastgele sayı çekirdeği için, model tarafından kullanılan rastgele sayı oluşturucuyu temel alarak isteğe bağlı olarak bir değer yazabilirsiniz. Aynı denemenin farklı çalıştırmaları genelinde aynı sonuçların bakımını yapmak istiyorsanız, çekirdek değeri kullanmak faydalıdır.

  11. Eksik değerleri bir hata yükseltmek istiyorsanız, seçeneğin seçimini kaldırın.

    Bu seçenek belirlendiğinde, her kategorik sütun için ek bir düzey oluşturulur. Test veri kümesindeki tüm düzeyler eğitim veri kümesinde yok bu ek düzey ile eşleştirilir.

  12. Etiketli bir veri kümesi ve eğitim modülleriylebir tane ekleyin.

    Bir parametre süpürme kullanmıyorsanız, model eğitme modülünü kullanın.

    Algoritmanın sizin için en iyi parametreleri bulmasını sağlamak için modeli Ayarla hiper parametrelerinikullanarak modeli eğitme.

    Not

    Tek parametre seçeneğini kullanarak modeli belirli değerlerle yapılandırırsanız ve sonra parametre aralığı seçeneğine geçerseniz, model her bir parametre için aralıktaki en düşük değer kullanılarak eğitilir.

    Buna karşılık, modeli oluştururken belirli ayarları yapılandırırsanız ancak parametre aralığı seçeneğini belirlediğinizde, model, gözden geçirme yapılacak değer aralığı olarak öğrenici için varsayılan değerler kullanılarak eğitilir.

  13. Denemeyi çalıştırın.

Çevrimiçi gradyan sonuçları

Eğitim tamamlandıktan sonra:

  • Tahmine dayalı hale getirmek için eğitilen modeli, yeni giriş verileriyle birlikte puan modeli modülüne bağlayın.
  • Etiketli bir veri kümesine karşı çapraz doğrulama gerçekleştirmek için eğitilen modeli çapraz doğrulama modelinebağlayın.

Örnekler

Regresyon modellerinin örnekleri için Azure yapay zeka GalerisiŞu örnek denemeleri bakın:

Teknik notlar

Bu bölümde, sık sorulan soruların uygulama ayrıntıları, ipuçları ve yanıtları yer almaktadır.

Kullanım ipuçları

Birçok araç, basit ve karmaşık arasında değişen doğrusal regresyon oluşturmayı destekler. Örneğin, çözücü Araç Takımı ' nı kullanarak Excel 'de kolayca doğrusal gerileme gerçekleştirebilir veya R, Python veya C# kullanarak kendi gerileme algoritmanızı kodda yapabilirsiniz.

Ancak, doğrusal regresyon birçok farklı araç tarafından desteklenen iyi şekilde belirlenmiş bir tekniktir, birçok farklı yorumlamalar ve uygulama vardır. Tüm model türleri tüm araçlar tarafından eşit olarak desteklenmez. Ayrıca, terminolojiyle gözlemlemeye yönelik bazı farklılıklar vardır.

  • Regresyon yöntemleri genellikle yanıt değişkenlerinin sayısına göre kategorilere ayrılır. Örneğin, birden çok doğrusal regresyon, tahmin edilecek birden fazla değişkene sahip bir model anlamına gelir.

  • MATLAB 'de, çok değişen regresyon, birden fazla yanıt değişkenine sahip bir modele başvurur.

  • Azure Machine Learning, regresyon modelleri tek bir yanıt değişkenini destekler.

  • R dilinde, doğrusal regresyon için sunulan özellikler kullandığınız pakete bağlıdır. Örneğin, GLM paketi birden çok bağımsız değişkenle bir lojistik regresyon modeli oluşturma olanağı sağlar. Genellikle Azure Machine Learning Studio (klasik), R GLM paketiyle aynı işlevleri sağlar.

Bu modülü, Doğrusal regresyon, tipik gerileme sorunları için kullanmanızı öneririz.

Buna karşılık, bir sınıf değerini tahmin etmek için birden çok değişken kullanıyorsanız Iki sınıf Lojistik gerileme veya birden çok Lass lojistik regresyon modülünü öneririz.

R dili için kullanılabilir olan diğer doğrusal regresyon paketlerini kullanmak istiyorsanız, r betiği Yürüt modülünü kullanmanızı ve Azure Machine Learning Studio (klasik) çalışma zamanı ortamında bulunan LM veya GLM paketlerini çağırmayı öneririz.

Modül parametreleri

Name Aralık Tür Varsayılan Description
Özellikleri Normalleştir herhangi biri Boole true Örneklerin normalleştirilmesinin gerekip gerekmediğini belirtin
Ortalama son varsayım herhangi biri Boole true Son varsayımın ortalama olup olmayacağını belirtin
Öğrenme oranı >= Double. Upsilon Float 0.1 Stokastik gradyanı ilgili iyileştiricinin ilk öğrenme oranını belirtin
Eğitim dönemlerinde sayısı >= 0 Tamsayı 10 Algoritmanın örneklerle kaç kez yineyineleneceğini belirtin. Az sayıda örneğe sahip veri kümelerinde bu sayı yakınsama için büyük olmalıdır.
Öğrenme oranını azalt Herhangi biri Boole true Öğrenme oranının yineleme ilerleme durumu olarak azaltılıp azaltılmayacağını belirtin
L2 düzenleme ağırlığı >= 0,0 Float 0.001 L2 düzenleme için ağırlığı belirtin. Aşırı sığdırmayı önlemek için sıfır olmayan bir değer kullanın.
Rastgele sayı çekirdek herhangi biri Tamsayı Model tarafından kullanılan rastgele sayı oluşturucusunun temel aldığı bir değer belirtin. Varsayılan için boş bırakın.
Bilinmeyen kategorik düzeylerine izin ver herhangi biri Boole true Her kategorik sütun için ek bir düzeyin oluşturulup oluşturulmayacağını belirtin. Test veri kümesindeki tüm düzeyler eğitim veri kümesinde kullanılamıyor.
Kesme terimini dahil et Herhangi biri Boole Doğru Kesme için ek bir terim eklenip eklenmeyeceğini belirtin

Çıkışlar

Ad Tür Description
Eğitilen model ILearner arabirimi Eğitilen regresyon modeli

Ayrıca bkz.

Regresyon