Çizgisel Regresyon

Makale
05/06/2019

Önemli

Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.

1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.

Makine öğrenmesi projelerini ML Studio'dan (klasik) Azure Machine Learning.
Daha fazla bilgi Azure Machine Learning.

ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.

Doğrusal regresyon modeli oluşturur

Kategori: Machine Learning / Modeli Başlatma / Regresyon

Not

Uygulama: Machine Learning Studio (yalnızca klasik)

Benzer sürükle ve bırak modülleri tasarımcıda da Azure Machine Learning kullanılabilir.

Modüle genel bakış

Bu makalede, denemede kullanmak üzere doğrusal regresyon modeli oluşturmak için Machine Learning Studio'da (klasik) Doğrusal Regresyon modülünün nasıl kullanımı açıklanmıştır. Doğrusal regresyon, bir veya daha fazla bağımsız değişken ile sayısal bir sonuç ya da bağımlı değişken arasında doğrusal bir ilişki kurma girişiminde bulunmaktadır.

Doğrusal regresyon yöntemi tanımlamak için bu modülü kullanır ve ardından etiketlenmiş bir veri kümesi kullanarak modeli eğitebilirsiniz. Eğitilen model daha sonra tahmin yapmak için kullanılabilir. Alternatif olarak, eğitilmemiş model etiketli bir veri kümesinde çapraz doğrulama için Modeli Çapraz Doğrula'ya geçirebilirsiniz.

Doğrusal regresyon hakkında daha fazla bilgi

Doğrusal regresyon, makine öğrenmesinde benimsenmiş ve çizgiye uydurmak ve hatayı ölçmek için birçok yeni yöntemle geliştirilmiş olan yaygın bir istatistiksel yöntemdir. Regresyon, en temel anlamda sayısal bir hedefin tahminini ifade eder. Temel bir tahmine dayalı görev için çok basit bir model istediğinizde doğrusal regresyon yine de iyi bir seçimdir. Doğrusal regresyon, karmaşıklık düzeyi olmayan yüksek boyutlu, seyrek veri kümelerine de iyi çalışma eğilimindedir.

Machine Learning Studio (klasik), doğrusal regresyona ek olarak çeşitli regresyon modellerini destekler. Ancak "regresyon" terimi gevşek bir şekilde yorumlanır ve diğer araçlarda sağlanan bazı regresyon türleri Studio'da (klasik) desteklanmaz.

Klasik regresyon sorunu tek bir bağımsız değişken ve bağımlı bir değişken içerir. Buna basit regresyon denir. Bu modül basit regresyonu destekler.
Çoklu doğrusal regresyon, tek bir bağımlı değişkene katkıda bulunan iki veya daha fazla bağımsız değişken içerir. Tek bir sayısal sonucu tahmin etmek için birden çok girişin kullanılırken kullandığı sorunlara çok değişkenli doğrusal regresyon da denir.

Doğrusal Regresyon modülü , Studio'daki (klasik) diğer regresyon modüllerinin çoğunda olduğu gibi bu sorunları çözebilir.
Çok etiketli regresyon , tek bir model içindeki birden çok bağımlı değişkeni tahmin etmektir. Örneğin, çok etiketli lojistik regresyonda bir örnek birden çok farklı etikete atanabilir. (Bu, tek bir sınıf değişkeni içinde birden çok düzeyi tahmin etmek görevlerinden farklıdır.)

Bu regresyon türü, bu tür bir Machine Learning. Birden çok değişkeni tahmin etmek için, tahmin etmek istediğiniz her çıkış için ayrı bir learner oluşturun.

İstatistikçiler yıllardır regresyon için giderek daha gelişmiş yöntemler geliştiriyor. Doğrusal regresyon için bile bu doğrudur. Bu modül, hatayı ölçmek ve regresyon çizgilerini sığdırmak için iki yöntemi destekler: normal en az kareler yöntemi ve gradyan gerileme.

Gradyan küçültme, model eğitim sürecinin her adımda hata miktarını en aza indiren bir yöntemdir. Gradyan gerilemede birçok çeşitleme vardır ve çeşitli öğrenme sorunları için iyileştirme kapsamlı bir şekilde incelendi. Çözüm yöntemi için bu seçeneği belirtirseniz, adım boyutunu, öğrenme oranını vb. kontrol etmek için çeşitli parametreler belirtebilirsiniz. Bu seçenek tümleşik parametre tarama kullanımını da destekler.
Normal en az kareler , doğrusal regresyonda en yaygın kullanılan tekniklerdendir. Örneğin, en az kareler, analiz aracı için Analysis Toolpak'ta kullanılan Microsoft Excel.

Sıradan en küçük kareler, hatayı gerçek değerden tahmin edilen satıra olan uzaklığın karesi toplamı olarak hesaplandı ve hata karesi en aza indirerek modeli uyaran kayıp işlevini ifade eder. Bu yöntem, girişler ve bağımlı değişken arasında güçlü bir doğrusal ilişki olduğunu varsayıyor.

Doğrusal Regresyon nasıl yapılandırılır?

Bu modül, çok farklı seçeneklerle regresyon modelini sığdırma için iki yöntemi destekler:

Çevrimiçi gradyan iniş kullanarak regresyon modeli oluşturma

Gradyan eğim, daha karmaşık olan veya değişken sayısına göre çok az eğitim verisi olan modeller için daha iyi bir kayıp işlevidir.

Bu seçenek ayrıca modeli model parametrelerini otomatik olarak iyileştirmek için Modeli Ayarla Hiperparametreleri kullanarak eğitirken parametre taramayı da destekler.
Normal en küçük kareleri kullanarak regresyon modelini sığdırma

Küçük veri kümeleri için en iyisi sıradan en küçük kareleri seçmektir. Bu, aşağıdakine çok benzer sonuçlar Excel.

Normal en küçük kareleri kullanarak regresyon modeli oluşturma

Studio'da (klasik) denemenize Doğrusal Regresyon Modeli modülünü ekleyin.

Bu modülü Machine Learning bulabilirsiniz. Modeli Başlat'ı genişletin, Regresyon'ı genişletin ve Doğrusal Regresyon Modeli modülünü denemenize sürükleyin.
Özellikler bölmesindeki Çözüm yöntemi açılan listesinde Normal En Az Kareler'i seçin. Bu seçenek, regresyon çizgilerini bulmak için kullanılan hesaplama yöntemini belirtir.
L2 normalleştirme ağırlığı'nın içinde L2 düzenlileştirme için ağırlık olarak kullanmak üzere değeri yazın. Fazla uygunlaşmayı önlemek için sıfır olmayan bir değer kullanılması önerilir.

Düzenlileştirmenin model uydurmayı nasıl etkilediği hakkında daha fazla bilgi edinmek için şu makaleye bakın: L1 ve L2 Machine Learning
Kesme noktası teriminin terimini görüntülemek için Kesme terimini dahil etmek seçeneğini belirleyin.

Regresyon formülünü gözden geçirmeye gerek yoksa bu seçeneğin işaretini kaldırın.
Rastgele sayı çekirdeği için, isteğe bağlı olarak model tarafından kullanılan rastgele sayı oluşturucusunun çekirdeğini yapmak için bir değer yazın.

Aynı denemenin farklı çalıştırmaları arasında aynı sonuçları korumak için çekirdek değeri kullanmak yararlı olur. Aksi takdirde, varsayılan değer sistem saati değerini kullanmaktır.
Eksik değerlerin hataya neden olmasına izin vermek için Bilinmeyen kategorik düzeylere izin ver seçeneğinin işaretini kaldırın.

Bu seçenek seçilirse, her kategorik sütun için ek bir düzey oluşturulur. Test veri kümesinde eğitim veri kümesinde mevcut olan düzeyler bu ek düzeye eşlenmiş.
Modeli Eğitma modülünü denemenize ekleyin ve etiketlenmiş bir veri kümesine bağlanabilirsiniz.
Denemeyi çalıştırın.

Normal en az kareler modelinin sonuçları

Eğitim tamamlandıktan sonra:

Modelin parametrelerini görüntülemek için eğitimci çıkışına sağ tıklayın ve Görselleştir'i seçin.
Tahminde bulunurken eğitilen modeli Yeni değerlerin veri kümesiyle birlikte Modeli Puanla modülüne bağlamanız gerekir.
Etiketli bir veri kümesinde çapraz doğrulama gerçekleştirmek için, eğitilmemiş modeli Modeli Çapraz Doğrula'ya bağlama.

Çevrimiçi gradyan iniş kullanarak regresyon modeli oluşturma

Studio'da (klasik) denemenize Doğrusal Regresyon Modeli modülünü ekleyin.

Bu modülü Machine Learning bulabilirsiniz. Modeli Başlat'ı genişletin, Regresyon'ı genişletin ve Doğrusal Regresyon Modeli modülünü denemenize sürükleyin
Özellikler bölmesindeki Çözüm yöntemi açılan listesinde, regresyon çizgilerini bulmak için kullanılan hesaplama yöntemi olarak Çevrimiçi Gradyan Düşüşü'ne tıklayın.
Eğitimci modu oluştur için modeli önceden tanımlanmış bir parametre kümesiyle eğitmek mi yoksa parametre tarama kullanarak modeli iyileştirmek mi istediğinizi belirtir.
- Tek Parametre: Doğrusal regresyon ağına nasıl yapılandırmak istediğinizi biliyorsanız bağımsız değişken olarak belirli bir değer kümesi sebilirsiniz.
- Parametre Aralığı: Algoritmanın sizin için en iyi parametreleri bulmasını tercih ediyorsanız Eğitmen modu oluştur seçeneğini Parametre Aralığı olarak ayarlayın. Daha sonra algoritmanın denemesi için birden çok değer belirtebilirsiniz.
Stok Learning için stokastik gradyan düşük iyileştirici için ilk öğrenme oranını belirtin.
Eğitim dönemlerinin sayısı için, algoritmanın örneklerde kaç kez yeniden çalışması gerektiğini belirten bir değer yazın. Az sayıda örneği olan veri kümelerinin yakınsama ulaşmak için bu sayı büyük olması gerekir.
Özellikleri normalleştirme: Modeli eğitmek için kullanılan sayısal verileri zaten normalleştirmişseniz bu seçeneğin seçimini kaldırabilirsiniz. Varsayılan olarak, modül tüm sayısal girişleri 0 ile 1 arasında bir aralıkla normalleştirmektedir.

Not

Puanlama için kullanılan yeni verilere aynı normalleştirme yöntemini uygulamayı unutmayın.
L2 normalleştirme ağırlığı'nın içinde L2 düzenlileştirme için ağırlık olarak kullanmak üzere değeri yazın. Fazla uygunlaşmayı önlemek için sıfır olmayan bir değer kullanılması önerilir.

Düzenlileştirmenin model uydurmayı nasıl etkilediği hakkında daha fazla bilgi edinmek için şu makaleye bakın: L1 ve L2 Machine Learning
Son hipotezin ortalamasını yapmak için Ortalama son hipotez seçeneğini belirleyin.

Regresyon modellerinde hipotez testi, bağımlı ve bağımsız değişken arasında doğrusal bağıntı olmadığını ifade etmek amacıyla sıfır hipotezinin olasılığını değerlendirmek için bir istatistik kullanmak anlamına gelir. Birçok regresyon probleminde birden fazla değişken içeren bir hipotezi test etmek gerekir.

Bu seçenek varsayılan olarak etkindir, yani algoritma iki veya daha fazla parametrenin dahil olduğu parametrelerin bir birleşimini test ediyor.
Yinelemeler ilerledikçe öğrenme oranının azalmasini görmek için Öğrenme oranını azalt seçeneğini belirleyin.
Rastgele sayı çekirdeği için, isteğe bağlı olarak model tarafından kullanılan rastgele sayı oluşturucusunun çekirdeğini yapmak için bir değer yazın. Aynı denemenin farklı çalıştırmaları arasında aynı sonuçları korumak için çekirdek değeri kullanmak yararlı olur.
Eksik değerlerin hataya neden olmasına izin vermek için Bilinmeyen kategorik düzeylere izin ver seçeneğinin işaretini kaldırın.

Bu seçenek seçildiğinde, her kategorik sütun için ek bir düzey oluşturulur. Eğitim veri kümesinde mevcut olan test veri kümesi düzeyleri bu ek düzeye eşlenmiş olur.
Etiketli bir veri kümesi ve eğitim modüllerinden birini ekleyin.

Parametre tarama kullanıyorsanız Modeli Eğitme modülünü kullanın.

Algoritmanın sizin için en iyi parametreleri bulmasını için Modeli Ayarla Hiper Parametrelerini kullanarak modeli eğitin.

Not

Modeli Tek Parametre seçeneğini kullanarak belirli değerlerle yapılandırdı ve ardından Parametre Aralığı seçeneğine geçiş yaptısanız, model her parametre için aralıkta minimum değer kullanılarak eğitilmiş olur.

Buna karşılık, modeli oluşturmanıza karşın Parametre Aralığı seçeneğini belirtirken belirli ayarları yapılandırdısanız, model, tarama için değerler aralığı olarak öğrenen için varsayılan değerler kullanılarak eğitilen bir modeldir.
Denemeyi çalıştırın.

Çevrimiçi gradyan inişin sonuçları

Eğitim tamamlandıktan sonra:

Tahminde bulunurken eğitilen modeli yeni giriş verileriyle birlikte Modeli Puanla modülüne bağlamanız gerekir.
Etiketli bir veri kümesinde çapraz doğrulama gerçekleştirmek için, eğitilmemiş modeli Modeli Çapraz Doğrula'ya bağlama.

Örnekler

Regresyon modellerinin örnekleri için aşağıdaki örnek denemelere Azure Yapay Zeka Galerisi:

Regresyonları karşılaştırma: Çeşitli regresyon modellerini karşıtlıklı olarak karşıtlıklı olarak karşıtlıklı bir şekilde kullanın.
Regresyon için Çapraz Doğrulama: Normal en az kareler kullanarak doğrusal regresyonu gösteriyor.
Twitter yaklaşım analizi: Tahmin edilen derecelendirmeler oluşturmak için birkaç farklı regresyon modeli kullanır.

Teknik notlar

Bu bölümde uygulama ayrıntıları, ipuçları ve sık sorulan soruların yanıtları yer almaktadır.

Kullanım ipuçları

Birçok araç, basitten karmaşıka kadar değişen doğrusal regresyon oluşturulmasını destekler. Örneğin, Solver Toolpak kullanarak Excel kolayca doğrusal regresyon gerçekleştirebilir veya R, Python veya C# kullanarak kendi regresyon algoritmanızı kodlayabilirsiniz.

Ancak doğrusal regresyon birçok farklı araç tarafından desteklenen iyi bir teknik olduğundan birçok farklı yorumlama ve uygulama vardır. Tüm model türleri tüm araçlar tarafından eşit olarak desteklanmaz. Ayrıca, gözlemlenen bazı farklar da vardır.

Regresyon yöntemleri genellikle yanıt değişkeni sayısına göre kategorilere ayrılmıştır. Örneğin, çoklu doğrusal regresyon tahmin etmek için birden çok değişken içeren bir model anlamına gelir.
Matlab'de çok değişkenli regresyon, birden çok yanıt değişkeni olan bir modeli ifade eder.
Bu Machine Learning regresyon modelleri tek bir yanıt değişkenlerini destekler.
R dilinde, doğrusal regresyon için sağlanan özellikler kullandığınız pakete bağlıdır. Örneğin, glm paketi size birden çok bağımsız değişkenle lojistik regresyon modeli oluşturma olanağı sağlar. Genel olarak Machine Learning Studio (klasik), R glm paketiyle aynı işlevselliği sağlar.

Tipik regresyon sorunları için doğrusal regresyon modülünü kullanmanı öneririz.

Buna karşılık, bir sınıf değerini tahmin etmek için birden çok değişken kullanıyorsanız, İki Sınıflı Lojistik Regresyon veya Çok Sınıflı Lojistik Regresyon modüllerini öneririz.

R dili için kullanılabilen diğer doğrusal regresyon paketlerini kullanmak için R Betiği Yürütme modülünü kullanarak Machine Learning Studio'daki (klasik) çalışma zamanı ortamına dahil edilen lm veya glm paketlerini çağırmanız önerilir.

Modül parametreleri

Name	Aralık	Tür	Varsayılan	Description
Özellikleri normalleştirme	herhangi biri	Boole	true	Örneklerin normalleştirilmiş olup olmadığını belirt
Ortalama son hipotez	herhangi biri	Boole	true	Son hipotezin ortalamasını alanın
Öğrenme oranı	>=double. Epsilon	Float	0.1	Stokastik gradyan en iyileştirici için ilk öğrenme oranını belirtme
Eğitim dönemlerinin sayısı	>=0	Tamsayı	10	Algoritmanın örneklerde kaç kez daha geçerek yenilen bir algoritmaya sahip olması gerektiğini belirtin. Az sayıda örneği olan veri kümelerinin yakınsama ulaşmak için bu sayı büyük olması gerekir.
Öğrenme oranını azaltma	Herhangi biri	Boole	true	Yinelemeler ilerledikçe öğrenme oranının düşmesi gerekip gerek olmadığını belirtir
L2 düzenlileştirme ağırlığı	>=0,0	Float	0.001	L2 düzenlileştirme için ağırlığı belirtin. Fazla uygunlaşmayı önlemek için sıfır olmayan bir değer kullanın.
Rastgele sayı çekirdeği	herhangi biri	Tamsayı		Model tarafından kullanılan rastgele sayı oluşturucusunun çekirdeğini belirlemek için bir değer belirtin. Varsayılan olarak boş bırakın.
Bilinmeyen kategorik düzeylere izin ver	herhangi biri	Boole	true	Her kategorik sütun için ek bir düzeyin oluşturulıp oluşturulmayacaklarını gösterir. Eğitim veri kümesinde mevcut olan test veri kümesi düzeyleri bu ek düzeye eşlenmiş olur.
Kesme noktası terimini dahil etmek	Herhangi biri	Boole	Doğru	Kesme noktası için ek bir terim ekli olup olmadığını belirt

Çıkışlar

Ad	Tür	Description
Eğitilmemiş model	ILearner arabirimi	Eğitilmemiş regresyon modeli

Ayrıca bkz.

Regresyon