Doğrusal Regresyon bileşeni

Bu makalede Azure Machine Learning tasarımcısındaki bir bileşen açıklanmaktadır.

İşlem hattında kullanmak üzere doğrusal regresyon modeli oluşturmak için bu bileşeni kullanın. Doğrusal regresyon, bir veya daha fazla bağımsız değişken ile sayısal sonuç veya bağımlı değişken arasında doğrusal bir ilişki kurmaya çalışır.

Doğrusal regresyon yöntemi tanımlamak için bu bileşeni kullanır ve etiketli bir veri kümesi kullanarak modeli eğitebilirsiniz. Eğitilen model daha sonra tahminlerde bulunmak için kullanılabilir.

Doğrusal regresyon hakkında

Doğrusal regresyon, makine öğrenmesinde benimsenen ve hattı sığdırmak ve hatayı ölçmek için birçok yeni yöntemle geliştirilmiş yaygın bir istatistiksel yöntemdir. Basitçe ifade etmek gerekirse, regresyon sayısal bir hedefin tahminini ifade eder. Basit bir tahmine dayalı görev için basit bir model istediğinizde doğrusal regresyon yine de iyi bir seçimdir. Doğrusal regresyon, karmaşıklığı olmayan yüksek boyutlu, seyrek veri kümelerinde de iyi çalışma eğilimindedir.

Azure Machine Learning, doğrusal regresyona ek olarak çeşitli regresyon modellerini destekler. Ancak, "regresyon" terimi gevşek bir şekilde yorumlanabilir ve diğer araçlarda sağlanan bazı regresyon türleri desteklenmez.

  • Klasik regresyon sorunu tek bir bağımsız değişken ve bağımlı bir değişken içerir. Buna basit regresyon denir. Bu bileşen basit regresyonu destekler.

  • Birden çok doğrusal regresyon , tek bir bağımlı değişkene katkıda bulunabilen iki veya daha fazla bağımsız değişken içerir. Tek bir sayısal sonucu tahmin etmek için birden çok girişin kullanıldığı sorunlar, çok değişkenli doğrusal regresyon olarak da adlandırılır.

    Doğrusal Regresyon bileşeni, diğer regresyon bileşenlerinin çoğu gibi bu sorunları çözebilir.

  • Çok etiketli regresyon , tek bir modelde birden çok bağımlı değişkeni tahmin etme görevidir. Örneğin, çok etiketli lojistik regresyonda bir örnek birden çok farklı etikete atanabilir. (Bu, tek bir sınıf değişkeninde birden çok düzeyi tahmin etme görevinden farklıdır.)

    Bu tür regresyon Azure Machine Learning'de desteklenmez. Birden çok değişkeni tahmin etmek için tahmin etmek istediğiniz her çıkış için ayrı bir öğrenci oluşturun.

İstatistikçiler yıllardır regresyon için giderek daha gelişmiş yöntemler geliştirmektedir. Bu, doğrusal regresyon için bile geçerlidir. Bu bileşen, hatayı ölçmek ve regresyon çizgisine uydurmak için iki yöntemi destekler: normal en küçük kareler yöntemi ve gradyan azalma.

  • Gradyan azalma , model eğitim sürecinin her adımındaki hata miktarını en aza indiren bir yöntemdir. Gradyan azalmayla ilgili birçok çeşitleme vardır ve çeşitli öğrenme sorunlarına yönelik iyileştirmesi kapsamlı bir şekilde incelenmiştir. Çözüm yöntemi için bu seçeneği belirlerseniz, adım boyutunu, öğrenme oranını vb. denetlemek için çeşitli parametreler ayarlayabilirsiniz. Bu seçenek, tümleşik parametre süpürme kullanımını da destekler.

  • Normal en küçük kareler , doğrusal regresyonda en yaygın kullanılan tekniklerden biridir. Örneğin, en küçük kareler Microsoft Excel için Çözümleme Araç Takımı'nda kullanılan yöntemdir.

    Normal en küçük kareler, gerçek değerden tahmin edilen çizgiye kadar olan uzaklık karesinin toplamı olarak hatayı hesaplayan ve hatanın karesini en aza indirerek modele uyan kayıp işlevini ifade eder. Bu yöntem, girişlerle bağımlı değişken arasında güçlü bir doğrusal ilişki olduğunu varsayar.

Doğrusal Regresyonu Yapılandırma

Bu bileşen, farklı seçeneklerle bir regresyon modelini uydurmak için iki yöntemi destekler:

Normal en küçük kareleri kullanarak regresyon modeli oluşturma

  1. Doğrusal Regresyon Modeli bileşenini tasarımcıdaki işlem hattınıza ekleyin.

    Bu bileşeni Machine Learning kategorisinde bulabilirsiniz. Modeli Başlat'ı genişletin, Regresyon'u genişletin ve doğrusal regresyon modeli bileşenini işlem hattınıza sürükleyin.

  2. Özellikler bölmesindeki Çözüm yöntemi açılan listesinde Normal En Küçük Kareler'i seçin. Bu seçenek, regresyon satırını bulmak için kullanılan hesaplama yöntemini belirtir.

  3. L2 düzenlileştirme ağırlığı alanında, L2 düzenlileştirmesi için ağırlık olarak kullanılacak değeri yazın. Fazla uygunluktan kaçınmak için sıfır olmayan bir değer kullanmanızı öneririz.

    Düzenlileştirmenin modele uyumu nasıl etkilediği hakkında daha fazla bilgi edinmek için şu makaleye bakın: Makine Öğrenmesi için L1 ve L2 Düzenlileştirmesi

  4. Kesme noktası terimini görüntülemek istiyorsanız Kesme noktası terimini dahil et seçeneğini belirleyin.

    Regresyon formülünü gözden geçirmeniz gerekmiyorsa bu seçeneğin seçimini kaldırın.

  5. Rastgele sayı tohumu için isteğe bağlı olarak, model tarafından kullanılan rastgele sayı oluşturucuyu görmek için bir değer yazabilirsiniz.

    Aynı işlem hattının farklı çalıştırmaları arasında aynı sonuçları korumak istiyorsanız, bir dengeli değer kullanmak yararlı olur. Aksi takdirde, varsayılan değer sistem saatinden bir değer kullanmaktır.

  6. Modeli Eğit bileşenini işlem hattınıza ekleyin ve etiketli bir veri kümesini bağlayın.

  7. İşlem hattını gönderin.

Sıradan en küçük kareler modelinin sonuçları

Eğitim tamamlandıktan sonra:

  • Tahminlerde bulunmak için eğitilen modeli, yeni değerlerden oluşan bir veri kümesiyle birlikte Modeli Puanla bileşenine bağlayın.

Çevrimiçi gradyan azalmayı kullanarak regresyon modeli oluşturma

  1. Doğrusal Regresyon Modeli bileşenini tasarımcıdaki işlem hattınıza ekleyin.

    Bu bileşeni Machine Learning kategorisinde bulabilirsiniz. Modeli Başlat'ı genişletin, Regresyon'u genişletin ve Doğrusal Regresyon Modeli bileşenini işlem hattınıza sürükleyin

  2. Özellikler bölmesindeki Çözüm yöntemi açılan listesinde, regresyon çizgisini bulmak için kullanılan hesaplama yöntemi olarak Çevrimiçi Gradyan Azalma'yı seçin.

  3. Eğitmen modu oluşturma için modeli önceden tanımlanmış bir parametre kümesiyle eğitmek mi yoksa parametre süpürme kullanarak modeli iyileştirmek mi istediğinizi belirtin.

    • Tek Parametre: Doğrusal regresyon ağını nasıl yapılandırmak istediğinizi biliyorsanız, bağımsız değişken olarak belirli bir değer kümesi sağlayabilirsiniz.

    • Parametre Aralığı: En iyi parametrelerden emin değilseniz ve parametre süpürme işlemi çalıştırmak istiyorsanız bu seçeneği belirleyin. Yinelemek için bir değer aralığı seçin; Ayarlama Modeli Hiper Parametreleri , en iyi sonuçları oluşturan hiper parametreleri belirlemek için sağladığınız ayarların tüm olası birleşimleri üzerinde yinelenir.

  4. Öğrenme oranı için stokastik gradyan azalma iyileştiricisi için ilk öğrenme oranını belirtin.

  5. Eğitim dönemlerinin sayısı için algoritmanın örneklerde kaç kez yinelenmesi gerektiğini gösteren bir değer yazın. Az sayıda örneği olan veri kümelerinde yakınsamaya ulaşmak için bu sayının büyük olması gerekir.

  6. Özellikleri normalleştirme: Modeli eğitmek için kullanılan sayısal verileri zaten normalleştirdiyseniz, bu seçeneğin seçimini kaldırabilirsiniz. Varsayılan olarak, bileşen tüm sayısal girişleri 0 ile 1 arasında bir aralığa normalleştirir.

    Not

    Puanlama için kullanılan yeni verilere aynı normalleştirme yöntemini uygulamayı unutmayın.

  7. L2 düzenlileştirme ağırlığı alanında, L2 düzenlileştirmesi için ağırlık olarak kullanılacak değeri yazın. Fazla uygunluktan kaçınmak için sıfır olmayan bir değer kullanmanızı öneririz.

    Düzenlileştirmenin modele uyumu nasıl etkilediği hakkında daha fazla bilgi edinmek için şu makaleye bakın: Makine Öğrenmesi için L1 ve L2 Düzenlileştirmesi

  8. Yinelemeler ilerledikçe öğrenme oranının düşmesini istiyorsanız Öğrenme oranını azalt seçeneğini belirleyin.

  9. Rastgele sayı tohumu için isteğe bağlı olarak, model tarafından kullanılan rastgele sayı oluşturucuyu görmek için bir değer yazabilirsiniz. Aynı işlem hattının farklı çalıştırmaları arasında aynı sonuçları korumak istiyorsanız, bir dengeli değer kullanmak yararlı olur.

  10. Modeli eğitin:

    Not

    Modeli Eğitmek için bir parametre aralığı geçirirseniz, tek parametre listesindeki yalnızca varsayılan değeri kullanır.

    Model Ayarlama Hiper Parametreleri bileşenine tek bir parametre değeri kümesi geçirirseniz, her parametre için bir dizi ayar beklediğinde değerleri yoksayar ve öğrenci için varsayılan değerleri kullanır.

    Parametre Aralığı seçeneğini belirleyip herhangi bir parametre için tek bir değer girerseniz, diğer parametreler bir değer aralığında değişse bile belirttiğiniz tek değer süpürme boyunca kullanılır.

  11. İşlem hattını gönderin.

Çevrimiçi gradyan azalma sonuçları

Eğitim tamamlandıktan sonra:

  • Tahminlerde bulunmak için eğitilen modeli, yeni giriş verileriyle birlikte Modeli Puanla bileşenine bağlayın.

Sonraki adımlar

Azure Machine Learning'in kullanabileceği bileşenler kümesine bakın.