Artırmalı Karar Ağacı Regresyonu

Önemli

Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.

1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.

ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.

Artırıldı Karar Ağacı algoritmasını kullanarak bir regresyon modeli oluşturur

Kategori: Machine Learning / Modeli Başlatma / Regresyon

Not

Uygulama: Machine Learning Studio (yalnızca klasik)

Benzer sürükle ve bırak modülleri tasarımcıda da Azure Machine Learning kullanılabilir.

Modüle genel bakış

Bu makalede, artırma kullanarak bir regresyon ağacı grubu oluşturmak için Machine Learning Studio'daki (klasik) Artırıldı Karar Ağacı Regresyon modülünün nasıl kullanımı açıklanmıştır. Artırma, her ağacın önceki ağaçlara bağımlı olduğu anlamına gelir. Algoritma, önüne gelen ağaç artıklarını sığdırarak öğrenir. Bu nedenle karar ağacı gruplarında artış, kapsamın daha az olduğu küçük risklerle doğruluğu artırma eğilimindedir.

Bu regresyon yöntemi denetimli bir öğrenme yöntemidir ve bu nedenle etiketlenmiş bir veri kümesi gerektirir. Etiket sütunu sayısal değerler içermeli.

Not

Bu modülü yalnızca sayısal değişkenleri kullanan veri kümeleriyle kullanın.

Modeli tanımdikten sonra Modeli Eğit veya Modeli Ayarla Hiperparametreleri modüllerini kullanarak eğitin .

İpucu

Oluşturulan ağaçlar hakkında daha fazla bilgi almak ister misiniz? Model eğitildikten sonra Modeli Eğitma modülünün (veya Modeli Ayarlama Hiperparametreleri modülünün) çıkışına sağ tıklayın ve görselleştir'i seçerek her yinelemede oluşturulan ağacı seçin. Her ağaç için bölmelerin detaya iner ve her düğümün kurallarını görebilir.

Artırmış regresyon ağaçları hakkında daha fazla bilgi

Artırma, grup modelleri oluşturmak için kullanılan klasik yöntemlerden ve ayrıca etiketleme, rastgele ormanlar vb. yöntemlerden biri. Machine Learning Studio'da (klasik), artırlı karar ağaçları MART gradyan artırma algoritmasının verimli bir uygulamasını kullanır. Gradyan artırma, regresyon sorunlarına karşı bir makine öğrenmesi tekniğidir. Her bir regresyon ağacını, her adımda hatayı ölçmek ve bir sonraki adımda düzeltmek için önceden tanımlanmış bir kayıp işlevi kullanarak adım adım hazırlar. Bu nedenle tahmin modeli aslında daha zayıf tahmin modellerinden bir grup.

Regresyon problemlerinin artırılması, adım adım bir şekilde bir dizi ağaç derlemesini sağlar ve ardından rastgele bir farklılanabilir kayıp işlevi kullanarak en uygun ağacı seçer.

Ek bilgi için şu makalelere bakın:

Gradyan artırma yöntemi, uygun bir kayıp işleviyle regresyona indirgeyen sınıflandırma sorunları için de kullanılabilir. Sınıflandırma görevleri için artırilen ağaç uygulaması hakkında daha fazla bilgi için bkz. İki Sınıflı Artırıldı Karar Ağacı.

Artırılan Karar Ağacı Regresion'ını yapılandırma

  1. Denemenize Artırıldı Karar Ağacı modülünü ekleyin. Bu modülü Başlat'ın Machine LearningRegresyon kategorisi altında bulabilirsiniz.

  2. Eğitimci modu oluştur seçeneğini ayarerek modelin nasıl eğitilsin?

    • Tek Parametre: Modeli nasıl yapılandırmak istediğinizi biliyorsanız ve bağımsız değişken olarak belirli bir değer kümesi sağlamak için bu seçeneği belirleyin.

    • Parametre Aralığı: En iyi parametrelerden emin değilseniz ve bir parametre tarama çalıştırmak istiyorsanız bu seçeneği belirleyin. Tekrarlanacak bir değer aralığı seçin. Modeli Ayarla Hiperparametreleri, en iyi sonuçları üreten hiperparametreleri belirlemek için, sağlanan ayarların tüm olası birleşimleri üzerinde tekrarlar.

  3. Ağaç başına en fazla yaprak sayısı: Herhangi bir ağaçta oluşturulacak en fazla terminal düğümü (yaprak) sayısını gösterir.

    Bu değeri artırarak ağacın boyutunu artırma ve fazla uygun olma ve daha uzun eğitim süresi riskiyle daha iyi duyarlık elde edersiniz.

  4. Yaprak düğüm başına en az örnek sayısı: Bir ağaçta herhangi bir terminal düğümü (yaprak) oluşturmak için gereken en az örnek sayısını gösterir.

    Bu değeri artırarak, yeni kurallar oluşturma eşiğini artırın. Örneğin, varsayılan değer 1 olsa da tek bir durum bile yeni bir kuralın oluşturulmaya neden olabilir. Değeri 5'e artırsanız, eğitim verileri aynı koşulları karşılar en az 5 olay içermesi gerekir.

  5. Learning hızı: Öğrenme sırasında adım boyutunu tanımlayan 0 ile 1 arasında bir sayı yazın. Öğrenme hızı, en uygun çözümde ne kadar hızlı veya yavaş bir şekilde yakınsanıyor olduğunu belirler. Adım boyutu çok büyükse, en uygun çözümü aşırı atlarsanız. Adım boyutu çok küçükse, eğitimin en iyi çözümde yakınsanması daha uzun sürer.

  6. Oluşturulacak ağaç sayısı: Grup içinde oluşturulacak karar ağaçlarının toplam sayısını belirt. Daha fazla karar ağacı oluşturarak daha iyi kapsama sahip olabilirsiniz, ancak eğitim süresi artar.

    Bu değer, eğitilen modeli görselleştirerek görüntülenen ağaç sayısını da kontrol eder. Bir ingle ağacı görmek veya yazdırmak için değeri 1 olarak ayarlayın; ancak bu, yalnızca bir ağacın (ilk parametre kümesine sahip ağaç) üretil olduğu ve başka yinelemenin gerçekleştirililmay anlamına gelir.

  7. Rastgele sayı çekirdeği: Rastgele çekirdek değeri olarak kullanmak üzere isteğe bağlı negatif olmayan bir tamsayı yazın. Çekirdek belirtmek, aynı verilere ve parametrelere sahip çalıştırmalar arasında yenidenlanabilirliği sağlar.

    Varsayılan olarak, rastgele çekirdek 0 olarak ayarlanır ve bu da ilk çekirdek değerinin sistem saatiyle elde olduğu anlamına gelir.

  8. Bilinmeyen kategorik düzeylere izin ver: Eğitim ve doğrulama kümelerinde bilinmeyen değerler için bir grup oluşturmak için bu seçeneği belirleyin. Bu seçeneğin seçimini kaldırsanız, model yalnızca eğitim verisinde yer alan değerleri kabul eder. Model, bilinen değerler için daha az kesin olabilir, ancak yeni (bilinmeyen) değerler için daha iyi tahminler sağlar.

  9. Eğitim veri kümesi ve eğitim modüllerinden birini ekleyin:

    Not

    Modeli Eğit'e bir parametre aralığı iletirsiniz, parametre aralığı listesinde yalnızca ilk değeri kullanır.

    Model Ayarlama Hiperparametreleri modülüne tek bir parametre değeri kümesi iletirsiniz; her parametre için bir dizi ayar bekliyorsa, değerleri yoksayır ve öğrenciler için varsayılan değerleri kullanır.

    Parametre Aralığı seçeneğini belirtir ve herhangi bir parametre için tek bir değer girerseniz, diğer parametreler bir değer aralığında değişse bile bu tek değer tarama boyunca kullanılır.

  10. Denemeyi çalıştırın.

Sonuçlar

Eğitim tamamlandıktan sonra:

  • Her yinelemede oluşturulan ağacı görmek için Modeli Eğitma modülü'ne sağ tıklayın ve görselleştirilen model'i seçin. Model Ayarlama HiperParametrelerini kullanıyorsanız modüle sağ tıklayın ve en iyi modeli görselleştirmek için Eğitilen en iyi model'i seçin.

    Bölmelerde detaya inecek ve her düğümün kurallarını görmek için her bir ağacı tıklatın.

  • Modeli puanlama için kullanmak üzere Modeli Puanlama'ya bağarak yeni giriş örneklerinin değerlerini tahmin etmek için kullanın.

  • Eğitilen modelin anlık görüntüsünü kaydetmek için eğitim modülünün Eğitilmiş model çıkışına sağ tıklayın ve Farklı Kaydet'i seçin. Kaydetmiş olduğunu eğitilen modelin kopyası, denemenin başarılı çalıştırmalarında güncelleştirilmez.

Örnekler

Artırlı ağaçları makine öğrenmesinde nasıl kullandığına örnekler için bkz. Azure Yapay Zeka Galerisi:

  • Talep tahmini: Belirli bir süre için kiralama sayısını tahmin etmek için Artırıldı Karar Ağacı Regresmasını kullanır.

  • Twitter yaklaşım analizi: Tahmin edilen derecelendirme oluşturmak için regresyon kullanır.

Teknik notlar

Bu bölümde uygulama ayrıntıları, ipuçları ve sık sorulan soruların yanıtları yer almaktadır.

İpucu

Genel olarak, özellikler bir şekilde ilgili olduğunda karar ağaçları daha iyi sonuçlar verir. Özelliklerin büyük bir entropi derecesi varsa (yani bunlar ilişkili değil), çok az karşılıklı bilgi paylaşır veya hiç paylaşmaz ve bunları bir ağaçta sıralamak tahmine dayalı öneme sahip olmaz.

Uygulama ayrıntıları

Ağaç grubu, her adımda, kayıp işlevinin gradyanı hakkında bilgi işlem ile ve yeni ağacın kaybını en aza indiren katsayılarla önceki ağacın üzerine ek olarak bir regresyon ağacı oluşturur. Mart tarafından verilen bir örnekte üretilen topluluğun çıkışı, ağaç çıkışlarının toplamıdır.

  • İkili sınıflandırma sorunu için çıkış, bir tür ayarlama kullanılarak olasılık olarak dönüştürülür.

  • Regresyon sorunları için çıkış, işlevin tahmin edilen değeridir.

  • Derecelendirme sorunları için örnekler, ensede 'ın çıkış değerine göre sıralanır.

Modül parametreleri

Name Aralık Tür Varsayılan Description
Ağaç başına en fazla yaprakları >değer Tamsayı 20 Ağaç başına düşen en fazla yaprakları sayısını belirtin
Yaprak düğüm başına minimum örnek sayısı >değer Tamsayı 10 Yaprak düğüm oluşturmak için gereken minimum durum sayısını belirtin
Öğrenme oranı Çift. Epsilon; 1.0] Float 0,2 İlk öğrenme oranını belirtin
Oluşturulan toplam ağaç sayısı >değer Tamsayı 100 Eğitim sırasında oluşturulabilecek maksimum ağaç sayısını belirtin
Rastgele sayı çekirdek herhangi biri Tamsayı Model tarafından kullanılan rastgele sayı Oluşturucu için bir çekirdek sağlayın. Varsayılan için boş bırakın.
Bilinmeyen kategorik düzeylerine izin ver herhangi biri Boole true Doğru ise, her kategorik sütun için ek bir düzey oluşturun. Test veri kümesindeki düzeyler eğitim veri kümesinde kullanılamıyor bu ek düzeye eşlenir.

Çıkışlar

Ad Tür Description
Eğitilen model ILearner arabirimi Eğitilen regresyon modeli

Ayrıca bkz.

A-Z modül listesi
Regresyon