İki Sınıflı Karar Ormanı

Önemli

Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.

1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.

ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.

Karar ormanı algoritmasını kullanarak iki sınıflı bir sınıflandırma modeli oluşturur

Kategori: Machine Learning / Modeli Başlatma / Sınıflandırma

Not

Uygulama: Machine Learning Studio (yalnızca klasik)

Benzer sürükle ve bırak modülleri tasarımcıda da Azure Machine Learning kullanılabilir.

Modüle genel bakış

Bu makalede karar ormanları algoritmasını temel alan bir makine öğrenmesi modeli oluşturmak için Machine Learning Studio'da (klasik) İki Sınıflı Karar Ormanı modülünün nasıl kullanımı açıklanmıştır.

Karar ormanları hızlı, denetimli grup modelleridir. En fazla iki sonuçla bir hedefle ilgili tahminde bulunursanız bu modül iyi bir seçimdir. Karar ağacı modelini en iyi sonuçlar için nasıl yapılandırmazsanız, birden çok modeli eğitmek ve test etmek için Modeli Ayarlama Hiperparametreleri modülünü kullanmanız önerilir. ayarlama birden çok olasılık üzerinde yineler ve sizin için en uygun çözümü bulur.

Karar ormanlarını anlama

Bu karar ormanı algoritması, sınıflandırma görevlerine yönelik bir grup öğrenme yöntemidir. Grup yöntemleri, tek bir modele güvenmek yerine birden çok ilgili model oluşturarak ve bunları bir şekilde birleştirerek daha iyi sonuçlar ve daha genelleştirilmiş bir model elde etmek için genel ilkeyi temel almaktadır. Grup modelleri genellikle tek karar ağaçlarına göre daha iyi kapsam ve doğruluk sağlar.

Tek tek modeller oluşturmanın ve bunları bir grup içinde birleştirmenin birçok yolu vardır. Karar ormanının bu özel uygulaması, birden çok karar ağacı oluşturur ve ardından en popüler çıkış sınıfını oylar. Oylama, grup modelinde sonuç oluşturmak için daha iyi bilinen yöntemlerden birisidir.

  • Birçok tek sınıflandırma ağacı, veri kümenin tamamı kullanılarak oluşturulur, ancak farklı (genellikle rastgele) başlangıç noktaları kullanılır. Bu, tek tek karar ağaçlarının verilerin veya özelliklerin yalnızca rastgele bir kısmını kullanabileceği rastgele orman yaklaşımından farklıdır.
  • Karar ormanı ağacının her ağacı, normalleştirilmiş olmayan bir etiket sıklığı histogramı oluşturur.
  • Toplama işlemi bu histogramları toplar ve her etiket için "olasılıkları" almak için sonucu normalleştirmektedir.
  • Tahmin güveni yüksek olan ağaçlar, grupla ilgili son kararda daha fazla ağır olacak.

Karar ağaçlarının genel olarak sınıflandırma görevleri için birçok avantajı vardır:

  • Doğrusal olmayan karar sınırlarını yakalarlar.
  • Hesaplama ve bellek kullanımı açısından verimli olduğu için çok sayıda veri üzerinde eğitebilir ve tahminde bulundurabilirsiniz.
  • Özellik seçimi, eğitim ve sınıflandırma süreçleriyle tümleştirilmiştir.
  • Ağaçlar gürültülü verileri ve birçok özelliği barındırır.
  • Bunlar parametrik olmayan modellerdir, yani verileri farklı dağıtımlarla işebilirler.

Ancak basit karar ağaçları verilere fazla uygun olabilir ve ağaç gruplarına göre daha az genelleştirilebilir.

Daha fazla bilgi için Karar Ormanları bölümüne veya Teknik notlar bölümünde listelenen diğer belgelere bakın.

Karar Ormanı Two-Class yapılandırma

  1. Machine Learning Studio'da (klasik) denemenize İki Sınıflı Karar Ormanı modülünü ekleyin ve modülün Özellikler bölmesini açın.

    Modülü modülünün altında bulabilirsiniz Machine Learning. Başlat'ı ve ardından Sınıflandırma'ı genişletin.

  2. Yeniden örnekleme yöntemi için tek tek ağaçları oluşturmak için kullanılan yöntemi seçin. Etiketleme veya Çoğaltma'dan biriniseçebilirsiniz.

    • Etiketleme: Etiketleme bootstrap toplama olarak da ifade eder. Bu yöntemde, özgün veri kümesi boyutuna sahip bir veri kümesine sahip olana kadar her ağaç, özgün veri kümesinde rastgele örnekleme ve değiştirme ile oluşturulan yeni bir örnekte oluşturulur.

      Modellerin çıkışları bir toplama biçimi olan oylama ile bir araya gelir. Sınıflandırma karar ormanında bulunan her ağaç, normalleştirlanmamış bir etiket histogramı oluşturur. Toplama, her etiket için "olasılıkları" almak için bu histogramları toplama ve normalleşmedir. Bu şekilde, tahmin güveni yüksek olan ağaçlar, grupla ilgili son kararda daha fazla ağır olacak.

      Daha fazla bilgi için Bootstrap toplama için Wikipedia girdisi'ne bakın.

    • Çoğaltma: Çoğaltmada her ağaç tam olarak aynı giriş verileri üzerinde eğitılır. Her bir ağaç düğümü için hangi bölmenin hangi ikiktek olduğunu belirleme rastgele kalır ve ağaçlar farklı olur.

      Çoğalt seçeneğiyle eğitim süreci hakkında daha fazla bilgi için Teknik Notlar bölümünde listelenen belgelere bakın.

  3. Eğitimci modu oluştur seçeneğini ayarerek modelin nasıl eğitilsin?

    • Tek Parametre: Modeli nasıl yapılandırmak istediğinizi biliyorsanız bağımsız değişken olarak belirli bir değer kümesi sebilirsiniz.

    • Parametre Aralığı: En iyi parametrelerin ne olduğundan emin değilsanız, birden çok değer belirterek ve En uygun yapılandırmayı bulmak için Modeli Ayarla Hiper Parametreleri modülünü kullanarak en uygun parametreleri bulabilirsiniz. Eğitimci, sağlanan ayarların birden çok bileşimini tekrarlar ve en iyi modeli üreten değerlerin birleşimini belirler.

  4. Karar ağacı sayısı için, grup içinde oluşturulacak en fazla karar ağacı sayısını yazın. Daha fazla karar ağacı oluşturarak daha iyi kapsama sahip olabilirsiniz, ancak eğitim süresi artar.

    Not

    Bu değer, eğitilen modeli görselleştirerek görüntülenen ağaç sayısını da kontrol eder. Tek bir ağacı görmek veya yazdırmak için değeri 1 olarak ayarlayın. Ancak, yalnızca bir ağaç (ilk parametre kümesine sahip ağaç) üretilebilirsiniz ve başka yineleme gerçekleştirilamaz.

  5. Karar ağaçlarının maksimum derinliği için herhangi bir karar ağacının maksimum derinliğini sınırlamak için bir sayı yazın. Ağacın derinliğini artırmak, fazla çalışma ve eğitim süresi riskiyle karşıtlığı artırabilir.

  6. Düğüm başına rastgele bölme sayısı için, ağacın her düğümünü inşa etmek için kullanabileceğiniz bölme sayısını yazın. Bölme , ağacın (düğümün) her düzeyindeki özelliklerin rastgele bölündükleri anlamına gelir.

  7. Yaprak düğüm başına en az örnek sayısı için, bir ağaçta herhangi bir terminal düğümü (yaprak) oluşturmak için gereken en az örnek sayısını gösterir.

    Bu değeri artırarak, yeni kurallar oluşturma eşiğini artırın. Örneğin, varsayılan değer 1 olsa da tek bir durum bile yeni bir kuralın oluşturulmaya neden olabilir. Değeri 5'e artırsanız, eğitim verileri aynı koşulları karşılar en az 5 olay içermesi gerekir.

  8. Eğitim veya doğrulama kümelerini bilinmeyen değerler için bir grup oluşturmak için Kategorik özellikler için bilinmeyen değerlere izin ver seçeneğini belirleyin. Model, bilinen değerler için daha az kesin olabilir, ancak yeni (bilinmeyen) değerler için daha iyi tahminler sağlar.

    Bu seçeneğin seçimini kaldırsanız, model yalnızca eğitim verisinde yer alan değerleri kabul eder.

  9. Etiketli bir veri kümesi ve eğitim modüllerinden birini ekleme:

    Not

    Modeli Eğit'e bir parametre aralığı iletirsiniz, parametre aralığı listesinde yalnızca ilk değer kullanılır.

    Model Ayarlama Hiperparametreleri modülüne tek bir parametre değeri kümesi iletirsiniz; her parametre için bir dizi ayar bekliyorsa, değerleri yoksayır ve öğrenciler için varsayılan değerleri kullanır.

    Parametre Aralığı seçeneğini belirtir ve herhangi bir parametre için tek bir değer girerseniz, diğer parametreler bir değer aralığında değişse bile bu tek değer tarama boyunca kullanılır.

Sonuçlar

Eğitim tamamlandıktan sonra:

  • Her yinelemede oluşturulan ağacı görmek için Modeli Eğitma modülü'ne sağ tıklayın ve görselleştirilen model'i seçin. Model Ayarlama HiperParametrelerini kullanıyorsanız modüle sağ tıklayın ve en iyi modeli görselleştirmek için Eğitilen en iyi model'i seçin.

    Bölmelerde detaya inecek ve her düğümün kurallarını görmek için her bir ağacı tıklatın.

  • Modelin anlık görüntüsünü kaydetmek için Eğitilen Model çıkışına sağ tıklayın ve Modeli Kaydet'i seçin. Kaydedilen model, denemenin başarılı çalıştırmalarında güncelleştirilmez.

  • Modeli puanlama için kullanmak üzere Modeli Puanlama modülünü bir denemeye ekleyin.

Örnekler

Karar ormanlarının makine öğrenmesinde nasıl kullanıldıklarına ilişkin örnekler için aşağıdaki örnekteki örnek denemelere Azure Yapay Zeka Galerisi:

Teknik notlar

Bu bölümde ek uygulama ayrıntıları, araştırma ve sık sorulan sorular yer almaktadır.

Kullanım ipuçları

Verileriniz sınırlısa veya modeli eğitmek için harcanan zamanı en aza indirmek için şu ayarları deneyin:

Sınırlı eğitim kümesi

Eğitim kümesi sınırlı sayıda örnek içeriyorsa:

  • Çok sayıda karar ağacı (örneğin, 20'den fazla) kullanarak karar ormanı oluşturun.
  • Yeniden örnekleme için Etiketleme seçeneğini kullanın.
  • Düğüm başına çok sayıda rastgele bölme belirtin (örneğin, 1.000'den fazla).

Sınırlı eğitim süresi

Eğitim kümesi çok sayıda örnek içeriyorsa ve eğitim süresi sınırlıdır:

  • Daha az karar ağacı (örneğin, 5-10) kullanarak karar ormanı oluşturun.
  • Yeniden örnekleme için Çoğalt seçeneğini kullanın.
  • Düğüm başına daha az sayıda rastgele bölme belirtin (örneğin, 100'den az).

Uygulama ayrıntıları

Microsoft Research'un bu makalesinde karar ağaçlarını kullanan grup yöntemleri hakkında yararlı bilgiler yer almaktadır. Stumps'tan Ağaçlara ve Ormanlara.

Çoğaltma seçeneğiyle eğitim süreci hakkında daha fazla bilgi için bkz. Görüntü İşleme ve Tıbbi Görüntü Analizi için Karar Ormanları. Criminisi ve J. Shotton. Springer 2013.

Modül parametreleri

Name Aralık Tür Varsayılan Description
Yeniden örnekleme yöntemi Herhangi biri ResamplingMethod Torbalama Yeniden örnekleme yöntemi seçme
Karar ağacı sayısı >=1 Tamsayı 8 Grup içinde oluşturulan karar ağacı sayısını belirtin
Karar ağaçlarının maksimum derinliği >=1 Tamsayı 32 Oluşturulacak karar ağacının maksimum derinliğini belirtin
Düğüm başına rastgele bölme sayısı >=1 Tamsayı 128 Düğüm başına oluşturulan ve en uygun bölmenin seçilecek bölme sayısını belirtin
Yaprak düğüm başına en az örnek sayısı >=1 Tamsayı 1 Yaprak düğüm üretmek için gereken en az eğitim örneği sayısını belirtin
Kategorik özellikler için bilinmeyen değerlere izin ver Herhangi biri Boole Doğru Mevcut kategorik özelliklerin bilinmeyen değerlerinin yeni ve ek bir özellikle eşlenmiş olup olmadığını gösterir

Çıktı

Ad Tür Description
Eğitilmemiş model ILearner arabirimi Eğitilmemiş ikili sınıflandırma modeli

Ayrıca bkz.

Sınıflandırma
Karar Ormanı Regresyonu
Çok Sınıflı Karar Ormanı
A-Z Modül Listesi