Çok Sınıflı Karar Ormanı

Karar ormanı algoritmasını kullanarak birden çok Lass sınıflandırma modeli oluşturur

Kategori: model/sınıflandırmayı Machine Learning/Başlat

Not

Için geçerlidir: Machine Learning Studio (klasik)

Bu içerik yalnızca Studio (klasik) ile ilgili. Benzer sürükle ve bırak modülleri bir tasarımcıya Azure Machine Learning eklendi. İki sürümü karşılaştıran bu makalede daha fazla bilgi bulabilirsiniz.

Modüle genel bakış

Bu makalede, karar ormanı algoritmasını temel alan bir makine öğrenimi modeli oluşturmak için Azure Machine Learning Studio (klasik) ' de çok sınıf karar ormanı modülünün nasıl kullanılacağı açıklanır. Karar verme ormanı, etiketli verilerden öğrenirken, bir dizi karar ağacının çok hızlı bir şekilde oluşturmasındaki bir en hızlı bir modeldir.

Karar ormanları hakkında daha fazla bilgi

Karar orman algoritması, sınıflandırma için bir ensebölümlü öğrenme yöntemidir. Algoritma, birden çok karar ağacı oluşturup en popüler çıkış sınıfı üzerinde oy vererek işe yarar. Oylama, bir sınıflandırma kararı ormanındaki her bir ağacın etiketlerin Normalleştirilmemiş bir sıklık histogramını çıktılarından oluşan bir toplama biçimidir. Toplama işlemi, bu histogramları toplar ve her etiket için "olasılıkların" elde edilmesine ilişkin sonucu normalleştirir. Yüksek tahmin güvenilirliği olan ağaçlar, en son karar veren kararına daha büyük bir ağırlığa sahiptir.

Genel içindeki karar ağaçları, farklı dağıtımlarla verileri destekledikleri anlamına gelen, parametrik modellerdir. Her bir ağaçta, her sınıf için bir dizi basit test çalıştırılır ve bir yaprak düğümüne (karar) kadar bir ağaç yapısının düzeylerini artırır.

Karar ağaçları birçok avantaj sunar:

  • Bunlar, doğrusal olmayan karar sınırlarını temsil edebilirler.
  • Eğitim ve tahmin sırasında hesaplama ve bellek kullanımında etkilidir.
  • Tümleşik Özellik seçimi ve sınıflandırması gerçekleştirir.
  • Bu kişiler, gürültülü Özellikler bulunması halinde esnektir.

Azure Machine Learning Studio (klasik) ' deki karar ormanı Sınıflandırıcısı, karar ağaçlarının bir listesini içerir. Genel olarak, en iyi şekilde modelleyen modeller, tek karar ağaçlarından daha iyi kapsam ve doğruluk sağlar. Daha fazla bilgi için bkz. karar ağaçları.

Birden çok Lass karar ormanını yapılandırma

İpucu

En iyi parametrelerden emin değilseniz, birden çok modeli eğitmek ve test etmek ve en iyi parametreleri bulmak için model hiper parametreleri ayarlama modülünü kullanmanızı öneririz.

  1. Çoklu sınıf karar ormanı modülünü Studio 'daki denemenize (klasik) ekleyin. Bu modülü Machine Learning, modeli başlatabilir ve sınıflandırmada bulabilirsiniz.

  2. Özellikler bölmesini açmak için modüle çift tıklayın.

  3. Yeniden örnekleme yöntemi için, bireysel ağaçları oluşturmak için kullanılan yöntemi seçin. Bagging veya çoğaltma arasından seçim yapabilirsiniz.

    • Bagging: Bagging de önyükleme toplama olarak adlandırılır. Bu yöntemde, her ağaç yeni bir örnek üzerinde büyüerek orijinal veri kümesini rastgele örnekleyerek, özgün veri kümesinin orijinal bir veri kümesine sahip olana kadar bir şekilde oluşturulur. Modellerin çıkışları, bir toplama biçimi olan Oylama tarafından birleştirilir. Daha fazla bilgi için bkz. önyükleme toplama için Vikipedi girişi.

    • Çoğaltma: çoğaltmadaki her ağaç, tam olarak aynı giriş verilerinde eğitilir. Her ağaç düğümü için hangi bölünmüş koşulun kullanıldığını belirleme rastgele kalır ve farklı ağaçlar oluşturur.

    Yönergeler için birden çok Lass karar ormanı modeli yapılandırma bölümüne bakın.

  4. Model oluşturma modunu ayarlayarak modelin eğitilme şeklini belirleyin.

    • Tek parametre: modeli nasıl yapılandırmak istediğinizi biliyorsanız ve bağımsız değişken olarak bir değer kümesi sağlamak için bu seçeneği belirleyin.

    • Parametre aralığı: en iyi parametrelerden emin değilseniz ve bir parametre tarama kullanmak istiyorsanız bu seçeneği kullanın.

  5. Karar ağacının sayısı: en yüksek sayıda karar ağacının, en fazla bir şekilde oluşturulabilir. Daha fazla karar ağacı oluşturarak daha iyi kapsam edinebilirsiniz, ancak eğitim süresi artabilir.

    Bu değer Ayrıca, eğitilen modeli görselleştirirken sonuçlarda görünen ağaç sayısını da denetler. Tek bir ağacı görmek veya yazdırmak için, değeri 1 olarak ayarlayabilirsiniz. Ancak, bu, yalnızca bir ağacın üretilebileceği (ilk parametre kümesini içeren ağaç) ve başka bir yinelemenin gerçekleştirilmeyeceği anlamına gelir.

  6. Karar ağaçlarının en yüksek derinliği: herhangi bir karar ağacının maksimum derinliğini sınırlamak için bir sayı yazın. Ağacın derinliğini artırmak, bazı fazla sığdırma ve daha fazla eğitim süresi riskinde duyarlık artırabilir.

  7. Düğüm başına rastgele bölme sayısı: ağacın her bir düğümünü oluştururken kullanılacak bölme sayısını yazın. Bölünmüş , ağaç (node) düzeyindeki özelliklerin rastgele bölündüğü anlamına gelir.

  8. Yaprak düğüm başına minimum örnek sayısı: bir ağaçta herhangi bir Terminal düğümü (yaprak) oluşturmak için gereken minimum durum sayısını belirtin. Bu değeri artırarak, yeni kurallar oluşturma eşiğini artırırsınız.

    Örneğin, varsayılan 1 değeri ile tek bir durum bile yeni bir kuralın oluşturulmasına neden olabilir. Değeri 5 ' e artırırsanız eğitim verilerinin aynı koşulları karşılayan en az 5 durum içermesi gerekir.

  9. Kategorik özellikler için bilinmeyen değerlere Izin ver: eğitim veya doğrulama kümelerinde bilinmeyen değerler için bir grup oluşturmak üzere bu seçeneği belirleyin. Model, bilinen değerler için daha az kesin olabilir, ancak yeni (bilinmiyor) değerler için daha iyi tahminler sağlayabilir.

    Bu seçeneğin işaretini kaldırırsanız model yalnızca eğitim verilerinde mevcut olan değerleri kabul edebilir.

  10. Etiketli bir datset ve eğitim modüllerinden birini bağlayın:

    • Tek parametreye oluşturma ve ayarlama modunu ayarlarsanız, model eğitme modülünü kullanın.

    • Parametre aralığına bir eğitmen modu seçeneği ayarlarsanız, ayar modeli hiper parametreleri modülünü kullanın. Bu seçenekle, eğitmen ayarların birden çok birleşimini yineleyebilir ve en iyi modeli üreten parametre değerlerini belirleyebilir.

    Not

    Modeli Eğiteetmekiçin bir parametre aralığı geçirirseniz, parametre aralığı listesindeki yalnızca ilk değeri kullanır.

    Tek bir parametre değerleri kümesini ayarlama modeli hiper parametreleri modülüne geçirirseniz, her parametre için bir dizi ayar beklerken, değerleri yoksayar ve öğrenici için varsayılan değerleri kullanır.

    Parametre aralığı seçeneğini belirleyip herhangi bir parametre için tek bir değer girerseniz, belirtilen tek değer, diğer parametrelerin bir değer aralığı üzerinde değişse bile, tarama boyunca kullanılır.

  11. Denemeyi çalıştırın.

Sonuçlar

Eğitim tamamlandıktan sonra:

  • Her yinelemede oluşturulan ağacı görmek için model modülünü eğitme ' ye sağ tıklayın ve görselleştirmek Için eğitilen model ' i seçin. Model hiper parametrelerini ayarla' yı kullanırsanız, en iyi modeli görselleştirmek için modüle sağ tıklayın ve eğitimli en iyi modeli seçin. Her bir düğümün kurallarını görmek için, her bir ağaca tıklayarak bölünmeleri inceleyin.

Örnekler

Karar ormanlarının Machine Learning 'de nasıl kullanıldığı hakkında örnekler için Azure yapay zeka Galerisibakın:

Teknik notlar

Bu bölümde, sık sorulan soruların uygulama ayrıntıları, ipuçları ve yanıtları yer almaktadır.

Uygulama ayrıntıları

Sınıflandırma kararı ormanındaki her ağaç, etiketlerin Normalleştirilmemiş bir sıklık histogramını çıktı. Toplama işlemi, her etiket için "olasılıklara" almak üzere bu histogramları ve normalleştirerek toplanacak. Bu şekilde, yüksek tahmine sahip olan ağaçlar, en son karar veren kararına daha büyük bir ağırlığa sahiptir.

Çoğalt seçeneğiyle eğitim süreci hakkında daha fazla bilgi için bkz.:

Birden çok Lass karar ormanı modelini yapılandırma

Modülün çok az veri veya eğitim için sınırlı zaman gibi senaryolara uyum sağlayacak şekilde yapılandırıldığı yöntemi değiştirebilirsiniz.

Sınırlı eğitim süresi

Eğitim kümesi çok sayıda örnek içeriyorsa, ancak modelde eğitim için kullanabileceğiniz süre sınırlıysa, şu seçenekleri kullanmayı deneyin:

  • Daha az sayıda karar ağacının kullanıldığı bir karar ormanı oluşturun (örneğin, 5-10).
  • Yeniden örnekleme için Çoğalt seçeneğini kullanın.
  • Düğüm başına daha az sayıda rastgele bölme belirtin (örneğin, 100 ' den az).

Sınırlı eğitim kümesi

Eğitim kümesi sınırlı sayıda örnek içeriyorsa, şu seçenekleri kullanmayı deneyin:

  • Çok sayıda karar ağacının kullanıldığı bir karar ormanı oluşturun (örneğin, 20 ' den fazla).
  • Yeniden örnekleme için Bagging seçeneğini kullanın.
  • Düğüm başına çok sayıda rastgele bölme belirtin (örneğin, 1.000 ' den fazla).

Modül parametreleri

Name Aralık Tür Varsayılan Açıklama
Yeniden örnekleme yöntemi Herhangi biri ResamplingMethod İlişkilendirme Yeniden örnekleme yöntemi seçin: baya da Çoğalt
Karar ağacının sayısı >= 1 Tamsayı 8 Ensede oluşturmak için karar ağacının sayısını belirtin
Karar ağaçlarının maksimum derinliği >= 1 Tamsayı 32 Oluşturulabilen herhangi bir karar ağacının maksimum derinliğini belirtin
Düğüm başına rastgele bölme sayısı >= 1 Tamsayı 128 En uygun bölünmeden seçilen düğüm başına oluşturulan bölme sayısını belirtin
Yaprak düğüm başına minimum örnek sayısı >= 1 Tamsayı 1 Yaprak düğüm oluşturmak için gereken en düşük eğitim örneği sayısını belirtin
Kategorik özellikler için bilinmeyen değerlere izin ver Herhangi biri Boole Doğru Var olan kategorik özelliklerin bilinmeyen değerlerinin yeni, ek bir özellikle eşleştirilemeyeceğini belirtin

Çıkışlar

Ad Tür Açıklama
Eğitilen model ILearner arabirimi Eğitilen birden çok sınıf sınıflandırma modeli

Ayrıca bkz.

Sınıflandırmaya
İki sınıf karar ormanı
Karar ormanı gerileme
A-Z modül listesi