Permütasyon Özelliği Önem Derecesi

Eğitilmiş bir model ve test veri kümesi verilen özellik değişkenlerinin permütasyon özelliği önem puanlarını hesaplama

Kategori: Özellik Seçimi Modülleri

Not

Uygulama hedefi: Machine Learning Studio (klasik)

Bu içerik yalnızca Studio (klasik) ile ilgilidir. Benzer sürükle ve bırak modülleri Azure Machine Learning tasarımcısına eklenmiştir. Bu makalede iki sürümü karşılaştırandaha fazla bilgi edinin.

Modüle genel bakış

Bu makalede, veri kümeniz için bir dizi özellik önem puanı hesaplamak üzere Azure Machine Learning Studio'da (klasik) Permutation Feature Importance modülünün nasıl kullanımı açıklanmıştır. Modelde kullanmak üzere en iyi özellikleri belirlemenize yardımcı olmak için bu puanları kullanırsiniz.

Bu modülde özellik değerleri rastgele karıştırılır, bir sütun tek tek karıştırılır ve modelin performansı önce ve sonra ölçülür. Performansı ölçmek için sağlanan standart ölçümlerden birini seçebilirsiniz.

Modülün döndüren puanları, permütasyondan sonra eğitilen bir modelin performansında yapılan değişikliği temsil eder. Önemli özellikler genellikle işlemde daha hassastır ve bu nedenle daha yüksek önem puanına neden olur.

Bu makalede, permütasyon özelliğinin önemi, teorik temeli ve makine öğrenmesi uygulamalarına genel bir bakış verilmektedir: Permütasyon özelliği önemi

Permütasyon Özelliğinin Önemini Kullanma

Özellik puanları kümesi oluşturmak için hem zaten eğitilmiş bir modelin hem de test veri kümesine sahip olmak gerekir.

  1. Permutation Feature Importance modülünü denemenize ekleyin. Bu modülü Özellik Seçimi kategorisinde bulabilirsiniz.

  2. Eğitilmiş bir modeli sol girişe bağlama. Modelin bir regresyon modeli veya sınıflandırma modeli olması gerekir.

  3. Doğru girişte, tercihen modelin eğitimi için kullanılan veri kümesinden farklı olan bir veri kümesine bağlanabilirsiniz. Bu veri kümesi eğitilen modeli temel alarak puanlama ve özellik değerleri değiştirildikten sonra modeli değerlendirmek için kullanılır.

  4. Rastgele çekirdek için, rasgeleleştirme için çekirdek olarak kullanılacak bir değer yazın. 0 (varsayılan) belirtirseniz, sistem saatine göre bir sayı oluşturulur.

    Çekirdek değer isteğe bağlıdır, ancak aynı denemenin reproducibility arasında çalışmasını istiyorsanız bir değer sağlamalısınız.

  5. Performansı ölçme ölçümü için, permütasyon sonrasında model kalitesi hesaplanırken kullanılacak tek bir ölçüm seçin.

    Azure Machine Learning Studio (klasik), bir sınıflandırma veya regresyon modelini değerlendiriyor olmanıza bağlı olarak aşağıdaki ölçümleri destekler:

    • Sınıflandırma

      Doğruluk, duyarlık, geri çekme, ortalama günlük kaybı

    • Regresyon

      Precision, geri çek, ortalama mutlak hata, kök ortalama kare hatası, göreli mutlak hata, göreli kare hatası, belirleme katsayısı

    Bu değerlendirme ölçümlerinin ve nasıl hesaplandıkları hakkında daha ayrıntılı bir açıklama için bkz. değerlendir.

  6. Denemeyi çalıştırın.

  7. Modül, bir özellik sütunları listesi ve bunlarla ilişkili puanlar, puanlar sırasıyla azalan şekilde sıralanır.

Örnekler

Azure yapay zeka GalerisiŞu örnek denemeleri bakın:

Teknik notlar

Bu bölümde, sık sorulan soruların uygulama ayrıntıları, ipuçları ve yanıtları sağlanmaktadır.

Bu, diğer özellik seçimi yöntemleriyle nasıl karşılaştırılmaktadır?

Permütasyon özelliği önem derecesi, her bir özellik sütununun değerlerini rastgele değiştirerek, tek seferde bir sütundan ve sonra modeli değerlendirirken kullanılır.

Permütasyon özelliği önem derecesine göre sunulan ranteler, genellikle bir model oluşturulmadan önce puanları hesaplayan filtre tabanlı özellik seçimindenaldığınız uygulamalardan farklıdır.

Bunun nedeni, permütasyon özelliğinin önemi, özellik ile hedef değer arasındaki ilişkilendirmeyi ölçmez, bunun yerine her özelliğin modelden gelen tahminler üzerindeki etkisini yakalar.

Beklenen girişler

Ad Tür Description
Eğitilen model ILearner arabirimi Eğitilmiş bir sınıflandırma veya regresyon modeli
Test verileri Veri Tablosu Özellik değerlerinin permütasyondan sonra modeli puanlama ve değerlendirme için veri kümelerini test etmek

Modül parametreleri

Ad Tür Aralık İsteğe Bağlı Varsayılan Description
Rastgele çekirdek Tamsayı >=0 Gerekli 0 Rastgele sayı oluşturucu çekirdek değeri
Performansı ölçme ölçümü EvaluationMetricType listeden seçme Gerekli Sınıflandırma - Doğruluk Permütasyondan sonra modelin değişkenliğini değerlendirirken kullanmak üzere ölçümü seçin

Çıkışlar

Ad Tür Description
Özelliğin önemi Veri Tablosu Seçilen ölçüme göre özellik önemi sonuçlarını içeren bir veri kümesi

Özel durumlar

Özel durum Description
Hata 0062 İki modeli farklı learner türleriyle karşılaştırmaya çalışırken özel durum oluşur.
Hata 0024 DataSet bir etiket sütunu içermiyorsa özel durum oluşur.
Hata 0105 Modül tanımı dosyası desteklenmeyen parametre türünü tanımlıyorsa oluşturulur
Hata 0021 Modüle geçirilen bazı veri kümelerinde satır sayısı çok küçük olduğunda özel durum oluşur.

Ayrıca bkz.

Özellik seçimi
Filtre tabanlı özellik seçimi
Sorumlu bileşen analizi