Fisher Linear Discriminant Analysis

Önemli

Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.

1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.

ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.

Verileri ayrı sınıflarda en iyi şekilde grup haline dönüştüren özellik değişkenlerinin doğrusal birleşimini tanımlar

Kategori: Özellik Seçimi Modülleri

Not

Uygulama: Machine Learning Studio (yalnızca klasik)

Benzer sürükle ve bırak modülleri tasarımcıda da Azure Machine Learning kullanılabilir.

Modüle genel bakış

Bu makalede, iki veya daha fazla sınıfı en iyi şekilde ayıran özelliklerin birleşimini yakalayan yeni bir özellik veri kümesi oluşturmak için Machine Learning Studio'daki (klasik) Linear Linear Discriminant Analysis modülünün nasıl kullanılası anlatılmaktadır.

Bu yöntem genellikle boyutsallığı azaltma için kullanılır çünkü sınıflar arasında ayrım yapan bilgileri korurken bir dizi özelliği daha küçük bir özellik alanı üzerine projeler. Bu, yalnızca bir sınıflandırma görevi için hesaplama maliyetlerini azaltmakla birlikte fazla uygunlaşmayı önlemeye yardımcı olabilir.

Puan oluşturmak için bir etiket sütunu ve giriş olarak sayısal özellik sütunları kümesi sağlarsınız. Algoritma, her bir veri grubunu doğrusal olarak ayıran giriş sütunlarının en uygun birleşimini belirlerken her grup içindeki uzaklıkları en aza indirerek belirler. Modül, sıkıştırılmış, dönüştürülmüş özellikleri içeren bir veri kümesi ve başka bir veri kümesine kaydeden ve uygulayabilecek bir dönüşüm döndürür.

Doğrusal ayrımcı analiz hakkında daha fazla bilgi

Doğrusal ayrımcı analiz, değişkenlerin yollarını karşılaştırarak çalışır ve varyans analizine (ANOVA) benzer. ANOVA gibi bu varsayımları da temel almaktadır:

  • Tahminciler bağımsızdır
  • Her örneğin koşullu olasılık yoğunluğu işlevleri normalde dağıtılır
  • Gruplar arasındaki farklar benzerdir

Doğrusal Ayrımcı Analiz bazen LDA olarak kısaltılır, ancak bu durum Latent Dirichlet Allocation ile kolayca karıştırılır. Teknikler tamamen farklıdır, bu nedenle bu belgelerde mümkün olan her yerde tam adları kullanırız.

Doğrusal Ayrımcı Analizi yapılandırma

  1. Giriş veri kümenizi ekleyin ve giriş verilerinizin şu gereksinimleri karşılayana kadar olup olamay olduğunu kontrol edin:

    • Verileriniz mümkün olduğunca eksiksiz olmalı. Eksik değerler içeren satırlar yoksayılır.
    • Değerlerin normal bir dağılıma sahip olması beklenir. Linear Discriminant Analysis'i (Linear Linear Discriminant Analysis) kullanmadan önce verileri gözden geçirebilirsiniz veya dağıtımı test etmek için kullanın.
    • Örneklerden daha az tahmine sahip olmak gerekir.
    • Sayısal olmayan sütunları kaldırın. Algoritma, girişlere dahil edilen tüm geçerli sayısal sütunları inceler ve geçersiz sütunlar dahil edilirse hata döndürür. Herhangi bir sayısal sütunu dışlamanız gerekirse, Yalnızca analiz etmek istediğiniz sütunları içeren bir görünüm oluşturmak için, Veri Kümesinde Sütunları Seçme modülünü Linear Discriminant Analysis'den önce ekleyin. Sütun Ekle'yi kullanarak daha sonra sütunları yeniden ekleyebilirsiniz. Satırların özgün sırası korunur.
  2. Bağlan Verilerini Linear Discriminant Analysis modülüne kullanın.

  3. Sınıf etiketleri sütunu için Sütunseçiciyi başlat'a tıklayın ve bir etiket sütunu seçin.

  4. Özellik ayıkıcı sayısı için sonuç olarak istediğiniz sütun sayısını yazın.

    Örneğin, veri kümeniz sekiz sayısal özellik sütunu içeriyorsa, 3 bunları yalnızca üç sütundan yeni, azaltılmış bir özellik alanına daraltacak şekilde yazabilirsiniz.

    Çıkış sütunlarının tam olarak giriş sütunlarına karşılık olmadığını, bunun yerine giriş sütunlarında değerlerin küçük bir dönüşüme karşılık gelir olduğunu anlamak önemlidir.

    Özellik ayıkıcı sayısı için 0 değerini kullanırsanız ve giriş olarak n sütun kullanılırsa n boyutlu özellik alanı temsil eden yeni değerler içeren n özellik ayıkıcısı döndürülür.

  5. Denemeyi çalıştırın.

Sonuçlar

Algoritma, giriş sütunlarında her bir veri grubunu doğrusal olarak ayıran değerlerin bileşimini belirlerken her grup içindeki mesafeleri en aza indirerek iki çıkış oluşturur:

  • Dönüştürülen özellikler. Col1, col2, col3 vb. adlı belirli sayıda özellik ayıkıcı sütunlarını içeren bir veri kümesi. Çıkış, sınıf veya etiket değişkenlerini de içerir.

    Modeli eğitecek bu küçük değer kümelerini kullanabilirsiniz.

  • Doğrusal doğrusal ayrımcı analiz dönüşümü. Kaydedebilirsiniz ve ardından aynı şemaya sahip bir veri kümesine uygulayabilecek bir dönüşüm. Bu, aynı türde birçok veri kümesi analiz ediyorsanız ve her biri için aynı özellik azaltmayı uygulamak istediğinizde kullanışlıdır. Bunu uygulayan veri kümesi aynı şemaya sahip olmalıdır.

Örnekler

Makine öğrenmesinde özellik seçimi örnekleri için bkz. Azure Yapay Zeka Galerisi:

Teknik notlar

Bu bölümde uygulama ayrıntıları, ipuçları ve sık sorulan soruların yanıtları yer almaktadır.

Kullanım ipuçları

  • Bu yöntem kategorik veya ordinal değişkenler üzerinde değil yalnızca sürekli değişkenler üzerinde çalışır.

  • Dönüştürme matrisi hesaplanırken eksik değerleri olan satırlar yoksayılır.

  • Bir denemeden dönüştürmeyi kaydedecek olursanız, özgün denemeden hesaplanan dönüştürmeler her yeni veri kümesine yeniden kullanılır ve yeniden hesaplanmaz. Bu nedenle, her veri kümesi için yeni bir özellik kümesi hesaplamak için her veri kümesi için yeni bir Linear Discriminant Analysis örneği kullanın.

Uygulama ayrıntıları

Özelliklerin veri kümesi, eigenvektörler kullanılarak dönüştürüler. Giriş veri kümesine yönelik eigenvector'lar, matris matrisi olarak da adlandırılan, sağlanan özellik sütunlarına göre hesaplanır.

Modülün dönüştürme çıktısı, aynı şemaya sahip başka bir veri kümesine dönüştürmek için uygulanacak bu eigenvector'ları içerir.

eigenvalues değerinin nasıl hesaplanması hakkında daha fazla bilgi için şu makaleye bakın (PDF): Sınıflandırma için Eigenvector tabanlı Özellik Ayıklama. Tymbal, Puhonen ve diğer.

Beklenen girişler

Ad Tür Description
Veri kümesi Veri Tablosu Giriş veri kümesi

Modül parametreleri

Ad Tür Aralık İsteğe Bağlı Varsayılan Description
Sınıf etiketleri sütunu ColumnSelection Gerekli Hiçbiri Kategorik sınıf etiketlerini içeren sütunu seçin
Özellik ayıkıcı sayısı Tamsayı >=0 Gerekli 0 Kullanılacak özellik ayıklayıcıları sayısı. Sıfır ise, tüm özellik ayıklayıcıları kullanılacaktır

Çıkışlar

Ad Tür Description
Dönüştürülen Özellikler Veri tablosu Egenvector alanına dönüştürülen, Fisher doğrusal ayrılmış minant analiz özellikleri
Fisher doğrusal ayrılmış minant Analizi dönüştürmesi Iransform arabirimi Fisher doğrusal ayrılmış minant analizinin dönüşümü

Özel durumlar

Özel durum Description
Hata 0001 Belirli bir veya daha fazla veri kümesi sütunu bulunamazsa özel durum oluşur.
Hata 0003 Bir veya daha fazla giriş null veya boş olduğunda özel durum oluşur.
Hata 0017 Belirtilen bir veya daha fazla sütunda geçerli modülde desteklenmeyen tür varsa özel durum oluşur.

Studio (klasik) modüllerine özgü hataların listesi için bkz. Machine Learning hata kodları.

apı özel durumlarının listesi için bkz. Machine Learning REST API hata kodları.

Ayrıca bkz.

Özellik seçimi
Filtre Tabanlı Özellik Seçimi
Sorumlu bileşen analizi