Fisher Linear Discriminant Analysis
Önemli
Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.
1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.
- Makine öğrenmesi projelerini ML Studio'dan (klasik) Azure Machine Learning.
- Daha fazla bilgi Azure Machine Learning.
ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.
Verileri ayrı sınıflarda en iyi şekilde grup haline dönüştüren özellik değişkenlerinin doğrusal birleşimini tanımlar
Kategori: Özellik Seçimi Modülleri
Not
Uygulama: Machine Learning Studio (yalnızca klasik)
Benzer sürükle ve bırak modülleri tasarımcıda da Azure Machine Learning kullanılabilir.
Modüle genel bakış
Bu makalede, iki veya daha fazla sınıfı en iyi şekilde ayıran özelliklerin birleşimini yakalayan yeni bir özellik veri kümesi oluşturmak için Machine Learning Studio'daki (klasik) Linear Linear Discriminant Analysis modülünün nasıl kullanılası anlatılmaktadır.
Bu yöntem genellikle boyutsallığı azaltma için kullanılır çünkü sınıflar arasında ayrım yapan bilgileri korurken bir dizi özelliği daha küçük bir özellik alanı üzerine projeler. Bu, yalnızca bir sınıflandırma görevi için hesaplama maliyetlerini azaltmakla birlikte fazla uygunlaşmayı önlemeye yardımcı olabilir.
Puan oluşturmak için bir etiket sütunu ve giriş olarak sayısal özellik sütunları kümesi sağlarsınız. Algoritma, her bir veri grubunu doğrusal olarak ayıran giriş sütunlarının en uygun birleşimini belirlerken her grup içindeki uzaklıkları en aza indirerek belirler. Modül, sıkıştırılmış, dönüştürülmüş özellikleri içeren bir veri kümesi ve başka bir veri kümesine kaydeden ve uygulayabilecek bir dönüşüm döndürür.
Doğrusal ayrımcı analiz hakkında daha fazla bilgi
Doğrusal ayrımcı analiz, değişkenlerin yollarını karşılaştırarak çalışır ve varyans analizine (ANOVA) benzer. ANOVA gibi bu varsayımları da temel almaktadır:
- Tahminciler bağımsızdır
- Her örneğin koşullu olasılık yoğunluğu işlevleri normalde dağıtılır
- Gruplar arasındaki farklar benzerdir
Doğrusal Ayrımcı Analiz bazen LDA olarak kısaltılır, ancak bu durum Latent Dirichlet Allocation ile kolayca karıştırılır. Teknikler tamamen farklıdır, bu nedenle bu belgelerde mümkün olan her yerde tam adları kullanırız.
Doğrusal Ayrımcı Analizi yapılandırma
Giriş veri kümenizi ekleyin ve giriş verilerinizin şu gereksinimleri karşılayana kadar olup olamay olduğunu kontrol edin:
- Verileriniz mümkün olduğunca eksiksiz olmalı. Eksik değerler içeren satırlar yoksayılır.
- Değerlerin normal bir dağılıma sahip olması beklenir. Linear Discriminant Analysis'i (Linear Linear Discriminant Analysis) kullanmadan önce verileri gözden geçirebilirsiniz veya dağıtımı test etmek için kullanın.
- Örneklerden daha az tahmine sahip olmak gerekir.
- Sayısal olmayan sütunları kaldırın. Algoritma, girişlere dahil edilen tüm geçerli sayısal sütunları inceler ve geçersiz sütunlar dahil edilirse hata döndürür. Herhangi bir sayısal sütunu dışlamanız gerekirse, Yalnızca analiz etmek istediğiniz sütunları içeren bir görünüm oluşturmak için, Veri Kümesinde Sütunları Seçme modülünü Linear Discriminant Analysis'den önce ekleyin. Sütun Ekle'yi kullanarak daha sonra sütunları yeniden ekleyebilirsiniz. Satırların özgün sırası korunur.
Bağlan Verilerini Linear Discriminant Analysis modülüne kullanın.
Sınıf etiketleri sütunu için Sütunseçiciyi başlat'a tıklayın ve bir etiket sütunu seçin.
Özellik ayıkıcı sayısı için sonuç olarak istediğiniz sütun sayısını yazın.
Örneğin, veri kümeniz sekiz sayısal özellik sütunu içeriyorsa,
3
bunları yalnızca üç sütundan yeni, azaltılmış bir özellik alanına daraltacak şekilde yazabilirsiniz.Çıkış sütunlarının tam olarak giriş sütunlarına karşılık olmadığını, bunun yerine giriş sütunlarında değerlerin küçük bir dönüşüme karşılık gelir olduğunu anlamak önemlidir.
Özellik ayıkıcı sayısı için 0 değerini kullanırsanız ve giriş olarak n sütun kullanılırsa n boyutlu özellik alanı temsil eden yeni değerler içeren n özellik ayıkıcısı döndürülür.
Denemeyi çalıştırın.
Sonuçlar
Algoritma, giriş sütunlarında her bir veri grubunu doğrusal olarak ayıran değerlerin bileşimini belirlerken her grup içindeki mesafeleri en aza indirerek iki çıkış oluşturur:
Dönüştürülen özellikler. Col1, col2, col3 vb. adlı belirli sayıda özellik ayıkıcı sütunlarını içeren bir veri kümesi. Çıkış, sınıf veya etiket değişkenlerini de içerir.
Modeli eğitecek bu küçük değer kümelerini kullanabilirsiniz.
Doğrusal doğrusal ayrımcı analiz dönüşümü. Kaydedebilirsiniz ve ardından aynı şemaya sahip bir veri kümesine uygulayabilecek bir dönüşüm. Bu, aynı türde birçok veri kümesi analiz ediyorsanız ve her biri için aynı özellik azaltmayı uygulamak istediğinizde kullanışlıdır. Bunu uygulayan veri kümesi aynı şemaya sahip olmalıdır.
Örnekler
Makine öğrenmesinde özellik seçimi örnekleri için bkz. Azure Yapay Zeka Galerisi:
- Linear Discriminant Analysis: Bu modülü boyutsal azalma için kullanmayı gösteriyor.
Teknik notlar
Bu bölümde uygulama ayrıntıları, ipuçları ve sık sorulan soruların yanıtları yer almaktadır.
Kullanım ipuçları
Bu yöntem kategorik veya ordinal değişkenler üzerinde değil yalnızca sürekli değişkenler üzerinde çalışır.
Dönüştürme matrisi hesaplanırken eksik değerleri olan satırlar yoksayılır.
Bir denemeden dönüştürmeyi kaydedecek olursanız, özgün denemeden hesaplanan dönüştürmeler her yeni veri kümesine yeniden kullanılır ve yeniden hesaplanmaz. Bu nedenle, her veri kümesi için yeni bir özellik kümesi hesaplamak için her veri kümesi için yeni bir Linear Discriminant Analysis örneği kullanın.
Uygulama ayrıntıları
Özelliklerin veri kümesi, eigenvektörler kullanılarak dönüştürüler. Giriş veri kümesine yönelik eigenvector'lar, matris matrisi olarak da adlandırılan, sağlanan özellik sütunlarına göre hesaplanır.
Modülün dönüştürme çıktısı, aynı şemaya sahip başka bir veri kümesine dönüştürmek için uygulanacak bu eigenvector'ları içerir.
eigenvalues değerinin nasıl hesaplanması hakkında daha fazla bilgi için şu makaleye bakın (PDF): Sınıflandırma için Eigenvector tabanlı Özellik Ayıklama. Tymbal, Puhonen ve diğer.
Beklenen girişler
Ad | Tür | Description |
---|---|---|
Veri kümesi | Veri Tablosu | Giriş veri kümesi |
Modül parametreleri
Ad | Tür | Aralık | İsteğe Bağlı | Varsayılan | Description |
---|---|---|---|---|---|
Sınıf etiketleri sütunu | ColumnSelection | Gerekli | Hiçbiri | Kategorik sınıf etiketlerini içeren sütunu seçin | |
Özellik ayıkıcı sayısı | Tamsayı | >=0 | Gerekli | 0 | Kullanılacak özellik ayıklayıcıları sayısı. Sıfır ise, tüm özellik ayıklayıcıları kullanılacaktır |
Çıkışlar
Ad | Tür | Description |
---|---|---|
Dönüştürülen Özellikler | Veri tablosu | Egenvector alanına dönüştürülen, Fisher doğrusal ayrılmış minant analiz özellikleri |
Fisher doğrusal ayrılmış minant Analizi dönüştürmesi | Iransform arabirimi | Fisher doğrusal ayrılmış minant analizinin dönüşümü |
Özel durumlar
Özel durum | Description |
---|---|
Hata 0001 | Belirli bir veya daha fazla veri kümesi sütunu bulunamazsa özel durum oluşur. |
Hata 0003 | Bir veya daha fazla giriş null veya boş olduğunda özel durum oluşur. |
Hata 0017 | Belirtilen bir veya daha fazla sütunda geçerli modülde desteklenmeyen tür varsa özel durum oluşur. |
Studio (klasik) modüllerine özgü hataların listesi için bkz. Machine Learning hata kodları.
apı özel durumlarının listesi için bkz. Machine Learning REST API hata kodları.
Ayrıca bkz.
Özellik seçimi
Filtre Tabanlı Özellik Seçimi
Sorumlu bileşen analizi