Machine Learning Studio'da algoritmalarınızı iyileştirmek için parametreleri seçme (klasik)

UYGULANDI:Şunlar için geçerlidir. Machine Learning Studio (klasik) için geçerli değildir.Azure Machine Learning

Önemli

Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.

1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.

ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.

Bu konuda Machine Learning Studio'da (klasik) bir algoritma için doğru hiper parametre kümesinin nasıl seçileceği açıklanmaktadır. Çoğu makine öğrenmesi algoritmasının ayarlanacağı parametreler vardır. Modeli eğitirken, bu parametreler için değerler sağlamanız gerekir. Eğitilen modelin etkinliği, seçtiğiniz model parametrelerine bağlıdır. En uygun parametre kümesini bulma işlemi model seçimi olarak bilinir.

Model seçimi yapmanın çeşitli yolları vardır. Makine öğrenmesinde çapraz doğrulama, model seçimi için en yaygın kullanılan yöntemlerden biridir ve Machine Learning Studio'da (klasik) varsayılan model seçim mekanizmasıdır. Machine Learning Studio (klasik) hem R hem de Python'ı desteklediğinden, R veya Python kullanarak her zaman kendi model seçim mekanizmalarını uygulayabilirsiniz.

En iyi parametre kümesini bulma işleminde dört adım vardır:

  1. Parametre alanını tanımlayın: Algoritma için öncelikle dikkate almak istediğiniz tam parametre değerlerine karar verin.
  2. Çapraz doğrulama ayarlarını tanımlama: Veri kümesi için çapraz doğrulama katlamalarının nasıl seçileceğine karar verin.
  3. Ölçümü tanımlama: Doğruluk, kök ortalama kare hatası, duyarlık, yakalama veya f puanı gibi en iyi parametre kümesini belirlemek için hangi ölçümün kullanılacağına karar verin.
  4. Eğitme, değerlendirme ve karşılaştırma: Parametre değerlerinin her benzersiz bileşimi için çapraz doğrulama, tanımladığınız hata ölçümüne göre ve tarafından gerçekleştirilir. Değerlendirme ve karşılaştırmadan sonra en iyi performans gösteren modeli seçebilirsiniz.

Aşağıdaki görüntüde Machine Learning Studio'da (klasik) bunun nasıl elde edilebileceği gösterilmektedir.

En iyi parametre kümesini bulma

Parametre alanını tanımlama

Parametre kümesini model başlatma adımında tanımlayabilirsiniz. Tüm makine öğrenmesi algoritmalarının parametre bölmesinde iki eğitmen modu vardır: Tek Parametre ve Parametre Aralığı. Parametre Aralığı modu'nu seçin. Parametre Aralığı modunda, her parametre için birden çok değer girebilirsiniz. Metin kutusuna virgülle ayrılmış değerler girebilirsiniz.

İki sınıflı artırılmış karar ağacı, tek parametre

Alternatif olarak, Kılavuzun en yüksek ve en düşük noktalarını ve Use Range Builder ile oluşturulacak toplam nokta sayısını tanımlayabilirsiniz. Varsayılan olarak, parametre değerleri doğrusal ölçekte oluşturulur. Ancak Günlük Ölçeği denetlenirse, değerler günlük ölçeğinde oluşturulur (yani, bitişik noktaların oranı farkları yerine sabittir). Tamsayı parametreleri için kısa çizgi kullanarak bir aralık tanımlayabilirsiniz. Örneğin, "1-10", 1 ile 10 (her ikisi de dahil) arasındaki tüm tamsayıların parametre kümesini oluşturduğu anlamına gelir. Karma mod da desteklenir. Örneğin, "1-10, 20, 50" parametre kümesi 1-10, 20 ve 50 tamsayılarını içerir.

İki sınıflı artırılmış karar ağacı, parametre aralığı

Çapraz doğrulama katlamalarını tanımlama

Bölümleme ve Örnek modülü verilere rastgele katlamalar atamak için kullanılabilir. Modülün aşağıdaki örnek yapılandırmasında beş katlama tanımladık ve örnek örneklere rastgele bir katlama numarası atıyoruz.

Bölüm ve örnek

Ölçümü tanımlama

Ayarlama Modeli Hiper Parametreleri modülü, belirli bir algoritma ve veri kümesi için en iyi parametre kümesini ampirik olarak seçme desteği sağlar. Modeli eğitmeyle ilgili diğer bilgilere ek olarak, bu modülün Özellikler bölmesi en iyi parametre kümesini belirleme ölçümünü içerir. Sınıflandırma ve regresyon algoritmaları için sırasıyla iki farklı açılan liste kutusu vardır. Dikkate alınan algoritma bir sınıflandırma algoritmasıysa regresyon ölçümü yoksayılır ve tersi de geçerlidir. Bu örnekte ölçüm Doğruluk'tır.

Süpürme parametreleri

Eğitin, değerlendirin ve karşılaştırın

Aynı Tune Model Hyperparameters modülü parametre kümesine karşılık gelen tüm modelleri eğiter, çeşitli ölçümleri değerlendirir ve ardından seçtiğiniz ölçüme göre en iyi eğitilmiş modeli oluşturur. Bu modülde iki zorunlu giriş vardır:

  • Eğitimsiz öğrenci
  • Veri kümesi

Modülde isteğe bağlı bir veri kümesi girişi de vardır. Katlanmış bilgilerle veri kümesini zorunlu veri kümesi girişine bağlayın. Veri kümesine katlanmış bilgi atanmazsa, 10 kat çapraz doğrulama varsayılan olarak otomatik olarak yürütülür. Katlama ataması yapılmazsa ve isteğe bağlı veri kümesi bağlantı noktasında bir doğrulama veri kümesi sağlanırsa, bir eğitim testi modu seçilir ve modeli her parametre bileşimi için eğitmek için ilk veri kümesi kullanılır.

Artırılmış karar ağacı sınıflandırıcısı

Model daha sonra doğrulama veri kümesinde değerlendirilir. Modülün sol çıkış bağlantı noktası, parametre değerlerinin işlevleri olarak farklı ölçümleri gösterir. Doğru çıkış bağlantı noktası, seçilen ölçüme (bu örnekte doğruluk ) göre en iyi performansa sahip modele karşılık gelen eğitilmiş modeli verir.

Doğrulama veri kümesi

Doğru çıkış bağlantı noktasını görselleştirerek tam olarak seçilen parametreleri görebilirsiniz. Bu model, eğitilmiş bir model olarak kaydettikten sonra bir test kümesini puanlamada veya kullanıma hazır bir web hizmetinde kullanılabilir.