Model Hiper Parametrelerini Ayarlama

Bu makalede Azure Machine Learning tasarımcısında Model Hiper Parametreleri Ayarlama bileşeninin nasıl kullanılacağı açıklanmaktadır. Amaç, bir makine öğrenmesi modeli için en uygun hiper parametreleri belirlemektir. Bileşen, farklı ayar bileşimlerini kullanarak birden çok modeli derler ve test eder. Ayarların bileşimlerini almak için tüm modellerdeki ölçümleri karşılaştırır.

Parametre ve hiper parametre terimleri kafa karıştırıcı olabilir. Modelin parametreleri , bileşenin sağ bölmesinde ayarladığınız parametrelerdir. Temel olarak, bu bileşen belirtilen parametre ayarları üzerinde bir parametre süpürme gerçekleştirir. Her belirli karar ağacı, veri kümesi veya regresyon yöntemi için farklı olabilecek en uygun hiper parametre kümesini öğrenir. En uygun yapılandırmayı bulma işlemine bazen ayarlama denir.

Bileşen, bir model için en uygun ayarları bulmak için aşağıdaki yöntemi destekler: tümleşik eğitim ve ayarlama. Bu yöntemde kullanılacak bir parametre kümesi yapılandıracaksınız. Ardından bileşenin birden çok bileşim üzerinde yinelemesine izin verirsiniz. Bileşen, "en iyi" modeli bulana kadar doğruluğu ölçer. Çoğu öğrenci bileşeninde, eğitim sürecinde hangi parametrelerin değiştirilmesi gerektiğini ve hangi parametrelerin sabit kalması gerektiğini seçebilirsiniz.

Ayarlama işleminin ne kadar süreyle çalışmasını istediğinize bağlı olarak, tüm birleşimleri kapsamlı bir şekilde test etmeye karar vekleyebilirsiniz. Ya da parametre birleşimlerinden oluşan bir kılavuz oluşturup parametre kılavuzunun rastgele bir alt kümesini test ederek işlemi kısaltabilirsiniz.

Bu yöntem, yeniden kullanmak üzere kaydedebileceğiniz eğitilmiş bir model oluşturur.

İpucu

İlgili bir görev yapabilirsiniz. Ayarlamaya başlamadan önce, en yüksek bilgi değerine sahip sütunları veya değişkenleri belirlemek için özellik seçimi uygulayın.

Model Ayarlama Hiper Parametreleri nasıl yapılandırılır

Makine öğrenmesi modeli için en uygun hiper parametreleri öğrenmek için işlem hatlarının önemli ölçüde kullanılması gerekir.

Parametre süpürme kullanarak modeli eğitme

Bu bölümde, Modeli Ayarlama Hiper Parametreleri bileşenini kullanarak modeli eğiten temel parametre süpürme işleminin nasıl gerçekleştirildiği açıklanmaktadır.

  1. Model Hiper Parametreleri Ayarlama bileşenini tasarımcıdaki işlem hattınıza ekleyin.

  2. Eğitilmemiş bir modeli en soldaki girişe bağlayın.

    Not

    Ayarlama Modeli Hiper parametreleri yalnızca yerleşik makine öğrenmesi algoritması bileşenlerine bağlanabilir ve Python Modeli Oluşturma'da yerleşik özelleştirilmiş modeli destekleyemez.

  3. Eğitim için kullanmak istediğiniz veri kümesini ekleyin ve Modeli Ayarlama Hiper Parametreleri'nin orta girişine bağlayın.

    İsteğe bağlı olarak, etiketli bir veri kümeniz varsa bunu en sağdaki giriş bağlantı noktasına (İsteğe bağlı doğrulama veri kümesi) bağlayabilirsiniz. Bu, eğitim ve ayarlama sırasında doğruluğu ölçmenize olanak tanır.

  4. Model Hiper Parametreleri Ayarlama'nın sağ panelinde Parametre süpürme modu için bir değer seçin. Bu seçenek parametrelerin nasıl seçildiğini denetler.

    • Kılavuzun tamamı: Bu seçeneği belirlediğinizde bileşen, farklı bileşimleri denemek ve en iyi öğrenciyi belirlemek için sistem tarafından önceden tanımlanmış bir kılavuz üzerinde döngü oluşturur. Bu seçenek, en iyi parametre ayarlarının ne olabileceğini bilmediğiniz ve olası tüm değer bileşimlerini denemek istediğiniz durumlarda kullanışlıdır.

    • Rastgele süpürme: Bu seçeneği belirlediğinizde bileşen, sistem tanımlı bir aralık üzerinden parametre değerlerini rastgele seçer. Bileşenin yürütmesini istediğiniz en fazla çalıştırma sayısını belirtmeniz gerekir. Bu seçenek, tercih ettiğiniz ölçümleri kullanarak model performansını artırmak ancak yine de bilgi işlem kaynaklarından tasarruf etmek istediğinizde kullanışlıdır.

  5. Etiket sütunu için, tek bir etiket sütunu seçmek için sütun seçicisini açın.

  6. Çalıştırma sayısını seçin:

    • Rastgele süpürmede en fazla çalıştırma sayısı: Rastgele bir süpürme seçerseniz, parametre değerlerinin rastgele bir bileşimini kullanarak modelin kaç kez eğitilmesi gerektiğini belirtebilirsiniz.
  7. Derecelendirme için modelleri derecelendirmek için kullanılacak tek bir ölçüm seçin.

    Parametre süpürme çalıştırdığınızda bileşen, model türü için tüm geçerli ölçümleri hesaplar ve süpürme sonuçları raporunda döndürür. Bileşen, regresyon ve sınıflandırma modelleri için ayrı ölçümler kullanır.

    Ancak, seçtiğiniz ölçüm modellerin nasıl dereceleneceğini belirler. Yalnızca en üstteki model, seçilen ölçüme göre derecelendirilir ve puanlama için kullanılacak eğitilmiş bir model olarak çıkıştır.

  8. Rastgele tohum için, önceden tanımlanmış bir aralık üzerinde parametre değerlerini rastgele seçmek için kullanılan sahte rastgele sayı oluşturucu durumu olarak bir tamsayı girin. Bu parametre yalnızca Parametre süpürme moduRastgele süpürme ise geçerlidir.

  9. İşlem hattını gönderin.

Hiper parametre ayarlama sonuçları

Eğitim tamamlandığında:

  • Süpürme sonuçlarını görüntülemek için bileşene sağ tıklayıp Görselleştir'i seçebilir veya görselleştirmek için bileşenin sol çıkış bağlantı noktasına sağ tıklayabilirsiniz.

    Süpür sonuçları, model türüne uygulanan tüm parametre süpürme ve doğruluk ölçümlerini içerir ve derecelendirme için seçtiğiniz ölçüm hangi modelin "en iyi" olarak kabul edildiğini belirler.

  • Eğitilen modelin anlık görüntüsünü kaydetmek için Modeli eğit bileşeninin sağ panelinde Çıkışlar+günlükler sekmesini seçin. Modeli yeniden kullanılabilir bir bileşen olarak kaydetmek için Veri kümesini kaydet simgesini seçin.

Teknik notlar

Bu bölüm uygulama ayrıntılarını ve ipuçlarını içerir.

Parametre süpürme nasıl çalışır?

Parametre süpürme ayarladığınızda, aramanızın kapsamını tanımlarsınız. Aramada rastgele seçilen sınırlı sayıda parametre kullanılabilir. Ya da tanımladığınız bir parametre alanı üzerinde kapsamlı bir arama olabilir.

  • Rastgele süpürme: Bu seçenek, belirli sayıda yineleme kullanarak modeli eğiter.

    Yinelemek için bir değer aralığı belirtirsiniz ve bileşen bu değerlerin rastgele seçilen bir alt kümesini kullanır. Değerler değiştirerek seçilir; başka bir deyişle, önceden rastgele seçilen sayılar kullanılabilir sayı havuzundan kaldırılmaz. Bu nedenle, herhangi bir değerin seçilme olasılığı tüm geçişlerde aynı kalır.

  • Kılavuzun tamamı: Kılavuzun tamamını kullanma seçeneği, her birleşimin test edilmiş olduğu anlamına gelir. Bu seçenek en kapsamlı seçenektir, ancak en çok zaman gerektirir.

Eğitimin uzunluğunu ve karmaşıklığını denetleme

Birçok ayar bileşimini yinelemek zaman alabilir, bu nedenle bileşen işlemi kısıtlamak için çeşitli yollar sağlar:

  • Modeli test etmek için kullanılan yineleme sayısını sınırlayın.
  • Parametre alanını sınırlayın.
  • Hem yineleme sayısını hem de parametre alanını sınırlayın.

Belirli bir veri kümesi ve model üzerinde en verimli eğitim yöntemini belirlemek için ayarlarla işlem hattı oluşturmanızı öneririz.

Değerlendirme ölçümü seçme

Test sonunda model, ölçüm sonuçlarını gözden geçirebilmeniz için her modelin doğruluğunu içeren bir rapor sunar:

  • Tüm ikili sınıflandırma modelleri için tekdüzen bir ölçüm kümesi kullanılır.
  • Doğruluk, tüm çok sınıflı sınıflandırma modelleri için kullanılır.
  • Regresyon modelleri için farklı bir ölçüm kümesi kullanılır.

Ancak eğitim sırasında, ayarlama işlemi sırasında oluşturulan modelleri derecelendirmek için kullanılacak tek bir ölçüm seçmeniz gerekir. en iyi ölçümün, iş sorununuza ve hatalı pozitif ve hatalı negatiflerin maliyetine bağlı olarak değiştiğini fark edebilirsiniz.

İkili sınıflandırma için kullanılan ölçümler

  • Doğruluk , gerçek sonuçların toplam vakalara oranıdır.

  • Duyarlık , gerçek sonuçların pozitif sonuçlarla oranıdır.

  • Geri çağırma , tüm sonuçlara göre tüm doğru sonuçların kesirli kısmıdır.

  • F puanı , duyarlığı ve yakalamayı dengeleyen bir ölçüdür.

  • AUC , x ekseninde yanlış pozitifler çizildiğinde ve y ekseninde gerçek pozitifler çizildiğinde eğrinin altındaki alanı temsil eden bir değerdir.

  • Ortalama Günlük Kaybı , iki olasılık dağılımı arasındaki farktır: gerçek dağılım ve modeldeki dağılım.

Regresyon için kullanılan ölçümler

  • Ortalama mutlak hata modeldeki tüm hataların ortalamasını alır; burada hata , tahmin edilen değerin gerçek değerden uzaklığı anlamına gelir. Genellikle MAE olarak kısaltılır.

  • Ortalama hata karesinin kökü hataların karelerinin ortalamasını ölçer ve ardından bu değerin kökünü alır. Genellikle RMSE olarak kısaltılır.

  • Göreli mutlak hata , hatayı gerçek değerin yüzdesi olarak temsil eder.

  • Göreli kare hatası , tahmin edilen değerlerin toplam kare hatasına bölerek toplam kare hatasını normalleştirir.

  • Katsayı belirleme , verilerin bir modele ne kadar uygun olduğunu gösteren tek bir sayıdır. Bir değeri, modelin veriyle tam olarak eşleşir anlamına gelir. Sıfır değeri, verilerin rastgele olduğu veya başka bir şekilde modele sığmayacağı anlamına gelir. Genellikle r2, R2 veya r karesi olarak adlandırılır.

Parametre süpürme desteği olmayan bileşenler

Azure Machine Learning'deki neredeyse tüm öğrenciler tümleşik parametre süpürme özelliğiyle çapraz doğrulamayı destekler ve işlem hattında işlem hattı için parametreleri seçmenize olanak tanır. Öğrenci bir değer aralığı ayarlamayı desteklemiyorsa, çapraz doğrulamada kullanmaya devam edebilirsiniz. Bu durumda, süpürme için bir izin verilen değerler aralığı seçilir.

Sonraki adımlar

Bkz. Azure Machine Learning'de kullanılabilen bileşenler kümesi .