Model Hiper Parametrelerini Ayarlama

En uygun parametre ayarlarını belirleyebilmek için modelde bir parametre süpüruygular

Kategori: Machine Learning/eğitme

Not

Için geçerlidir: Machine Learning Studio (klasik)

Bu içerik yalnızca Studio (klasik) ile ilgili. Benzer sürükle ve bırak modülleri bir tasarımcıya Azure Machine Learning eklendi. İki sürümü karşılaştıran bu makalede daha fazla bilgi bulabilirsiniz.

Modüle genel bakış

Bu makalede, belirli bir makine öğrenimi modelinin en uygun hiper parametrelerini öğrenmek için Azure Machine Learning Studio (klasik) ' de ayarlama modeli hiper parametreleri modülünün nasıl kullanılacağı açıklanır. Modül, farklı ayar bileşimleri kullanarak birden çok modeli oluşturur ve sınar ve ayarların birleşimini almak için ölçümleri tüm modeller üzerinde karşılaştırır.

Terms parametresi ve hyperparameter kafa karıştırıcı olabilir. Modelin parametreleri Özellikler bölmesinde ayarladığınız şeydir. Temel olarak, bu modül belirtilen parametre ayarları üzerinde bir parametre tarama gerçekleştirir ve belirli bir karar ağacı, veri kümesi veya gerileme yöntemi için farklı olabilecek en iyi hiper parametre kümesini öğrenir. En iyi yapılandırmayı bulma işlemi bazen ayarlama olarak adlandırılır.

Modül, bir modelin en iyi ayarlarını bulmak için iki yöntemi destekler:

  • Tümleşik eğitim ve ayarlama: kullanılacak parametre kümesini yapılandırır ve ardından modülün birden fazla kombinasyon üzerinde yineleme yapmasına izin verir ve bu da "en iyi" modeli bulana kadar doğruluğu ölçmenize olanak tanır. En öğrenner modülleri sayesinde, eğitim süreci sırasında hangi parametrelerin değiştirilmesi gerektiğini ve ne sabit kalması gerektiğini seçebilirsiniz.

    Ayarlama işleminin ne kadar süreyle çalışmasını istediğinize bağlı olarak, tüm birleşimleri ayrı test etmeye karar verebilir veya parametre birleşimlerinin bir kılavuzunu oluşturarak ve parametre kılavuzunun rastgele bir alt kümesini test ederek işlemi kısaltabilirsiniz.

  • Ayarlama Ile çapraz doğrulama: Bu seçenekle, verilerinizi biraz katlara böler ve ardından her katda modeller oluşturup test edersiniz. Bu yöntem en iyi doğruluğu sağlar ve veri kümesiyle ilgili sorunları bulmaya yardımcı olabilir; ancak, eğitim daha uzun sürer.

Her iki yöntem de yeniden kullanmak üzere kaydedilebilirsiniz eğitilmiş bir model üretir.

  • Kümeleme modeli kullanıyorsanız, en uygun küme sayısını ve diğer parametreleri otomatik olarak belirlemek için Tarama Kümelemesi'ni kullanın.

  • Ayarlamadan önce, en yüksek bilgi değerine sahip sütunları veya değişkenleri belirlemek için özellik seçimini uygulama. Daha fazla bilgi için bkz. Özellik Seçimi.

Model HiperParametrelerini Ayarlamayı Yapılandırma

Genellikle, belirli bir makine öğrenmesi modeli için en uygun hiperparametreleri öğrenmek için önemli ölçüde deneme gerekir. Bu modül hem ilk ayarlama işlemini hem de model doğruluğunu test etmek için çapraz doğrulamayı destekler:

Parametre tarama kullanarak model eğitme

Bu bölümde, Modeli Ayarlama Hiper Parametreleri modülünü kullanarak bir modeli eğiten temel parametre tarama işleminin nasıl gerçekleştiriliyor olduğu açıklanmaktadır.

  1. Studio'da (klasik) denemenize Model Ayarlama Hiperparametreleri modülünü ekleyin.

  2. Eğitilmemiş bir modeli (iLearner biçimindeki bir model) en soldaki girişe bağlama.

  3. Eğitmen modu oluştur seçeneğini Parametre Aralığı olarak ayarlayın ve parametre taramada kullanmak üzere bir değer aralığı belirtmek için Range Builder'ın kullanın.

    Sınıflandırma ve regresyon modüllerinin neredeyse hepsi tümleşik parametre taramayı destekler. Parametre aralığı yapılandırmayı desteklemeen öğrenciler için yalnızca kullanılabilir parametre değerleri test edilebilir.

    Bir veya daha fazla parametrenin değerini el ile ayarp kalan parametrelerin üzerinde tarama yapabilirsiniz. Bu, biraz zaman tasarrufuna neden olabilir.

  4. Eğitim için kullanmak istediğiniz veri kümesini ekleyin ve Bunu Tune Model Hyperparameters'ın orta girişine bağlamanız gerekir.

    İsteğe bağlı olarak, etiketli bir veri kümeniz varsa, bunu en sağdaki giriş bağlantı noktasına (Isteğe bağlı doğrulama veri kümesi) bağlayabilirsiniz. Bu, eğitim ve ayarlama sırasında doğruluğu ölçmenize olanak tanır.

  5. Model hiper parametrelerinin ayarla' nın Özellikler bölmesinde, parametre swemodu için bir değer seçin. Bu seçenek parametrelerin nasıl seçili olduğunu denetler.

    • Tüm ızgara: Bu seçeneği belirlediğinizde, modül, sistem tarafından önceden tanımlanmış bir kılavuz üzerinde döngü gerçekleştirerek farklı birleşimler deneyebilir ve en iyi öğrenme kimliğini belirler. Bu seçenek, en iyi parametre ayarlarının ne olabileceğini ve tüm olası değer birleşimini denemek istediğinizi bilmeyen durumlar için yararlıdır.

    Ayrıca kılavuzun boyutunu küçültebilir ve rastgele bir ızgara süpürme çalıştırabilirsiniz. Araştırma, bu yöntemin aynı sonuçlara neden olduğunu, ancak daha verimli bir hesaplama olduğunu göstermiştir.

    • Rastgele tarama: Bu seçeneği belirlediğinizde modül, sistem tarafından tanımlanan bir aralıktaki parametre değerlerini rastgele seçer. Modülün yürütmesini istediğiniz en fazla çalıştırma sayısını belirtmeniz gerekir. Bu seçenek, tercih ettiğiniz ölçümleri kullanarak model performansını artırmak istediğiniz, ancak bilgi işlem kaynaklarını sürdürmeye devam eden durumlar için yararlıdır.
  6. Etiket sütunu için, tek bir etiket sütunu seçmek üzere sütun seçiciyi başlatın.

  7. Modelleri derecelendirerek kullanılacak tek bir ölçüm seçin.

    Bir parametre süpürme çalıştırdığınızda model türü için geçerli tüm ölçümler hesaplanır ve tarama sonuçları raporunda döndürülür. Ayrı ölçümler, regresyon ve sınıflandırma modelleri için kullanılır.

    Ancak, seçtiğiniz ölçüm modellerin derecelendirme şeklini belirler. Yalnızca, seçili ölçüm tarafından derecelendirilen en üst model, Puanlama için kullanılacak eğitilen bir model olarak çıktı.

  8. Rastgele çekirdek için, parametre süpürme başlatılırken kullanılacak bir sayı yazın.

    Tümleşik bir parametre süpüryi destekleyen bir modelde eğitim yapıyorsanız, kullanılacak bir çekirdek değerleri aralığı da ayarlayabilirsiniz ve ayrıca rastgele çekirdekler üzerinde de yineleme yapabilirsiniz. Bu, çekirdek seçimiyle ortaya sızan sapmaları önlemek için yararlı olabilir.

  9. Denemeyi çalıştırın.

Hiperparametre ayarlamanın sonuçları

Eğitim tamamlandığında:

  • En iyi modele göre doğruluk ölçümleri kümesi görüntülemek için modüle sağ tıklayın, Tarama sonuçları'ı ve ardından Görselleştir'i seçin.

    Model türü için geçerli olan tüm doğruluk ölçümleri çıkıştır, ancak derecelendirme için seçtiğiniz ölçüm hangi modelin "en iyi" olarak kabul edilir olduğunu belirler. Ölçümler yalnızca en üst sıradaki model için oluşturulur.

  • "En iyi" model için türetilmiş ayarları görüntülemek için modüle sağ tıklayın, Eğitilen en iyi model 'i seçin ve ardından Görselleştir'e tıklayın. Rapor, giriş sütunları için parametre ayarlarını ve özellik ağırlıklarını içerir.

  • Diğer denemelerde puanlama için modeli kullanmak için, ayarlama işlemini tekrarlamak zorunda kalmadan model çıkışına sağ tıklayın ve Eğitilmiş Model Olarak Kaydet'i seçin.

Parametre tarama ile çapraz doğrulama gerçekleştirme

Bu bölümde bir parametre taramasını çapraz doğrulama ile birleştirme işlemi açık bir şekilde anlattır. Bu işlem daha uzun sürer, ancak kat sayısını belirtebilirsiniz ve veri kümeniz ve olası modeller hakkında maksimum bilgi miktarını elde edin.

  1. Denemenize Bölüm ve Örnek modülünü ekleyin ve eğitim verilerini bağlama.

  2. Katlamalara Ata seçeneğini belirleyin ve verileri bölmek için birkaç katlama belirtin. Bir sayı belirtmezseniz varsayılan olarak 10 kat kullanılır. Satırlar, değiştirme olmadan rastgele olarak bu katlara göre seçilir.

  3. Bazı sütunlarda örneklemeyi dengelemek için, Katmanlı bölmeyi TRUE olarak ayarlayın ve ardından katman sütununu seçin. Örneğin, dengesiz bir veri kümeye sahipsiniz, her kat aynı sayıda servise sahip olacak şekilde veri kümelerini bölmek istiyor olabilir.

  4. Modeli Ayarlama Hiperparametreleri modülünü denemenize ekleyin.

  5. Bu kategorideki makine öğrenmesi modüllerinden birini Tune Model Hyperparameters'ın sol girişine bağlama.

  6. Öğrenici için Özellikler bölmesinde, bir çöp modu oluştur seçeneğini parametre aralığına ayarlayın ve parametre süpürme içinde kullanılacak bir değer aralığı belirtmek için Aralık Oluşturucu 'yu kullanın.

    Tüm değerler için bir Aralık belirtmeniz gerekmez. Bazı parametrelerin değerini el ile ayarlayabilir ve ardından kalan parametrelerin üzerinde tarama yapabilirsiniz. Bu işlem biraz zaman kazandırabilir.

    Bu seçeneği desteklemeyen öğrenenler listesi için bkz. Teknik notlar bölümü.

  7. Bölüm ve örnek çıktısını, ayar modeli hiper parametrelerininetiketli eğitim veri kümesi girişine bağlayın.

  8. İsteğe bağlı olarak, bir doğrulama veri kümesini ayarlama modeli hiper parametrelerininen sağdaki girdisine bağlayabilirsiniz. Çapraz doğrulama için yalnızca bir eğitim veri kümesine ihtiyacınız vardır.

  9. Model hiper parametrelerinin ayarla' nın Özellikler bölmesinde, rastgele bir tarama veya kılavuz tarama gerçekleştirmek isteyip istemediğinizi belirtin. Bir ızgara tarama, çok daha fazla zaman alır. Rastgele bir parametre araması, çok fazla zaman almadan iyi sonuçlar elde edebilir.

    Rastgele tarama sırasında en fazla çalışma sayısı: rastgele bir tarama seçerseniz, parametre değerlerinin rastgele bir birleşimini kullanarak modelin kaç kez eğitilmeli olduğunu belirtebilirsiniz.

    Rastgele kılavuzda en fazla çalışma sayısı: Bu seçenek ayrıca parametre değerlerinin rastgele bir örneklemede yineleme sayısını denetler, ancak değerler belirtilen aralıktan rastgele oluşturulmaz; Bunun yerine, tüm olası parametre değeri birleşimlerinin bir matrisi oluşturulur ve bir rastgele örnekleme, matris üzerinden alınır. Bu yöntem, bölgesel fazla örnekleme veya yetersiz örnekleme konusunda daha etkilidir ve daha az açıktır.

    İpucu

    Bu seçeneklere yönelik daha ayrıntılı bir açıklama için bkz. Teknik notlar bölümü.

  10. Tek etiketli bir sütun seçin.

  11. Modeli derecelendirerek kullanılacak tek bir ölçüm seçin. Birçok ölçüm hesaplanır, bu nedenle sonuçları sıralamak için en önemli olanı seçin.

  12. Rastgele çekirdek için, parametre taramayı başlatma sırasında kullanmak üzere bir sayı yazın.

    Tümleşik parametre taramayı destekleyen bir model eğitirsiniz, ayrıca kullanmak üzere bir dizi çekirdek değeri ayarleyip rastgele çekirdekler üzerinde de yinelersiniz. Bu isteğe bağlıdır, ancak çekirdek seçimiyle ortaya sızan sapmalardan kaçınmak için yararlı olabilir.

  13. Modeli Çapraz Doğrulama modülünü ekleyin. Bölüm ve Örnek çıkışını Veri Kümesi girişine, Tune Model Hyperparameters çıkışını ise Eğitilmemiş model girişine bağlama.

  14. Denemeyi çalıştırın.

Çapraz doğrulama sonuçları

Çapraz doğrulama tamamlandığında:

  • Değerlendirme sonuçlarını görüntülemek için modüle sağ tıklayın, Değerlendirme sonuçları katlama seçeneğini ve ardından Görselleştir'i seçin.

    Doğruluk ölçümleri çapraz doğrulama geçişi üzerinden hesaplanır ve seçtiğiniz katlara bağlı olarak biraz farklılık gösterebilir.

  • Veri kümesi nasıl bölündü ve "en iyi" modelin veri kümesinde her satırı nasıl puanlay olduğunu görmek için modüle sağ tıklayın, Puanlı sonuçlar'ı seçin ve ardından Görselleştir'i seçin.

  • Bu veri kümesi daha sonra yeniden kullanmak üzere kaydedilse de kat atamaları korunur. Örneğin, kaydedilen datsaet şu şekilde olabilir:

    Atamaları katlama Sınıf Age(1. özellik sütunu)
    2 0 35
    1 1 17
    3 0 62
  • "En iyi" modelin parametre ayarlarını almak için Model Hiper Parametrelerini Ayarla'ya sağ tıklayın

Örnekler

Bu modülün nasıl kullanıldıklarının örnekleri için bkz. Azure Yapay Zeka Galerisi:

Teknik notlar

Bu bölümde, sık sorulan soruların uygulama ayrıntıları, ipuçları ve yanıtları yer almaktadır.

Bir parametre süpürme nasıl kullanılır

Bu bölümde, parametre süpür'nin genel olarak nasıl çalıştığı ve bu modüldeki seçeneklerin nasıl etkileşime gireceğini açıklanmaktadır.

Bir parametre süpürme ayarladığınızda, en çok sınırlı sayıda parametresi veya tanımladığınız bir parametre alanı üzerinde ayrıntılı bir arama kullanmak için aramanızın kapsamını tanımlarsınız.

  • Rastgele tarama: Bu seçenek, bir dizi yinelemenin sayısını kullanarak bir modeli ister.

    Yinelemek için bir Aralık değeri belirtirsiniz ve modül bu değerlerin rastgele seçilmiş bir alt kümesini kullanır. Değerler değiştirme ile seçilir, yani önceden rastgele seçilmiş olan sayıların kullanılabilir sayı havuzundan kaldırılmadığı anlamına gelir. Bu nedenle, seçilen herhangi bir değer tüm geçişlerde aynı kalır.

  • Izgara tarama: Bu seçenek, belirttiğiniz değer aralığındaki parametrelerin her birleşimini içeren bir matris veya kılavuz oluşturur. Bu modülle ayarlamayı başlattığınızda, bu parametrelerin birleşimleri kullanılarak birden çok model eğitilir.

  • Tüm ızgara: kılavuzun tamamını kullanma seçeneği, her bir ve her birleşimin test edileceği anlamına gelir. Bu seçenek en kapsamlı olarak düşünülebilir, ancak en fazla zaman gerektirir.

  • Rastgele kılavuz: Bu seçeneği belirlerseniz, tüm birleşimlerin matrisi hesaplanır ve değerler, belirttiğiniz yineleme sayısına göre matrgöre örneklenir.

    Son araştırma, rastgele bir EPS 'nin ızgara ile EPS 'den daha iyi gerçekleştiremediğini göstermiştir.

Eğitimin uzunluğunu ve karmaşıklığını denetleme

Birçok ayar kombinasyonu üzerinde yineleme zaman alabilir, bu nedenle modül işlemi kısıtlamak için çeşitli yollar sağlar:

  • Modeli test etmek için kullanılan yineleme sayısını sınırlama
  • Parametre alanı sınırlama
  • Yinelemelerin hem de parametre alanı sayılarının ikisini de sınırla

Belirli bir veri kümesi ve model üzerinde en verimli eğitim yöntemini belirlemek için ayarlarla denemeler yapın.

Değerlendirme ölçümü seçme

Her modelin doğruluğunu içeren bir rapor en sonunda sunulmaktadır, böylece ölçüm sonuçlarını gözden geçirebilirsiniz. Tüm sınıflandırma modelleri için tekdüdüz bir ölçüm kümesi, regresyon modellerinde ise farklı bir ölçüm kümesi kullanılır. Ancak eğitim sırasında, ayarlama işlemi sırasında oluşturulan modelleri derecelendirmek için tek bir ölçüm seçmeniz gerekir. İş problemnize ve hatalı pozitiflerin ve hatalı negatiflerin maliyetine bağlı olarak en iyi ölçümün farklı olduğunu bulabilirsiniz.

Daha fazla bilgi için, bkz. How to evaluate model performance in Azure Machine Learning

Sınıflandırma için kullanılan ölçümler

  • Doğruluk Gerçek sonuçların toplam durumlara oranı.

  • Duyarlık Gerçek sonuçların pozitif sonuçlara oranı.

  • Geri çağırma Tüm sonuçlar üzerinde tüm doğru sonuçların kesri.

  • F puanı Duyarlık ve geri çağırmayı dengeler.

  • AUC X ekseninde hatalı pozitif sonuçlar çizilen ve gerçek pozitifler y ekseninde çizilen eğrinin altındaki alanı temsil eden bir değer.

  • Ortalama Günlük Kaybı İki olasılık dağılımı arasındaki fark: gerçek dağılım ve modelde bir tane.

  • Günlük Kaybını Eğitin Model tarafından rastgele bir tahmin üzerinde sağlanan geliştirme.

Regresyon için kullanılan ölçümler

  • Ortalama mutlak hata Modelde tüm hatanın ortalamasını alır; burada hata, tahmin edilen değerin gerçek değerden uzaklığı anlamına gelir. Genellikle Mae olarak kısaltılır.

  • Ortalama kareli hata kökü Hataların karelerinin ortalamasını ölçer ve sonra bu değerin kökünü alır. Genellikle rmo olarak kısaltıcı

  • Göreli mutlak hata Hatayı, doğru değerin yüzdesi olarak gösterir.

  • Göreli kare hatası Tahmini değerlerin toplam kare şeklinde hata sayısını bölerek toplam kare içinde hatayı normalleştirir.

  • Belirleme katsayısı Verilerin modele ne kadar iyi uyduğunu gösteren tek bir sayı. 1 değeri, modelin verilerle tam olarak eşleştiği anlamına gelir; 0 değeri, verilerin rastgele olması veya başka türlü modele sığamayacak olması anlamına gelir. Genellikle r 2, r 2 veya r-kare olarak adlandırılır.

Parametre süpürme desteği olmayan modüller

Azure Machine Learning neredeyse tüm öğrenenler, tümleşik bir parametre süpürme ile çapraz doğrulamayı destekler ve bu da deneme parametrelerini seçmenizi sağlar. Learner, bir değer aralığı ayarlamayı desteklemiyorsa, bunu çapraz doğrulamada kullanmaya devam edebilirsiniz. Bu durumda, tarama için bazı izin verilen değerler aralığı seçilir.

Aşağıdaki öğrenenler, bir parametre süpürme içinde kullanılacak bir değer aralığı ayarlamayı desteklemez:

Beklenen girişler

Ad Tür Description
Eğitilen model ILearner arabirimi Parametre tarama için eğitilen model
Eğitim veri kümesi Veri Tablosu Eğitim için giriş veri kümesi
Doğrulama veri kümesi Veri Tablosu Doğrulama için giriş veri kümesi (Eğitim/Test doğrulama modu için). Bu giriş isteğe bağlıdır.

Modül parametreleri

Name Aralık Tür Varsayılan Description
Parametre tarama modunu belirtme Liste Tarama Yöntemleri Rastgele tarama Parametre alanı üzerinde kılavuzun tamamını tarama veya sınırlı sayıda örnek çalıştırma kullanarak tarama
Rastgele taramada en fazla çalıştırma sayısı [1;10000] Tamsayı 5 Rastgele tarama kullanarak en fazla çalıştırma sayısını yürütme
Rastgele çekirdek herhangi biri Tamsayı 0 Rastgele sayı oluşturucusunun çekirdeğini sağlamak için bir değer sağlama
Etiket sütunu herhangi biri ColumnSelection Etiket sütunu
Sınıflandırma için performansı ölçme ölçümü Liste İkili sınıflandırma ölçüm türü Veritabanınızın Sınıflandırma modellerini değerlendirmek için kullanılan ölçümü seçin
Gerileme performansını ölçmek için ölçüm Liste Gerilesionmetrik türü Ortalama mutlak hata Regresyon modellerini değerlendirmek için kullanılan ölçümü seçin

Çıkışlar

Ad Tür Description
Tarama sonuçları Veri tablosu Parametre tarama çalıştırmaları için sonuç ölçümü
Eğitilen en iyi model ILearner arabirimi Eğitim veri kümesinde en iyi performansa sahip model

Ayrıca bkz.

A-Z modül listesi
Eğit
Çapraz doğrulama modeli