Çapraz doğrulamayı hızlandırma

Apache mini ml modellerinin hiper parametre ayarlaması, parametre kılavuzunun boyutuna bağlı olarak çok uzun zaman alır. Şunları hızlandırmak için, Mini-mini Şirket içindeki çapraz doğrulama adımının performansını artırabilirsiniz:

  • Çapraz doğrulama dahil olmak üzere herhangi bir özellik dönüştürmesi veya modelleme adımı çalıştırmadan önce verileri önbelleğe alma. Verileri bir önbellekten birden çok kez karşılayan süreçler. Önbelleğin etkili olması için üzerinde bir eylem çağırılacağını unutmayın DataFrame .
  • CrossValidatorParalel algoritmaları çalıştırırken kullanılacak iş parçacığı sayısını ayarlayan içindeki paralellik parametresini arttırın. Varsayılan ayar 1 ' dir. Daha fazla bilgi için bkz. çapraz Doğrulayıcı belgeleri .
  • İşlem hattını belirtim içinde tahmin aracı olarak kullanmayın CrossValidator . Korlavaslarının modelle birlikte ayarlandığı bazı durumlarda, tüm işlem hattının bu şekilde çalıştırılması CrossValidator anlamlı olur. Ancak bu, her parametre birleşimi ve katlama için tüm işlem hattını yürütür. Bu nedenle, yalnızca model ayarlanmakta ise, model belirtimini içindeki tahmin aracı olarak ayarlayın CrossValidator .

Not

CrossValidator işlem hattının içindeki son aşama, kortoizleyiciler sonrasında ayarlanabilir. Çıktı tarafından tanımlanan en iyi model CrossValidator .