Vowpal Wabbit sürüm 8 modelini eğitme
Önemli
Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.
1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.
- makine öğrenimi projelerini ML Studio (klasik) konumundan Azure Machine Learning taşımaya yönelik bilgilerebakın.
- Azure Machine Learninghakkında daha fazla bilgi edinin.
ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.
Vowpal Wabbit makine öğrenimi sisteminin 8 sürümünü kullanarak bir modeli Oylar
kategori: Metin Analizi
Not
uygulama hedefi: yalnızca Machine Learning Studio (klasik)
benzer sürükle ve bırak modülleri Azure Machine Learning tasarımcısındakullanılabilir.
Modüle genel bakış
bu makalede, vowpal wabbit (sürüm 8) kullanarak bir makine öğrenimi modeli oluşturmak için Machine Learning Studio 'da (klasik) vowpal wabbit sürüm 8 modülünün nasıl kullanılacağı açıklanır.
Machine Learning için Vowpal Wabbit kullanmak için, girişinizi Vowpal Wabbit gereksinimlerine göre biçimlendirin ve verileri bir Azure Blob 'una kaydedin. Vowpal Wabbit komut satırı bağımsız değişkenlerini belirtmek için bu modülü kullanın.
Deneme çalıştırıldığında, bir Vowpal Wabbit örneği, belirtilen verilerle birlikte deneme çalışma zamanına yüklenir. Eğitim tamamlandığında, model çalışma alanına yeniden serileştirilir. Modeli veri puanlandırmaya hemen kullanabilirsiniz. Eğitilen model Ayrıca, daha sonra eğitim verilerini işlemek zorunda kalmadan kullanabilmeniz için Azure Storage 'da kalıcı hale getirilir.
Mevcut bir modeli yeni verilerde artımlı olarak eğitme, kaydedilmiş bir modeli önceden eğitilen model girişine bağlayın ve yeni verileri diğer girişe ekleyin.
Not
Machine Learning Studio (klasik), vowpal wabbit çerçevesinin birden çok sürümünü barındırır. Bu modül, sürüm 8 olan Vowpal Wabbit çerçevesinin en son sürümünü kullanır. Yeni giriş verilerini öğrenmek için, Vowpal Wabbit sürüm 8 modelinikullanmanız gerekir.
Vowpal Wabbit sürümleri 7-4 veya 7-6: Vowpal wabbit 7-4 modelini eğitme ve vowpal Wabbit 7-4 model Puanlama.
Vowpal Wabbit sürüm 7-10: Vowpal wabbit 7-10 modelini eğitme ve vowpal Wabbit 7-10 modelini Puanlama.
Vowpal Wabbit nedir?
Vowpal Wabbit (VW), Yahoo! tarafından dağıtılmış bilgi işlem için geliştirilen hızlı, paralel bir makine öğrenimi çerçevesidir Araştır. daha sonra, paralel mimarilerde bilimsel bilgi işlem için John langford (Microsoft Research) tarafından Windows ve uyarlanmıştır.
Machine Learning için önemli olan Vowpal Wabbit özellikleri, sürekli öğrenme (çevrimiçi öğrenme), boyutlılık azaltma ve etkileşimli öğrenimi içerir. Vowpal Wabbit, model verilerini belleğe sığdırmadığında bir sorun için de çözümdür.
Vowpal Wabbit 'in birincil kullanıcıları, daha önce çerçevesini sınıflandırma, regresyon, konu modelleme veya matris oluşturma gibi makine öğrenimi görevleri için kullanmış olan veri Bilimleridir. Vowpal Wabbit için Azure sarmalayıcı, şirket içi sürüme çok benzer performans özelliklerine sahiptir, bu nedenle Vowpal Wabbit ' in güçlü özelliklerini ve yerel performansını kullanabilir ve eğitilen modeli bir çalışan hizmet olarak kolayca yayımlayabilirsiniz.
Özellik karma modülü, Vowpal Wabbit tarafından sunulan işlevleri de içerir. Bu, metin veri kümelerini karma algoritma kullanarak ikili özelliklere dönüştürmenizi sağlar.
Vowpal Wabbit sürüm 8 modelini yapılandırma
Bu bölümde, yeni bir modelin nasıl eğiteyapılacağı ve var olan bir modele yeni verilerin nasıl ekleneceği açıklanmaktadır.
Studio 'daki diğer modüllerin aksine (klasik), bu modül her ikisi de modül parametrelerini belirtir ve modeli tradük. Mevcut bir modeliniz varsa, modeli artımlı olarak eğitebilmeniz için isteğe bağlı bir giriş olarak ekleyebilirsiniz.
- Giriş verilerini gerekli biçimlerden birinde hazırlama
- Yeni bir modeli eğitme
- Var olan bir modeli artımlı olarak eğitme
Bu modülün kullanılması için bir Azure depolama hesabına yönelik kimlik doğrulaması gerekir.
Girdi verilerini hazırlama
Bu modülü kullanarak bir modeli eğitebilmeniz için, giriş veri kümesinin desteklenen iki biçimden birindeki tek bir metin sütunundan oluşması gerekir: Libsvm veya VW. Bu, Vowpal Wabbit yalnızca metin verilerini analiz etmenin, yalnızca özellik ve değerlerin gerekli metin dosyası biçiminde hazırlanmalıdır.
Veriler Azure Storage 'dan okunmalıdır. Biçimlendirme bazı ek değişiklikler gerektirdiğinden, giriş dosyasını Vowpal Wabbit ile kullanılmak üzere Azure 'a doğrudan kaydetmek için verileri dışarı aktarma kullanılması mümkün değildir. Verilerin doğru biçimde olduğundan emin olmanız ve verileri Azure Blob depolama alanına yüklemeniz gerekir.
Ancak, bir kısayol olarak bir SVMLight biçim dosyası oluşturmak için svmlight modülünü Dönüştür ' i kullanabilirsiniz. Daha sonra, SVMLight biçim dosyasını Azure Blob depolama alanına yükleyebilir ve giriş olarak kullanabilir ya da Vowpal Wabbit giriş dosyası gereksinimlerine uymak için dosyayı biraz daha değiştirebilirsiniz.
Vowpal Wabbit veri biçimi, seyrek verilerle ilgilenirken boş alan kaydeden bir sütunlu biçim gerektirmeyen avantajın avantajlarından yararlanır. Bu biçim hakkında daha fazla bilgi için bkz. Vowpal Wabbit wiki sayfası.
Vowpal Wabbit modeli oluşturma ve eğitme
Denemeniz için Vowpal Wabbit sürüm 8 modülünü ekleyin.
Eğitim verilerinin depolandığı hesabı belirtin. Eğitilen model ve karma dosya aynı konumda depolanır.
Azure depolama hesabı adıiçin Azure depolama hesabının adını yazın.
Azure depolama anahtarıiçin, depolama hesabına erişim için belirtilen anahtarı kopyalayıp yapıştırın.
Anahtarınız yoksa bkz. depolama erişim anahtarlarını yeniden oluşturma
Azure kapsayıcı adıiçin, model eğitim verilerinin depolandığı belirtilen Azure depolama hesabındaki tek bir kapsayıcının adını yazın. Hesap adı veya herhangi bir protokol ön eki yazmayın.
Örneğin, tam kapsayıcı yolu ve adı ise
https://myaccount.blob.core.windows.net/vwmodels
, yalnızcavwmodels
yazmalısınız. Kapsayıcı adları hakkında daha fazla bilgi için bkz. kapsayıcıları, Blobları ve meta verileri adlandırma ve başvuru.VW bağımsız değişkenleri metin kutusunda Vowpal Wabbit yürütülebilir dosyası için komut satırı bağımsız değişkenlerini yazın.
Örneğin, öğrenme hızını belirtmek için veya
-b
karma bitlerin sayısını belirtmek için ekleyebilirsiniz–l
.Daha fazla bilgi için bkz. Vowpal Wabbit parametreleri bölümü.
GIRIŞ VW dosyasının adı: giriş verilerini içeren dosyanın adını yazın. Dosya, Azure Blob depolama alanında, daha önce belirtilen depolama hesabında ve kapsayıcıda bulunan mevcut bir dosya olmalıdır. Dosya desteklenen biçimlerden biri kullanılarak hazırlanmalıdır.
Çıkış okunabilir modelinin adı (--readable_model) dosyası: eğitilen modelin kaydedileceği dosyanın adını yazın. Dosya, giriş dosyası ile aynı depolama hesabı ve kapsayıcı içinde kaydedilmelidir.
Bu bağımsız değişken, VW komut satırındaki parametresine karşılık gelir
--readable_model
.Ters çevrilen karma karma Işlevinin adı (--invert_hash) dosyası: ters karma işlevin kaydedileceği dosyanın adını yazın. Dosya, giriş dosyası ile aynı depolama hesabı ve kapsayıcı içinde kaydedilmelidir.
Bu bağımsız değişken, VW komut satırındaki parametresine karşılık gelir
--invert_hash
.Lütfen dosya türünü belirtin: eğitim verilerinizin hangi biçimde kullanacağını belirtin. Vowpal Wabbit, bu iki giriş dosyası biçimini destekler:
VW , Vowpal Wabbit tarafından kullanılan iç biçimi temsil eder. Ayrıntılar için bkz. Vowpal Wabbit wiki sayfası .
Svmlight , bazı diğer makine öğrenimi araçları tarafından kullanılan bir biçimdir.
Denemeyi her yeniden yeniden başlattığınızda verileri depolamadan yüklemek istemiyorsanız, önbelleğe alınmış sonuçları kullanınseçeneğini belirleyin. Başka hiçbir parametrenin değişmediğinden ve geçerli bir önbelleğin bulunamadığı varsayılarak, Studio (klasik) verilerin önbelleğe alınmış bir sürümünü kullanır.
Bu seçenek işaretli değilse, modül verileri her zaman depolamadan okur.
Denemeyi çalıştırın.
Eğitim tamamlandığında, çıktıyı sağ tıklatın ve modeli Studio (klasik) çalışma alanınıza kaydetmek için eğitilen model olarak kaydet ' i seçin.
Mevcut bir Vowpal Wabbit modelini yeniden eğitme
Vowpal Wabbit, mevcut bir modele yeni veri ekleyerek artımlı eğitimi destekler. Yeniden eğitim için mevcut bir modeli almanın iki yolu vardır:
Aynı deneyde başka bir tren Vowpal Wabbit sürüm 8 modülünün çıkışını kullanın.
Bir kaydedilmiş modeli, Studio 'nun eğitilen modeller grubunun (klasik) sol gezinti bölmesinde bulun ve denemenize sürükleyin.
Denemeniz için Vowpal Wabbit sürüm 8 modülünü ekleyin.
daha önce eğitilen modeli vowpal wabbit sürüm 8' in eğitim giriş bağlantı noktasına Bağlan.
Vowpal Wabbit sürüm 8 ' i eğitmeÖzellikler bölmesinde yeni eğitim verilerinin konumunu ve biçimini belirtin.
İnsan tarafından okunabilen model çıkış dosyası için bir ad ve güncelleştirilmiş modelle ilişkili karma dosya için başka bir ad belirtin.
Not
Belirtilen konumda mevcut bir Vowpal Wabbit modeli veya karma dosyası varsa, yeni eğitilen model tarafından dosyaların üzerine sessizce yazılır. Yeniden eğitilen ara modelleri korumak için depolama konumunu değiştirmeli veya model dosyalarının yerel bir kopyasını ala çalışmanız gerekir.
Denemeyi çalıştırın.
Güncelleştirilmiş modeli çalışma alanınıza kaydetmek için modüle sağ tıklayın ve Eğitilmiş Model Olarak Kaydet'Machine Learning seçin. Yeni bir ad belirtmezseniz, güncelleştirilmiş model mevcut kayıtlı modelin üzerine yazacak.
Örnekler
Vowpal Wabbit'in makine öğrenmesinde nasıl kullanılabuzla ilgili örnekler için bkz . Azure Yapay Zeka Galerisi:
-
Bu denemede bir VW modelinin veri hazırlama, eğitim ve operasyonel hale nasıl hazır hale geldi?
Ayrıca şu kaynaklara bakın:
Vowpal Wabbit uygulamasını ve yol haritasını açıklayan blog
https://blogs.technet.com/b/machinelearning/archive/2014/10/02/vowpal-wabbit-modules-in-azureml.aspx
Teknik notlar
Bu bölümde uygulama ayrıntıları, ipuçları ve sık sorulan soruların yanıtları yer almaktadır.
Vowpal Wabbit'in avantajları
Vowpal Wabbit, n-gram gibi doğrusal olmayan özellikler üzerinde son derece hızlı öğrenme sağlar.
Vowpal Wabbit, modele aynı anda tek bir kayıt sığdırmak için stokastik gradyan indüz (SGD) gibi çevrimiçi öğrenme tekniklerini kullanır. Bu nedenle ham veriler üzerinde çok hızlı bir şekilde tekrarlar ve çoğu modele göre daha hızlı iyi bir tahmin geliştirebilir. Bu yaklaşım, tüm eğitim verilerini belleğe okumaktan da kaçınıyor.
Vowpal Wabbit, tüm verileri yalnızca metin verilerine değil, diğer kategorik değişkenlere de dönüştürür. Karmaların kullanımı regresyon ağırlıklarının aramasını daha verimli hale getirir ve bu da etkin stokastik gradyan gerileme için kritik öneme sahip olur.
Eğitim sırasında modül, Azure için geliştirilen bir Vowpal Wabbit sarmalayıcıya çağrı yapar. Eğitim verileri, hesaplamaları yürüten çalışan rolleri ile depo arasındaki yüksek bant genişliği kullanılarak Azure'dan bloklar olarak indirilir ve VW öğrenicilerine akışı ilir. Sonuçta elde edilen model, VW tarafından yapılan iç sıkıştırma nedeniyle genellikle çok küçük olur. Model, deneme çalışma alanına geri kopyalanır ve bu çalışma alanında diğer modeller gibi Machine Learning.
Desteklenen ve desteklenmeyen parametreler
Bu bölümde, Machine Learning Studio'da (klasik) Vowpal Wabbit komut satırı parametreleri desteği açıklanır.
Genel olarak, sınırlı sayıda bağımsız değişkenden başka her şey de desteklene. Bağımsız değişkenlerin tam listesi için Vowpal Wabbit wiki sayfasını kullanın.
Aşağıdaki parametreler için gerekli değildir:
içinde belirtilen giriş/çıkış seçenekleri https://github.com/JohnLangford/vowpal_wabbit/wiki/Command-line-arguments
Bu özellikler modül tarafından otomatik olarak zaten yapılandırılmıştır.
Ayrıca, birden çok çıkış oluşturan veya birden çok giriş alan tüm seçeneklere izin verilmiyor. Bunlar ,
--cbt
ve--lda
'dır--wap
.Yalnızca denetimli öğrenme algoritmaları de destekler. Bu nedenle, bu seçenekler desteklenmiyor:
–active
,--rank
,--search
vb. ### Kısıtlamaları
Kısıtlamalar
Hizmetin amacı Vowpal Wabbit'in deneyimli kullanıcılarını desteklemek olduğundan, giriş verileri diğer modüller tarafından kullanılan veri kümesi biçimi yerine Vowpal Wabbit yerel metin biçimi kullanılarak önceden hazırlanır.
Eğitim verileri Azure ML çalışma alanında kullanmak yerine, en yüksek performans ve minimum ayrıştırma yükü için doğrudan Azure'dan akışa alır. Bu nedenle VW modülleriyle Azure'daki diğer modüller arasında yalnızca sınırlı birlikte çalışabilirlik ML.
Modül parametreleri
Name | Aralık | Tür | İsteğe Bağlı | Varsayılan | Description |
---|---|---|---|---|---|
Dosya türünü belirtin | VW SVMLight |
DataType | Gerekli | VW | Dosya türünün SVMLight mı yoksa Vowpal Wabbit mi olduğunu belirtir. |
Azure depolama hesabı adı | herhangi biri | Dize | Gerekli | Azure depolama hesabı adını yazın | |
Azure depolama anahtarı | herhangi biri | Securestring | Gerekli | Azure depolama anahtarını sağlama | |
Azure kapsayıcı adı | herhangi biri | Dize | Gerekli | Azure kapsayıcı adını yazın | |
VW bağımsız değişkenleri | herhangi biri | Dize | İsteğe Bağlı | Vowpal Wabbit bağımsız değişkenlerini belirtin. -f' dahil değildir. | |
Giriş VW dosyasının adı | herhangi biri | Dize | Gerekli | Vowpal Wabbit biçiminde bir giriş dosyasının adını belirtin | |
Çıktı okunabilir model (--readable_model) dosyasının adı | herhangi biri | Dize | İsteğe Bağlı | Belirtilirse, okunabilir bir modeli Azure kapsayıcıya geri alır. | |
Çıktı ters karma (--invert_hash) dosyasının adı | Dize | Dize | İsteğe Bağlı | Belirtilirse, ters karma işlevini içeren bir dosyayı Azure kapsayıcıya geri verir. |
Çıkışlar
Ad | Tür | Description |
---|---|---|
Eğitilen model | ILearner arabirimi | Eğitilen öğrenciler |
Özel durumlar
Özel durum | Description |
---|---|
Hata 0001 | Belirli bir veya daha fazla veri kümesi sütunu bulunamazsa özel durum oluşur. |
Hata 0003 | Bir veya daha fazla giriş null veya boş olduğunda özel durum oluşur. |
Hata 0,0004 | Parametre belirli bir değerden küçük veya ona eşitse özel durum oluşur. |
Hata 0017 | Belirtilen bir veya daha fazla sütunda geçerli modülde desteklenmeyen tür varsa özel durum oluşur. |
Studio (klasik) modüllerine özgü hataların listesi için bkz. Machine Learning hata kodları.
apı özel durumlarının listesi için bkz. Machine Learning REST API hata kodları.
Ayrıca bkz.
Metin Analizi
Özellik Karma
Adlandırılmış Varlık Tanıma
Vowpal Wabbit 7-4 modeli puanı
Vowpal Wabbit sürüm 8 modelini puanedin.
Vowpal Wabbit 7-4 modeline eğitme
A-Z modül listesi