Vowpal Wabbit Sürüm 7-10 Modelini Eğitin

Önemli

Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.

1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.

ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.

Vowpal Wabbit makine öğrenmesi sisteminin 7-10 sürümünü kullanarak model eğitiyor

Kategori: Metin Analizi

Not

Uygulama: Machine Learning Studio (yalnızca klasik)

Benzer sürükle ve bırak modülleri tasarımcıda da Azure Machine Learning kullanılabilir.

Modüle genel bakış

Bu makalede, Vowpal Wabbit örneği (sürüm 7-10) kullanarak makine öğrenmesi modeli oluşturmak için Machine Learning Studio'daki (klasik) Vowpal Wabbit Sürüm 7-10'un Nasıl Eğitiliyor olduğu açıklanmıştır.

Makine öğrenmesi için Vowpal Wabbit kullanmak üzere girişlerinizi Vowpal Wabbit gereksinimlerine göre biçimlendirin ve verileri bir Azure blob'a kaydedin. Vowpal Wabbit komut satırı bağımsız değişkenlerini belirtmek için bu modülü kullanın.

Deneme çalıştır yüklendiğinde, belirtilen verilerle birlikte deneme çalışma zamanında Bir Vowpal Wabbit örneği yüklenir. Eğitim tamamlandığında model çalışma alanına geri seri hale getirilecek. Verileri puan almak için modeli hemen kullanabilirsiniz. Eğitilen model, daha sonra eğitim verilerini yeniden işlemeye gerek kalmadan kullanabileceğiniz şekilde Azure depolamada da kalıcıdır.

Mevcut bir modeli yeni verilerde artımlı olarak eğitmek için, kaydedilmiş bir modeli Önceden eğitilmiş model girişine bağlama ve yeni verileri diğer girişe ekleme.

Not

Machine Learning Studio (klasik), Vowpal Wabbit çerçevesinin birden çok sürümünü barındırr. Bu modül, Vowpal Wabbit çerçevesinin 7-10 sürümünü kullanır.

Önceki bir sürüme (7-4 veya 7-6) göre bir model derlemeniz veya puanlarsanız şu modülleri kullanın: Vowpal Wabbit 7-4 Modeli Eğitin ve Vowpal Wabbit 7-4 Modelini Puanla.

En son sürüm için Vowpal Wabbit Sürüm 8 Modelini Eğit'i, puanlama modülü olan Score Vowpal Wabbit 8 Model'i kullanın.

Vowpal Wabbit nedir?

Vowpal Wabbit (VW), Yahoo! tarafından dağıtılmış bilgi işlem için geliştirilmiş hızlı ve paralel bir makine öğrenmesi çerçevesidir! Araştırma. Daha sonra paralel mimarilerde bilimsel bilgi Windows john Langford (Microsoft Research) tarafından uyarlandı.

Makine öğrenmesi için önemli olan Vowpal Wabbit'in özellikleri arasında sürekli öğrenme (çevrimiçi öğrenme), boyut azaltma ve etkileşimli öğrenme yer aldı. Vowpal Wabbit, model verilerini belleğe sığdırmanıza neden olan sorunların çözümüdür.

Machine Learning'de Vowpal Wabbit'in birincil kullanıcıları sınıflandırma, regresyon, konu modellemesi veya matris çarpanlarına dönüştürme gibi makine öğrenmesi görevleri için çerçeveyi kullanan veri bilimcileridir. Vowpal Wabbit için Azure sarmalayıcı, şirket içi sürüme çok benzer performans özelliklerine sahiptir. Bu da kullanıcıların, eğitilen modeli operasyonel bir hizmet olarak kolayca yayımlama becerisi elde ederken Vowpal Wabbit'in güçlü özelliklerini ve yerel performansını kullanarak modeller derlemeye, yeniden eğiterek ve puanlama yapmaya devam ettiği anlamına gelir.

Özellik Karması modülü ayrıca Vowpal Wabbit tarafından sağlanan ve bir karma algoritması kullanarak metin veri kümelerini ikili özelliklere dönüştürmenizi sağlayan işlevleri de içerir.

Vowpal Wabbit Sürüm 7-10 Modelini yapılandırma

Bu bölümde, yeni bir modeli eğitma ve var olan bir modele yeni veri ekleme açık açıklamalarını içerir.

Studio'daki (klasik) diğer modüllerin aksine, bu modül hem modül parametrelerini belirtir hem de modeli eğiter. Mevcut bir modeliniz varsa, modeli artımlı olarak eğitmek için isteğe bağlı bir giriş olarak ekleyin.

Bu modülün kullanımı için Azure depolama hesabında kimlik doğrulaması gerekir.

Girdi verilerini hazırlama

Bu modülü kullanarak modeli eğitmek için giriş veri kümesi, desteklenen iki biçimden biri olan LibSVM veya VW'de tek bir metin sütunundan oluşur.

Bu, Vowpal Wabbit'in yalnızca metin verilerini analiz etmiş olduğu anlamına değildir; yalnızca özelliklerin ve değerlerin gerekli metin dosyası biçiminde hazır olması gerekir.

Verilerin Azure depolamadan okunmaları gerekir. Biçim bazı ek değişiklikler gerektirdiği için , Giriş dosyasını Vowpal Wabbit ile kullanmak üzere doğrudan Azure'a kaydetmek için Verileri Dışarı Aktar'ı kullanmak mümkün değildir. Verilerin doğru biçimde olduğundan emin olun ve sonra verileri Azure blob depolamaya yükleyin.

Ancak kısayol olarak Convert to SVMLight modülünü kullanarak bir SVMLight biçim dosyası oluşturabilirsiniz. Daha sonra SVMLight biçim dosyasını Azure blob depolamaya yükleyebilir ve giriş olarak kullanabilir veya dosyayı Vowpal Wabbit giriş dosyası gereksinimlerine uygun şekilde değiştirebilirsiniz.

Vowpal Wabbit veri biçimi, seyrek verilerle uğraşan alandan tasarruf etmek için sütunlu bir biçim gerektirmeyen bir avantaja sahiptir. Bu biçim hakkında daha fazla bilgi için Vowpal Wabbit wiki sayfasına bakın.

Vowpal Wabbit modeli oluşturma ve eğitma

  1. Train Vowpal Wabbit Version 7-10 modülünü denemenize ekleyin.

  2. Eğitim verisi depolandığı hesabı belirtin. Eğitilen model ve karma dosyası aynı konumda depolanır.

    • Azure depolama hesabı adı için Azure depolama hesabının adını yazın.

    • Azure depolama anahtarı için, depolama hesabına erişmek için sağlanan anahtarı kopyalayıp yapıştırın,

    Anahtarınız yoksa bkz. Depolama erişim anahtarlarını yeniden oluşturma

  3. Azure kapsayıcı adı için, model eğitim verisi depolandığı belirtilen Azure depolama hesabına tek bir kapsayıcının adını yazın. Hesap adını veya protokol ön eklerini yazmayın.

    Örneğin, tam kapsayıcı yolu ve adı ise, https://myaccount.blob.core.windows.net/vwmodelsyalnızca yazmalı.vwmodels Kapsayıcı adları hakkında daha fazla bilgi için bkz . Kapsayıcıları, Blobları ve Meta Verileri Adlandırma ve Başvuru.

  4. VW bağımsız değişkenleri metin kutusuna Vowpal Wabbit yürütülebilir dosyası için komut satırı bağımsız değişkenlerini yazın.

    Örneğin, öğrenme oranını –l belirtmek veya karma bit sayısını -b belirtmek için eklemesi de dahildir.

    Daha fazla bilgi için parameters bölümüne bakın.

  5. Giriş VW dosyasının adı: Giriş verilerini içeren dosyanın adını yazın. Dosya, daha önce belirtilen depolama hesabında ve kapsayıcıda bulunan, Azure blob depolamada var olan bir dosya olması gerekir. Dosya, desteklenen biçimlerden biri kullanılarak hazırlanmış olması gerekir.

  6. Çıktı okunabilir model (--readable_model) dosyasının adı: Eğitilen modelin kaydedilemediklerinin adını yazın. Dosya, giriş dosyasıyla aynı depolama hesabına ve kapsayıcıya kaydedilebilir.

    Bu bağımsız değişken VW --readable_model komut satırı parametresine karşılık gelen.

  7. Çıktı ters karma (--invert_hash) dosyasının adı: Ters karma işlevinin kaydedileci dosyanın adını yazın. Dosya, giriş dosyasıyla aynı depolama hesabına ve kapsayıcıya kaydedilebilir.

    Bu bağımsız değişken VW --invert_hash komut satırı parametresine karşılık gelen.

  8. Lütfen dosya türünü belirtin: Eğitim verilerinizin hangi biçimi kullandığını belirtin. Vowpal Wabbit şu iki giriş dosyası biçimlerini destekler:

    • VW , Vowpal Wabbit tarafından kullanılan iç biçimi temsil eder. Ayrıntılar için Vowpal Wabbit wiki sayfasına bakın.

    • SVMLight , diğer makine öğrenmesi araçları tarafından kullanılan bir biçimdir.

  9. Deneme her yeniden başlatıldında verileri depolamadan yüklemek istemiyorsanız Önbelleğe alınmış sonuçları kullan seçeneğini belirleyin. Başka bir parametrenin değişmediğini ve geçerli bir önbelleğin buluna olduğunu varsayarak Studio (klasik) verilerin önbelleğe alınmış bir sürümünü kullanır.

    Bu seçeneğin seçimi kaldırılırsa modül verileri her zaman depolamadan okur.

  10. Denemeyi çalıştırın.

  11. Model oluşturmanın ardından çıkışa sağ tıklar ve Eğitilmiş model olarak kaydet'i seçerek modeli daha sonra yeniden kullanabilir ve yeniden eğitebilirsiniz.

Mevcut Bir Vowpal Wabbit modelini yeniden eğitin

Vowpal Wabbit, mevcut modele yeni veriler ekleyerek artımlı eğitimi destekler. Mevcut bir modeli yeniden eğitim için almak için iki yol vardır:

  • Aynı denemede başka bir Train Vowpal Wabbit Sürüm 8 modülünün çıkışını kullanın.

  • Studio'da (klasik ) Eğitilen Modeller grubunda kayıtlı bir modeli bulun ve denemenize sürükleyin.

  1. Train Vowpal Wabbit Version 8 modülünü denemenize ekleyin.

  2. Bağlan eğitilmiş modeli Train Vowpal Wabbit Version 8'in giriş bağlantı noktasına kullanın:

  3. Vowpal Wabbit Sürüm 8'i Eğitin'in Özellikler bölmesinde, yeni eğitim verisi konumunu ve biçimini belirtin.

  4. İnsan tarafından okunabilir model çıkış dosyası için bir ad ve güncelleştirilmiş modelle ilişkili karma dosya için başka bir ad belirtin.

    Not

    Belirtilen konumda bir Vowpal Wabbit modeli veya karma dosyası varsa, dosyaların yeni eğitilen model tarafından sessizce üzerine yazılır. Yeniden eğitiminde ara modellerini korumak için, depolama konumunu değiştirmeniz veya model dosyalarının yerel bir kopyasını oluşturmanız gerekir.

  5. Denemeyi çalıştırın.

  6. Machine Learning çalışma alanınızda güncelleştirilmiş modeli korumak için modüle sağ tıklayın ve eğitilen model olarak kaydet ' i seçin. Yeni bir ad belirtmezseniz, güncelleştirilmiş model var olan kaydedilen modelin üzerine yazar.

Örnekler

Bilgisayar öğreniminde Vowpal Wabbit kullanım örnekleri için bkz. Azure yapay zeka Galerisi:

  • Vowpal Wabbit örneği

    Bu deneme, bir VW modelinin veri hazırlanmasını, eğitimini ve işlem kullanımını gösterir.

Ayrıca, şu kaynaklara bakın:

Teknik notlar

Bu bölümde, sık sorulan soruların uygulama ayrıntıları, ipuçları ve yanıtları yer almaktadır.

Vowpal Wabbit avantajları

Vowpal Wabbit, n-gram gibi doğrusal olmayan özellikler üzerinde son derece hızlı öğrenme sağlar.

Vowpal Wabbit, tek seferde bir modele bir kayıt olmak için Stokastik gradyan (SGD) gibi çevrimiçi öğrenme teknikleri kullanır. Böylece ham verileri çok hızlı bir şekilde yineler ve diğer modellerden daha hızlı bir tahmin geliştirebilir. Bu yaklaşım ayrıca tüm eğitim verilerini belleğe okumak zorunda kalmaktan kaçınır.

Vowpal Wabbit, yalnızca metin verileri değil diğer kategorik değişkenler değil, tüm verileri karmaya dönüştürür. Karma kullanımı, regresyon ağırlıklarını, etkin Stokastik gradyan açısından kritik olan bir şekilde daha verimli hale getirir.

Eğitim sırasında modül, Azure için geliştirilmiş bir Vowpal Wabbit sarmalayıcısına çağrı yapar. Eğitim verileri, Azure 'dan bloklar halinde indirilir, böylece mağaza ve hesapları yürüten çalışan rolleri arasındaki yüksek bant genişliğidir ve bu da VW öğrenillerine akış yapılır. Elde edilen model, VW tarafından gerçekleştirilen dahili sıkıştırma nedeniyle genellikle çok daha kısa olur. Model, Machine Learning diğer modeller gibi kullanılabilecek deneme çalışma alanına geri kopyalanır.

Desteklenen ve desteklenmeyen parametreler

bu bölümde Machine Learning Studio 'daki (klasik) vowpal wabbit komut satırı parametrelerine yönelik destek açıklanmaktadır.

Machine Learning Studio 'da aşağıdaki komut satırı bağımsız değişkenlerini kullanamazsınız (klasik).

Yukarıda açıklananlar dışında tüm bağımsız değişkenlere izin verilir.

Bağımsız değişkenlerin tüm listesi için Vowpal Wabbit wiki sayfasınıkullanın.

Kısıtlamalar

Hizmetin hedefi Vowpal Wabbit 'in deneyimli kullanıcılarını destekleyeceği için, giriş verileri, diğer modüller tarafından kullanılan veri kümesi biçimi yerine Vowpal Wabbit yerel metin biçimi kullanılarak önceden hazırlanmalıdır.

azure ML çalışma alanındaki verileri kullanmak yerine, eğitim verileri, en yüksek performans ve en düşük ayrıştırma yükü için doğrudan azure 'dan akışla kaydedilir. Bu nedenle, Azure ML VW modülleri ve diğer modüller arasında yalnızca sınırlı birlikte çalışabilirlik vardır.

Modül parametreleri

Name Aralık Tür Varsayılan Description
Azure depolama hesabı adı herhangi biri Dize Azure depolama hesabı adını yazın
Azure depolama anahtarı herhangi biri SecureString Azure depolama anahtarını sağlayın
Azure kapsayıcı adı herhangi biri Dize Azure Container adını yazın
VW bağımsız değişkenleri herhangi biri Dize Herhangi bir Vowpal Wabbit bağımsız değişkeni belirtin.

– F bağımsız değişkeni desteklenmez.
Giriş VW dosyasının adı herhangi biri Dize Vowpal Wabbit biçiminde bir giriş dosyasının adını belirtin
Çıkış okunabilir modelinin adı (--readable_model) dosyası herhangi biri Dize Belirtilmişse, okunabilir bir modeli Azure Container 'a geri gönderir.

Bu bağımsız değişken isteğe bağlıdır.
Çıkış ters karma (--invert_hash) dosyasının adı herhangi biri Dize Belirtilmişse, ters karma işlevini içeren bir dosyayı Azure Container 'a geri gönderir.

Bu bağımsız değişken isteğe bağlıdır.
Lütfen dosya türünü belirtin VW

SVMLight
DataType VW Dosya türünün SVMLight biçimini mi yoksa Vowpal Wabbit biçimini mi kullanacağını belirtin.

Çıkışlar

Ad Tür Description
Eğitilen model ILearner arabirimi Eğitilen öğrenici

Özel durumlar

Özel durum Description
Hata 0001 Belirli bir veya daha fazla veri kümesi sütunu bulunamazsa özel durum oluşur.
Hata 0003 Bir veya daha fazla giriş null veya boş olduğunda özel durum oluşur.
Hata 0,0004 Parametre belirli bir değerden küçük veya ona eşitse özel durum oluşur.
Hata 0017 Belirtilen bir veya daha fazla sütunda geçerli modülde desteklenmeyen tür varsa özel durum oluşur.

Studio (klasik) modüllerine özgü hataların listesi için bkz. Machine Learning hata kodları.

apı özel durumlarının listesi için bkz. Machine Learning REST API hata kodları.

Ayrıca bkz.

Metin Analizi
Özellik Karma
Adlandırılmış Varlık Tanıma
Vowpal Wabbit 7-4 modeli puanı
Vowpal Wabbit 7-10 modeli puanı
Vowpal Wabbit 7-4 modeline eğitme
A-Z modül listesi