Özel Konuşma Tanıma modeli eğitme ve dağıtma

Bu makalede Özel Konuşma modellerini eğitip dağıtmayı öğrenirsiniz. Konuşmayı metne göre eğiten bir model, Microsoft temel modeli için tanıma doğruluğunu geliştirebilir. Modeli eğitmek için insan etiketli transkripsiyonlar ve ilgili metinler kullanırsanız. Bu veri kümeleri, daha önce karşıya yüklenen ses verileriyle birlikte konuşmayı metne göre modeli geliştirmek ve eğitmek için kullanılır.

Doğruluk sorunlarını çözmek için eğitimi kullanma

Temel modelde tanıma sorunlarıyla karşılaşıyorsanız, insan etiketli transkriptleri ve ilgili verileri kullanarak özel bir model eğitebilir ve doğruluğun iyileştirilmesine yardımcı olabilirsiniz. Sorunlarınızı ele alan veri kümelerini belirlemek için bu tabloyu kullanın:

Kullanım örneği Veri türü
Tıbbi terminoloji veya IT jargonu gibi sektöre özgü sözlük ve dil bilgisi konusunda tanıma doğruluğunu geliştirme Düz metin veya yapılandırılmış metin verileri
Ürün adları veya kısaltmalar gibi standart olmayan söylenişleri olan bir sözcüğün veya terimin telefon numarasını ve görüntülenen formunu tanımlama Yapılandırılmış metinde söyleniş verileri veya metne yönelik söyleniş
Konuşma stilleri, vurgular veya belirli arka plan gürültüleri için tanıma doğruluğunu geliştirme Ses + insan etiketli transkriptler

Modeli eğitme ve değerlendirme

Modeli eğitecek ilk adım eğitim verilerini karşıya yüklemektir. bkz. İnsan etiketli transkripsiyonları ve ilgili metinleri (konuşmalar ve söylenişler) hazırlamak için verilerinizi adım adım yönergeler için hazırlama ve test edin. Eğitim verilerini karşıya yükledikten sonra modelinizi eğit etmeye başlamak için şu yönergeleri izleyin:

  1. Özel Konuşma portalında oturum açın. Ses + insan etiketine sahip transkripsiyon veri kümeleriyle bir model eğiteceksanız eğitim için ayrılmış donanıma sahip bir bölgede Konuşma aboneliği seçin.
  2. Konuşmayı Metne Özel Konuşma > [projenin > adı] Eğitim'e > gidin.
  3. Modeli eğit'i seçin.
  4. Eğitiminize bir Ad ve Açıklama girin.
  5. Senaryo ve Temel model listesinde etki alanınıza en uygun senaryoyu seçin. Hangi senaryoyu seçeceksiniz? emin değilsanız Genel'i seçin. Temel model, eğitimin başlangıç noktasıdır. En son model genellikle en iyi seçenektir.
  6. Eğitim verilerini seçin sayfasında, eğitim için kullanmak istediğiniz bir veya daha fazla ilgili metin veri kümesi ya da ses + insan etiketine sahip transkripsiyon veri kümeleri seçin.

Not

Yeni bir model eğitip ilgili metinle çalışmaya başlarken; ses + insan etiketli transkripsiyon ile eğitim çok daha uzun sürebilir (birkaç gün kadar).

Not

Tüm temel modeller ses ile eğitimi desteklemez. Temel model bunu desteklemezse, Konuşma hizmeti yalnızca transkriptlerden metni kullanır ve sesi yoksayar. Ses verileriyle eğitimi destekleyen temel modellerin listesi için bkz. Dil desteği.

Not

Eğitim için kullanılan temel modeli değiştirmiyorsanız ve eğitim veri kümesinde sese sahip olduğunuz durumlarda, her zaman yeni seçilen temel modelin ses verileriyle eğitimi destekleyip desteklemey olmadığını kontrol edin. Daha önce kullanılan temel model ses verileriyle eğitimi desteklemezse ve eğitim veri kümesi ses içeriyorsa, yeni temel modelle eğitim süresi önemli ölçüde artar ve birkaç saat ile birkaç gün arasında kolayca gidebilir. Bu durum özellikle Konuşma hizmeti aboneliğiniz eğitim için ayrılmış donanıma sahip bir bölgede yer almaıyorsa doğrudur.

Yukarıdaki paragrafta açıklanan sorunla karşı karşıya olursanız, veri kümesinde ses miktarını azaltarak veya tamamen kaldırarak ve yalnızca metni bırakarak eğitim süresini hızla azaltabilirsiniz. Konuşma hizmeti aboneliğiniz eğitim için ayrılmış donanıma sahip bir bölgede yer almamışsa ikinci seçenek kesinlikle önerilir.

  1. Eğitim tamamlandıktan sonra, yeni eğitilen modelde doğruluk testi yapabiliriz. Bu adım isteğe bağlıdır.
  2. Özel modelinizi oluşturmak için Oluştur'a seçin.

Eğitim tablosunda yeni modele karşılık gelen yeni bir giriş görüntülenir. Tabloda şu durum da görüntülenir: İşlem, Başarılı veya Başarısız.

Özel Konuşma modeli doğruluğunu değerlendirme ve geliştirme hakkında bilgi için bkz. Doğruluğu test etmek için modelinizin performansıyla ilgili gerçekçi bir anlam elde etmek için modeliniz ile birlikte kullanılandan farklı bir akustik veri kümesi seçmeniz önemlidir.

Not

Hem temel modeller hem de özel modeller yalnızca belirli bir tarihe kadar kullanılabilir (bkz. Model ve uç nokta yaşam döngüsü). Speech Studio modelin ve uç noktanın Sona Erme sütununda bu tarihi gösterir. Bu tarihten sonra uç nokta veya toplu transkripsiyon isteği başarısız olabilir veya temel modele geri dönebilir.

Doğruluk geliştirmelerinden yararlanmak ve model sürenizin dolmaması için modelinizi en son temel modeli kullanarak yeniden eğitin.

Özel bir modeli dağıtma

Verileri karşıya yükleyen ve inceledikten, doğruluğu değerlendirdikten ve özel bir modeli eğitdikten sonra uygulamalarınız, araçlarınız ve ürünleriniz ile kullanmak üzere özel bir uç nokta dağıtabilirsiniz.

Özel bir uç nokta oluşturmak için Özel Konuşma portalında oturum açın. Sayfanın üst kısmında özel konuşma menüsünde Dağıtım'ı seçin. Bu ilk çalıştırmanızsa tabloda listelenen uç nokta olmadığını fark edin. Bir uç nokta oluşturdukta, dağıtılan her uç noktayı izlemek için bu sayfayı kullanırsiniz.

Ardından Uç nokta ekle'yi seçin ve özel uç noktanız için Bir Ad ve Açıklama girin. Ardından uç noktayla ilişkilendirmek istediğiniz özel modeli seçin. Günlüğe kaydetmeyi bu sayfadan da etkinleştirebilirsiniz. Günlüğe kaydetme, uç nokta trafiğini izlemenizi sağlar. Günlük devre dışı bırakılırsa trafik depolanmış olmayacaktır.

Yeni uç nokta sayfasını gösteren ekran görüntüsü.

Not

Kullanım koşullarını ve fiyatlandırma ayrıntılarını kabul edin.

Ardından Oluştur'a seçin. Bu eylem sizi Dağıtım sayfasına döndürür. Tabloda artık özel uç noktanıza karşılık gelen bir giriş yer alır. Uç noktanın durumu geçerli durumunu gösterir. Özel modellerinizi kullanarak yeni uç nokta örneği oluşturmak 30 dakika kadar sürebilir. Dağıtımın durumu Tamamlandı olarak değişirse uç nokta kullanıma hazırdır.

Uç noktanız dağıtıldıktan sonra uç nokta adı bir bağlantı olarak görünür. Uç nokta anahtarı, uç nokta URL'si ve örnek kod gibi uç noktanıza özgü bilgileri görmek için bağlantıyı seçin. Sona erme tarihini not edin ve kesintisiz hizmet sağlamak için uç noktanın modelini bu tarihten önce güncelleştirin.

Günlük verilerini görüntüleme

Dağıtımlar altındaki uç noktanın sayfasına gidersiniz günlük verileri dışarı aktarma için kullanılabilir.

Not

Günlük verileri, Microsoft'a ait depolamada 30 gün boyunca kullanılabilir. Daha sonra kaldırılacaktır. Müşteriye ait depolama hesabı Bilişsel Hizmetler aboneliğine bağlı ise günlük verileri otomatik olarak silinmez.

Sonraki adımlar

Ek kaynaklar