Tümcecik listesi ile tanıma doğruluğunu geliştirme

Tümcecik listesi, tanımalarını geliştirmeye yardımcı olmak için önceden sağlanan sözcüklerin veya tümceciklerin listesidir. Tümcecik listesine tümcecik eklemek önemini artırır ve bu nedenle tanınma olasılığını artırır.

Desteklenen tümcecik listesi yerel ayarları için bkz . Konuşma hizmeti için dil ve ses desteği.

Tümceciklere örnek olarak şunlar verilebilir:

  • Adlar
  • Coğrafi konumlar
  • Eş adlılar
  • Sektörünüz veya kuruluşunuza özgü sözcükler veya kısaltmalar

Tümcecik listeleri basit ve basittir:

  • Tam zamanında: Konuşma tanımaya başlamadan hemen önce bir tümcecik listesi sağlanır ve özel model eğitme gereksinimi ortadan kaldırılır.
  • Basit: Büyük bir veri kümesine ihtiyacınız yoktur. Tanımayı artırmak için bir sözcük veya tümcecik sağlayın.

Tümcecik listelerini Speech Studio, Konuşma SDK'sı veya Konuşma Komut Satırı Arabirimi (CLI) ile kullanabilirsiniz. Batch transkripsiyon API'sinde tümcecik listeleri desteklenmez.

Tümcecik listelerini hem standart hem de özel konuşmayla kullanabilirsiniz. İfadeler içeren özel bir modeli eğitmek, doğruluğu artırmak için en iyi seçenek olabilir. Örneğin, aşağıdaki durumlarda özel konuşma kullanabilirsiniz:

  • Büyük bir tümcecik listesi kullanmanız gerekiyorsa. Tümcecik listesinde 500'den fazla tümcecik olmamalıdır.
  • Şu anda desteklenmeyen diller için tümcecik listesine ihtiyacınız varsa.

Speech Studio'da deneyin

Konuşma Studio'yu kullanarak tümcecik listesinin sesinizin tanınmasını iyileştirmeye nasıl yardımcı olacağını test edebilirsiniz. Üretim ortamında uygulamanızla bir tümcecik listesi uygulamak için Konuşma SDK'sını veya Konuşma CLI'sini kullanırsınız.

Örneğin Konuşma hizmetinin şu cümleyi tanımasını istediğinizi varsayalım: "Merhaba Rehaan, ben Contoso bankasından Jessie."

Bir ifadenin yanlış tanındığını fark edebilirsiniz: "Herkese merhaba, ben Jesse' den bunu yapamam banka."

Önceki senaryoda, tümcecik listenize "Rehaan", "Jessie" ve "Contoso" eklemek istersiniz. Ardından adların doğru şekilde tanınması gerekir.

Şimdi tümcecik listesinin tanıma doğruluğunu nasıl iyileştirebileceğini görmek için Speech Studio'yu deneyin.

Not

Azure aboneliğinizi ve Konuşma kaynağınızı seçmeniz ve bölgeniz için faturalamayı onaylamanız istenebilir.

  1. Speech Studio'da metin için Gerçek Zamanlı Konuşma'ya gidin.
  2. Ses dosyasını karşıya yükleyerek veya mikrofonla ses kaydederek konuşma tanımayı test edebilirsiniz. Örneğin, mikrofonla ses kaydet'i seçin ve ardından "Merhaba Rehaan, contoso bankasından Jessie'yim. " Ardından kaydı durdurmak için kırmızı düğmeyi seçin.
  3. Test sonuçları metin kutusunda transkripsiyon sonucunu görmeniz gerekir. "Rehaan", "Jessie" veya "Contoso" yanlış tanındıysa, bir sonraki adımda terimleri tümcecik listesine ekleyebilirsiniz.
  4. Gelişmiş seçenekleri göster'i seçin ve Tümcecik listesini açın.
  5. "Contoso; Jessie; Tümcecik listesi metin kutusunda yeniden vurgula" yazın. Birden çok tümceciği noktalı virgülle ayırmak gerekir. Screenshot of a phrase list applied in Speech Studio.
  6. Tanımayı yeniden test etmek için mikrofonu kullanın. Aksi takdirde, sesinizi yeniden çalıştırmak için ses dosyanızın yanındaki yeniden deneme okunu seçebilirsiniz. "Rehaan", "Jessie" veya "Contoso" terimleri tanınmalıdır.

Tümcecik listesi uygulama

Konuşma SDK'sı ile tümcecikleri tek tek ekleyebilir ve ardından konuşma tanımayı çalıştırabilirsiniz.

var phraseList = PhraseListGrammar.FromRecognizer(recognizer);
phraseList.AddPhrase("Contoso");
phraseList.AddPhrase("Jessie");
phraseList.AddPhrase("Rehaan");

Konuşma SDK'sı ile tümcecikleri tek tek ekleyebilir ve ardından konuşma tanımayı çalıştırabilirsiniz.

auto phraseListGrammar = PhraseListGrammar::FromRecognizer(recognizer);
phraseListGrammar->AddPhrase("Contoso");
phraseListGrammar->AddPhrase("Jessie");
phraseListGrammar->AddPhrase("Rehaan");

Konuşma SDK'sı ile tümcecikleri tek tek ekleyebilir ve ardından konuşma tanımayı çalıştırabilirsiniz.

PhraseListGrammar phraseList = PhraseListGrammar.fromRecognizer(recognizer);
phraseList.addPhrase("Contoso");
phraseList.addPhrase("Jessie");
phraseList.addPhrase("Rehaan");

Konuşma SDK'sı ile tümcecikleri tek tek ekleyebilir ve ardından konuşma tanımayı çalıştırabilirsiniz.

const phraseList = sdk.PhraseListGrammar.fromRecognizer(recognizer);
phraseList.addPhrase("Contoso");
phraseList.addPhrase("Jessie");
phraseList.addPhrase("Rehaan");

Konuşma SDK'sı ile tümcecikleri tek tek ekleyebilir ve ardından konuşma tanımayı çalıştırabilirsiniz.

phrase_list_grammar = speechsdk.PhraseListGrammar.from_recognizer(reco)
phrase_list_grammar.addPhrase("Contoso")
phrase_list_grammar.addPhrase("Jessie")
phrase_list_grammar.addPhrase("Rehaan")

Konuşma CLI'sı ile, tanıma komutuyla birlikte satır içi veya metin dosyası içeren bir tümcecik listesi ekleyebilirsiniz.

Mikrofondan veya ses dosyasından tanımayı deneyin.

spx recognize --microphone --phrases "Contoso;Jessie;Rehaan;"
spx recognize --file "your\path\to\audio.wav" --phrases "Contoso;Jessie;Rehaan;"

Satır başına bir tümcecik içeren bir metin dosyası kullanarak tümcecik listesi de ekleyebilirsiniz.

spx recognize --microphone --phrases @phrases.txt
spx recognize --file "your\path\to\audio.wav" --phrases @phrases.txt

İzin verilen karakterler yerel ayara özgü harfler ve basamaklar, boşluk karakterleri ve +, -, $, :, (, ), {, }, _, ., ?, @, \, ', &, #, %, ^, *, ', <, , >;, / gibi özel karakterleri içerir. Diğer özel karakterler tümcecikten dahili olarak kaldırılır.

Sonraki adımlar

Tanıma doğruluğunu geliştirmek için daha fazla seçeneğe göz atın.