Meningkatkan akurasi pengenalan dengan daftar frasa

Daftar frasa adalah daftar kata atau frasa yang disediakan sebelumnya untuk membantu meningkatkan pengenalan mereka. Menambahkan frasa ke daftar frasa meningkatkan kepentingannya, sehingga membuatnya lebih mungkin dikenali.

Untuk lokal daftar frasa yang didukung, lihat Dukungan bahasa serta suara untuk layanan Azure Cognitive Service untuk Ucapan.

Contoh frasa meliputi:

  • Nama
  • Lokasi geografis
  • Homonim
  • Kata-kata atau akronim yang unik untuk industri atau organisasi Anda

Daftar frasa sederhana dan ringan:

  • Just-in-time: Daftar frasa disediakan tepat sebelum memulai pengenalan ucapan, menghilangkan kebutuhan untuk melatih model khusus.
  • Ringan: Anda tidak memerlukan kumpulan data yang besar. Berikan kata atau frasa untuk meningkatkan pengenalannya.

Anda bisa menggunakan daftar frasa dengan Studio Azure Cognitive Service untuk Ucapan, SDK Azure Cognitive Service untuk Ucapan, atau Speech Command Line Interface (CLI). API transkripsi Batch tidak mendukung daftar frasa.

Anda dapat menggunakan daftar frasa dengan ucapan standar dan ucapan kustom. Ada beberapa situasi di mana melatih model khusus yang mencakup frasa kemungkinan merupakan pilihan terbaik untuk meningkatkan akurasi. Misalnya, dalam kasus berikut, Anda akan menggunakan ucapan kustom:

  • Jika Anda perlu menggunakan daftar besar frasa. Daftar frasa tidak boleh memiliki lebih dari 500 frasa.
  • Jika Anda memerlukan daftar frasa untuk bahasa yang saat ini tidak didukung.

Cobalah di Studio Azure Cognitive Service untuk Ucapan

Anda bisa menggunakan Studio Azure Cognitive Service untuk Ucapan untuk menguji cara daftar frasa akan membantu meningkatkan pengenalan untuk audio Anda. Untuk menerapkan daftar frasa dengan aplikasi Anda dalam produksi, Anda menggunakan Speech SDK atau Speech CLI.

Misalnya, Katakanlah Anda ingin layanan Ucapan mengenali kalimat ini: "Hai Rehaan, saya Jessie dari bank Contoso."

Anda mungkin menemukan bahwa frasa salah dikenali sebagai: "Hai semua orang, saya Jesse dari tidak dapat melakukannya bank."

Dalam skenario sebelumnya, Anda ingin menambahkan "Rehaan", "Jessie", dan "Contoso" ke daftar frasa Anda. Maka nama-nama harus dikenali dengan benar.

Sekarang coba Speech Studio untuk Ucapan untuk melihat bagaimana daftar frasa dapat meningkatkan akurasi pengenalan.

Catatan

Anda mungkin diminta untuk memilih langganan Azure dan sumber daya Ucapan Anda, lalu mengakui penagihan untuk wilayah Anda.

  1. Buka Ucapan Real-time ke teks di Speech Studio.
  2. Anda menguji pengenalan ucapan dengan mengunggah file audio atau merekam audio dengan mikrofon. Misalnya, pilih rekam audio dengan mikrofon lalu ucapkan "Hai Rehaan, saya Jessie dari bank Contoso. " Kemudian pilih tombol merah untuk berhenti merekam.
  3. Anda akan melihat hasil transkripsi dalam kotak teks Hasil pengujian. Jika "Rehaan", "Jessie", atau "Contoso" salah dikenali, Anda dapat menambahkan istilah ke daftar frasa di langkah berikutnya.
  4. Pilih Perlihatkan opsi tingkat lanjut dan aktifkan Daftar frasa.
  5. Masukkan "Contoso; Jessie; Rehaan" dalam kotak teks daftar frasa. Beberapa frasa perlu dipisahkan oleh titik koma. Screenshot of a phrase list applied in Speech Studio.
  6. Gunakan mikrofon untuk menguji pengenalan lagi. Jika tidak, Anda dapat memilih panah coba lagi di samping file audio Anda untuk menjalankan kembali audio Anda. Istilah "Rehaan", "Jessie", atau "Contoso" harus diakui.

Menerapkan daftar frasa

Dengan Speech SDK Anda dapat menambahkan frasa satu per satu dan kemudian menjalankan pengenalan ucapan.

var phraseList = PhraseListGrammar.FromRecognizer(recognizer);
phraseList.AddPhrase("Contoso");
phraseList.AddPhrase("Jessie");
phraseList.AddPhrase("Rehaan");

Dengan Speech SDK Anda dapat menambahkan frasa satu per satu dan kemudian menjalankan pengenalan ucapan.

auto phraseListGrammar = PhraseListGrammar::FromRecognizer(recognizer);
phraseListGrammar->AddPhrase("Contoso");
phraseListGrammar->AddPhrase("Jessie");
phraseListGrammar->AddPhrase("Rehaan");

Dengan Speech SDK Anda dapat menambahkan frasa satu per satu dan kemudian menjalankan pengenalan ucapan.

PhraseListGrammar phraseList = PhraseListGrammar.fromRecognizer(recognizer);
phraseList.addPhrase("Contoso");
phraseList.addPhrase("Jessie");
phraseList.addPhrase("Rehaan");

Dengan Speech SDK Anda dapat menambahkan frasa satu per satu dan kemudian menjalankan pengenalan ucapan.

const phraseList = sdk.PhraseListGrammar.fromRecognizer(recognizer);
phraseList.addPhrase("Contoso");
phraseList.addPhrase("Jessie");
phraseList.addPhrase("Rehaan");

Dengan Speech SDK Anda dapat menambahkan frasa satu per satu dan kemudian menjalankan pengenalan ucapan.

phrase_list_grammar = speechsdk.PhraseListGrammar.from_recognizer(reco)
phrase_list_grammar.addPhrase("Contoso")
phrase_list_grammar.addPhrase("Jessie")
phrase_list_grammar.addPhrase("Rehaan")

Dengan Speech CLI Anda dapat menyertakan daftar frasa in-line atau dengan file teks bersama dengan perintah recognize.

Coba pengenalan dari mikrofon atau file audio.

spx recognize --microphone --phrases "Contoso;Jessie;Rehaan;"
spx recognize --file "your\path\to\audio.wav" --phrases "Contoso;Jessie;Rehaan;"

Anda juga dapat menambahkan daftar frasa menggunakan file teks yang berisi satu frasa per baris.

spx recognize --microphone --phrases @phrases.txt
spx recognize --file "your\path\to\audio.wav" --phrases @phrases.txt

Karakter yang diizinkan termasuk huruf dan digit khusus lokal, karakter spasi kosong, dan karakter khusus seperti +, -, $, :, (, ), {, }, _, ., ?, @, \, ', &, #, %, ^, *, ', <, >, ; , / . Karakter khusus lainnya dihapus secara internal dari frasa.

Langkah berikutnya

Lihat lebih banyak opsi untuk meningkatkan akurasi pengenalan.