Förbättra igenkänningsnoggrannheten med fraslistan

En fraslista är en lista över ord eller fraser som tillhandahålls i förväg för att förbättra deras igenkänning. Att lägga till en fras i en fraslista ökar dess betydelse, vilket gör den mer sannolikt att identifieras.

Språk och röststöd för Speech-tjänsten finns i Språk och röststöd för fraslistan som stöds.

Exempel på fraser är:

  • Namn
  • Geografiska platser
  • Homonymer
  • Ord eller förkortningar som är unika för din bransch eller organisation

Fraslistor är enkla och enkla:

  • Just-in-time: En fraslista tillhandahålls precis innan taligenkänningen startas, vilket eliminerar behovet av att träna en anpassad modell.
  • Lättvikt: Du behöver ingen stor datamängd. Ange ett ord eller en fras för att öka dess igenkänning.

Du kan använda fraslistor med Speech Studio, Speech SDK eller Speech Command Line Interface (CLI). Batch-transkriptions-API:et stöder inte fraslistor.

Du kan använda fraslistor med både standard- och anpassat tal. Det finns vissa situationer där träning av en anpassad modell som innehåller fraser sannolikt är det bästa alternativet för att förbättra noggrannheten. I följande fall använder du till exempel anpassat tal:

  • Om du behöver använda en stor lista med fraser. En fraslista får inte innehålla fler än 500 fraser.
  • Om du behöver en fraslista för språk som för närvarande inte stöds.

Prova i Speech Studio

Du kan använda Speech Studio för att testa hur fraslistan skulle bidra till att förbättra igenkänningen för ditt ljud. Om du vill implementera en fraslista med ditt program i produktion använder du Speech SDK eller Speech CLI.

Anta till exempel att du vill att speechtjänsten ska känna igen den här meningen: "Hej Rehaan, jag är Jessie från Contoso bank."

Du kanske upptäcker att en fras felaktigt känns igen som: "Hej alla, jag är Jesse från kan inte göra det bank."

I föregående scenario skulle du vilja lägga till "Rehaan", "Jessie" och "Contoso" i din fraslista. Sedan bör namnen identifieras korrekt.

Prova nu Speech Studio för att se hur fraslistan kan förbättra igenkänningsprecisionen.

Kommentar

Du kan uppmanas att välja din Azure-prenumeration och Speech-resurs och sedan bekräfta faktureringen för din region.

  1. Gå till Tal i realtid till text i Speech Studio.
  2. Du testar taligenkänning genom att ladda upp en ljudfil eller spela in ljud med en mikrofon. Välj till exempel spela in ljud med en mikrofon och säg sedan "Hej Rehaan, jag är Jessie från Contoso bank. " Välj sedan den röda knappen för att stoppa inspelningen.
  3. Du bör se transkriptionsresultatet i textrutan Testresultat . Om "Rehaan", "Jessie" eller "Contoso" identifierades felaktigt kan du lägga till termerna i en fraslista i nästa steg.
  4. Välj Visa avancerade alternativ och aktivera fraslista.
  5. Ange "Contoso; Jessie; Rehaan" i textrutan i fraslistan. Flera fraser måste avgränsas med ett semikolon. Screenshot of a phrase list applied in Speech Studio.
  6. Använd mikrofonen för att testa igenkänningen igen. Annars kan du välja återförsökspilen bredvid ljudfilen för att köra ljudet igen. Termerna "Rehaan", "Jessie" eller "Contoso" ska kännas igen.

Implementera fraslista

Med Speech SDK kan du lägga till fraser individuellt och sedan köra taligenkänning.

var phraseList = PhraseListGrammar.FromRecognizer(recognizer);
phraseList.AddPhrase("Contoso");
phraseList.AddPhrase("Jessie");
phraseList.AddPhrase("Rehaan");

Med Speech SDK kan du lägga till fraser individuellt och sedan köra taligenkänning.

auto phraseListGrammar = PhraseListGrammar::FromRecognizer(recognizer);
phraseListGrammar->AddPhrase("Contoso");
phraseListGrammar->AddPhrase("Jessie");
phraseListGrammar->AddPhrase("Rehaan");

Med Speech SDK kan du lägga till fraser individuellt och sedan köra taligenkänning.

PhraseListGrammar phraseList = PhraseListGrammar.fromRecognizer(recognizer);
phraseList.addPhrase("Contoso");
phraseList.addPhrase("Jessie");
phraseList.addPhrase("Rehaan");

Med Speech SDK kan du lägga till fraser individuellt och sedan köra taligenkänning.

const phraseList = sdk.PhraseListGrammar.fromRecognizer(recognizer);
phraseList.addPhrase("Contoso");
phraseList.addPhrase("Jessie");
phraseList.addPhrase("Rehaan");

Med Speech SDK kan du lägga till fraser individuellt och sedan köra taligenkänning.

phrase_list_grammar = speechsdk.PhraseListGrammar.from_recognizer(reco)
phrase_list_grammar.addPhrase("Contoso")
phrase_list_grammar.addPhrase("Jessie")
phrase_list_grammar.addPhrase("Rehaan")

Med Speech CLI kan du inkludera en fraslista i rad eller med en textfil tillsammans med kommandot recognize.

Prova att känna igen från en mikrofon eller en ljudfil.

spx recognize --microphone --phrases "Contoso;Jessie;Rehaan;"
spx recognize --file "your\path\to\audio.wav" --phrases "Contoso;Jessie;Rehaan;"

Du kan också lägga till en fraslista med hjälp av en textfil som innehåller en fras per rad.

spx recognize --microphone --phrases @phrases.txt
spx recognize --file "your\path\to\audio.wav" --phrases @phrases.txt

Tillåtna tecken inkluderar språkspecifika bokstäver och siffror, blankstegstecken och specialtecken som +, -, $, :, (, ), {, }, _, ., ?, @, \, ', &, #, %, ^, *, ', <, , >;, /. Andra specialtecken tas bort internt från frasen.

Nästa steg

Kolla in fler alternativ för att förbättra igenkänningsprecisionen.