Komma igång med Anpassat nyckelord

I den här snabbstarten lär du dig grunderna i att arbeta med anpassade nyckelord, Speech Studio och Speech SDK. Ett nyckelord är ett ord eller en kort fras som gör att produkten kan röstaktiveras. Du skapar nyckelordsmodeller i Speech Studio och exporterar sedan en modellfil som du använder med Speech SDK i dina program.

Förutsättningar

Stegen i den här artikeln kräver en Speech-prenumeration och Speech SDK. Om du inte redan har en prenumeration kan du prova Speech-tjänsten utan kostnad. Information om hur du hämtar SDK:n finns i installationsguiden för din plattform.

Skapa ett nyckelord i Speech Studio

Innan du kan använda ett anpassat nyckelord måste du skapa ett nyckelord med hjälp av Anpassat nyckelordSpeech Studio. När du har anger ett nyckelord skapar den en .table fil som du kan använda med Speech SDK.

Viktigt

Anpassade nyckelordsmodeller och resulterande .table filer kan bara skapas i Speech Studio. Du kan inte skapa anpassade nyckelord från SDK eller med REST-anrop.

  1. Gå till Speech Studio logga in eller välj Skapa en prenumeration om du ännu inte har en talprenumeration.

  2. Anpassat nyckelord skapar du ett Nytt projekt.

  3. Ange ett Namn, en valfri Beskrivning och välj språket. Du behöver ett projekt per språk och supporten är för närvarande begränsad till engelska (USA) och kinesiska (mandarin, förenklad).

    Beskriv nyckelordsprojektet

  4. Välj projektet i listan.

    Välj ditt nyckelordsprojekt

  5. Om du vill skapa en ny nyckelordsmodell klickar du på Träna modell.

  6. Ange ett Namn för modellen, en valfri Beskrivning och valfritt nyckelord och klicka sedan på Nästa. Se riktlinjerna för att välja ett effektivt nyckelord.

    Ange nyckelordet

  7. Portalen skapar uttal av kandidater för ditt nyckelord. Lyssna på varje kandidat genom att klicka på uppspelningsknapparna och ta bort kontrollerna bredvid uttal som är felaktiga. När endast bra uttal har markerats klickar du på Träna för att börja generera nyckelordsmodellen.

    Skärmbild som visar var du väljer rätt pronounciations.

  8. Det kan ta upp till 30 minuter innan modellen genereras. Nyckelordslistan ändras från Bearbetning till Lyckades när modellen är klar. Du kan sedan ladda ned filen.

    Granska nyckelordet

  9. Den nedladdade filen är ett .zip arkiv. Extrahera arkivet så ser du en fil med .table tillägget . Det här är den fil som du använder med SDK i nästa avsnitt, så se till att anteckna dess sökväg. filnamnet speglar ditt nyckelordsnamn, till exempel har nyckelordet Aktivera enhet filnamnet Activate_device.table .

Använda en nyckelordsmodell med Speech SDK

Läs först in nyckelordsmodellfilen med hjälp av FromFile() den statiska funktionen, som returnerar en KeywordRecognitionModel . Använd sökvägen till filen .table som du laddade ned från Speech Studio. Dessutom skapar du en med AudioConfig hjälp av standardmifonen och skapar sedan en ny instans KeywordRecognizer med hjälp av ljudkonfigurationen.

using Microsoft.CognitiveServices.Speech;
using Microsoft.CognitiveServices.Speech.Audio;

var keywordModel = KeywordRecognitionModel.FromFile("your/path/to/Activate_device.table");
using var audioConfig = AudioConfig.FromDefaultMicrophoneInput();
using var keywordRecognizer = new KeywordRecognizer(audioConfig);

Sedan körs nyckelordsigenkänning med ett anrop till RecognizeOnceAsync() genom att skicka modellobjektet. Detta startar en session för nyckelordsigenkänning som varar tills nyckelordet identifieras. Därför använder du vanligtvis det här designmönstret i flertrådade program, eller i användningsfall där du kanske väntar på ett väckningsord på obestämd tid.

KeywordRecognitionResult result = await keywordRecognizer.RecognizeOnceAsync(keywordModel);

Anteckning

Exemplet som visas här använder lokal nyckelordsigenkänning, eftersom det inte kräver något objekt för autentiseringskontext och SpeechConfig inte kontaktar serverslutet. Du kan dock köra både nyckelordsigenkänning och verifiering med hjälp av en direkt backend-anslutning.

Kontinuerlig igenkänning

Andra klasser i Speech SDK stöder kontinuerlig igenkänning (för både tal- och avsiktsigenkänning) med nyckelordsigenkänning. På så sätt kan du använda samma kod som du normalt använder för kontinuerlig igenkänning, med möjlighet att referera till .table en fil för din nyckelordsmodell.

För tal till text följer du samma designmönster som visas i snabbstarten för att konfigurera kontinuerlig igenkänning. Ersätt sedan -anropet recognizer.StartContinuousRecognitionAsync() till med och skicka recognizer.StartKeywordRecognitionAsync(KeywordRecognitionModel) KeywordRecognitionModel -objektet. Om du vill stoppa kontinuerlig igenkänning med nyckelordsigenkänning använder du recognizer.StopKeywordRecognitionAsync() i stället för recognizer.StopContinuousRecognitionAsync() .

Avsiktsigenkänning använder ett identiskt mönster med StartKeywordRecognitionAsync StopKeywordRecognitionAsync funktionerna och .

Se exemplet på GitHub för att använda din Anpassat nyckelord modell med Python SDK.

Se exemplet på GitHub hur du använder din Anpassat nyckelord modell med Objective C SDK.

Nästa steg