Introducción a Palabra clave personalizadaGet started with Custom Keyword

En este inicio rápido, aprenderá los conceptos básicos de trabajar con palabras clave personalizadas mediante Speech Studio y el SDK de voz.In this quickstart, you learn the basics of working with custom keywords, using Speech Studio and the Speech SDK. Una palabra clave es una palabra o frase corta que permite activar por voz el producto.A keyword is a word or short phrase which allows your product to be voice activated. Se crean modelos de palabras clave en Speech Studio y, a continuación, se exporta un archivo de modelo que se usará con el SDK de Voz en sus aplicaciones.You create keyword models in Speech Studio, then you export a model file that you use with the Speech SDK in your applications.

Requisitos previosPrerequisites

Los pasos descritos en este artículo requieren una suscripción a Voz y el SDK de Voz.The steps in this article require a Speech subscription, and the Speech SDK. Si no dispone ya de una suscripción, pruebe el servicio de voz de forma gratuita.If you don't already have a subscription, try the Speech service for free. Para obtener el SDK, consulte la guía de instalación para su plataforma.To get the SDK, see the install guide for your platform.

Creación de una palabra clave en Speech StudioCreate a keyword in Speech Studio

Antes de que pueda usar una palabra clave personalizada, deberá crear una palabra clave con la página Custom Keyword (Palabra clave personalizada) en Speech Studio.Before you can use a custom keyword, you need to create a keyword using the Custom Keyword page on Speech Studio. Después de proporcionar una palabra clave, se genera un archivo .table que puede usar con el SDK de Voz.After you provide a keyword, it produces a .table file that you can use with the Speech SDK.

Importante

Los modelos de palabra clave personalizada y los archivos .table resultantes solo pueden crearse en Speech Studio.Custom keyword models, and the resulting .table files, can only be created in Speech Studio. No se pueden crear palabras clave personalizadas a partir del SDK o mediante llamadas REST.You cannot create custom keywords from the SDK or with REST calls.

  1. Vaya a Speech Studio e inicie sesión o, si todavía no tiene una suscripción a Voz, elija Crear una suscripción.Go to the Speech Studio and Sign in or, if you do not yet have a speech subscription, choose Create a subscription.

  2. En la página Custom Keyword (Palabra clave personalizada), cree un Nuevo proyecto.At the Custom Keyword page, create a New project.

  3. Escriba un Nombre , una Descripción opcional y seleccione el idioma.Enter a Name , an optional Description , and select the language. Necesita un proyecto por idioma, y la compatibilidad está limitada actualmente al idioma en-US.You need one project per language, and support is currently limited to the en-US language.

    Descripción del proyecto de palabra clave

  4. Seleccione el proyecto de la lista.Select your project from the list.

    Selección del proyecto de palabra clave

  5. Para crear un nuevo modelo de palabra clave, haga clic en Entrenar modelo.To create a new keyword model, click Train model.

  6. Escriba un Nombre para el modelo, una Descripción opcional y la Palabra clave de su elección y después haga clic en Siguiente.Enter a Name for the model, an optional Description , and the Keyword of your choice, then click Next. Consulte las directrices sobre cómo elegir una palabra clave eficaz.See the guidelines on choosing an effective keyword.

    Escriba su palabra clave

  7. El portal creará pronunciaciones candidatas para la palabra clave.The portal creates candidate pronunciations for your keyword. Para escuchar a cada candidato, haga clic en los botones de reproducción y desactive las pronunciaciones que sean incorrectas.Listen to each candidate by clicking the play buttons and remove the checks next to any pronunciations that are incorrect. Una vez que solo las pronunciaciones correctas estén marcadas como activas, haga clic en Entrenar para empezar a generar el modelo de palabra clave.Once only good pronunciations are checked, click Train to begin generating the keyword model.

    Captura de pantalla que muestra dónde se eligen las pronunciaciones correctas.

  8. El modelo puede tardar hasta treinta minutos en generarse.It may take up to thirty minutes for the model to be generated. La lista de palabras clave cambiará de Procesando a Correcto cuando el modelo esté completo.The keyword list will change from Processing to Succeeded when the model is complete. Luego puede descargar el archivo.You can then download the file.

    Revisión de la palabra clave

  9. El archivo descargado es un archivo .zip.The downloaded file is a .zip archive. Extraiga el archivo y verá un archivo con la extensión .table.Extract the archive, and you see a file with the .table extension. Este es el archivo que usará con el SDK en la sección siguiente, por lo que debe asegurarse de anotar la ruta de acceso.This is the file you use with the SDK in the next section, so make sure to note its path. El nombre del archivo refleja el nombre de la palabra clave; por ejemplo, la palabra clave Activate device (activa el dispositivo) tiene el nombre de archivo Activate_device.table.the file name mirrors your keyword name, for example a keyword Activate device has the file name Activate_device.table.

Uso de un modelo de palabras clave con el SDKUse a keyword model with the SDK

En primer lugar, cargue el archivo del modelo de palabra clave mediante la función estática FromFile(), que devuelve un KeywordRecognitionModel.First, load your keyword model file using the FromFile() static function, which returns a KeywordRecognitionModel. Use la ruta de acceso al archivo .table que descargó de Speech Studio.Use the path to the .table file you downloaded from Speech Studio. Además, debe crear una configuración AudioConfig con el micrófono predeterminado y, a continuación, cree una instancia nueva de KeywordRecognizer mediante la configuración de audio.Additionally, you create an AudioConfig using the default microphone, then instantiate a new KeywordRecognizer using the audio configuration.

using Microsoft.CognitiveServices.Speech;
using Microsoft.CognitiveServices.Speech.Audio;

var keywordModel = KeywordRecognitionModel.FromFile("your/path/to/Activate_device.table");
using var audioConfig = AudioConfig.FromDefaultMicrophoneInput();
using var keywordRecognizer = new KeywordRecognizer(audioConfig);

A continuación, se ejecuta el reconocimiento de palabras clave mediante una llamada a RecognizeOnceAsync() en la que se pasa el objeto de modelo.Next, running keyword recognition is done with one call to RecognizeOnceAsync() by passing your model object. De este modo, se inicia una sesión de reconocimiento de palabras clave que continúa hasta que se reconoce la palabra clave.This starts a keyword recognition session that lasts until the keyword is recognized. Por lo tanto, normalmente se usa este modelo de diseño en aplicaciones multiproceso o en casos de uso en los que puede esperar una palabra de activación indefinidamente.Thus, you generally use this design pattern in multi-threaded applications, or in use cases where you may be waiting for a wake-word indefinitely.

KeywordRecognitionResult result = await keywordRecognizer.RecognizeOnceAsync(keywordModel);

Nota

El ejemplo que se muestra aquí usa el reconocimiento de palabras clave local, ya que no requiere un objeto SpeechConfig para el contexto de autenticación y no se comunica con el servidor back-end.The example shown here uses local keyword recognition, since it does not require a SpeechConfig object for authentication context, and does not contact the back-end. Sin embargo, puede ejecutar el reconocimiento de palabras clave y la comprobación mediante una conexión continua con el servidor back-end.However, you can run both keyword recognition and verification utilizing a continuous back-end connection.

Consulte el ejemplo en GitHub para usar el modelo de palabra clave personalizado con el SDK de Python.See the sample on GitHub for using your Custom Keyword model with the Python SDK.

Consulte el ejemplo de GitHub para usar el modelo de palabra clave personalizada con el SDK de Objective C.See the sample on GitHub for using your Custom Keyword model with the Objective C SDK.

Pasos siguientesNext steps

Pruebe la palabra clave personalizada con la guía de inicio rápido del SDK de dispositivos de Voz.Test your custom keyword with the Speech Devices SDK Quickstart.