Grabaciones de voz

Importante

LUIS se retirará el 1 de octubre de 2025. Además, a partir del 1 de abril de 2023, ya no se podrán crear recursos de este servicio. Se recomienda migrar las aplicaciones de LUIS al reconocimiento del lenguaje conversacional para aprovechar el soporte continuo del producto y las capacidades multilingües.

Las expresiones son datos que proporcionan los usuarios y que la aplicación tiene que interpretar. Para entrenar a LUIS para que extraiga intenciones y entidades estos datos, es importante capturar varias expresiones de ejemplo diferentes por cada intención. El aprendizaje activo o el proceso de continuar entrenando expresiones nuevas es esencial para la inteligencia de aprendizaje automático que proporciona LUIS.

Recopile expresiones que crea que los usuarios pueden escribir. Incluya expresiones que signifiquen lo mismo, pero que se construyen de maneras diferentes:

  • Longitud de expresión: corta, media o larga para la aplicación cliente
  • Longitud de la palabra y frase
  • Ubicación de las palabras: entidad al principio, en el medio o al final de una expresión
  • Gramática
  • Pluralización
  • Raíz
  • Elección del nombre y del verbo
  • Puntuación, con gramática tanto correcta como incorrecta

Elección de expresiones variadas

Cuando empiece a agregar expresiones de ejemplo al modelo de LUIS, hay varios principios que debe tener en cuenta:

Las expresiones no siempre tienen el formato correcto

Es posible que la aplicación tenga que procesar oraciones, como "Reservar un billete a París para mí", o frases, como "Reservar" o "Vuelo a París". Los usuarios a menudo cometen errores ortográficos. Al planear la aplicación, tenga en cuenta si quiere usar Bing Spell Check para revisar la ortografía de la entrada del usuario o no, antes de pasarla a LUIS.

Si no revisa la ortografía de las expresiones del usuario, debe entrenar a LUIS en expresiones que incluyan errores tipográficos y faltas de ortografía.

Utilice el lenguaje representativo del usuario

Al elegir expresiones, tenga en cuenta que lo que cree que son términos o frases comunes tal vez no sean correctos para el típico usuario de la aplicación cliente. Es posible que no tengan experiencia en ese campo o que se use una terminología diferente. Preste atención al utilizar términos o frases que solo las diría un experto.

Elección de terminología y estilos variados

Observará que aunque realice esfuerzos para crear patrones de frases variadas,se seguirá repitiendo algo de vocabulario. Por ejemplo, las siguientes expresiones tienen un significado similar, pero terminología y estilos diferentes:

  • "¿Cómo puedo obtener un equipo?"
  • "¿Dónde puedo obtener un equipo?"
  • "Quiero obtener un equipo, ¿cómo lo hago?"
  • "¿Cuándo puedo tener un equipo?"

En este caso, el término principal, equipo, no varía. Use alternativas como "equipo de escritorio", "portátil", "estación de trabajo" o incluso simplemente "máquina". LUIS puede deducir de forma inteligente los sinónimos a partir del contexto, pero cuando se crean expresiones para el entrenamiento, siempre es mejor variarlas.

Expresiones de ejemplo en cada intención

Cada intención debe tener expresiones de ejemplo, al menos 15. Si tiene una intención que no tiene ninguna expresión de ejemplo, no podrá entrenar a LUIS. Si dispone de una intención con una o pocas expresiones de ejemplo, es posible que LUIS no pueda predecirla con precisión.

Adición de pequeños grupos de expresiones

Cada vez que itera el modelo para mejorarlo, no agregue grandes cantidades de expresiones. Agregue de a unas 15 expresiones. Luego entrene, publique y vuelva a probar.

LUIS compila modelos efectivos con expresiones seleccionadas cuidadosamente por su autor de modelos. Agregar demasiadas expresiones no resulta útil porque genera confusión.

Es mejor empezar con pocas expresiones y, luego, revisar las expresiones del punto de conexión para que la extracción de la entidad y la predicción de la intención se realicen correctamente.

Normalización de expresiones

La normalización de expresiones es el proceso de omitir los efectos de los tipos de texto, como la puntuación y las marcas diacríticas, durante el entrenamiento y la predicción.

La configuración de la normalización de expresiones está desactivada de manera predeterminada. Esta configuración incluye:

  • Formas de las palabras
  • Marcas diacríticas
  • Signos de puntuación

Si activa la configuración de normalización, las puntuaciones del panel Prueba, las pruebas por lotes y las consultas de puntos de conexión cambiarán en todas las expresiones que usen esa configuración de normalización.

Al clonar una versión en el portal de LUIS, la configuración de la versión se mantiene con la nueva versión clonada.

Para establecer la configuración de la versión de la aplicación mediante el portal de LUIS, seleccione Administrar en el menú de navegación superior, en la página Configuración de la aplicación. También puede usar la API de actualización de la configuración de la versión. Consulte la documentación de referencia para obtener más información.

Formas de las palabras

Normalizar las formas de las palabras omite las diferencias en las palabras que se expanden más allá de la raíz.

Marcas diacríticas

Los signos diacríticos son marcas o signos dentro del texto, como:

İ ı Ş Ğ ş ğ ö ü

Signos de puntuación

Normalizar la puntuación significa que antes de que los modelos se entrenen y antes de que las consultas de punto de conexión se predigan, la puntuación se quitará de las expresiones.

Los signos de puntuación son un token independiente de LUIS. Una expresión que contiene un punto final es una expresión distinta de otra que no tenga un punto final, y podría tener dos predicciones diferentes.

Si la puntuación no se normaliza, LUIS tiene en cuenta los signos de puntuación de manera predeterminada, ya que es posible que estos signos tengan una mayor importancia en algunas aplicaciones cliente. Asegúrese de incluir expresiones de ejemplo que usen signos de puntuación y otras que no, para que ambos estilos devuelvan las mismas puntuaciones relativas.

Asegúrese de que el modelo controle los signos de puntuación, ya sea en las expresiones de ejemplo (así tengan signos de puntuación o no) o en los patrones, donde es más sencillo pasar por alto los signos de puntuación. Por ejemplo: Me postulo para el puesto {Job}[.]

Si la puntuación no tiene un significado concreto en la aplicación cliente, podría omitir la puntuación mediante la normalización de la puntuación.

Omisión de palabras y puntuación

Si quiere omitir palabras o signos de puntuación específicos en los patrones, use un patrón con la sintaxis ignore de corchetes, [].

Entrenamiento con todas las expresiones

En general, el entrenamiento no es determinista: la predicción de expresiones puede variar ligeramente entre versiones o aplicaciones. Puede quitar el aprendizaje no determinista actualizando la API de configuración de versión con el par nombre-valor UseAllTrainingData para que así pueda utilizar todos los datos de entrenamiento.

Prueba de expresiones

Los desarrolladores deben empezar a probar su aplicación de LUIS con datos reales mediante el envío de expresiones a la URL del punto de conexión de predicción. Estas expresiones se utilizan para mejorar el rendimiento de las intenciones y las entidades con la revisión de expresiones. Las pruebas enviadas mediante el panel de pruebas del portal de LUIS no se envían a través del punto de conexión y no contribuyen al aprendizaje activo.

Revisión de las expresiones

Una vez que el modelo esté entrenado, publicado y reciba consultas del punto de conexión, revise las expresiones sugeridas por LUIS. LUIS selecciona expresiones del punto de conexión que tienen puntuaciones bajas, ya sea para la intención o para la entidad.

Procedimientos recomendados

Etiqueta para el significado de las palabras

Si la elección o la organización de las palabras es la misma pero no significa lo mismo, no la etiquete con la entidad.

En las siguientes expresiones, la palabra "cerca" es un homógrafo, lo que significa que se escribe igual, pero tiene un significado diferente:

  • "¿Qué tipo de ferias locales se producen cerca de Seattle este verano?"
  • "¿Dónde puedo encontrar una casa de 2 plantas y cerca alrededor?"

Si quiere que una entidad de evento busque todos los datos de eventos, etiquete la palabra "cerca" en la primera expresión, pero no en la segunda.

No ignore las posibles variaciones de expresiones

LUIS espera variaciones en las expresiones de una intención. Las expresiones pueden variar y conservar el mismo significado general. Las variaciones pueden incluir la longitud de la expresión, así como la elección y ubicación de las palabras.

No usar el mismo formato Usar formatos variados
Comprar un billete a Seattle Comprar 1 billete a Seattle
Comprar un billete a París Reservar dos asientos en el vuelo nocturno a París el próximo lunes
Comprar un billete a Orlando Quiero adquirir 3 billetes a Orlando para las vacaciones de primavera

El la segunda columna se usan otros verbos (comprar, reservar y adquirir), otras cantidades (1, "dos" y 3), y otras colocaciones de las palabras, pero todas tienen la misma intención de comprar billetes de avión para viajar.

No agregar demasiadas expresiones de ejemplo a las intenciones

Una vez publicada la aplicación, agregue solo expresiones de aprendizaje activo en el proceso de ciclo de vida del desarrollo. Si las expresiones son demasiado similares, agregue un patrón.

Pasos siguientes