Comprender cuáles son las expresiones correctas para la aplicación de LUIS

Las expresiones son datos proporcionados por el usuario que la aplicación necesita interpretar. Para entrenar a LUIS para que extraiga intenciones y entidades de ellas, es importante capturar varias expresiones de ejemplo diferentes por cada intención. El aprendizaje activo o el proceso de entrenar continuamente en nuevas expresiones es esencial para la inteligencia de aprendizaje automático que LUIS proporciona.

Recopile expresiones que crea que los usuarios pueden escribir. Incluya expresiones que significan lo mismo, pero que se construyen de maneras diferentes:

  • Longitud de expresión: corta, media o larga para la aplicación cliente
  • Longitud de la palabra y frase
  • Ubicación de las palabras: entidad al principio, en el medio o al final de una expresión
  • Gramática
  • Pluralización
  • Raíz
  • Elección del nombre y del verbo
  • Puntuación: una buena variedad con un uso correcto, incorrecto y sin gramática

Cómo elegir expresiones variadas

Cuando empiece por primera vez a agregar expresiones de ejemplo al modelo de LUIS, debe tener en cuenta algunos de los principios siguientes.

Las expresiones no siempre tienen el formato correcto

Puede ser una frase, como "Reservar un billete a París para mí" o un fragmento de una frase, como "Reservar" o "Vuelo a París". Los usuarios a menudo cometen errores ortográficos. Al planear la aplicación, tenga en cuenta si usar Bing Spell Check para revisar la ortografía de la entrada del usuario o no, antes de pasarla a LUIS.

Si no revisa la ortografía de las expresiones del usuario, debe entrenar a LUIS en expresiones que incluyan errores tipográficos y faltas de ortografía.

Utilice el lenguaje representativo del usuario

Al elegir expresiones, tenga en cuenta que lo que cree que es un término o frase común tal vez no sea correcto para el típico usuario de la aplicación cliente. Es posible que no tenga experiencia de dominio. Preste atención al utilizar términos o frases que solo las diría un experto.

Elija terminología así como frases variadas

Observará que aunque realice esfuerzos para crear patrones de frases variadas,se seguirá repitiendo algo de vocabulario.

Considere las siguientes expresiones de ejemplo:

Expresiones de ejemplo
¿Cómo puedo obtener un equipo?
¿Dónde puedo obtener un equipo?
Quiero obtener un equipo, ¿cómo lo hago?
¿Cuándo puedo tener un equipo?

En este caso, el término principal, equipo, no varía. Use alternativas como "equipo de escritorio", "portátil", "estación de trabajo" o incluso simplemente "máquina". LUIS puede deducir de forma inteligente los sinónimos a partir del contexto, pero cuando se crean expresiones para el entrenamiento, siempre es mejor variarlas.

Expresiones de ejemplo en cada intención

Cada intención debe tener expresiones de ejemplo, al menos 15. Si tiene una intención que no tiene ninguna expresión de ejemplo, no podrá entrenar a LUIS. Si dispone de una intención con una o muy pocas expresiones de ejemplo, es posible que LUIS no pueda predecirla con precisión.

Adición de grupos pequeños de 15 expresiones para cada iteración de creación

En cada iteración del modelo, no agregue una gran cantidad de expresiones. Agregue expresiones en grupos de 15. Entrene, publique y vuelva a realizar pruebas.

LUIS compila modelos efectivos con expresiones seleccionadas cuidadosamente por su autor de modelos. Agregar demasiadas expresiones no resulta útil porque genera confusión.

Es mejor empezar con pocas expresiones y, luego, revisar las expresiones del punto de conexión para que la extracción de la entidad y la predicción de intención se realicen correctamente.

Normalización de expresiones

La normalización de expresiones es el proceso de omitir los efectos de los tipos de texto, como la puntuación y las marcas diacríticas, durante el entrenamiento y la predicción.

La configuración de la normalización de expresiones está desactivada de forma predeterminada. Esta configuración incluye:

  • Formas de las palabras
  • Marcas diacríticas
  • Signos de puntuación

Si activa la configuración de normalización, las puntuaciones del panel Prueba, las pruebas por lotes y las consultas de puntos de conexión cambiarán en todas las expresiones que usen esa configuración de normalización.

Al clonar una versión en el portal de LUIS, la configuración de la versión continúa con la nueva versión clonada.

Establezca la configuración de la versión a través del portal LUIS, en la sección Administrar, en la página Configuración de la aplicación o en la Actualización de la configuración de la versión de la API. Obtenga más información sobre estos cambios de normalización en la Referencia.

Formas de las palabras

Normalizar las formas de las palabras omite las diferencias en las palabras que se expanden más allá de la raíz.

Marcas diacríticas

Los signos diacríticos son marcas o signos dentro del texto, como:

İ ı Ş Ğ ş ğ ö ü

Signos de puntuación

Normalizar la puntuación significa que antes de que los modelos se entrenen y antes de que las consultas de punto de conexión se predigan, la puntuación se quitará de las expresiones.

Los signos de puntuación son un token independiente de LUIS. Una expresión que contiene un punto final frente a una expresión que no lo tiene son dos expresiones distintas y pueden tener predicciones diferentes.

Si la puntuación no se normaliza, LUIS tiene en cuenta los signos de puntuación de forma predeterminada, ya que es posible que estos signos tengan una mayor importancia en algunas aplicaciones cliente. Asegúrese de que haya expresiones de ejemplo con y sin signos de puntuación ellos para que los dos estilos devuelvan los mismos resultados relativos.

Asegúrese de que el modelo controla los signos de puntuación, ya sea en las expresiones de ejemplo (que los tengan o no) o en los patrones, donde es más sencillo pasar por alto los signos de puntuación con la sintaxis especial: I am applying for the {Job} position[.].

Si la puntuación no tiene un significado concreto en la aplicación cliente, podría omitir la puntuación mediante la normalización de la puntuación.

Omisión de palabras y puntuación

Si quiere omitir palabras o signos de puntuación específicos en los patrones, use un patrón con la sintaxis ignore de corchetes, [].

Entrenamiento con todas las expresiones

El entrenamiento no es generalmente determinista: la predicción de expresiones podría variar ligeramente entre versiones o aplicaciones. Puede quitar el aprendizaje no determinista actualizando la API de configuración de versión con el par nombre-valor UseAllTrainingData para que así pueda utilizar todos los datos de aprendizaje.

Prueba de expresiones

Los desarrolladores deben empezar a probar su aplicación de LUIS con tráfico real mediante el envío de expresiones a la URL de punto de conexión de predicción. Estas expresiones se utilizan para mejorar el rendimiento de las intenciones y las entidades con la revisión de expresiones. Las pruebas enviadas mediante el panel de pruebas del sitio web de LUIS no se envían a través del punto de conexión y, por lo tanto, no contribuyen al aprendizaje activo.

Revisión de las expresiones

Una vez que el modelo esté entrenado, publicado y reciba consultas del punto de conexión, revise las expresiones sugeridas por LUIS. LUIS selecciona expresiones del punto de conexión que tienen puntuaciones bajas, ya sea para la intención o para la entidad.

Procedimientos recomendados

Revise los procedimientos recomendados y aplíquelos como parte del ciclo de creación regular.

Etiqueta para el significado de las palabras

Si la elección o la organización de las palabras es la misma pero no significa lo mismo, no la etiquete con la entidad.

En las siguientes expresiones inglesas, la palabra fair es un homógrafo. Es decir, se escribe igual pero tiene un significado diferente:

Expresión
What kind of county fairs are happening in the Seattle area this summer?
Is the current rating for the Seattle review fair?

Si quiere que una entidad de evento busque todos los datos de eventos, etiquete la palabra fair en la primera expresión, pero no en la segunda.

Pasos siguientes

Consulte Agregar expresiones de ejemplo para información sobre cómo entrenar una aplicación de LUIS para comprender las expresiones del usuario.