Directrices de formato para la respuesta a preguntas personalizada

Revise estas instrucciones de formato para obtener los mejores resultados de su contenido.

Consideraciones de formato

Después de importar un archivo o una dirección URL, la respuesta a preguntas personalizada convierte y almacena el contenido en el formato markdown. El proceso de conversión agrega nuevas líneas al texto, como \n\n. Conocer el formato de Markdown le ayuda a comprender el contenido convertido y a administrar el contenido del proyecto.

Si agrega o edita el contenido directamente en el proyecto, use el formato de Markdown para crear contenido de texto enriquecido o cambiar el contenido de dicho formato que ya está en la respuesta. La respuesta a preguntas personalizada admite gran parte del formato markdown para incorporar funcionalidades de texto enriquecido al contenido. Sin embargo, es posible que la aplicación cliente, como un bot de chat, no admita el mismo conjunto de formatos de Markdown. Es importante probar la presentación de las respuestas de la aplicación cliente.

Formato básico de documentos

La respuesta a preguntas personalizada identifica secciones y subsecciones y relaciones en el archivo en función de pistas visuales como:

  • tamaño de fuente
  • estilo de fuente
  • numeración
  • colores

Nota

Actualmente no se admite la extracción de imágenes de los documentos cargados.

Manuales de productos

Un manual suele ser material de orientación que acompaña a un producto. Ayuda al usuario a configurar, usar y mantener el producto y a solucionar problemas con el mismo. Cuando la respuesta a preguntas personalizada procesa un manual, extrae los encabezados y los subtítulos como preguntas y el contenido posterior como respuestas. Consulte un ejemplo aquí.

A continuación se muestra un ejemplo de un manual con una página de índice y contenido jerárquico

Product Manual example for a project

Nota:

La extracción funciona mejor en manuales que tienen una tabla de contenido o una página de índice y una estructura clara con títulos jerárquicos.

Folletos, instrucciones, documentos y otros archivos

También se pueden procesar muchos otros tipos de documentos para generar pares de preguntas y respuestas, siempre que tengan una estructura y un diseño claros. Entre ellas se incluyen las siguientes: folletos, instrucciones, informes, documentos técnicos, documentos científicos, directivas, libros, etc. Consulte un ejemplo aquí.

A continuación se muestra un ejemplo de documento semiestructurado, sin un índice:

Azure Blob storage semi-structured Doc

Compatibilidad con documentos no estructurados

La característica de respuesta a preguntas personalizada ahora admite documentos no estructurados. Se puede considerar que un documento que no tiene su contenido organizado de una manera jerárquica bien definida, al que le falta una estructura de conjunto o cuyo contenido fluye libremente es un documento no estructurado.

A continuación se muestra un ejemplo de un documento PDF no estructurado:

Unstructured document example for a project

Nota:

Los pares de pregunta y respuesta no se extraen en la pestaña "Editar orígenes" para orígenes no estructurados.

Importante

La compatibilidad con archivos o contenido no estructurados solo está disponible en la respuesta a preguntas personalizada.

Documento de respuesta a preguntas personalizado estructurado

El formato de respuestas a preguntas estructuradas en los archivos de documento (DOC) consiste en alternar preguntas y respuestas por línea, una pregunta por línea seguida de su respuesta en la línea siguiente, tal como se muestra a continuación:

Question1

Answer1

Question2

Answer2

A continuación se muestra un ejemplo de un documento de word de respuesta a preguntas personalizado estructurado:

Structured custom question answering document example for a project

Archivos TXT, TSV y XLS estructurados

Las respuestas a preguntas personalizadas en forma de archivos estructurados de .txt, .tsv o .xls también se pueden cargar en respuesta a preguntas personalizadas para crear o aumentar un proyecto. Pueden ser texto sin formato o pueden tener contenido en formato RTF o HTML. Los pares de preguntas y respuestas tienen un campo de metadatos opcional que se puede usar para agruparlos en categorías.

Pregunta Respuesta Metadatos (1 clave: 1 valor)
Pregunta1 Respuesta1 Key1:Value1 | Key2:Value2
Pregunta2 Respuesta2 Key:Value

Se ignoran las columnas adicionales del archivo de origen.

Formato de datos estructurado mediante importación

La importación de un proyecto reemplaza el contenido del proyecto existente. La importación requiere un archivo .tsv estructurado que contiene información del origen de datos. Esta información ayuda a agrupar los pares pregunta-respuesta y a atribuirlos a un origen de datos particular. Los pares de preguntas y respuestas tienen un campo de metadatos opcional que se puede usar para agruparlos en categorías. El formato de importación debe ser similar al formato de la base de conocimiento exportada.

Pregunta Respuesta Source Metadatos (1 clave: 1 valor) QnaId
Pregunta1 Respuesta1 URL1 Key1:Value1 | Key2:Value2 QnaId 1
Pregunta2 Respuesta2 Editorial Key:Value QnaId 2

Formato de documento de varios turnos

  • Use encabezados y subtítulos para indicar la jerarquía. Por ejemplo, puede usar h1 para indicar la respuesta a la pregunta primaria y h2 para indicar la respuesta a la pregunta que se debe tomar como solicitud. Use el tamaño de encabezado pequeño para indicar la jerarquía subsiguiente. No use el estilo, el color o algún otro mecanismo para implicar la estructura en el documento, la respuesta a preguntas personalizada no extraerá las indicaciones de varios turnos.
  • El primer carácter del encabezado debe escribirse en mayúsculas.
  • No termine un encabezado con un signo de interrogación, ?.

Documentos de muestra:
Surface Pro (docx)
Ventajas de Contoso (docx)
Ventajas de Contoso (pdf)

Preguntas más frecuentes sobre las direcciones URL

Las respuestas a preguntas personalizadas pueden admitir páginas web de preguntas más frecuentes en tres formas diferentes:

  • Páginas de preguntas más frecuentes sin formato
  • Páginas de preguntas más frecuentes con vínculos
  • Páginas de preguntas más frecuentes con una página principal de temas

Páginas de preguntas más frecuentes sin formato

Este es el tipo más común de página de preguntas más frecuentes, en la que las respuestas siguen inmediatamente las preguntas de la misma página.

En este tipo de página de preguntas más frecuentes, las preguntas se agregan juntas y se vinculan a respuestas que están en secciones diferentes de la misma página o en páginas distintas.

A continuación se muestra un ejemplo de una página de preguntas más frecuentes con vínculos en las secciones que se encuentran en la misma página:

Section Link FAQ page example for a project

Este tipo de preguntas más frecuentes tiene una página de temas en la que cada tema se vincula a un conjunto de preguntas y respuestas correspondiente en una página diferente. Respuesta a preguntas rastrea todas las páginas vinculadas para extraer las preguntas y respuestas correspondientes.

A continuación, se muestra un ejemplo de una página de temas con vínculos a secciones de preguntas más frecuentes en páginas distintas.

Deep link FAQ page example for a project

Direcciones URL de soporte técnico

La respuesta a preguntas personalizada puede procesar páginas web de soporte semiestructuradas, como artículos web que describirían cómo realizar una tarea determinada, cómo diagnosticar y resolver un problema determinado y cuáles son los procedimientos recomendados para un proceso determinado. La extracción funciona mejor en contenido con una estructura clara y con encabezados jerárquicos.

Nota

La extracción para artículos de soporte técnico es una característica nueva que se encuentra en sus primeras etapas. Funciona mejor con páginas simples, que están bien estructuradas y no contienen encabezados ni pies de página complejos.

Importación y exportación del proyecto

Los archivos TSV y XLS de los proyectos exportados solo se pueden usar mediante la importación de los archivos de la página Configuración en Language Studio. No se pueden usar como orígenes de datos durante la creación del proyecto ni desde las características + Agregar archivo o + Agregar URL de la página Configuración.

Al importar el proyecto mediante estos archivos TSV y XLS, los pares de preguntas y respuestas se agregan al origen editorial y no a los orígenes de los que se extrajeron estos pares en el proyecto exportado.

Pasos siguientes