Diretrizes de formato para resposta a perguntas personalizadas

Reveja estas diretrizes de formatação para obter os melhores resultados para o seu conteúdo.

Considerações sobre formatação

Depois de importar um arquivo ou URL, a resposta personalizada a perguntas converte e armazena seu conteúdo no formato de marcação. O processo de conversão adiciona novas linhas no texto, como \n\n. O conhecimento do formato de marcação ajuda você a entender o conteúdo convertido e gerenciar o conteúdo do projeto.

Se você adicionar ou editar seu conteúdo diretamente em seu projeto, use a formatação de marcação para criar conteúdo rich text ou altere o conteúdo de formato de marcação que já está na resposta. A resposta personalizada a perguntas suporta grande parte do formato markdown para trazer recursos de rich text ao seu conteúdo. No entanto, o aplicativo cliente, como um bot de bate-papo, pode não suportar o mesmo conjunto de formatos de marcação. É importante testar a exibição de respostas do aplicativo cliente.

Formatação básica do documento

A resposta personalizada a perguntas identifica seções, subseções e relacionamentos no arquivo com base em pistas visuais como:

  • tamanho do tipo de letra
  • estilo da fonte
  • numeração
  • cores

Nota

Atualmente, não suportamos a extração de imagens de documentos carregados.

Manuais do produto

Um manual é normalmente um material de orientação que acompanha um produto. Ele ajuda o usuário a configurar, usar, manter e solucionar problemas do produto. Quando a resposta a perguntas personalizada processa um manual, extrai os títulos e subtítulos como perguntas e o conteúdo subsequente como respostas. Veja um exemplo aqui.

Abaixo está um exemplo de um manual com uma página de índice e conteúdo hierárquico

Product Manual example for a project

Nota

A extração funciona melhor em manuais que têm um índice e/ou uma página de índice e uma estrutura clara com cabeçalhos hierárquicos.

Brochuras, diretrizes, documentos e outros ficheiros

Muitos outros tipos de documentos também podem ser processados para gerar pares de respostas a perguntas, desde que tenham uma estrutura e um layout claros. Estes incluem: Brochuras, diretrizes, relatórios, white papers, artigos científicos, políticas, livros, etc. Veja um exemplo aqui.

Abaixo está um exemplo de um documento semi-estruturado, sem um índice:

Azure Blob storage semi-structured Doc

Suporte a documentos não estruturados

A resposta personalizada a perguntas agora suporta documentos não estruturados. Um documento que não tem seu conteúdo organizado de forma hierárquica bem definida, está faltando uma estrutura definida ou tem seu conteúdo fluindo livremente pode ser considerado como um documento não estruturado.

Abaixo está um exemplo de um documento PDF não estruturado:

Unstructured document example for a project

Nota

Os pares QnA não são extraídos na guia "Editar fontes" para fontes não estruturadas.

Importante

O suporte para arquivo/conteúdo não estruturado está disponível apenas na resposta a perguntas personalizadas.

Documento estruturado de resposta a perguntas personalizado

O formato para perguntas-respostas estruturadas em arquivos DOC, é na forma de perguntas e respostas alternadas por linha, uma pergunta por linha seguida de sua resposta na seguinte linha, como mostrado abaixo:

Question1

Answer1

Question2

Answer2

Abaixo está um exemplo de uma pergunta personalizada estruturada respondendo a um documento do Word:

Structured custom question answering document example for a project

Arquivos TXT, TSV e XLS estruturados

Respostas a perguntas personalizadas na forma de arquivos .txt, .tsv ou .xls estruturados também podem ser carregadas para respostas a perguntas personalizadas para criar ou aumentar um projeto. Estes podem ser texto simples ou podem ter conteúdo em RTF ou HTML. Os pares de respostas a perguntas têm um campo de metadados opcional que pode ser usado para agrupar pares de respostas em categorias.

Pergunta Resposta Metadados (1 chave: 1 valor)
Pergunta1 Resposta1 Key1:Value1 | Key2:Value2
Pergunta2 Resposta2 Key:Value

Todas as colunas adicionais no arquivo de origem são ignoradas.

Formato de dados estruturados através da importação

A importação de um projeto substitui o conteúdo do projeto existente. A importação requer um arquivo .tsv estruturado que contenha informações da fonte de dados. Essas informações ajudam a agrupar os pares pergunta-resposta e atribuí-los a uma fonte de dados específica. Os pares de respostas a perguntas têm um campo de metadados opcional que pode ser usado para agrupar pares de respostas em categorias. O formato de importação precisa ser semelhante ao formato da base de dados de conhecimento exportado.

Pergunta Resposta Source Metadados (1 chave: 1 valor) QnaId
Pergunta1 Resposta1 Url1 Key1:Value1 | Key2:Value2 QnaId 1
Pergunta2 Resposta2 Editorial Key:Value QnaId 2

Formatação de documentos em várias voltas

  • Use títulos e subtítulos para indicar hierarquia. Por exemplo, Você pode h1 para denotar a resposta da pergunta pai e h2 para denotar a resposta da pergunta que deve ser tomada como prompt. Use um tamanho de título pequeno para indicar a hierarquia subsequente. Não use estilo, cor ou algum outro mecanismo para implicar estrutura em seu documento, a resposta personalizada a perguntas não extrairá os prompts de várias voltas.
  • O primeiro caractere do título deve ser maiúsculo.
  • Não termine um título com um ponto de interrogação, ?.

Exemplos de documentos:
Surface Pro (docx)
Benefícios da Contoso (docx)
Benefícios da Contoso (pdf)

FAQ URLs

A resposta a perguntas personalizadas pode suportar páginas Web de FAQ de três formas diferentes:

  • Páginas simples de perguntas frequentes
  • Páginas de FAQ com links
  • Páginas de FAQ com uma Homepage de Tópicos

Páginas simples de perguntas frequentes

Este é o tipo mais comum de página de FAQ, em que as respostas seguem imediatamente as perguntas na mesma página.

Neste tipo de página de FAQ, as perguntas são agregadas e estão ligadas a respostas que estão em diferentes secções da mesma página ou em páginas diferentes.

Abaixo está um exemplo de uma página de FAQ com links em seções que estão na mesma página:

Section Link FAQ page example for a project

Este tipo de FAQ tem uma página de Tópicos onde cada tópico está ligado a um conjunto correspondente de perguntas e respostas numa página diferente. A resposta à pergunta rastreia todas as páginas vinculadas para extrair as perguntas e respostas correspondentes.

Abaixo está um exemplo de uma página de tópicos com links para seções de perguntas frequentes em páginas diferentes.

Deep link FAQ page example for a project

URLs de suporte

A resposta a perguntas personalizadas pode processar páginas da Web de suporte semiestruturadas, como artigos da Web que descreveriam como executar uma determinada tarefa, como diagnosticar e resolver um determinado problema e quais são as melhores práticas para um determinado processo. A extração funciona melhor em conteúdo que tem uma estrutura clara com cabeçalhos hierárquicos.

Nota

A extração de artigos de suporte é um recurso novo e está em estágios iniciais. Funciona melhor para páginas simples, que estão bem estruturadas e não contêm cabeçalhos/rodapés complexos.

Projeto de importação e exportação

Os arquivos TSV e XLS, de projetos exportados, só podem ser usados importando os arquivos da página Configurações no Language Studio. Eles não podem ser usados como fontes de dados durante a criação do projeto ou do recurso + Adicionar arquivo ou + Adicionar URL na página Configurações .

Quando você importa o projeto através desses arquivos TSV e XLS, os pares de perguntas e respostas são adicionados à fonte editorial e não às fontes das quais as perguntas e respostas foram extraídas no projeto exportado.

Próximos passos