Diretrizes de formato para documentos e URLs importados

Reveja estas diretrizes de formatação para obter os melhores resultados para o seu conteúdo.

Considerações sobre formatação

Depois de importar um arquivo ou URL, o QnA Maker converte e armazena seu conteúdo no formato markdown. O processo de conversão adiciona novas linhas no texto, como \n\n. O conhecimento do formato de marcação ajuda você a entender o conteúdo convertido e gerenciar o conteúdo da base de conhecimento.

Se você adicionar ou editar seu conteúdo diretamente em sua base de dados de conhecimento, use a formatação de marcação para criar conteúdo rich text ou altere o conteúdo de formato de marcação que já está na resposta. O QnA Maker suporta grande parte do formato markdown para trazer recursos de rich text ao seu conteúdo. No entanto, o aplicativo cliente, como um bot de bate-papo, pode não suportar o mesmo conjunto de formatos de marcação. É importante testar a exibição de respostas do aplicativo cliente.

Veja uma lista completa de tipos de conteúdo e exemplos.

Formatação básica do documento

O QnA Maker identifica seções, subseções e relacionamentos no arquivo com base em pistas visuais como:

  • tamanho do tipo de letra
  • estilo da fonte
  • numeração
  • cores

Nota

Atualmente, não suportamos a extração de imagens de documentos carregados.

Manuais do produto

Um manual é normalmente um material de orientação que acompanha um produto. Ele ajuda o usuário a configurar, usar, manter e solucionar problemas do produto. Quando o QnA Maker processa um manual, ele extrai os títulos e subtítulos como perguntas e o conteúdo subsequente como respostas. Veja um exemplo aqui.

Abaixo está um exemplo de um manual com uma página de índice e conteúdo hierárquico

Product Manual example for a knowledge base

Nota

A extração funciona melhor em manuais que têm um índice e/ou uma página de índice e uma estrutura clara com cabeçalhos hierárquicos.

Brochuras, diretrizes, documentos e outros ficheiros

Muitos outros tipos de documentos também podem ser processados para gerar pares de GQ, desde que tenham uma estrutura e layout claros. Estes incluem: Brochuras, diretrizes, relatórios, white papers, artigos científicos, políticas, livros, etc. Veja um exemplo aqui.

Abaixo está um exemplo de um documento semi-estruturado, sem um índice:

Azure Blob storage semi-structured Doc

Suporte a documentos não estruturados

A resposta personalizada a perguntas agora suporta documentos não estruturados. Um documento que não tem o seu conteúdo organizado de forma hierárquica bem definida, que não tem uma estrutura definida ou que tem o seu conteúdo a fluir livremente pode ser considerado como um documento não estruturado.

Abaixo está um exemplo de um documento PDF não estruturado:

Unstructured document example for a knowledge base

Atualmente, esta funcionalidade está disponível apenas através do upload de documentos e apenas para os formatos de ficheiro PDF e DOC.

Importante

O suporte para ficheiros/conteúdos não estruturados só está disponível na resposta a perguntas.

Documento QnA estruturado

O formato para Perguntas-Respostas estruturadas em arquivos DOC, é na forma de Perguntas e Respostas alternadas por linha, uma pergunta por linha seguida de sua resposta na seguinte linha, como mostrado abaixo:

Question1

Answer1

Question2

Answer2

Abaixo está um exemplo de um documento de palavra QnA estruturado:

Structured QnA document example for a knowledge base

Arquivos TXT, TSV e XLS estruturados

QnAs na forma de .txt estruturado, .tsv ou arquivos .xls também podem ser carregados no QnA Maker para criar ou aumentar uma base de conhecimento. Estes podem ser texto simples ou podem ter conteúdo em RTF ou HTML. Os pares QnA têm um campo de metadados opcional que pode ser usado para agrupar pares QnA em categorias.

Pergunta Resposta Metadados (1 chave: 1 valor)
Pergunta1 Resposta1 Key1:Value1 | Key2:Value2
Pergunta2 Resposta2 Key:Value

Todas as colunas adicionais no arquivo de origem são ignoradas.

Exemplo de arquivo Excel estruturado

Abaixo está um exemplo de um arquivo de .xls QnA estruturado, com conteúdo HTML:

Structured QnA excel example for a knowledge base

Exemplo de perguntas alternativas para resposta única no arquivo Excel

Abaixo está um exemplo de um arquivo de .xls QnA estruturado, com várias perguntas alternativas para uma única resposta:

Example of alternate questions for single answer in Excel file

Depois que o arquivo é importado, o par de perguntas e respostas está na base de dados de conhecimento, conforme mostrado abaixo:

Screenshot of alternate questions for single answer imported into knowledge base

Formato de dados estruturados através da importação

A importação de uma base de dados de conhecimento substitui o conteúdo da base de dados de conhecimento existente. A importação requer um arquivo .tsv estruturado que contenha informações da fonte de dados. Essas informações ajudam o QnA Maker a agrupar os pares pergunta-resposta e atribuí-los a uma fonte de dados específica. Os pares QnA têm um campo de metadados opcional que pode ser usado para agrupar pares QnA em categorias.

Pergunta Resposta Source Metadados (1 chave: 1 valor)
Pergunta1 Resposta1 Url1 Key1:Value1 | Key2:Value2
Pergunta2 Resposta2 Editorial Key:Value

Formatação de documentos em várias voltas

  • Use títulos e subtítulos para indicar hierarquia. Por exemplo: Você pode h1 para denotar o QnA pai e h2 para denotar o QnA que deve ser tomado como prompt. Use um tamanho de título pequeno para indicar a hierarquia subsequente. Não use estilo, cor ou algum outro mecanismo para implicar estrutura em seu documento, o QnA Maker não extrairá os prompts de várias voltas.
  • O primeiro caractere do título deve ser maiúsculo.
  • Não termine um título com um ponto de interrogação, ?.

Exemplos de documentos:
Surface Pro (docx)
Benefícios da Contoso (docx)
Benefícios da Contoso (pdf)

FAQ URLs

O QnA Maker pode suportar páginas web de FAQ em 3 formas diferentes:

  • Páginas simples de perguntas frequentes
  • Páginas de FAQ com links
  • Páginas de FAQ com uma Homepage de Tópicos

Páginas simples de perguntas frequentes

Este é o tipo mais comum de página de FAQ, em que as respostas seguem imediatamente as perguntas na mesma página.

Abaixo está um exemplo de uma página de FAQ simples:

Plain FAQ page example for a knowledge base

Neste tipo de página de FAQ, as perguntas são agregadas e estão ligadas a respostas que estão em diferentes secções da mesma página ou em páginas diferentes.

Abaixo está um exemplo de uma página de FAQ com links em seções que estão na mesma página:

Section Link FAQ page example for a knowledge base

Este tipo de FAQ tem uma página de Tópicos onde cada tópico está ligado a um conjunto correspondente de perguntas e respostas numa página diferente. O QnA Maker rastreia todas as páginas vinculadas para extrair as perguntas e respostas correspondentes.

Abaixo está um exemplo de uma página de tópicos com links para seções de perguntas frequentes em páginas diferentes.

Deep link FAQ page example for a knowledge base

URLs de suporte

O QnA Maker pode processar páginas da Web de suporte semiestruturadas, como artigos da Web que descreveriam como executar uma determinada tarefa, como diagnosticar e resolver um determinado problema e quais são as melhores práticas para um determinado processo. A extração funciona melhor em conteúdo que tem uma estrutura clara com cabeçalhos hierárquicos.

Nota

A extração de artigos de suporte é um recurso novo e está em estágios iniciais. Funciona melhor para páginas simples, que estão bem estruturadas e não contêm cabeçalhos/rodapés complexos.

QnA Maker supports extraction from semi-structured web pages where a clear structure is presented with hierarchical headings

Base de conhecimento de importação e exportação

Os arquivos TSV e XLS, de bases de dados de conhecimento exportadas, só podem ser usados importando os arquivos da página Configurações no portal do QnA Maker. Eles não podem ser usados como fontes de dados durante a criação da base de dados de conhecimento ou do recurso + Adicionar arquivo ou + Adicionar URL na página Configurações .

Quando você importa a Base de Dados de Conhecimento por meio desses arquivos TSV e XLS, os pares QnA são adicionados à fonte editorial e não às fontes das quais os QnAs foram extraídos na Base de Dados de Conhecimento exportada.

Próximos passos

Veja uma lista completa de tipos de conteúdo e exemplos