Recursos do Azure para o QnA Maker

O QnA Maker usa várias fontes do Azure, cada uma com uma finalidade diferente. Entender como eles são usados individualmente permite que você planeje e selecione o nível de preço correto ou saiba quando alterar seu nível de preço. Entender como eles são usados em combinação permite que você encontre e corrija problemas quando eles ocorrem.

Nota

O serviço QnA Maker será desativado no dia 31 de março de 2025. Uma versão mais recente do recurso de perguntas e respostas agora está disponível como parte da Linguagem de IA do Azure. Para obter os recursos de resposta a perguntas no Serviço Linguístico, consulte Resposta a perguntas. A partir de 1º de outubro de 2022, você não poderá criar novos recursos do QnA Maker. Para obter informações sobre como migrar bases de conhecimento existentes do QnA Maker para responder a perguntas, consulte o guia de migração.

Planeamento de recursos

Quando você desenvolve pela primeira vez uma base de conhecimento do QnA Maker, na fase de protótipo, é comum ter um único recurso do QnA Maker para testes e produção.

Ao passar para a fase de desenvolvimento do projeto, você deve considerar:

  • Quantas línguas terá o seu sistema de base de conhecimento?
  • Em quantas regiões você precisa que sua base de conhecimento esteja disponível?
  • Quantos documentos em cada domínio o seu sistema irá conter?

Planeje ter um único recurso do QnA Maker contendo todas as bases de conhecimento que tenham o mesmo idioma, a mesma região e a mesma combinação de domínio de assunto.

Considerações sobre os escalões de preços

Normalmente, há três parâmetros que você precisa considerar:

  • A taxa de transferência que você precisa do serviço:

    • Selecione o Plano de Aplicação adequado para o seu Serviço de Aplicação com base nas suas necessidades. Você pode aumentar ou diminuir a escala do aplicativo.
    • Isso também deve influenciar sua seleção de SKU da Pesquisa Cognitiva do Azure, veja mais detalhes aqui. Além disso, pode ser necessário ajustar a capacidade de Pesquisa Cognitiva com réplicas.
  • Tamanho e número de bases de dados de conhecimento: escolha a SKU de pesquisa do Azure apropriada para seu cenário. Normalmente, você decide o número de bases de conhecimento necessárias com base no número de domínios de assunto diferentes. Uma vez que o domínio do assunto (para um único idioma) deve estar em uma base de conhecimento.

Seu recurso de serviço do Azure Search deve ter sido criado após janeiro de 2019 e não pode estar na camada gratuita (compartilhada). Não há suporte para configurar chaves gerenciadas pelo cliente no portal do Azure.

Importante

Você pode publicar bases de conhecimento N-1 em uma camada específica, onde N é o índice máximo permitido na camada. Verifique também o tamanho máximo e o número de documentos permitidos por camada.

Por exemplo, se sua camada tiver 15 índices permitidos, você poderá publicar 14 bases de dados de conhecimento (um índice por base de dados de conhecimento publicada). O décimo quinto índice é usado para todas as bases de conhecimento para criação e teste.

  • Número de documentos como fontes: O SKU gratuito do serviço de gerenciamento QnA Maker limita o número de documentos que você pode gerenciar através do portal e das APIs a 3 (de 1 MB de tamanho cada). O SKU padrão não tem limites para o número de documentos que você pode gerenciar. Veja mais detalhes aqui.

A tabela a seguir fornece algumas diretrizes de alto nível.

Gestão QnA Maker Serviço de Aplicações Azure AI Search Limitações
Experimentação SKU grátis Escalão Gratuito Escalão Gratuito Publicar até 2 KBs, 50 MB de tamanho
Ambiente de desenvolvimento/teste SKU Standard Partilhado Básica Publique até 14 KBs, tamanho de 2 GB
Ambiente de Produção SKU Standard Básica Standard Publicar até 49 KBs, tamanho de 25 GB
QPS alvo Serviço de Aplicações Azure AI Search
3 S1, uma réplica S1, uma réplica
65 S3, 10 réplicas S1, 12 Réplicas
80 S3, 10 réplicas S3, 12 Réplicas
100 P3V2, 10 Réplicas S3, 12 Réplicas, 3 Partições
200 a 250 P3V2, 20 Réplicas S3, 12 Réplicas, 3 Partições

Quando alterar um nível de preços

Atualização Razão
Atualizar o SKU de gerenciamento do QnA Maker Você deseja ter mais pares de QnA ou fontes de documentos em sua base de dados de conhecimento.
Atualize a SKU do Serviço de Aplicativo e verifique a camada de Pesquisa do Azure AI e crie réplicas da Pesquisa Cognitiva Sua base de conhecimento precisa atender a mais solicitações do seu aplicativo cliente, como um bot de chat.
Atualizar o serviço Azure AI Search Você planeja ter muitas bases de conhecimento.

Obtenha as atualizações de tempo de execução mais recentes atualizando seu Serviço de Aplicativo no portal do Azure.

Chaves no QnA Maker

Seu serviço QnA Maker lida com dois tipos de chaves: chaves de criação e chaves de ponto de extremidade de consulta usadas com o tempo de execução hospedado no serviço de aplicativo.

Use essas chaves ao fazer solicitações ao serviço por meio de APIs.

Key management

Nome Localização Objetivo
Chave de criação/subscrição Portal do Azure Essas chaves são usadas para acessar as APIs do serviço de gerenciamento do QnA Maker. Essas APIs permitem que você edite as perguntas e respostas em sua base de dados de conhecimento e publique sua base de dados de conhecimento. Essas chaves são criadas quando você cria um novo serviço QnA Maker.

Encontre essas chaves no recurso de serviços de IA do Azure na página Chaves e Ponto de Extremidade.
Chave do ponto de extremidade de consulta Portal do QnA Maker Essas chaves são usadas para consultar o ponto de extremidade da base de dados de conhecimento publicado para obter uma resposta para uma pergunta do usuário. Normalmente, você usa esse ponto de extremidade de consulta em seu bot de chat ou no código do aplicativo cliente que se conecta ao serviço QnA Maker. Essas chaves são criadas quando você publica sua base de conhecimento do QnA Maker.

Encontre essas chaves na página Configurações do serviço . Encontre esta página no menu do usuário no canto superior direito da página no menu suspenso.

Localizar chaves de criação no portal do Azure

Você pode exibir e redefinir suas chaves de criação no portal do Azure, onde criou o recurso QnA Maker.

  1. Vá para o recurso QnA Maker no portal do Azure e selecione o recurso que tem o tipo de serviços Azure AI:

    QnA Maker resource list

  2. Vá para Chaves e Endpoint:

    QnA Maker managed (Preview) Subscription key

Localizar chaves de ponto de extremidade de consulta no portal do QnA Maker

O ponto de extremidade está na mesma região que o recurso porque as chaves do ponto de extremidade são usadas para fazer uma chamada para a base de dados de conhecimento.

As chaves de ponto de extremidade podem ser gerenciadas a partir do portal do QnA Maker.

  1. Entre no portal do QnA Maker, acesse seu perfil e selecione Configurações de serviço:

    Endpoint key

  2. Ver ou repor as suas chaves:

    Endpoint key manager

    Nota

    Atualize as chaves se achar que elas foram comprometidas. Isso pode exigir alterações correspondentes ao seu aplicativo cliente ou código de bot.

Região de serviço de gerenciamento

O serviço de gerenciamento do QnA Maker é usado apenas para o portal do QnA Maker e para o processamento inicial de dados. Este serviço está disponível apenas na região Oeste dos EUA . Nenhum dado do cliente é armazenado neste serviço do oeste dos EUA.

Considerações sobre nomenclatura de recursos

O nome do recurso do QnA Maker, como qna-westus-f0-b, também é usado para nomear os outros recursos.

A janela de criação do portal do Azure permite criar um recurso do QnA Maker e selecionar as camadas de preços para os outros recursos.

Screenshot of Azure portal for QnA Maker resource creation

Depois que os recursos são criados, eles têm o mesmo nome, exceto para o recurso opcional do Application Insights, que coloca caracteres no nome.

Screenshot of Azure portal resource listing

Gorjeta

Crie um novo grupo de recursos ao criar um recurso do QnA Maker. Isso permite que você veja todos os recursos associados ao recurso QnA Maker ao pesquisar por grupo de recursos.

Gorjeta

Use uma convenção de nomenclatura para indicar níveis de preços dentro do nome do recurso ou do grupo de recursos. Quando você recebe erros de criar uma nova base de dados de conhecimento ou adicionar novos documentos, o limite da camada de preços da Pesquisa Cognitiva é um problema comum.

Finalidades dos recursos

Cada recurso do Azure criado com o QnA Maker tem uma finalidade específica:

  • Recurso QnA Maker
  • Recurso de Pesquisa Cognitiva
  • Serviço de Aplicações
  • Serviço de Plano de Aplicativo
  • Serviço Application Insights

Recurso QnA Maker

O recurso QnA Maker fornece acesso às APIs de criação e publicação.

Definições de configuração de recursos do QnA Maker

Quando você cria uma nova base de dados de conhecimento no portal do QnA Maker, a configuração Language é a única configuração aplicada no nível de recurso. Selecione o idioma ao criar a primeira base de dados de conhecimento para o recurso.

Recurso de Pesquisa Cognitiva

O recurso de Pesquisa Cognitiva é usado para:

  • Armazene os pares QnA
  • Fornecer a classificação inicial (ranker #1) dos pares QnA em tempo de execução

Utilização do índice

O recurso mantém um índice para atuar como o índice de teste e os índices restantes se correlacionam a uma base de dados de conhecimento publicada cada.

Um recurso com preço para conter 15 índices, conterá 14 bases de conhecimento publicadas e um índice é usado para testar todas as bases de conhecimento. Esse índice de teste é particionado pela base de dados de conhecimento para que uma consulta usando o painel de teste interativo use o índice de teste, mas retorne apenas resultados da partição específica associada à base de dados de conhecimento específica.

Utilização da língua

A primeira base de conhecimento criada no recurso QnA Maker é usada para determinar o conjunto de linguagem única para o recurso de Pesquisa Cognitiva e todos os seus índices. Você só pode ter um idioma definido para um serviço QnA Maker.

Usando um único serviço de Pesquisa Cognitiva

Se você criar um serviço QnA e suas dependências (como Pesquisar) através do portal, um serviço de Pesquisa será criado para você e vinculado ao serviço QnA Maker. Depois que esses recursos forem criados, você poderá atualizar a configuração do Serviço de Aplicativo para usar um serviço de Pesquisa existente anteriormente e remover o que você acabou de criar.

Saiba como configurar o QnA Maker para usar um recurso de serviço de IA do Azure diferente daquele criado como parte do processo de criação de recursos do QnA Maker.

Serviço de aplicativo e plano de serviço de aplicativo

O serviço de aplicativo é usado pelo seu aplicativo cliente para acessar as bases de dados de conhecimento publicadas por meio do ponto de extremidade de tempo de execução. O serviço de aplicativo inclui a segunda camada de classificação baseada em processamento de linguagem natural (NLP) (ranker #2) dos pares QnA em tempo de execução. A segunda classificação aplica filtros inteligentes que podem incluir metadados e prompts de acompanhamento.

Para consultar a base de dados de conhecimento publicada, todas as bases de dados de conhecimento publicadas usam o mesmo ponto de extremidade de URL, mas especificam o ID da base de dados de conhecimento dentro da rota.

{RuntimeEndpoint}/qnamaker/knowledgebases/{kbId}/generateAnswer

Application Insights

O Application Insights é usado para coletar logs de bate-papo e telemetria. Reveja as consultas comuns do Kusto para obter informações sobre o seu serviço.

Compartilhe serviços com o QnA Maker

O QnA Maker cria vários recursos do Azure. Para reduzir o gerenciamento e se beneficiar do compartilhamento de custos, use a tabela a seguir para entender o que você pode e o que não pode compartilhar:

Service Partilhar Razão
Serviços de IA do Azure X Não é possível desde a conceção
Plano do Serviço de Aplicações Espaço fixo em disco alocado para um plano do Serviço de Aplicativo. Se outros aplicativos que compartilham o mesmo plano do Serviço de Aplicativo usarem espaço em disco significativo, a instância do Serviço de Aplicativo QnAMaker encontrará problemas.
Serviço de Aplicações X Não é possível desde a conceção
Application Insights Pode ser partilhado
Serviço de pesquisa 1. é um nome reservado para o serviço QnAMaker, não pode ser usado por outras pessoas. testkb
2. O mapa de sinónimos pelo nome synonym-map está reservado para o serviço QnAMaker.
3. O número de bases de conhecimento publicadas é limitado pela camada de serviço de pesquisa. Se houver índices gratuitos disponíveis, outros serviços podem usá-los.

Próximos passos

  • Saiba mais sobre a base de conhecimento do QnA Maker
  • Compreender o ciclo de vida de uma base de dados de conhecimento
  • Rever os limites do serviço e da base de dados de conhecimento