Recursos do Azure para resposta a perguntas personalizadas

A resposta a perguntas personalizadas usa várias fontes do Azure, cada uma com uma finalidade diferente. Entender como eles são usados individualmente permite que você planeje e selecione o nível de preço correto ou saiba quando alterar seu nível de preço. Compreender como os recursos são usados em combinação permite que você encontre e corrija problemas quando eles ocorrem.

Planeamento de recursos

Gorjeta

"Base de conhecimento" e "projeto" são termos equivalentes na resposta a perguntas personalizadas e podem ser usados indistintamente.

Quando você desenvolve um projeto pela primeira vez, na fase de protótipo, é comum ter um único recurso para testes e produção.

Ao passar para a fase de desenvolvimento do projeto, você deve considerar:

  • Quantas línguas terá o seu projeto?
  • Em quantas regiões precisa que o seu projeto esteja disponível?
  • Quantos documentos o seu sistema terá em cada domínio?

Considerações sobre os escalões de preços

Normalmente, há três parâmetros que você precisa considerar:

  • A taxa de transferência de que você precisa:

    • A taxa de transferência para resposta a perguntas personalizadas está atualmente limitada a 10 registros de texto por segundo para APIs de gerenciamento e APIs de previsão.

    • Isso também deve influenciar sua seleção de SKU do Azure AI Search , veja mais detalhes aqui. Além disso, talvez seja necessário ajustar a capacidade de Pesquisa de IA do Azure com réplicas.

  • Tamanho e número de projetos: escolha a SKU de pesquisa do Azure apropriada para o seu cenário. Normalmente, você decide o número de projetos necessários com base no número de domínios de assunto diferentes. Um domínio temático (para uma única língua) deve estar num projeto.

    Com a resposta a perguntas personalizadas, você tem a opção de configurar seu recurso linguístico em um único idioma ou em vários idiomas. Pode fazer esta seleção quando criar o seu primeiro projeto no Language Studio.

    Importante

    Você pode publicar projetos N-1 de um único idioma ou projetos N/2 de idiomas diferentes em uma camada específica, onde N é o índice máximo permitido na camada. Verifique também o tamanho máximo e o número de documentos permitidos por camada.

    Por exemplo, se sua camada tiver 15 índices permitidos, você poderá publicar 14 projetos do mesmo idioma (um índice por projeto publicado). O índice 15 é usado para todos os projetos para criação e teste. Se optar por ter projetos em línguas diferentes, só poderá publicar sete projetos.

  • Número de documentos como fontes: Não há limites para o número de documentos que você pode adicionar como fontes na resposta personalizada a perguntas.

A tabela a seguir fornece algumas diretrizes de alto nível.

Pesquisa de IA do Azure Limitações
Experimentação Escalão Gratuito Publicar até 2 KBs, 50 MB de tamanho
Ambiente de desenvolvimento/teste Básica Publique até 14 KBs, tamanho de 2 GB
Ambiente de Produção Standard Publicar até 49 KBs, tamanho de 25 GB

A taxa de transferência para resposta a perguntas personalizadas está atualmente limitada a 10 registros de texto por segundo para APIs de gerenciamento e APIs de previsão. Para direcionar 10 registros de texto por segundo para seu serviço, recomendamos a SKU S1 (uma instância) do Azure AI Search.

Chaves na resposta personalizada a perguntas

Seu recurso personalizado de resposta a perguntas lida com dois tipos de chaves: chaves de criação e chaves de Pesquisa do Azure AI usadas para acessar o serviço na assinatura do cliente.

Use essas chaves ao fazer solicitações ao serviço por meio de APIs.

Nome Localização Propósito
Chave de criação/subscrição Portal do Azure Essas chaves são usadas para acessar as APIs do serviço de idioma). Essas APIs permitem que você edite as perguntas e respostas em seu projeto e publique seu projeto. Essas chaves são criadas quando você cria um novo recurso.

Encontre essas chaves no recurso de serviços de IA do Azure na página Chaves e Ponto de Extremidade.
Chave de administração do Azure AI Search Portal do Azure Essas chaves são usadas para se comunicar com o serviço Azure AI Search implantado na assinatura do Azure do usuário. Quando você associa um recurso do Azure AI Search ao recurso de resposta a perguntas personalizadas, a chave de administrador é passada automaticamente para a resposta a perguntas personalizadas.

Você pode encontrar essas chaves no recurso Azure AI Search na página Chaves .

Localizar chaves de criação no portal do Azure

Pode ver e repor as suas chaves de criação a partir do portal do Azure, onde adicionou a funcionalidade de resposta a perguntas personalizada no seu recurso de idioma.

  1. Vá para o recurso de idioma no portal do Azure e selecione o recurso que tem o tipo de serviços de IA do Azure:

    Screenshot of custom question answering resource list.

  2. Vá para Chaves e Endpoint:

    Screenshot of subscription key.

Região de serviço de gerenciamento

Na resposta a perguntas personalizadas, os serviços de gestão e de previsão estão colocalizados na mesma região.

Finalidades dos recursos

Cada recurso do Azure criado com o recurso personalizado de resposta a perguntas tem uma finalidade específica:

  • Recurso de idioma (também conhecido como recurso de Análise de Texto, dependendo do contexto de onde você está avaliando o recurso.)
  • Recurso Azure AI Search

Recurso linguístico

O recurso de linguagem com recurso de resposta a perguntas personalizado fornece acesso às APIs de criação e publicação, hospeda o tempo de execução de classificação, bem como fornece telemetria.

Recurso Azure AI Search

O recurso Azure AI Search é usado para:

  • Armazene os pares de perguntas e respostas
  • Forneça a classificação inicial (ranker #1) dos pares de perguntas e respostas em tempo de execução

Utilização do índice

Você pode publicar projetos N-1 de um único idioma ou projetos N/2 de idiomas diferentes em uma camada específica, onde N é o número máximo de índices permitido na camada de Pesquisa do Azure AI. Verifique também o tamanho máximo e o número de documentos permitidos por camada.

Por exemplo, se sua camada tiver 15 índices permitidos, você poderá publicar 14 projetos do mesmo idioma (um índice por projeto publicado). O índice 15 é usado para todos os projetos para criação e teste. Se optar por ter projetos em línguas diferentes, só poderá publicar sete projetos.

Utilização da língua

Com a resposta personalizada a perguntas, você tem a opção de configurar seu serviço para projetos em um único idioma ou em vários idiomas. Você faz essa escolha durante a criação do primeiro projeto em seu recurso linguístico.

Próximos passos

  • Saiba mais sobre os projetos personalizados de resposta a perguntas