Recursos do Azure para resposta a perguntas personalizadas
A resposta a perguntas personalizadas usa várias fontes do Azure, cada uma com uma finalidade diferente. Entender como eles são usados individualmente permite que você planeje e selecione o nível de preço correto ou saiba quando alterar seu nível de preço. Compreender como os recursos são usados em combinação permite que você encontre e corrija problemas quando eles ocorrem.
Planeamento de recursos
Gorjeta
"Base de conhecimento" e "projeto" são termos equivalentes na resposta a perguntas personalizadas e podem ser usados indistintamente.
Quando você desenvolve um projeto pela primeira vez, na fase de protótipo, é comum ter um único recurso para testes e produção.
Ao passar para a fase de desenvolvimento do projeto, você deve considerar:
- Quantas línguas terá o seu projeto?
- Em quantas regiões precisa que o seu projeto esteja disponível?
- Quantos documentos o seu sistema terá em cada domínio?
Considerações sobre os escalões de preços
Normalmente, há três parâmetros que você precisa considerar:
A taxa de transferência de que você precisa:
A taxa de transferência para resposta a perguntas personalizadas está atualmente limitada a 10 registros de texto por segundo para APIs de gerenciamento e APIs de previsão.
Isso também deve influenciar sua seleção de SKU do Azure AI Search , veja mais detalhes aqui. Além disso, talvez seja necessário ajustar a capacidade de Pesquisa de IA do Azure com réplicas.
Tamanho e número de projetos: escolha a SKU de pesquisa do Azure apropriada para o seu cenário. Normalmente, você decide o número de projetos necessários com base no número de domínios de assunto diferentes. Um domínio temático (para uma única língua) deve estar num projeto.
Com a resposta a perguntas personalizadas, você tem a opção de configurar seu recurso linguístico em um único idioma ou em vários idiomas. Pode fazer esta seleção quando criar o seu primeiro projeto no Language Studio.
Importante
Você pode publicar projetos N-1 de um único idioma ou projetos N/2 de idiomas diferentes em uma camada específica, onde N é o índice máximo permitido na camada. Verifique também o tamanho máximo e o número de documentos permitidos por camada.
Por exemplo, se sua camada tiver 15 índices permitidos, você poderá publicar 14 projetos do mesmo idioma (um índice por projeto publicado). O índice 15 é usado para todos os projetos para criação e teste. Se optar por ter projetos em línguas diferentes, só poderá publicar sete projetos.
Número de documentos como fontes: Não há limites para o número de documentos que você pode adicionar como fontes na resposta personalizada a perguntas.
A tabela a seguir fornece algumas diretrizes de alto nível.
Pesquisa de IA do Azure | Limitações | |
---|---|---|
Experimentação | Escalão Gratuito | Publicar até 2 KBs, 50 MB de tamanho |
Ambiente de desenvolvimento/teste | Básica | Publique até 14 KBs, tamanho de 2 GB |
Ambiente de Produção | Standard | Publicar até 49 KBs, tamanho de 25 GB |
Definições recomendadas
A taxa de transferência para resposta a perguntas personalizadas está atualmente limitada a 10 registros de texto por segundo para APIs de gerenciamento e APIs de previsão. Para direcionar 10 registros de texto por segundo para seu serviço, recomendamos a SKU S1 (uma instância) do Azure AI Search.
Chaves na resposta personalizada a perguntas
Seu recurso personalizado de resposta a perguntas lida com dois tipos de chaves: chaves de criação e chaves de Pesquisa do Azure AI usadas para acessar o serviço na assinatura do cliente.
Use essas chaves ao fazer solicitações ao serviço por meio de APIs.
Nome | Localização | Propósito |
---|---|---|
Chave de criação/subscrição | Portal do Azure | Essas chaves são usadas para acessar as APIs do serviço de idioma). Essas APIs permitem que você edite as perguntas e respostas em seu projeto e publique seu projeto. Essas chaves são criadas quando você cria um novo recurso. Encontre essas chaves no recurso de serviços de IA do Azure na página Chaves e Ponto de Extremidade. |
Chave de administração do Azure AI Search | Portal do Azure | Essas chaves são usadas para se comunicar com o serviço Azure AI Search implantado na assinatura do Azure do usuário. Quando você associa um recurso do Azure AI Search ao recurso de resposta a perguntas personalizadas, a chave de administrador é passada automaticamente para a resposta a perguntas personalizadas. Você pode encontrar essas chaves no recurso Azure AI Search na página Chaves . |
Localizar chaves de criação no portal do Azure
Pode ver e repor as suas chaves de criação a partir do portal do Azure, onde adicionou a funcionalidade de resposta a perguntas personalizada no seu recurso de idioma.
Vá para o recurso de idioma no portal do Azure e selecione o recurso que tem o tipo de serviços de IA do Azure:
Vá para Chaves e Endpoint:
Região de serviço de gerenciamento
Na resposta a perguntas personalizadas, os serviços de gestão e de previsão estão colocalizados na mesma região.
Finalidades dos recursos
Cada recurso do Azure criado com o recurso personalizado de resposta a perguntas tem uma finalidade específica:
- Recurso de idioma (também conhecido como recurso de Análise de Texto, dependendo do contexto de onde você está avaliando o recurso.)
- Recurso Azure AI Search
Recurso linguístico
O recurso de linguagem com recurso de resposta a perguntas personalizado fornece acesso às APIs de criação e publicação, hospeda o tempo de execução de classificação, bem como fornece telemetria.
Recurso Azure AI Search
O recurso Azure AI Search é usado para:
- Armazene os pares de perguntas e respostas
- Forneça a classificação inicial (ranker #1) dos pares de perguntas e respostas em tempo de execução
Utilização do índice
Você pode publicar projetos N-1 de um único idioma ou projetos N/2 de idiomas diferentes em uma camada específica, onde N é o número máximo de índices permitido na camada de Pesquisa do Azure AI. Verifique também o tamanho máximo e o número de documentos permitidos por camada.
Por exemplo, se sua camada tiver 15 índices permitidos, você poderá publicar 14 projetos do mesmo idioma (um índice por projeto publicado). O índice 15 é usado para todos os projetos para criação e teste. Se optar por ter projetos em línguas diferentes, só poderá publicar sete projetos.
Utilização da língua
Com a resposta personalizada a perguntas, você tem a opção de configurar seu serviço para projetos em um único idioma ou em vários idiomas. Você faz essa escolha durante a criação do primeiro projeto em seu recurso linguístico.
Próximos passos
- Saiba mais sobre os projetos personalizados de resposta a perguntas