Dimensionamento automático no Serviço de Aplicativo do Azure

Observação

O dimensionamento automático está em versão prévia. Ele está disponível para os tipos de preço Premium V2 (P1V2, P2V2, P3V2) e Premium V3 (P1V3, P2V3, P3V3) e com suporte para todos os tipos de aplicativo: Windows, Linux e contêiner do Windows. Não há suporte para a escala automática no tráfego de slot de implantação.

O dimensionamento automático é uma nova opção de escalonamento horizontal que lida automaticamente com as decisões de dimensionamento dos seus aplicativos web e Planos do Serviço de Aplicativo. O recurso é diferente do dimensionamento automático do Azure pré-existente, que lhe permite definir as regras do dimensionamento com base em agendamentos e recursos. Com o dimensionamento automático, você pode ajustar as configurações de dimensionamento para aprimorar o desempenho do seu aplicativo e evitar problemas de inicialização a frio. A plataforma pré-aquece as instâncias para atuar como um buffer no escalonamento horizontal, garantindo transições de desempenho suaves. Use o Live Metrics do Application Insights para verificar seu número de instâncias atual e os performanceCounters para conferir o histórico dos números de instâncias. Você é cobrado por segundo para todas as instâncias, incluindo instâncias pré-aquecidas.

Uma comparação entre as opções escalonar horizontalmente e reduzir horizontalmente disponíveis no Serviço de Aplicativo:

  Manual Autoescala Dimensionamento automático
Tipos de preço disponíveis Básico e superior Standard e superior Premium V2 (P1V2, P2V2, P3V2) e Premium V3 (P1V3, P2V3, P3V3)
Dimensionamento baseado em regras No Sim Não, a plataforma gerencia as opções de escalonar e reduzir horizontalmente com base no tráfego HTTP.
Dimensionamento baseado em agendamento No Sim No
Instâncias sempre prontas Não, seu aplicativo web é executado no número de instâncias dimensionadas manualmente. Não, seu aplicativo web é executado em outras instâncias disponíveis durante a operação de escalonamento horizontal, com base no limite definido para as regras de dimensionamento automático. Sim (mínimo de 1)
Instâncias pré-aquecidas No No Sim (padrão de 1)
Máximo por aplicativo No No Sim

Como o dimensionamento automático funciona

Você pode habilitar o dimensionamento automático para um Plano do Serviço de Aplicativo e configurar uma faixa de instâncias para cada um dos aplicativos web. À medida que seu aplicativo web começa a receber tráfego HTTP, o Serviço de Aplicativo monitora a carga e adiciona instâncias. Os recursos podem ser compartilhados quando vários aplicativos web dentro de um plano do Serviço de Aplicativo são necessários para escalonar horizontalmente simultaneamente.

Veja alguns cenários nos quais você deve escalonar horizontalmente automaticamente:

  • Você não deseja configurar regras de dimensionamento automático com base em métricas de recursos.
  • Você deseja que seus aplicativos web dentro do mesmo Plano do Serviço de Aplicativo sejam dimensionados de forma diferente e independentemente uns dos outros.
  • Seu aplicativo web está conectado a um banco de dados ou sistema herdados, que podem não ser dimensionados tão rapidamente quanto o aplicativo web. O dimensionamento automático permite que você defina o número máximo de instâncias para as quais seu Plano do Serviço de Aplicativo pode ser dimensionado Essa configuração ajuda o aplicativo web a não sobrecarregar o back-end.

Habilitar o dimensionamento automático

Intermitência máxima é o maior número de instâncias para as quais seu Plano do Serviço de Aplicativo pode ser dimensionado com base em solicitações HTTP de entrada. Em planos Premium v2 e v3, você pode definir uma intermitência máxima de até 30 instâncias. A intermitência máxima deve ser igual ou maior que o número de trabalhos especificado para o Plano do Serviço de Aplicativo.

Importante

Always ON precisa ser desabilitado para usar o dimensionamento automático.

Para habilitar o dimensionamento automático, vá para o menu do lado esquerdo do aplicativo e selecione Escalonar horizontalmente (Plano do Serviço de Aplicativo). Selecione Automático (versão prévia), atualize o valor de Intermitência máxima e selecione o botão Salvar .

Automatic scaling in Azure portal

Definir o número mínimo de instâncias de aplicativo web

Instâncias sempre prontas é uma configuração no nível do aplicativo para especificar o número mínimo de instâncias. Se a carga exceder o que as instâncias sempre prontas podem lidar, instâncias adicionais serão adicionadas (até a intermitência máxima especificada para o plano do Serviço de Aplicativo).

Para definir o número mínimo de instâncias de aplicativos web, vá para o menu do lado esquerdo do aplicativo e selecione Escalonar horizontalmente (Plano do Serviço de Aplicativo). Atualize o valor Instâncias sempre prontas e selecione o botão Salvar.

Screenshot of always ready instances

Definir o número máximo de instâncias de aplicativo web

O limite máximo de dimensionamento define o número máximo de instâncias para as quais um aplicativo web pode ser dimensionado. O limite máximo de dimensionamento ajuda quando um componente downstream como um banco de dados tem uma taxa de transferência limitada. O máximo por aplicativo pode estar entre 1 e a intermitência máxima.

Para definir o número máximo de instâncias de aplicativos web, vá para o menu do lado esquerdo do aplicativo e selecione Escalonar horizontalmente (Plano do Serviço de Aplicativo). Selecione Implementar o limite de escalonamento horizontal, atualize o limite máximo do dimensionamento e selecione o botão Salvar.

Screenshot of maximum scale limit

Atualizar instâncias pré-aquecidas

A configuração de instâncias pré-aquecidas fornece instâncias aquecidas como um buffer durante os eventos de dimensionamento e ativação de HTTP. As instâncias pré-aquecidas continuam no buffer até que o limite máximo de expansão seja atingido. O número de instâncias pré-aquecidas padrão é 1 e, para a maioria dos cenários, esse valor deve permanecer como 1.

Você não pode alterar a configuração de instâncias pré-aquecidas no portal. Em vez disso, use a CLI do Azure.

Desabilitar o dimensionamento automático

Para desabilitar o dimensionamento automático, vá para o menu do lado esquerdo do aplicativo e selecione Escalonar horizontalmente (Plano do Serviço de Aplicativo). Selecione Manual e, em seguida, selecione o botão Salvar .

Screenshot of manual scaling

O dimensionamento automático é compatível com os aplicativos do Azure Functions?

Não, você só pode ter os aplicativos web do Serviço de Aplicativo do Azure no Plano do Serviço de Aplicativo em que quiser habilitar o dimensionamento automático. Se tiver aplicativos do Azure Functions existentes no mesmo plano do Serviço de Aplicativo ou se criar novos aplicativos do Azure Functions, o dimensionamento automático será desabilitado. Para o Functions, recomendamos usar o plano Azure Functions Premium.

Mais recursos