Profili di carico di lavoro in App contenitore di Azure

Un profilo del carico di lavoro determina la quantità di risorse di calcolo e memoria disponibili per le app contenitore distribuite in un ambiente.

I profili sono configurati per soddisfare le diverse esigenze delle applicazioni.

Tipo profilo Descrizione Potenziale utilizzo
Consumo Aggiunto automaticamente a qualsiasi nuovo ambiente. App che non richiedono requisiti hardware specifici
Dedicato (utilizzo generico) Bilanciamento della memoria e delle risorse di calcolo App che richiedono grandi quantità di CPU e/o memoria
Dedicato (ottimizzato per la memoria) Risorse di memoria aumentate App che richiedono l'accesso a dati di grandi dimensioni in memoria, modelli di Machine Learning in memoria o altri requisiti di memoria elevata
Dedicato (GPU abilitato) (anteprima) GPU abilitata con risorse di calcolo e memoria aumentate disponibili nelle aree Stati Uniti occidentali 3 ed Europa settentrionale. App che richiedono GPU

Nota

Quando si usano profili di carico di lavoro abilitati per GPU, assicurarsi che l'applicazione esegua la versione più recente di CUDA.

Il profilo del carico di lavoro Consumo è il profilo predefinito aggiunto a ogni tipo di ambiente profili di carico di lavoro. È possibile aggiungere profili di carico di lavoro dedicati all'ambiente durante la creazione di un ambiente o dopo la creazione. Gli ambienti dei profili di carico di lavoro vengono distribuiti separatamente dagli ambienti solo a consumo.

Per ogni profilo del carico di lavoro dedicato nell'ambiente, è possibile:

  • Selezionare il tipo e le dimensioni
  • Distribuire più app nel profilo
  • Usare la scalabilità automatica per aggiungere e rimuovere istanze in base alle esigenze delle app
  • Limitare il ridimensionamento del profilo per controllare meglio i costi

È possibile configurare ognuna delle app da eseguire in uno dei profili di carico di lavoro definiti nell'ambiente App contenitore. Questa configurazione è ideale per la distribuzione di microservizi in cui ogni app può essere eseguita nell'infrastruttura di calcolo appropriata.

Nota

È possibile applicare un profilo di carico di lavoro GPU solo a un ambiente durante la creazione dell'ambiente.

Tipi di profilo

Esistono tipi e dimensioni diversi dei profili di carico di lavoro disponibili in base all'area. Per impostazione predefinita, ogni piano dedicato include un profilo di consumo, ma è anche possibile aggiungere uno dei profili seguenti:

Nome visualizzato Nome vCPU Memoria (GiB) GPU Categoria Allocazione
Consumo Consumo 4 8 - Consumo per replica
D4 dedicato D4 4 16 - Utilizzo generico per nodo
Dedicato-D8 D8 8 32 - Utilizzo generico per nodo
Dedicato-D16 D16 16 64 - Utilizzo generico per nodo
Dedicato-D32 D32 32 128 - Utilizzo generico per nodo
Dedicato-E4 E4 4 32 - Ottimizzato per la memoria per nodo
Dedicato-E8 E8 8 64 - Ottimizzato per la memoria per nodo
Dedicato-E16 E16 16 128 - Ottimizzato per la memoria per nodo
Dedicato-E32 E32 32 256 - Ottimizzato per la memoria per nodo
Dedicated-NC24-A100 (anteprima) NC24-A100 24 220 1 Abilitate per la GPU per nodo*
Dedicated-NC48-A100 (anteprima) NC48-A100 48 440 2 Abilitate per la GPU per nodo*
Dedicated-NC96-A100 (anteprima) NC96-A100 96 880 4 Abilitate per la GPU per nodo*

* La capacità viene allocata in base al caso. Inviare un ticket di supporto per richiedere la quantità di capacità necessaria per l'applicazione.

Selezionare un profilo del carico di lavoro e usare il campo Nome quando si esegue az containerapp env workload-profile set per l'opzione --workload-profile-type .

Oltre a dimensioni di memoria e core diverse, i profili di carico di lavoro hanno anche limiti di dimensioni delle immagini variabili disponibili. Per altre informazioni sui limiti delle dimensioni delle immagini per le app contenitore, vedere Informazioni di riferimento sull'hardware.

La disponibilità di profili di carico di lavoro diversi varia in base all'area.

Utilizzo di risorse

È possibile vincolare l'utilizzo della memoria e della CPU di ogni app all'interno di un profilo del carico di lavoro ed è possibile eseguire più app all'interno di una singola istanza di un profilo di carico di lavoro. Tuttavia, la quantità totale di risorse disponibili per un'app contenitore è inferiore a quella allocata a un profilo. La differenza tra le risorse allocate e le risorse disponibili è la quantità riservata dal runtime di App contenitore.

Scalabilità

Quando la richiesta di nuove app o più repliche di un'app esistente supera le risorse correnti del profilo, è possibile aggiungere istanze del profilo.

Allo stesso tempo, se il numero di repliche necessarie diventa inattivo, le istanze del profilo possono essere rimosse. È possibile controllare i vincoli sul numero minimo e massimo di istanze del profilo.

Azure calcola la fatturazione in gran parte in base al numero di istanze del profilo in esecuzione.

Rete

Quando si usa l'ambiente del profilo del carico di lavoro, sono disponibili funzionalità di rete aggiuntive che proteggono completamente il traffico di rete in ingresso e in uscita (ad esempio le route definite dall'utente). Per altre informazioni sulle funzionalità di rete supportate, vedere Rete nell'ambiente app Azure Container. Per informazioni su come proteggere la rete con App contenitore, vedere la sezione relativa al blocco dell'ambiente dell'app contenitore.

Passaggi successivi