Passar ditt jobb bra för Azure HPC Cache?
Azure HPC Cache kan påskynda åtkomsten till data för jobb med databehandling med höga prestanda inom olika områden. Men det är inte perfekt för alla typer av arbetsflöden. Den här artikeln innehåller riktlinjer för hur du avgör HPC Cache är ett bra alternativ för dina behov.
Översiktsartikeln ger också en kort översikt över när du ska Azure HPC Cache och några exempel på användningsfall.
Läs även den här artikeln om hur du effektivt använder NFS-monterad bloblagring.
NFS version 3.0-program
Azure HPC Cache stöder endast NFS 3.0-klienter.
Högt läs-till-skriv-förhållande
Arbetsbelastningar där beräkningsklienterna läser mer än de skriver är vanligtvis bra kandidater för ett cacheminne. Om ditt läs-till-skriv-förhållande till exempel är 80/20 eller 70/30 kan Azure HPC Cache hjälpa genom att betjäna ofta begärda filer från cachen i stället för att behöva hämta dem från fjärrlagringen flera gånger.
Att hämta en fil och lagra den i cacheminnet för första gången har en liten ytterligare fördröjning över en normal klientbegäran direkt till lagringen, så effektivitetsförstärkningen kommer nästa gång en klient begär samma fil. Detta gäller särskilt för stora filer. Om varje klientbegäran är unik HPC Cache påverkas inte. Men ju större fil, desto bättre blir prestandan över tid efter den första åtkomsten.
Filbaserad analytisk arbetsbelastning
Azure HPC Cache är perfekt för en pipeline som använder filbaserade data och körs över ett stort antal beräkningsklienter, särskilt om beräkningsklienterna är virtuella Azure-datorer. Det kan hjälpa till att åtgärda långsamma eller inkonsekventa prestanda som orsakas av långa filåtkomsttider.
Fjärråtkomst till data
Azure HPC Cache kan minska svarstiden om din arbetsbelastning behöver komma åt fjärrdata som inte kan flyttas närmare beräkningsresurserna. Dina poster kan till exempel finnas längst ut i en WAN-miljö, i en annan Azure-region eller i ett kunddatacenter. (Detta kallas ibland "file-bursting".)
Tung belastning på begäran
Om ett stort antal klienter begär data från källan samtidigt kan Azure HPC Cache snabbare filåtkomst. När det till exempel används med ett högpresterande datorkluster ger Azure HPC Cache skalbarhet för ett stort antal samtidiga begäranden via cachen.
Beräkningsresurser finns i Azure
Virtuella Azure-datorer är ett skalbart och kostnadseffektivt svar på högpresterande beräkningsarbetsbelastningar. Azure HPC Cache kan hjälpa till genom att föra den information de behöver närmare, särskilt om ursprungliga data lagras i ett fjärrsystem.
Om en kund vill köra sin aktuella pipeline i "i stort" på virtuella Azure-datorer kan Azure HPC Cache tillhandahålla en POSIX-baserad delad lagringslösning (eller cachelagring) för skalbarhet.
Med Azure HPC Cache behöver du inte skapa om arbetspipelinen för att göra interna anrop till Azure Blob Storage. Du kan komma åt dina data i dess ursprungliga system eller använda HPC Cache för att flytta dem till en ny blobcontainer.
Nästa steg
- Läs mer om hur du planerar och konfigurerar en cache i artiklarna Översikt och förutsättningar
- Läs överväganden för att använda NFS-aktiverad Blob Storage med Azure HPC Cache