Confronto tra Azure Data Lake Store e l'archivio BLOB di AzureComparing Azure Data Lake Store and Azure Blob Storage

Questo articolo propone una tabella di riepilogo delle differenze tra Azure Data Lake Store e l'archivio BLOB di Azure, insieme ad alcuni aspetti fondamentali dell'elaborazione dei Big Data.The table in this article summarizes the differences between Azure Data Lake Store and Azure Blob Storage along some key aspects of big data processing. L'archivio BLOB di Azure è un archivio di oggetti generico e scalabile, progettato per un'ampia gamma di scenari di archiviazione.Azure Blob Storage is a general purpose, scalable object store that is designed for a wide variety of storage scenarios. Azure Data Lake Store è un repository su vasta scala ottimizzato per carici di lavoro di analisi dei Big Data.Azure Data Lake Store is a hyper-scale repository that is optimized for big data analytics workloads.

Archivio Azure Data LakeAzure Data Lake Store Archivio BLOB di AzureAzure Blob Storage
ScopoPurpose Archiviazione ottimizzata per carichi di lavoro di analisi dei Big DataOptimized storage for big data analytics workloads Archivio di oggetti generico per un'ampia gamma di scenari di archiviazioneGeneral purpose object store for a wide variety of storage scenarios
Casi di utilizzoUse Cases Dati batch, interattivi, di analisi di flusso e di apprendimento automatico come file di log, dati IoT, dati clickstream e set di dati di grandi dimensioniBatch, interactive, streaming analytics and machine learning data such as log files, IoT data, click streams, large datasets Qualsiasi tipo di dati di testo o binari, come back-end di applicazioni, dati di backup, archiviazione di supporti per dati di streaming e genericiAny type of text or binary data, such as application back end, backup data, media storage for streaming and general purpose data
Concetti principaliKey Concepts Un account di Data Lake Store contiene cartelle, che a loro volta contengono dati archiviati come fileData Lake Store account contains folders, which in turn contains data stored as files Un account di archiviazione include contenitori, che a loro volta contengono dati sotto forma di BLOBStorage account has containers, which in turn has data in the form of blobs
StructureStructure File system gerarchicoHierarchical file system Archivio di oggetti con spazio dei nomi flatObject store with flat namespace
APIAPI API REST su HTTPSREST API over HTTPS API REST su HTTP/HTTPSREST API over HTTP/HTTPS
API lato serverServer-side API API REST compatibile con WebHDFSWebHDFS-compatible REST API API REST dell'archivio BLOB di AzureAzure Blob Storage REST API
Client del file system HadoopHadoop File System Client Yes Yes
Operazioni sui dati: autenticazioneData Operations - Authentication Basata sulle identità di Azure Active DirectoryBased on Azure Active Directory Identities Basata su segreti condivisi: chiavi di accesso dell'account e chiavi di firma di accesso condiviso.Based on shared secrets - Account Access Keys and Shared Access Signature Keys.
Operazioni sui dati: protocollo di autenticazioneData Operations - Authentication Protocol OAuth 2.0.OAuth 2.0. Le chiamate devono contenere un token JSON Web (JWT) valido rilasciato da Azure Active Directory.Calls must contain a valid JWT (JSON Web Token) issued by Azure Active Directory Hash-based Message Authentication Code (HMAC).Hash-based Message Authentication Code (HMAC) . Le chiamate devono contenere un hash SHA-256 con codifica Base64 su una parte della richiesta HTTP.Calls must contain a Base64-encoded SHA-256 hash over a part of the HTTP request.
Operazioni sui dati: autorizzazioneData Operations - Authorization Elenchi di controllo di accesso (ACL) POSIX.POSIX Access Control Lists (ACLs). Gli elenchi di controllo di accesso basati sulle identità di Azure Active Directory possono essere impostati a livello di file e di cartelle.ACLs based on Azure Active Directory Identities can be set file and folder level. Per l'autorizzazione a livello di account: usare Chiavi di accesso dell'accountFor account-level authorization – Use Account Access Keys
Per l'autorizzazione relativa all'account, al contenitore o al BLOB: usare Chiavi di firma di accesso condivisoFor account, container, or blob authorization - Use Shared Access Signature Keys
Operazioni sui dati: controlloData Operations - Auditing Disponibile.Available. Per altre informazioni, fare clic qui .See here for information. DisponibileAvailable
Crittografia dei dati inattiviEncryption data at rest
  • Trasparente, lato serverTransparent, Server side
    • Con chiavi gestite dal servizioWith service-managed keys
    • Con chiavi gestite dal cliente nell'insieme di credenziali delle chiavi di AzureWith customer-managed keys in Azure KeyVault
  • Trasparente, lato serverTransparent, Server side
    • Con chiavi gestite dal servizioWith service-managed keys
    • Con chiavi gestite dal cliente nell'insieme di credenziali delle chiavi di Azure (presto disponibile)With customer-managed keys in Azure KeyVault (coming soon)
  • Crittografia lato clientClient-side encryption
Operazioni di gestione, come la creazione di accountManagement operations (e.g. Account Create) Controllo degli accessi in base al ruolo (RBAC) fornito da Azure per la gestione degli account.Role-based access control (RBAC) provided by Azure for account management Controllo degli accessi in base al ruolo (RBAC) fornito da Azure per la gestione degli account.Role-based access control (RBAC) provided by Azure for account management
SDK per sviluppatoriDeveloper SDKs .NET, Java, Python, Node.js.NET, Java, Python, Node.js .Net, Java, Python, Node.js, C++, Ruby.Net, Java, Python, Node.js, C++, Ruby
Prestazioni del carico di lavoro di analisiAnalytics Workload Performance Prestazioni ottimizzate per carichi di lavoro di analisi parallela.Optimized performance for parallel analytics workloads. IOPS e velocità effettiva elevata.High Throughput and IOPS. Non è ottimizzato per carichi di lavoro di analisi.Not optimized for analytics workloads
Limiti di dimensioniSize limits Nessun limite di dimensioni per l'account, i file o il numero di fileNo limits on account sizes, file sizes or number of files Limiti specifici documentati quiSpecific limits documented here
Ridondanza geograficaGeo-redundancy Archiviazione con ridondanza locale (più copie di dati in un'area di Azure).Locally-redundant (multiple copies of data in one Azure region) Archiviazione con ridondanza locale, archiviazione con ridondanza geografica, archiviazione con ridondanza geografica e accesso in lettura.Locally redundant (LRS), globally redundant (GRS), read-access globally redundant (RA-GRS). Per altre informazioni, fare clic qui .See here for more information
Stato del servizioService state Disponibile a livello generaleGenerally available Disponibile a livello generaleGenerally available
Disponibilità internazionaleRegional availability Vedere quiSee here Vedere quiSee here
PrezzoPrice Vedere i prezziSee Pricing Vedere i prezziSee Pricing

Passaggi successiviNext steps