Introduzione ad Azure Data Lake Storage Gen2Introduction to Azure Data Lake Storage Gen2

‎Azure Data Lake Storage Gen2 è un set di funzionalità dedicate all'analisi dei Big Data e integrate in Archiviazione BLOB di Azure.‎Azure Data Lake Storage Gen2 is a set of capabilities dedicated to big data analytics, built on Azure Blob storage.

Data Lake Storage Gen2 riunisce le funzionalità di Azure Data Lake Storage Gen1 e dell'archiviazione BLOB di Azure.Data Lake Storage Gen2 converges the capabilities of Azure Data Lake Storage Gen1 with Azure Blob storage. Offre ad esempio semantica dei file system, sicurezza a livello di file e scalabilità.For example, Data Lake Storage Gen2 provides file system semantics, file-level security, and scale. Poiché queste funzionalità sono basate sull'archiviazione BLOB, si ottiene anche un'archiviazione a più livelli a costi contenuti, con funzionalità di disponibilità elevata e ripristino di emergenza.Because these capabilities are built on Blob storage, you'll also get low-cost, tiered storage, with high availability/disaster recovery capabilities.

Progettato per l'analisi dei Big Data EnterpriseDesigned for enterprise big data analytics

Data Lake Storage Gen2 usa Archiviazione di Azure come base per la compilazione di Enterprise Data Lake (EDL) in Azure.Data Lake Storage Gen2 makes Azure Storage the foundation for building enterprise data lakes on Azure. Progettato dall'inizio per servire più petabyte di informazioni supportando al contempo centinaia di Gigabit di velocità effettiva, Data Lake Storage Gen2 consente di gestire facilmente grandi quantità di dati.Designed from the start to service multiple petabytes of information while sustaining hundreds of gigabits of throughput, Data Lake Storage Gen2 allows you to easily manage massive amounts of data.

Una parte fondamentale di Data Lake Storage Gen2 è l'aggiunta di uno spazio dei nomi gerarchico all'archivio BLOB.A fundamental part of Data Lake Storage Gen2 is the addition of a hierarchical namespace to Blob storage. Lo spazio dei nomi gerarchico organizza gli oggetti e i file in una gerarchia di directory per un accesso ai dati efficiente.The hierarchical namespace organizes objects/files into a hierarchy of directories for efficient data access. Una convenzione di denominazione comune per l'archiviazione di oggetti prevede l'inserimento di slash nel nome per simulare una struttura di directory gerarchica.A common object store naming convention uses slashes in the name to mimic a hierarchical directory structure. Questa struttura diventa effettiva con Data Lake Storage Gen2.This structure becomes real with Data Lake Storage Gen2. Operazioni come la ridenominazione o l'eliminazione di una directory diventano singole operazioni atomiche sui metadati della directory.Operations such as renaming or deleting a directory, become single atomic metadata operations on the directory. Non è necessario enumerare ed elaborare tutti gli oggetti che condividono il prefisso del nome della directory.There's no need to enumerate and process all objects that share the name prefix of the directory.

Data Lake Storage Gen2 si basa su archiviazione BLOB e migliora le prestazioni, la gestione e la sicurezza nei modi seguenti:Data Lake Storage Gen2 builds on Blob storage and enhances performance, management, and security in the following ways:

  • Le prestazioni sono ottimizzate perché non è necessario copiare o trasformare i dati come prerequisito per l'analisi.Performance is optimized because you do not need to copy or transform data as a prerequisite for analysis. Rispetto allo spazio dei nomi flat in archiviazione BLOB, lo spazio dei nomi gerarchico migliora notevolmente le prestazioni delle operazioni di gestione directory, consentendo di aumentare le prestazioni complessive del processo.Compared to the flat namespace on Blob storage, the hierarchical namespace greatly improves the performance of directory management operations, which improves overall job performance.

  • La gestione risulta più semplice poiché è possibile organizzare e gestire i file nelle directory e sottodirectory.Management is easier because you can organize and manipulate files through directories and subdirectories.

  • La protezione si può applicare perché è possibile definire le autorizzazioni POSIX delle directory o dei singoli file.Security is enforceable because you can define POSIX permissions on directories or individual files.

Inoltre, Data Lake Storage Gen2 è particolarmente conveniente perché si basa sull'archiviazione BLOB di Azure a basso costo.Also, Data Lake Storage Gen2 is very cost effective because it is built on top of the low-cost Azure Blob storage. Le funzionalità aggiuntive riducono ulteriormente il costo totale di proprietà per l'esecuzione di analisi dei Big Data in Azure.The additional features further lower the total cost of ownership for running big data analytics on Azure.

Funzionalità principali di Data Lake Storage Gen2Key features of Data Lake Storage Gen2

  • Accesso compatibile con Hadoop: Data Lake Storage Gen2 consente di gestire i dati e accedervi esattamente come si farebbe con Hadoop Distributed File System (HDFS).Hadoop compatible access: Data Lake Storage Gen2 allows you to manage and access data just as you would with a Hadoop Distributed File System (HDFS). Il nuovo driver ABFS (usato per accedere ai dati) è disponibile in tutti gli ambienti Apache Hadoop.The new ABFS driver (used to access data) is available within all Apache Hadoop environments. Questi ambienti includono Azure HDInsight , Azure Databricks e Azure Synapse Analytics.These environments include Azure HDInsight, Azure Databricks, and Azure Synapse Analytics.

  • Un superset di autorizzazioni POSIX: il modello di sicurezza per Data Lake Gen2 supporta l'elenco di controllo di accesso e le autorizzazioni POSIX oltre a una granularità aggiuntiva specifica di Data Lake Storage Gen2.A superset of POSIX permissions: The security model for Data Lake Gen2 supports ACL and POSIX permissions along with some extra granularity specific to Data Lake Storage Gen2. È possibile configurare le impostazioni tramite Storage Explorer o framework come Hive e Spark.Settings may be configured through Storage Explorer or through frameworks like Hive and Spark.

  • Conveniente: Data Lake Storage Gen2 offre capacità di archiviazione e transazioni a basso costo.Cost effective: Data Lake Storage Gen2 offers low-cost storage capacity and transactions. Funzionalità come il ciclo di vita dell'archiviazione BLOB di Azure ottimizzano i costi man mano che i dati si spostano lungo il ciclo di vita.Features such as Azure Blob storage lifecycle optimize costs as data transitions through its lifecycle.

  • Driver ottimizzato: il driver ABFS è ottimizzato appositamente per l'analisi dei Big Data.Optimized driver: The ABFS driver is optimized specifically for big data analytics. Le API REST corrispondenti vengono rilevate tramite l'endpoint dfs.core.windows.net.The corresponding REST APIs are surfaced through the endpoint dfs.core.windows.net.

ScalabilitàScalability

Archiviazione di Azure è scalabile per impostazione predefinita, sia che si acceda da Data Lake Storage Gen2 o dalle interfacce di archiviazione BLOB.Azure Storage is scalable by design whether you access via Data Lake Storage Gen2 or Blob storage interfaces. È in grado di archiviare e servire molti esabyte di dati.It is able to store and serve many exabytes of data. Questa quantità di archiviazione è disponibile con la velocità effettiva misurata in Gigabit al secondo (Gbps) con un elevato livello di operazioni di I/O al secondo (IOPS).This amount of storage is available with throughput measured in gigabits per second (Gbps) at high levels of input/output operations per second (IOPS). L'elaborazione viene eseguita a una latenza per richiesta quasi costante, misurata a livello di servizio, account e file.Processing is executed at near-constant per-request latencies that are measured at the service, account, and file levels.

ConvenienzaCost effectiveness

Poiché Data Lake Storage Gen2 si basa sull'archiviazione BLOB di Azure, i costi di transazione e capacità di archiviazione sono inferiori.Because Data Lake Storage Gen2 is built on top of Azure Blob storage, storage capacity and transaction costs are lower. A differenza di altri servizi di archiviazione cloud, non è necessario spostare o trasformare i dati per poterli analizzare.Unlike other cloud storage services, you don't have to move or transform your data before you can analyze it. Per altre informazioni sui prezzi, vedere Prezzi di Archiviazione di Azure.For more information about pricing, see Azure Storage pricing.

Funzionalità quali lo spazio dei nomi gerarchico migliorano significativamente anche le prestazioni complessive di molti processi di analisi.Additionally, features such as the hierarchical namespace significantly improve the overall performance of many analytics jobs. Questo miglioramento nelle prestazioni implica una minore capacità di calcolo per elaborare la stessa quantità di dati, con conseguente riduzione del costo totale di proprietà (TCO) per il processo di analisi end-to-end.This improvement in performance means that you require less compute power to process the same amount of data, resulting in a lower total cost of ownership (TCO) for the end-to-end analytics job.

Un servizio, più concettiOne service, multiple concepts

Poiché Data Lake Storage Gen2 si basa sull'archiviazione BLOB di Azure, possono essere usati più concetti per descrivere gli stessi elementi comuni.Because Data Lake Storage Gen2 is built on top of Azure Blob storage, multiple concepts can describe the same, shared things.

Di seguito sono elencate le entità equivalenti, descritte da concetti diversi.The following are the equivalent entities, as described by different concepts. Se non diversamente specificato, queste entità sono chiaramente sinonimi:Unless specified otherwise these entities are directly synonymous:

ConcettoConcept Organizzazione di livello superioreTop Level Organization Organizzazione di livello inferioreLower Level Organization Contenitore datiData Container
BLOB: archivio di oggetti per utilizzo genericoBlobs – General purpose object storage ContenitoreContainer Directory virtuale (solo SDK, non fornisce la manipolazione atomica)Virtual directory (SDK only – does not provide atomic manipulation) BLOBBlob
Azure Data Lake Storage Gen2 – Analisi sui dati archiviatiAzure Data Lake Storage Gen2 – Analytics Storage ContenitoreContainer DirectoryDirectory FileFile

Funzionalità di archiviazione BLOB supportateSupported Blob storage features

Le funzionalità di archiviazione BLOB, ad esempio registrazione diagnostica, livelli di accesso e criteri di gestione del ciclo di vita dell'archiviazione BLOB, sono disponibili nel proprio account.Blob storage features such as diagnostic logging, access tiers, and Blob Storage lifecycle management policies are available to your account.

Per un elenco delle funzionalità di archiviazione BLOB supportate, vedere Funzionalità di archiviazione BLOB disponibili in Azure Data Lake Storage Gen2.For a list of supported Blob storage features, see Blob Storage features available in Azure Data Lake Storage Gen2.

Integrazioni di servizi di Azure supportateSupported Azure service integrations

Data Lake Storage Gen2 supporta diversi servizi di Azure,Data Lake Storage gen2 supports several Azure services. che possono essere usati per inserire dati, eseguire analisi e creare rappresentazioni visive.You can use them to ingest data, perform analytics, and create visual representations. Per un elenco dei servizi di Azure supportati, vedere Servizi di Azure che supportano Azure Data Lake Storage Gen2.For a list of supported Azure services, see Azure services that support Azure Data Lake Storage Gen2.

Piattaforme open source supportateSupported open source platforms

Diverse piattaforme open source supportano Data Lake Storage Gen2.Several open source platforms support Data Lake Storage Gen2. Per un elenco completo, vedere Piattaforme open source che supportano Azure Data Lake Storage Gen2.For a complete list, see Open source platforms that support Azure Data Lake Storage Gen2.

Vedere ancheSee also