Panoramica dell’Archivio Data Lake di AzureOverview of Azure Data Lake Store

Azure Data Lake Store è un repository su vasta scala a livello aziendale per carichi di lavoro di analisi di Big Data.Azure Data Lake Store is an enterprise-wide hyper-scale repository for big data analytic workloads. Azure Data Lake consente di acquisire dati di qualsiasi dimensione, tipo e velocità di inserimento in un'unica posizione per le analisi esplorative e operative.Azure Data Lake enables you to capture data of any size, type, and ingestion speed in one single place for operational and exploratory analytics.

Suggerimento

Utilizzare il percorso di apprendimento di archivio Data Lake per iniziare ad esplorare il servizio di Archivio Data Lake di Azure.Use the Data Lake Store learning path to start exploring the Azure Data Lake Store service.

Si può accedere all’Archivio Data Lake di Azure da Hadoop (disponibile con i cluster HDInsight) mediante le API REST WebHDFS compatibili.Azure Data Lake Store can be accessed from Hadoop (available with HDInsight cluster) using the WebHDFS-compatible REST APIs. È progettato specificamente per consentire l'analisi su dati archiviati ed è ottimizzato per eseguire prestazioni per scenari di analisi dei dati.It is specifically designed to enable analytics on the stored data and is tuned for performance for data analytics scenarios. Per impostazione predefinita, include tutte le funzionalità a livello aziendale, protezione, gestibilità, scalabilità, affidabilità e disponibilità, essenziali per i casi di utilizzo aziendale reali.Out of the box, it includes all the enterprise-grade capabilities—security, manageability, scalability, reliability, and availability—essential for real-world enterprise use cases.

Azure Data Lake

Di seguito sono riportate alcune delle principali funzionalità di Azure Data Lake.Some of the key capabilities of the Azure Data Lake include the following.

Creato per HadoopBuilt for Hadoop

L'archivio Azure Data Lake è un file system Apache Hadoop compatibile con HDFS (Hadoop Distributed File System) e funziona con l'ecosistema Hadoop.The Azure Data Lake store is an Apache Hadoop file system compatible with Hadoop Distributed File System (HDFS) and works with the Hadoop ecosystem. Le applicazioni HDInsight esistenti o i servizi che utilizzano l'API WebHDFS possono integrarsi facilmente con l'Archivio Data Lake.Your existing HDInsight applications or services that use the WebHDFS API can easily integrate with Data Lake Store. L’Archivio Data Lake presenta anche un'interfaccia REST compatibile con WebHDFS per le applicazioniData Lake Store also exposes a WebHDFS-compatible REST interface for applications

I dati archiviati nell'Archivio Data Lake possono essere analizzati facilmente mediante framework di analisi di Hadoop, come MapReduce o Hive.Data stored in Data Lake Store can be easily analyzed using Hadoop analytic frameworks such as MapReduce or Hive. Si può eseguire il provisioning sui cluster di Microsoft Azure HDInsight e questi possono essere configurati per accedere direttamente ai dati archiviati nell'Archivio Data Lake.Microsoft Azure HDInsight clusters can be provisioned and configured to directly access data stored in Data Lake Store.

Archiviazione illimitata, file dei petabyteUnlimited storage, petabyte files

L’Archivio Data Lake di Azure fornisce un'archiviazione illimitata ed è adatto per l'archiviazione di una serie di dati per l'analisi.Azure Data Lake Store provides unlimited storage and is suitable for storing a variety of data for analytics. Ciò non impone limiti per le dimensioni dell’account, le dimensioni dei file o la quantità di dati che possono essere archiviati in un Data Lake.It does not impose any limits on account sizes, file sizes, or the amount of data that can be stored in a data lake. I singoli file possono variare da kilobyte di petabyte rendendo la scelta ideale per memorizzare qualsiasi tipo di dati.Individual files can range from kilobyte to petabytes in size making it a great choice to store any type of data. I dati vengono archiviati in modo permanente creando più copie e non esiste alcun limite per la durata del tempo durante il quale i dati possono essere archiviati nel Data Lake.Data is stored durably by making multiple copies and there is no limit on the duration of time for which the data can be stored in the data lake.

Prestazioni ottimizzate per l'analisi di Big DataPerformance-tuned for big data analytics

L'archivio Data Lake di Azure è progettato per l'esecuzione di sistemi di analisi di scalabilità di grandi dimensioni che richiedono una velocità effettiva molto elevata per eseguire query e analisi su grandi quantità di dati.Azure Data Lake Store is built for running large scale analytic systems that require massive throughput to query and analyze large amounts of data. Il Data Lake propaga parti di un file su un numero di singoli server di archiviazione.The data lake spreads parts of a file over a number of individual storage servers. Ciò migliora la velocità effettiva di lettura durante la lettura in parallelo del file per l'esecuzione dell’analisi dei dati.This improves the read throughput when reading the file in parallel for performing data analytics.

A livello aziendale: con disponibilità elevata e sicuroEnterprise-ready: Highly-available and secure

L’Archivio Data Lake di Azure offre affidabilità e disponibilità standard del settore.Azure Data Lake Store provides industry-standard availability and reliability. Gli asset di dati vengono archiviati in modo permanente creando copie ridondanti per salvaguardarsi da eventuali errori imprevisti.Your data assets are stored durably by making redundant copies to guard against any unexpected failures. Le aziende possono utilizzare Azure Data Lake nelle loro soluzioni come una parte importante della piattaforma di dati esistente.Enterprises can use Azure Data Lake in their solutions as an important part of their existing data platform.

Archivio Data Lake fornisce anche la protezione a livello aziendale per i dati archiviati.Data Lake Store also provides enterprise-grade security for the stored data. Per altre informazioni, vedere Protezione dei dati in Archivio Data Lake di Azure.For more information, see Securing data in Azure Data Lake Store.

Tutti i datiAll Data

L’Archivio Data Lake di Azure può immagazzinare i dati nel loro formato originale, così come sono, senza alcuna trasformazione.Azure Data Lake Store can store any data in their native format, as is, without requiring any prior transformations. Archivio Data Lake non richiede uno schema prima che i dati vengano caricati, lasciando al singolo framework di analisi l’interpretazione dei dati e la definizione di uno schema al momento dell'analisi.Data Lake Store does not require a schema to be defined before the data is loaded, leaving it up to the individual analytic framework to interpret the data and define a schema at the time of the analysis. La possibilità di archiviare i file di dimensioni e formati arbitrari fa sì che Archivio Data Lake possa gestire dati strutturati, semi-strutturati e non strutturati.Being able to store files of arbitrary sizes and formats makes it possible for Data Lake Store to handle structured, semi-structured, and unstructured data.

I contenitori di Archivio Azure Data Lake per i dati sono essenzialmente cartelle e file.Azure Data Lake Store containers for data are essentially folders and files. È possibile agire sui dati archiviati mediante SDK, portale di Azure e Azure PowerShell.You operate on the stored data using SDKs, Azure Portal, and Azure Powershell. Dopo aver inserito i dati nell'archivio usando queste interfacce e i contenitori appropriati, è possibile memorizzare qualsiasi tipo di dati.As long as you put your data into the store using these interfaces and using the appropriate containers, you can store any type of data. Archivio Data Lake non esegue una gestione particolare dei dati in base al tipo di dati archiviati.Data Lake Store does not perform any special handling of data based on the type of data it stores.

Protezione dei dati nell'archivio Data Lake di AzureSecuring data in Azure Data Lake Store

Azure Data Lake Store utilizza la Azure Active Directory per gli elenchi di autenticazione e di controllo di accesso (ACL) per gestire l'accesso ai dati.Azure Data Lake Store uses Azure Active Directory for authentication and access control lists (ACLs) to manage access to your data.

FunzionalitàFeature DescrizioneDescription
AutenticazioneAuthentication L’Archivio Data Lake di Azure si integra con la Azure Active Directory (AAD) per la gestione delle identità e degli accessi per tutti i dati memorizzati nell'archivio Data Lake di Azure.Azure Data Lake Store integrates with Azure Active Directory (AAD) for identity and access management for all the data stored in Azure Data Lake Store. Come risultato dell'integrazione, ci sono i vantaggi di Azure Data Lake tratti da tutte le funzionalità AAD compresi l’autenticazione a più fattori, l'accesso condizionale, il controllo dell'accesso basato su ruoli, il monitoraggio dell'utilizzo dell'applicazione, sicurezza, il monitoraggio e l’avviso di sicurezza, e così via. L’Archivio Data Lake di Azure supporta il protocollo OAuth 2.0 per l'autenticazione con l'interfaccia REST.As a result of the integration, Azure Data Lake benefits from all AAD features including multi-factor authentication, conditional access, role-based access control, application usage monitoring, security monitoring and alerting, etc. Azure Data Lake Store supports the OAuth 2.0 protocol for authentication with in the REST interface. Vedere Data Lake Store authentication (Autenticazione con Data Lake Store)See Data Lake Store authentication
Controllo di accessoAccess control L'Archivio Data Lake di Azure fornisce il controllo di accesso mediante il supporto delle autorizzazioni di tipo POSIX esposte dal protocollo WebHDFS.Azure Data Lake Store provides access control by supporting POSIX-style permissions exposed by the WebHDFS protocol. Nella versione di anteprima pubblica di Data Lake Store (la versione corrente) gli elenchi di controllo di accesso possono essere abilitati nella cartella radice, nelle sottocartelle e nei singoli file.In the Data Lake Store Public Preview (the current release), ACLs can be enabled on the root folder, on subfolders, and on individual files. Per altre informazioni sul funzionamento degli elenchi di controllo di accesso nel contesto di Data Lake Store, vedere Controllo di accesso in Data Lake Store.For more information on how ACLs work in context of Data Lake Store, see Access control in Data Lake Store.
CrittografiaEncryption Data Lake Store fornisce anche la crittografia per i dati archiviati nell'account.Data Lake Store also provides encryption for data that is stored in the account. Le impostazioni della crittografia vengono specificate durante la creazione dell'account Data Lake Store.You specify the encryption settings while creating a Data Lake Store account. È possibile scegliere di crittografare i dati oppure di fare a meno della crittografia.You can chose to have your data encrypted or opt for no encryption. Per altre informazioni, vedere Crittografia in Data Lake Store.For more information, see Encryption in Data Lake Store. Per istruzioni su come specificare la configurazione relativa alla crittografia, vedere Introduzione ad Azure Data Lake Store con il portale di Azure.For instructions on how to provide encryption-related configuration, see Get started with Azure Data Lake Store using the Azure Portal.

Per altre informazioni sulla protezione dei dati in Archivio Data Lake,Want to learn more about securing data in Data Lake Store. fare clic sui collegamenti seguenti.Follow the links below.

Applicazioni compatibili con l'archivio Data Lake di AzureApplications compatible with Azure Data Lake Store

Archivio Azure Data Lake è compatibile con la maggior parte dei componenti open source nell'ecosistema Hadoop.Azure Data Lake Store is compatible with most open source components in the Hadoop ecosystem. Si integra bene anche con altri servizi di Azure.It also integrates nicely with other Azure services. Questo fa di Archivio Data Lake la soluzione ideale per le esigenze di archiviazione dei dati.This makes Data Lake Store a perfect option for your data storage needs. Per altre informazioni su come usare Archivio Data Lake sia con componenti open source che con altri servizi di Azure, fare clic sui collegamenti seguenti.Follow the links below to learn more about how Data Lake Store can be used both with open source components as well as other Azure services.

Informazioni sul file system di Azure Data Lake Store (adl://)What is Azure Data Lake Store file system (adl://)?

È possibile accedere a Data Lake Store attraverso il nuovo file system, AzureDataLakeFilesystem (adl://), in ambienti Hadoop (disponibile con il cluster HDInsight).Data Lake Store can be accessed via the new filesystem, the AzureDataLakeFilesystem (adl://), in Hadoop environments (available with HDInsight cluster). Le applicazioni e servizi che utilizzano adl:// sono in grado di sfruttare altre ottimizzazioni delle prestazioni che non sono attualmente disponibili in WebHDFS.Applications and services that use adl:// are able to take advantage of further performance optimization that are not currently available in WebHDFS. Di conseguenza, l’Archivio Data Lake offre la flessibilità di ricorrere alle migliori prestazioni con l'opzione consigliata di utilizzo adl:// o di mantenere il codice esistente continuando a utilizzare l'API WebHDFS direttamente.As a result, Data Lake Store gives you the flexibility to either avail the best performance with the recommended option of using adl:// or maintain existing code by continuing to use the WebHDFS API directly. Azure HDInsight utilizza AzureDataLakeFilesystem per fornire prestazioni ottimali su Archivio Data Lake.Azure HDInsight fully leverages the AzureDataLakeFilesystem to provide the best performance on Data Lake Store.

È possibile accedere ai dati nell'Archivio Data Lake utilizzando adl://<data_lake_store_name>.azuredatalakestore.net.You can access your data in the Data Lake Store using adl://<data_lake_store_name>.azuredatalakestore.net. Per altre informazioni su come accedere ai dati nell'Archivio Data Lake vedere Visualizzare le proprietà dei dati archiviatiFor more information on how to access the data in the Data Lake Store, see View properties of the stored data

Come iniziare ad utilizzare Archivio Data Lake di Azure?How do I start using Azure Data Lake Store?

Vedere Guida introduttiva all’utilizzo di Archivio Data Lake tramite il portale di Azure, a come eseguire il provisioning di un Archivio Data Lake tramite il portale di Azure.See Get Started with Data Lake Store using the Azure Portal, on how to provision a Data Lake Store using the Azure Portal. Una volta eseguito il provisioning di Data Lake di Azure, è possibile imparare a utilizzare le offerte di Big data, ad esempio Analisi di Azure Data Lake o Azure HDInsight con l'Archivio Data Lake.Once you have provisioned Azure Data Lake, you can learn how to use big data offerings such as Azure Data Lake Analytics or Azure HDInsight with Data Lake Store. È inoltre possibile creare un'applicazione .NET per ottenere un account Archivio Data Lake di Azure ed eseguire operazioni, scaricare dati e così via.You can also create a .NET application to create an Azure Data Lake Store account and perform operations such as upload data, download data, etc.

Video su Archivio Data LakeData Lake Store videos

Se si preferisce guardare dei video per imparare a usare Archivio Data Lake, sono disponibili video su diverse funzionalità.If you prefer watching videos to learn, Data Lake Store provides videos on a range of features.