Co to jest Azure Data Lake Storage Gen1?What is Azure Data Lake Storage Gen1?

Uwaga

Usługa Azure Data Lake Storage Gen2 jest teraz ogólnie dostępna.Azure Data Lake Storage Gen2 is now generally available. Zalecamy, aby zacząć z niej korzystać już dziś.We recommend that you start using it today. Aby uzyskać więcej informacji, zobacz stronę produktu.For more information, see the product page.

Azure Data Lake Storage Gen1 jest repozytorium ogromnej skali całego przedsiębiorstwa na potrzeby obciążeń analizy danych big data.Azure Data Lake Storage Gen1 is an enterprise-wide hyper-scale repository for big data analytic workloads. Usługa Azure Data Lake umożliwia przechwytywanie danych dowolnego typu, o dowolnym rozmiarze i szybkości wprowadzania oraz przechowywanie ich w jednym miejscu na potrzeby analiz operacyjnych i poznawczych.Azure Data Lake enables you to capture data of any size, type, and ingestion speed in one single place for operational and exploratory analytics.

Data Lake Storage Gen1 jest możliwy z usługi Hadoop (dostępnej z klastrem HDInsight) przy użyciu interfejsów API REST zgodnych z WebHDFS.Data Lake Storage Gen1 can be accessed from Hadoop (available with HDInsight cluster) using the WebHDFS-compatible REST APIs. On zostało zaprojektowane w celu umożliwienia analizy przechowywanych danych i jest ona dostrojona dla wydajności dla scenariuszy analizy danych.It's designed to enable analytics on the stored data and is tuned for performance for data analytics scenarios. Data Lake Storage Gen1 zapewnia wszystkie funkcje klasy korporacyjnej: zabezpieczeń, możliwości zarządzania, skalowalności, niezawodności i dostępności.Data Lake Storage Gen1 includes all enterprise-grade capabilities: security, manageability, scalability, reliability, and availability.

Azure Data Lake

Najważniejsze możliwościKey capabilities

Niektóre z kluczowych możliwości Data Lake Storage Gen1 następujące.Some of the key capabilities of Data Lake Storage Gen1 include the following.

Stworzona dla platformy HadoopBuilt for Hadoop

Data Lake Storage Gen1 jest system plików Apache Hadoop, jest zgodna z pliku System (HDFS, Hadoop Distributed), która działa w ekosystemie usługi Hadoop.Data Lake Storage Gen1 is an Apache Hadoop file system that's compatible with Hadoop Distributed File System (HDFS), and works with the Hadoop ecosystem. Istniejące HDInsight aplikacji lub usług, które używają interfejsu API WebHDFS można łatwo zintegrować z Data Lake Storage Gen1.Your existing HDInsight applications or services that use the WebHDFS API can easily integrate with Data Lake Storage Gen1. Data Lake Storage Gen1 udostępnia również interfejs REST zgodny z WebHDFS dla aplikacji.Data Lake Storage Gen1 also exposes a WebHDFS-compatible REST interface for applications.

Można łatwo analizować dane przechowywane w Data Lake Storage Gen1 za pomocą platform analitycznych Hadoop, takich jak MapReduce lub Hive.You can easily analyze data stored in Data Lake Storage Gen1 using Hadoop analytic frameworks such as MapReduce or Hive. Można inicjować obsługę klastrów usługi Azure HDInsight i ich konfigurowania pod kątem uzyskania bezpośredniego dostępu do danych przechowywanych w Data Lake Storage Gen1.You can provision Azure HDInsight clusters and configure them to directly access data stored in Data Lake Storage Gen1.

Nieograniczony magazyn, petabajtowe plikiUnlimited storage, petabyte files

Data Lake Storage Gen1 zapewnia nieograniczony magazyn i mogą przechowywać różne danych na potrzeby analiz.Data Lake Storage Gen1 provides unlimited storage and can store a variety of data for analytics. Go nie nakłada żadnych limitów dotyczących rozmiarów kont, rozmiarów plików lub ilości danych, które mogą być przechowywane w usłudze data lake.It doesn't impose any limits on account sizes, file sizes, or the amount of data that can be stored in a data lake. Pojedyncze pliki należą do zakresu od kilobajta do petabajtów rozmiar.Individual files can range from kilobyte to petabytes in size. Dane są przechowywane trwale dzięki tworzeniu wielu kopii.Data is stored durably by making multiple copies. Nie ma żadnego limitu na czas, dla którego dane mogą być przechowywane w usłudze data lake.There is no limit on the duration of time for which the data can be stored in the data lake.

Wydajność dostosowana na potrzeby analizy danych big dataPerformance-tuned for big data analytics

Data Lake Storage Gen1 zaprojektowano pod kątem uruchamiania dużych systemów analitycznych, wymagających ogromnej przepustowości do zadawania zapytań i analizowania dużych ilości danych.Data Lake Storage Gen1 is built for running large-scale analytic systems that require massive throughput to query and analyze large amounts of data. Usługa Data Lake rozmieszcza części pliku na wielu serwerach magazynu.The data lake spreads parts of a file over a number of individual storage servers. Zwiększa to przepływność odczytu podczas odczytywania pliku równolegle w celu wykonywania analizy danych.This improves the read throughput when reading the file in parallel for performing data analytics.

Z myślą o przedsiębiorstwach: Wysoko dostępnych i bezpiecznychEnterprise ready: Highly available and secure

Data Lake Storage Gen1 zapewnia będące standardami branżowymi, dostępność i niezawodność.Data Lake Storage Gen1 provides industry-standard availability and reliability. Dane są przechowywane trwale dzięki wykonywaniu nadmiarowych kopii, aby zapewnić ochronę danych na wypadek nieoczekiwanych awarii.Your data assets are stored durably by making redundant copies to guard against any unexpected failures.

Data Lake Storage Gen1 zapewnia również zabezpieczenia korporacyjnej dla przechowywanych danych.Data Lake Storage Gen1 also provides enterprise-grade security for the stored data. Aby uzyskać więcej informacji, zobacz Zabezpieczanie danych w usłudze Azure Data Lake magazynu Gen1.For more information, see Securing data in Azure Data Lake Storage Gen1.

Wszystkie daneAll data

Data Lake Storage Gen1 może przechowywać wszystkie dane w formacie natywnym, bez wymagania jakiegokolwiek uprzedniego przekształcania.Data Lake Storage Gen1 can store any data in its native format, without requiring any prior transformations. Data Lake Storage Gen1 nie wymaga schematu należy zdefiniować przed załadowaniem danych równoczesnym pozostawieniu ich do poszczególnych framework analitycznych do interpretowania danych i zdefiniowanie schematu w czasie analizy.Data Lake Storage Gen1 does not require a schema to be defined before the data is loaded, leaving it up to the individual analytic framework to interpret the data and define a schema at the time of the analysis. Możliwość przechowywania plików dowolnych rozmiarów i formatów sprawiają, że Data Lake Storage Gen1 do obsługi danych ze strukturą, częściową strukturą i bez struktury.The ability to store files of arbitrary sizes and formats makes it possible for Data Lake Storage Gen1 to handle structured, semi-structured, and unstructured data.

Data Lake Storage Gen1 kontenery dla danych są zasadniczo foldery i pliki.Data Lake Storage Gen1 containers for data are essentially folders and files. Używanym dla przechowywanych danych przy użyciu zestawów SDK, witryny Azure portal i programu Azure Powershell.You operate on the stored data using SDKs, the Azure portal, and Azure Powershell. Jeśli dane są umieszczane w magazynie, za pomocą tych interfejsów i przy użyciu odpowiednich kontenerów, można przechowywać dane dowolnego typu.If you put your data into the store using these interfaces and using the appropriate containers, you can store any type of data. Data Lake Storage Gen1 nie wykonuje żadnej specjalnej obsługi danych na podstawie typu danych, które przechowuje.Data Lake Storage Gen1 does not perform any special handling of data based on the type of data it stores.

Zabezpieczanie danychSecuring data

Usługa Data Lake Gen1 magazynu używa usługi Azure Active Directory (Azure AD) do uwierzytelniania i dostępu do kontroli list kontroli dostępu (ACL) do zarządzania dostępem do danych.Data Lake Storage Gen1 uses Azure Active Directory (Azure AD) for authentication, and access control lists (ACLs) to manage access to your data.

CechaFeature OpisDescription
AuthenticationAuthentication Data Lake Storage Gen1 integruje się z usługą Azure AD do zarządzania tożsamościami i dostępem dla wszystkich danych przechowywanych w Data Lake Storage Gen1.Data Lake Storage Gen1 integrates with Azure AD for identity and access management for all the data stored in Data Lake Storage Gen1. Dzięki integracji Data Lake Storage Gen1 korzyści z wszystkie usługi Azure AD są wyposażone w takie jak uwierzytelnianie wieloskładnikowe, dostęp warunkowy, kontrola dostępu oparta na rolach, monitorowania użycia aplikacji, monitorowanie zabezpieczeń i alertów i tak dalej.Because of the integration, Data Lake Storage Gen1 benefits from all Azure AD feature such as multi-factor authentication, Conditional Access, role-based access control, application usage monitoring, security monitoring and alerting, and so on. Data Lake Storage Gen1 obsługuje protokół OAuth 2.0 na potrzeby uwierzytelniania w ramach interfejsu REST.Data Lake Storage Gen1 supports the OAuth 2.0 protocol for authentication within the REST interface. Zobacz uwierzytelniania Data Lake Storage Gen1.See Data Lake Storage Gen1 authentication.
Kontrola dostępuAccess control Data Lake Storage Gen1 zapewnia kontrolę dostępu dzięki obsłudze uprawnień POSIX udostępnianych przez protokół WebHDFS.Data Lake Storage Gen1 provides access control by supporting POSIX-style permissions exposed by the WebHDFS protocol. Można włączyć listy ACL dla folderu głównego, podfolderów i poszczególnych plików.You can enable ACLs on the root folder, on subfolders, and on individual files. Aby uzyskać więcej informacji na temat sposobu działania list kontroli dostępu w kontekście Data Lake Storage Gen1 zobacz kontrola dostępu w usługach Data Lake Storage Gen1.For more information about how ACLs work in the context of Data Lake Storage Gen1, see Access control in Data Lake Storage Gen1.
SzyfrowanieEncryption Data Lake Storage Gen1 umożliwia także szyfrowanie danych przechowywanych na koncie.Data Lake Storage Gen1 also provides encryption for data that's stored in the account. Ustawienia szyfrowania należy określić podczas tworzenia konta Data Lake Storage Gen1.You specify the encryption settings while creating a Data Lake Storage Gen1 account. Istnieje możliwość danych lub wybrać bez szyfrowania.You can choose to have your data encrypted or opt for no encryption. Aby uzyskać więcej informacji, zobacz szyfrowania w Data Lake Storage Gen1.For more information, see Encryption in Data Lake Storage Gen1. Aby uzyskać instrukcje na temat sposobu zapewnienia konfiguracji związanych z szyfrowaniem, zobacz Rozpoczynanie pracy z usługą Data Lake Storage Gen1 przy użyciu witryny Azure portal.For instructions on how to provide encryption-related configuration, see Get started with Data Lake Storage Gen1 using the Azure portal.

Aby uzyskać instrukcje, jak zabezpieczyć dane w Data Lake Storage Gen1, zobacz Zabezpieczanie danych w usłudze Azure Data Lake magazynu Gen1.For instructions on how to secure data in Data Lake Storage Gen1, see Securing data in Azure Data Lake Storage Gen1.

Zgodność aplikacjiApplication compatibility

Data Lake Storage Gen1 jest zgodny z większości składników typu open source należący do ekosystemu platformy Hadoop.Data Lake Storage Gen1 is compatible with most open-source components in the Hadoop ecosystem. Integruje się także współpracuje z innymi usługami platformy Azure.It also integrates well with other Azure services. Aby dowiedzieć się więcej na temat wykorzystania programu Data Lake Storage Gen1 dzięki składnikom typu open source i innych usług platformy Azure, użyj następujących linków:To learn more about how you can use Data Lake Storage Gen1 with open-source components and other Azure services, use the following links:

System plików Gen1 magazynu jeziora danychData Lake Storage Gen1 file system

Data Lake Storage Gen1 jest możliwy za pośrednictwem systemu plików AzureDataLakeFilesystem (adl: / /) w środowiskach Hadoop (dostępnych z klastrem HDInsight).Data Lake Storage Gen1 can be accessed via the filesystem AzureDataLakeFilesystem (adl://) in Hadoop environments (available with HDInsight cluster). Aplikacje i usługi używające systemu plików adl: / / skorzystać z dalszej optymalizacji wydajności, które nie są obecnie dostępne w systemie plików WebHDFS.Applications and services that use adl:// can take advantage of further performance optimizations that aren't currently available in WebHDFS. Co w efekcie Data Lake Storage Gen1 zapewnia elastyczność albo wprowadzone za pomocą o najlepszej wydajności zalecane możliwość korzystania z systemu plików adl: / / lub nadal obsługiwać istniejący kod przy użyciu interfejsu API WebHDFS bezpośrednio.As a result, Data Lake Storage Gen1 gives you the flexibility to either make use of the best performance with the recommended option of using adl:// or maintain existing code by continuing to use the WebHDFS API directly. Usługa Azure HDInsight w pełni wykorzystuje system AzureDataLakeFilesystem, aby zapewnić najlepszą wydajność na Data Lake Storage Gen1.Azure HDInsight fully leverages the AzureDataLakeFilesystem to provide the best performance on Data Lake Storage Gen1.

Dostępne dane przy użyciu Data Lake Storage Gen1 adl://<data_lake_storage_gen1_name>.azuredatalakestore.net.You can access your data in Data Lake Storage Gen1 using adl://<data_lake_storage_gen1_name>.azuredatalakestore.net. Aby uzyskać więcej informacji o tym, jak uzyskać dostęp do danych Data Lake Storage Gen1, zobacz wyświetlanie właściwości przechowywanych danych.For more information about how to access the data in Data Lake Storage Gen1, see View properties of the stored data.

Kolejne krokiNext steps