Co je Azure Data Lake Storage Gen1?What is Azure Data Lake Storage Gen1?

Poznámka

Platforma Azure Data Lake Storage Gen2 je teď obecně dostupná.Azure Data Lake Storage Gen2 is now generally available. Doporučujeme začít ji používat ještě dnes.We recommend that you start using it today. Další informace najdete na stránce produktu.For more information, see the product page.

Azure Data Lake Storage Gen1 je podnikové úrovni hyperškálovatelné úložiště pro analytické úlohy s velkými objemy dat.Azure Data Lake Storage Gen1 is an enterprise-wide hyper-scale repository for big data analytic workloads. Azure Data Lake umožňuje zaznamenávat data libovolné velikosti, typu a rychlosti příjmu do jediného místa pro účely provozní a zjišťovací analýzy.Azure Data Lake enables you to capture data of any size, type, and ingestion speed in one single place for operational and exploratory analytics.

Data Lake Storage Gen1 je přístupná z Hadoop (dostupné s clusterem HDInsight) pomocí rozhraní REST API kompatibilních s WebHDFS.Data Lake Storage Gen1 can be accessed from Hadoop (available with HDInsight cluster) using the WebHDFS-compatible REST APIs. Je navržena tak, aby povolení analýzy uložených dat a je vyladění z hlediska výkonu pro scénáře analýzy dat.It's designed to enable analytics on the stored data and is tuned for performance for data analytics scenarios. Data Lake Storage Gen1 včetně všech schopností na podnikové úrovni: zabezpečení, spravovatelnosti, škálovatelnosti, spolehlivosti a dostupnosti.Data Lake Storage Gen1 includes all enterprise-grade capabilities: security, manageability, scalability, reliability, and availability.

Azure Data Lake

Klíčové funkceKey capabilities

Mezi klíčové funkce Gen1 úložiště Data Lake patří následující.Some of the key capabilities of Data Lake Storage Gen1 include the following.

Sestaveno pro HadoopBuilt for Hadoop

Gen1 úložiště data Lake je systém souborů Apache Hadoop, který je kompatibilní s HDFS Hadoop Distributed File System () a spolupracuje s ekosystémem Hadoop.Data Lake Storage Gen1 is an Apache Hadoop file system that's compatible with Hadoop Distributed File System (HDFS), and works with the Hadoop ecosystem. Vaše aplikace HDInsight nebo služby, které používají rozhraní API WebHDFS můžou snadno integrovat s Data Lake Storage Gen1.Your existing HDInsight applications or services that use the WebHDFS API can easily integrate with Data Lake Storage Gen1. Data Lake Storage Gen1 také poskytuje rozhraní kompatibilních s WebHDFS REST pro aplikace.Data Lake Storage Gen1 also exposes a WebHDFS-compatible REST interface for applications.

Můžete snadno analyzovat data uložená v Data Lake Storage Gen1 pomocí analytických rámců Hadoop, jako je například MapReduce nebo Hive.You can easily analyze data stored in Data Lake Storage Gen1 using Hadoop analytic frameworks such as MapReduce or Hive. Můžete vytvářet clustery Azure HDInsight a nakonfigurujete je, aby přímo přístup k datům uloženým v Data Lake Storage Gen1.You can provision Azure HDInsight clusters and configure them to directly access data stored in Data Lake Storage Gen1.

Neomezené úložiště, petabajtové souboryUnlimited storage, petabyte files

Data Lake Storage Gen1 poskytuje neomezené úložiště a můžete ukládat různá data pro analýzu.Data Lake Storage Gen1 provides unlimited storage and can store a variety of data for analytics. Neuplatňuje žádná omezení velikosti účtů, velikosti souborů nebo množství dat, které mohou být uloženy ve službě data lake.It doesn't impose any limits on account sizes, file sizes, or the amount of data that can be stored in a data lake. Jednotlivých souborů může pohybovat od kilobajtů až petabajty velikosti.Individual files can range from kilobyte to petabytes in size. Data se ukládají odolným způsobem díky vytváření více kopií.Data is stored durably by making multiple copies. Neexistuje žádné omezení na doba, po kterou můžete být data uložená ve službě data lake.There is no limit on the duration of time for which the data can be stored in the data lake.

Optimalizace výkonu pro analýzu velkých objemů datPerformance-tuned for big data analytics

Gen1 úložiště data Lake je určený pro spouštění rozsáhlých analytických systémů, které vyžadují mimořádně velkou propustnost pro dotazy a analýzu velkých objemů dat.Data Lake Storage Gen1 is built for running large-scale analytic systems that require massive throughput to query and analyze large amounts of data. Úložiště Data Lake rozděluje části souborů do několika jednotlivých serverů úložiště.The data lake spreads parts of a file over a number of individual storage servers. Tím se zvyšuje propustnost čtení při paralelním čtení souboru pro provádění analýz dat.This improves the read throughput when reading the file in parallel for performing data analytics.

Připraveno pro podniky: Vysoce dostupnou a zabezpečenouEnterprise ready: Highly available and secure

Data Lake Storage Gen1 poskytuje standardní dostupnost a spolehlivost.Data Lake Storage Gen1 provides industry-standard availability and reliability. Vaše datové prostředky se ukládají odolným způsobem díky vytváření redundantních kopií, které chrání před neočekávaným selháním.Your data assets are stored durably by making redundant copies to guard against any unexpected failures.

Data Lake Storage Gen1 také poskytuje zabezpečení na podnikové úrovni pro uložená data.Data Lake Storage Gen1 also provides enterprise-grade security for the stored data. Další informace najdete v tématu zabezpečení dat v Azure Data Lake Storage Gen1.For more information, see Securing data in Azure Data Lake Storage Gen1.

Všechna dataAll data

Data Lake Storage Gen1 dokáže ukládat libovolná data v nativním formátu bez nutnosti předchozí transformace.Data Lake Storage Gen1 can store any data in its native format, without requiring any prior transformations. Data Lake Storage Gen1 nevyžaduje, aby schéma být definovány před načtením dat, ale ponechává jednotlivých analytické framework interpretoval data a definovat schéma během analýzy.Data Lake Storage Gen1 does not require a schema to be defined before the data is loaded, leaving it up to the individual analytic framework to interpret the data and define a schema at the time of the analysis. Možnost ukládat soubory libovolných velikostí a formátů umožňuje Gen1 úložiště Data Lake pro zpracování strukturovaných, částečně strukturovaná a Nestrukturovaná data.The ability to store files of arbitrary sizes and formats makes it possible for Data Lake Storage Gen1 to handle structured, semi-structured, and unstructured data.

Data Lake Storage Gen1 kontejnery na data jsou v podstatě složky a soubory.Data Lake Storage Gen1 containers for data are essentially folders and files. Pracují s uloženými daty pracujete pomocí sady SDK, webu Azure portal a Azure Powershellu.You operate on the stored data using SDKs, the Azure portal, and Azure Powershell. Když vložíte data do úložiště pomocí těchto rozhraní a příslušných kontejnerů, můžete ukládat data libovolného typu.If you put your data into the store using these interfaces and using the appropriate containers, you can store any type of data. Data Lake Storage Gen1 neprovádí žádným zvláštním způsobem na základě typu dat, která ukládá data.Data Lake Storage Gen1 does not perform any special handling of data based on the type of data it stores.

Zabezpečení datSecuring data

Data Lake Storage Gen1 používá Azure Active Directory (Azure AD) pro ověřování a přístup k řízení seznamy ACL můžete spravovat přístup k vašim datům.Data Lake Storage Gen1 uses Azure Active Directory (Azure AD) for authentication, and access control lists (ACLs) to manage access to your data.

FunkceFeature PopisDescription
AuthenticationAuthentication Gen1 úložiště data Lake se integruje s Azure AD pro správu identit a přístupu pro všechna data uložená v Data Lake Storage Gen1.Data Lake Storage Gen1 integrates with Azure AD for identity and access management for all the data stored in Data Lake Storage Gen1. Díky integraci Data Lake Storage Gen1 výhody všech Azure AD funkce jako je například vícefaktorové ověřování, podmíněného přístupu, řízení přístupu na základě rolí, sledování využití aplikací, monitorování zabezpečení a upozorňování a tak dále.Because of the integration, Data Lake Storage Gen1 benefits from all Azure AD feature such as multi-factor authentication, conditional access, role-based access control, application usage monitoring, security monitoring and alerting, and so on. Data Lake Storage Gen1 podporuje protokol OAuth 2.0 pro ověřování v rámci rozhraní REST.Data Lake Storage Gen1 supports the OAuth 2.0 protocol for authentication within the REST interface. Zobrazit ověřování Data Lake Storage Gen1.See Data Lake Storage Gen1 authentication.
Řízení přístupuAccess control Data Lake Storage Gen1 poskytuje řízení přístupu díky podpoře oprávnění ve stylu POSIX vystavený protokolem WebHDFS.Data Lake Storage Gen1 provides access control by supporting POSIX-style permissions exposed by the WebHDFS protocol. Můžete povolit seznamy řízení přístupu u kořenové složky, podsložek a jednotlivých souborů.You can enable ACLs on the root folder, on subfolders, and on individual files. Další informace o fungování seznamů řízení přístupu v kontextu Data Lake Storage Gen1 najdete v tématu řízení přístupu v Data Lake Storage Gen1.For more information about how ACLs work in the context of Data Lake Storage Gen1, see Access control in Data Lake Storage Gen1.
ŠifrováníEncryption Data Lake Storage Gen1 také zajišťuje šifrování dat uložených v účtu.Data Lake Storage Gen1 also provides encryption for data that's stored in the account. Nastavení šifrování se zadává při vytváření účtu Data Lake Storage Gen1.You specify the encryption settings while creating a Data Lake Storage Gen1 account. Můžete se vaše data šifrovala, nebo zvolit možnost bez šifrování.You can choose to have your data encrypted or opt for no encryption. Další informace najdete v tématu šifrování ve službě Data Lake Storage Gen1.For more information, see Encryption in Data Lake Storage Gen1. Pokyny pro poskytnutí konfigurace související se šifrováním najdete v tématu Začínáme s Data Lake Storage Gen1 pomocí webu Azure portal.For instructions on how to provide encryption-related configuration, see Get started with Data Lake Storage Gen1 using the Azure portal.

Pokyny k zabezpečení dat v Data Lake Storage Gen1 najdete v tématu zabezpečení dat v Azure Data Lake Storage Gen1.For instructions on how to secure data in Data Lake Storage Gen1, see Securing data in Azure Data Lake Storage Gen1.

Kompatibilita aplikacíApplication compatibility

Data Lake Storage Gen1 je kompatibilní s Většina komponent open source v ekosystému Hadoop.Data Lake Storage Gen1 is compatible with most open-source components in the Hadoop ecosystem. Taky se integruje s dalšími službami Azure.It also integrates well with other Azure services. Další informace o použití Data Lake Storage Gen1 s open source komponenty a další služby Azure, použijte následující odkazy:To learn more about how you can use Data Lake Storage Gen1 with open-source components and other Azure services, use the following links:

Systém souborů data Lake Storage Gen1Data Lake Storage Gen1 file system

Data Lake Storage Gen1 je přístupná prostřednictvím systému souborů, AzureDataLakeFilesystem (adl: / /) v prostředích Hadoop (dostupné s clusterem HDInsight).Data Lake Storage Gen1 can be accessed via the filesystem AzureDataLakeFilesystem (adl://) in Hadoop environments (available with HDInsight cluster). Aplikace a služby, které používají adl: / / můžete využít další optimalizace výkonu, které nejsou ve WebHDFS aktuálně dostupná.Applications and services that use adl:// can take advantage of further performance optimizations that aren't currently available in WebHDFS. V důsledku toho Gen1 úložiště Data Lake poskytuje flexibilitu při buď provedete pomocí nejlepší výkon doporučená možnost použití adl: / / nebo zachovat stávající kód a dál přímo používat rozhraní API WebHDFS.As a result, Data Lake Storage Gen1 gives you the flexibility to either make use of the best performance with the recommended option of using adl:// or maintain existing code by continuing to use the WebHDFS API directly. Azure HDInsight plně využívá systém AzureDataLakeFilesystem k zajištění nejlepšího výkonu v Data Lake Storage Gen1.Azure HDInsight fully leverages the AzureDataLakeFilesystem to provide the best performance on Data Lake Storage Gen1.

Můžete přistupovat k datům v Data Lake Storage Gen1 pomocí adl://<data_lake_storage_gen1_name>.azuredatalakestore.net.You can access your data in Data Lake Storage Gen1 using adl://<data_lake_storage_gen1_name>.azuredatalakestore.net. Další informace o tom, jak získat přístup k datům v Data Lake Storage Gen1 najdete v tématu zobrazení vlastností uložených dat.For more information about how to access the data in Data Lake Storage Gen1, see View properties of the stored data.

Další postupNext steps