Was ist Azure Data Lake Storage Gen1?What is Azure Data Lake Storage Gen1?

Hinweis

Azure Data Lake Storage Gen2 ist jetzt allgemein verfügbar.Azure Data Lake Storage Gen2 is now generally available. Es wird empfohlen, ab sofort diese SKU zu verwenden.We recommend that you start using it today. Weitere Informationen hierzu finden Sie auf der Produktseite.For more information, see the product page.

Azure Data Lake Storage Gen1 ist ein unternehmensweites Repository mit Hyperskalierung für Big Data-Analyseworkloads.Azure Data Lake Storage Gen1 is an enterprise-wide hyper-scale repository for big data analytic workloads. Azure Data Lake bietet Ihnen die Möglichkeit, Daten von beliebiger Größe, Art und Erfassungsgeschwindigkeit zur Durchführung operativer und explorativer Analysen an einem einzigen Ort zu erfassen.Azure Data Lake enables you to capture data of any size, type, and ingestion speed in one single place for operational and exploratory analytics.

Auf Data Lake Storage Gen1 kann über Hadoop (verfügbar mit HDInsight-Cluster) mithilfe der WebHDFS-kompatiblen REST-APIs zugegriffen werden.Data Lake Storage Gen1 can be accessed from Hadoop (available with HDInsight cluster) using the WebHDFS-compatible REST APIs. Dieser Speichertyp wurde speziell für Analysen der gespeicherten Daten konzipiert und ist für eine hohe Leistung in Datenanalyseszenarien optimiert.It's designed to enable analytics on the stored data and is tuned for performance for data analytics scenarios. Data Lake Storage Gen1 bietet alle Funktionen für Unternehmen: Sicherheit, Verwaltbarkeit, Skalierbarkeit, Zuverlässigkeit und Verfügbarkeit.Data Lake Storage Gen1 includes all enterprise-grade capabilities: security, manageability, scalability, reliability, and availability.

Azure Data Lake

Wichtige FunktionenKey capabilities

Data Lake Storage Gen1 bietet u.a. die folgenden wichtigen Funktionen.Some of the key capabilities of Data Lake Storage Gen1 include the following.

Konzipiert für HadoopBuilt for Hadoop

Bei Data Lake Storage Gen1 handelt es sich um ein Apache Hadoop-Dateisystem, das mit dem HDFS (Hadoop Distributed File System) kompatibel ist und mit dem Hadoop-Ökosystem eingesetzt werden kann.Data Lake Storage Gen1 is an Apache Hadoop file system that's compatible with Hadoop Distributed File System (HDFS), and works with the Hadoop ecosystem. Ihre vorhandenen HDInsight-Anwendungen oder -Dienste, die die WebHDFS-API verwenden, können problemlos in Data Lake Storage Gen1 integriert werden.Your existing HDInsight applications or services that use the WebHDFS API can easily integrate with Data Lake Storage Gen1. Data Lake Storage Gen1 macht auch eine WebHDFS-kompatible REST-Schnittstelle für Anwendungen verfügbar.Data Lake Storage Gen1 also exposes a WebHDFS-compatible REST interface for applications.

Sie können in Data Lake Storage Gen1 gespeicherte Daten mühelos mit Hadoop-Analyseframeworks wie MapReduce oder Hive analysieren.You can easily analyze data stored in Data Lake Storage Gen1 using Hadoop analytic frameworks such as MapReduce or Hive. Sie können Azure HDInsight-Cluster bereitstellen und für den direkten Zugriff auf in Data Lake Storage Gen1 gespeicherte Daten konfigurieren.You can provision Azure HDInsight clusters and configure them to directly access data stored in Data Lake Storage Gen1.

Unbegrenzter Speicher, Dateigrößen bis in den PetabytebereichUnlimited storage, petabyte files

Data Lake Storage Gen1 bietet unbegrenzten Speicher und kann unterschiedlichste Daten für Analysezwecke speichern.Data Lake Storage Gen1 provides unlimited storage and can store a variety of data for analytics. Es gibt keinerlei Einschränkungen für Kontogrößen, Dateigrößen oder die Menge an Daten, die in einem Data Lake gespeichert werden kann.It doesn't impose any limits on account sizes, file sizes, or the amount of data that can be stored in a data lake. Einzelne Dateien können von Kilobyte bis Petabyte groß sein.Individual files can range from kilobyte to petabytes in size. Daten werden dauerhaft gespeichert, indem mehrere Kopien angefertigt werden.Data is stored durably by making multiple copies. Die Daten können für unbegrenzte Zeit im Data Lake gespeichert werden.There is no limit on the duration of time for which the data can be stored in the data lake.

Leistungsoptimiert für Big Data-AnalysenPerformance-tuned for big data analytics

Data Lake Storage Gen1 ist für die Ausführung großer Analysesysteme ausgelegt, die zum Abfragen und Analysieren großer Datenmengen einen enormen Durchsatz erfordern.Data Lake Storage Gen1 is built for running large-scale analytic systems that require massive throughput to query and analyze large amounts of data. Der Data Lake verteilt Teile einer Datei auf mehrere einzelne Speicherserver.The data lake spreads parts of a file over a number of individual storage servers. Dies verbessert den Lesedurchsatz, wenn die Datei zum Ausführen von Datenanalysen parallel gelesen wird.This improves the read throughput when reading the file in parallel for performing data analytics.

Bereit für den Einsatz in Unternehmen: Hoch verfügbar und sicherEnterprise ready: Highly available and secure

Data Lake Storage Gen1 bietet Verfügbarkeit und Zuverlässigkeit nach Branchenstandard.Data Lake Storage Gen1 provides industry-standard availability and reliability. Ihre Datenassets werden dauerhaft gespeichert, indem zum Schutz vor unerwarteten Fehlern redundante Kopien erstellt werden.Your data assets are stored durably by making redundant copies to guard against any unexpected failures.

Data Lake Storage Gen1 bietet außerdem Sicherheit auf Unternehmensniveau für die gespeicherten Daten.Data Lake Storage Gen1 also provides enterprise-grade security for the stored data. Weitere Informationen finden Sie unter Schützen von Daten in Data Lake Storage Gen1.For more information, see Securing data in Azure Data Lake Storage Gen1.

Alle DatenAll data

Data Lake Storage Gen1 kann beliebige Daten ohne vorherige Umwandlung im nativen Format speichern.Data Lake Storage Gen1 can store any data in its native format, without requiring any prior transformations. Bei Data Lake Storage Gen1 ist es nicht erforderlich, vor dem Laden der Daten ein Schema zu definieren. Die Interpretation der Daten und Definition eines Schemas erfolgt zum Zeitpunkt der Analyse durch die einzelnen Analyseframeworks.Data Lake Storage Gen1 does not require a schema to be defined before the data is loaded, leaving it up to the individual analytic framework to interpret the data and define a schema at the time of the analysis. Dank der Möglichkeit, Dateien beliebiger Größe und Formate zu speichern, kann Data Lake Storage Gen1 strukturierte, teilweise strukturierte und unstrukturierte Daten verwalten.The ability to store files of arbitrary sizes and formats makes it possible for Data Lake Storage Gen1 to handle structured, semi-structured, and unstructured data.

Data Lake Storage Gen1-Container für Daten sind im Wesentlichen Ordner und Dateien.Data Lake Storage Gen1 containers for data are essentially folders and files. Sie arbeiten mit den gespeicherten Daten über SDKs, das Azure-Portal und Azure PowerShell.You operate on the stored data using SDKs, the Azure portal, and Azure Powershell. Wenn Sie Ihre Daten unter Verwendung dieser Schnittstellen im Speicher ablegen und die entsprechenden Container verwenden, können Sie jeden Datentyp speichern.If you put your data into the store using these interfaces and using the appropriate containers, you can store any type of data. Data Lake Storage Gen1 führt keine spezielle Verarbeitung von Daten basierend auf dem Typ der gespeicherten Daten durch.Data Lake Storage Gen1 does not perform any special handling of data based on the type of data it stores.

Absichern von DatenSecuring data

Data Lake Storage Gen1 verwendet Azure Active Directory (Azure AD) zur Authentifizierung und Zugriffssteuerungslisten (ACLs) zum Verwalten des Zugriffs auf Ihre Daten.Data Lake Storage Gen1 uses Azure Active Directory (Azure AD) for authentication, and access control lists (ACLs) to manage access to your data.

FeatureFeature BESCHREIBUNGDescription
AuthenticationAuthentication Zur Identitäts- und Zugriffsverwaltung für alle in Data Lake Storage Gen1 gespeicherten Daten ist Data Lake Storage Gen1 in Azure AD integriert.Data Lake Storage Gen1 integrates with Azure AD for identity and access management for all the data stored in Data Lake Storage Gen1. Durch diese Integration nutzt Data Lake Storage Gen1 sämtliche Azure AD-Features, z.B. mehrstufige Authentifizierung, bedingten Zugriff, rollenbasierte Zugriffssteuerung, Überwachung der Anwendungsnutzung, Sicherheitsüberwachung und -warnungen.Because of the integration, Data Lake Storage Gen1 benefits from all Azure AD feature such as multi-factor authentication, Conditional Access, role-based access control, application usage monitoring, security monitoring and alerting, and so on. Data Lake Storage Gen1 unterstützt das OAuth 2.0-Protokoll für die Authentifizierung mit der REST-Schnittstelle.Data Lake Storage Gen1 supports the OAuth 2.0 protocol for authentication within the REST interface. Weitere Informationen finden Sie unter Authentifizierung bei Azure Data Lake Storage Gen1.See Data Lake Storage Gen1 authentication.
ZugriffssteuerungAccess control Data Lake Storage Gen1 ermöglicht eine Zugriffssteuerung durch die Unterstützung von POSIX-Berechtigungen, die vom WebHDFS-Protokoll verfügbar gemacht werden.Data Lake Storage Gen1 provides access control by supporting POSIX-style permissions exposed by the WebHDFS protocol. ACLs können für Stammordner, Unterordner und einzelne Dateien aktiviert werden.You can enable ACLs on the root folder, on subfolders, and on individual files. Weitere Informationen zur Funktionsweise von ACLs im Kontext von Data Lake Storage Gen1 finden Sie unter Zugriffssteuerung in Azure Data Lake Storage Gen1.For more information about how ACLs work in the context of Data Lake Storage Gen1, see Access control in Data Lake Storage Gen1.
VerschlüsselungEncryption Data Lake Storage Gen1 bietet auch eine Verschlüsselung für Daten, die im Konto gespeichert sind.Data Lake Storage Gen1 also provides encryption for data that's stored in the account. Beim Erstellen eines Data Lake Storage Gen1-Kontos geben Sie die Einstellungen für die Verschlüsselung an.You specify the encryption settings while creating a Data Lake Storage Gen1 account. Sie können auswählen, ob Ihre Daten verschlüsselt werden sollen.You can choose to have your data encrypted or opt for no encryption. Weitere Informationen finden Sie unter Verschlüsselung von Daten in Azure Data Lake Storage Gen1.For more information, see Encryption in Data Lake Storage Gen1. Anweisungen zur Bereitstellung einer verschlüsselungsbezogenen Konfiguration finden Sie unter Erste Schritte mit Data Lake Storage Gen1 über das Azure-Portal.For instructions on how to provide encryption-related configuration, see Get started with Data Lake Storage Gen1 using the Azure portal.

Anweisungen zum Schutz von Daten in Data Lake Storage Gen1 finden Sie unter Schutz von Daten in Azure Data Lake Storage Gen1.For instructions on how to secure data in Data Lake Storage Gen1, see Securing data in Azure Data Lake Storage Gen1.

AnwendungskompatibilitätApplication compatibility

Data Lake Storage Gen1 ist mit den meisten Open Source-Komponenten im Hadoop-Ökosystem kompatibel.Data Lake Storage Gen1 is compatible with most open-source components in the Hadoop ecosystem. Außerdem ist eine problemlose Integration in andere Azure-Dienste möglich.It also integrates well with other Azure services. Weitere Informationen zur Verwendung von Data Lake Storage Gen1 mit Open-Source-Komponenten und anderen Azure-Diensten finden Sie unter den folgenden Links:To learn more about how you can use Data Lake Storage Gen1 with open-source components and other Azure services, use the following links:

Data Lake Storage Gen1-DateisystemData Lake Storage Gen1 file system

In Hadoop-Umgebungen (verfügbar mit HDInsight-Clustern) kann über das Dateisystem AzureDataLakeFilesystem (adl://) auf Data Lake Storage Gen1 zugegriffen werden.Data Lake Storage Gen1 can be accessed via the filesystem AzureDataLakeFilesystem (adl://) in Hadoop environments (available with HDInsight cluster). Anwendungen und Dienste, die adl:// verwenden, können weitere Leistungsoptimierungen nutzen, die gegenwärtig nicht in WebHDFS verfügbar sind.Applications and services that use adl:// can take advantage of further performance optimizations that aren't currently available in WebHDFS. Daher bietet Ihnen Data Lake Storage Gen1 die Flexibilität, entweder mit adl:// (empfohlene Option) die optimale Leistung zu nutzen oder vorhandenen Code beizubehalten, indem Sie die WebHDFS-API weiterhin direkt verwenden.As a result, Data Lake Storage Gen1 gives you the flexibility to either make use of the best performance with the recommended option of using adl:// or maintain existing code by continuing to use the WebHDFS API directly. Azure HDInsight schöpft die Möglichkeiten des „AzureDataLakeFilesystem“ voll aus, um eine optimale Leistung für Data Lake Storage Gen1 bereitzustellen.Azure HDInsight fully leverages the AzureDataLakeFilesystem to provide the best performance on Data Lake Storage Gen1.

Sie können mithilfe von adl://<data_lake_storage_gen1_name>.azuredatalakestore.net auf Ihre Daten in Data Lake Storage Gen1 zugreifen.You can access your data in Data Lake Storage Gen1 using adl://<data_lake_storage_gen1_name>.azuredatalakestore.net. Weitere Informationen zum Zugriff auf die Daten in Data Lake Storage Gen1 finden Sie unter Anzeigen der Eigenschaften der gespeicherten Daten.For more information about how to access the data in Data Lake Storage Gen1, see View properties of the stored data.

Nächste SchritteNext steps