Azure Data Lake Storage Gen1 と Azure Blob Storage の比較Comparing Azure Data Lake Storage Gen1 and Azure Blob Storage

注意

Azure Data Lake Storage Gen2 の一般提供が開始されました。Azure Data Lake Storage Gen2 is now generally available. 今すぐ使用を開始することをお勧めします。We recommend that you start using it today. 詳細については、製品に関するページを参照してください。For more information, see the product page.

この記事の表には、ビッグ データ処理の重要な側面に沿った Azure Data Lake Storage Gen1 と Azure Blob Storage の違いがまとめられています。The table in this article summarizes the differences between Azure Data Lake Storage Gen1 and Azure Blob Storage along some key aspects of big data processing. Azure BLOB ストレージは、さまざまなストレージ シナリオ向けに設計されたスケーラブルな汎用オブジェクト ストアです。Azure Blob Storage is a general purpose, scalable object store that is designed for a wide variety of storage scenarios. Azure Data Lake Storage Gen1 は、ビッグ データ分析ワークロードに最適化されたハイパースケール リポジトリです。Azure Data Lake Storage Gen1 is a hyper-scale repository that is optimized for big data analytics workloads.

Azure Data Lake Storage Gen1Azure Data Lake Storage Gen1 Azure Blob StorageAzure Blob Storage
目的Purpose ビッグ データ分析ワークロードに最適化されたストレージOptimized storage for big data analytics workloads さまざまなストレージ シナリオ (ビッグ データ分析を含む) のための汎用オブジェクト ストアGeneral purpose object store for a wide variety of storage scenarios, including big data analytics
ユース ケースUse Cases バッチ、対話型、ストリーミング分析、および機械学習データ (ログ ファイル、IoT データ、クリック ストリーム、大規模なデータセットなど)Batch, interactive, streaming analytics and machine learning data such as log files, IoT data, click streams, large datasets あらゆる種類のテキストまたはバイナリ データ (アプリケーション バックエンド、バックアップ データ、ストリーミング用のメディア ストレージ、汎用データなど)。Any type of text or binary data, such as application back end, backup data, media storage for streaming and general purpose data. さらに、分析ワークロードに対するフル サポート。バッチ、対話型、ストリーミング分析、および機械学習データ (ログ ファイル、IoT データ、クリック ストリーム、大規模なデータセットなど)Additionally, full support for analytics workloads; batch, interactive, streaming analytics and machine learning data such as log files, IoT data, click streams, large datasets
主要な概念Key Concepts Data Lake Storage Gen1 アカウントにはフォルダーが含まれ、フォルダーにはファイルとして保存されたデータが含まれます。Data Lake Storage Gen1 account contains folders, which in turn contains data stored as files ストレージ アカウントにはコンテナーが含まれ、コンテナーには BLOB の形でデータが含まれます。Storage account has containers, which in turn has data in the form of blobs
StructureStructure 階層型ファイル システムHierarchical file system フラットな名前空間を使用するオブジェクト ストアObject store with flat namespace
APIAPI HTTPS 経由の REST APIREST API over HTTPS HTTP/HTTPS 経由の REST APIREST API over HTTP/HTTPS
サーバー側 APIServer-side API WebHDFS 互換の REST APIWebHDFS-compatible REST API Azure BLOB ストレージ REST APIAzure Blob Storage REST API
Hadoop ファイル システム クライアントHadoop File System Client はいYes はいYes
データ操作 - 認証Data Operations - Authentication Azure Active Directory IDBased on Azure Active Directory Identities 共有シークレット (アカウント アクセス キーShared Access Signature キー) に基づきます。Based on shared secrets - Account Access Keys and Shared Access Signature Keys.
データ操作 - 認証プロトコルData Operations - Authentication Protocol OAuth 2.0。OAuth 2.0. 呼び出しには、Azure Active Directory によって発行された有効な JWT (JSON Web トークン) が含まれている必要があります。Calls must contain a valid JWT (JSON Web Token) issued by Azure Active Directory ハッシュベース メッセージ認証コード (HMAC)。Hash-based Message Authentication Code (HMAC) . 呼び出しには、HTTP 要求の一部に対する Base64 でエンコードされた SHA-256 ハッシュが含まれている必要があります。Calls must contain a Base64-encoded SHA-256 hash over a part of the HTTP request.
データ操作 - 承認Data Operations - Authorization POSIX アクセス制御リスト (ACL)。POSIX Access Control Lists (ACLs). Azure Active Directory ID に基づく ACL は、ファイルおよびフォルダー レベルで設定できます。ACLs based on Azure Active Directory Identities can be set at the file and folder level. アカウントレベルの承認には、アカウント アクセス キーを使用しますFor account-level authorization – Use Account Access Keys
アカウント、コンテナー、または BLOB の承認には、Shared Access Signature キーを使用しますFor account, container, or blob authorization - Use Shared Access Signature Keys
データ操作 - 監査Data Operations - Auditing 使用可能。Available. 詳細については、 こちら をご覧ください。See here for information. 使用可能Available
保存データの暗号化Encryption data at rest
  • 透過的、サーバー側Transparent, Server side
    • サービスによって管理されるキーを使用With service-managed keys
    • ユーザーによって Azure KeyVault で管理されるキーを使用With customer-managed keys in Azure KeyVault
  • 透過的、サーバー側Transparent, Server side
    • サービスによって管理されるキーを使用With service-managed keys
    • ユーザーによって Azure KeyVault で管理されるキーを使用 (プレビュー)With customer-managed keys in Azure KeyVault (preview)
  • クライアント側暗号化Client-side encryption
管理操作 (アカウントの作成など)Management operations (e.g. Account Create) ロールベースのアクセス制御 (RBAC)Role-based access control (RBAC) provided by Azure for account management ロールベースのアクセス制御 (RBAC)Role-based access control (RBAC) provided by Azure for account management
Developer SDKDeveloper SDKs .NET、Java、Python、Node.js.NET, Java, Python, Node.js .Net、Java、Python、Node.js、C++、Ruby、PHP、Go、Android、iOS.Net, Java, Python, Node.js, C++, Ruby, PHP, Go, Android, iOS
分析ワークロードのパフォーマンスAnalytics Workload Performance 並列分析ワークロードに最適化されたパフォーマンス。Optimized performance for parallel analytics workloads. 高スループットおよび高 IOPS。High Throughput and IOPS. 並列分析ワークロードに最適化されたパフォーマンス。Optimized performance for parallel analytics workloads.
サイズ制限Size limits アカウント サイズ、ファイル サイズ、ファイル数に制限はありません。No limits on account sizes, file sizes or number of files 具体的な制限については、こちらSpecific limits documented here. より大きなアカウント制限については Azure サポートへの問い合わせで入手可能Larger account limits available by contacting Azure Support
geo 冗長Geo-redundancy ローカル冗長 (1 つの Azure リージョンにデータの複数のコピー)Locally-redundant (multiple copies of data in one Azure region) ローカル冗長 (LRS)、ゾーン冗長 (ZRS)、geo 冗長 (GRS)、読み取りアクセス geo 冗長 (RA-GRS)。Locally redundant (LRS), zone redundant (ZRS), globally redundant (GRS), read-access globally redundant (RA-GRS). 詳細については、 こちら をご覧ください。See here for more information
サービスの状態Service state 一般公開Generally available 一般公開Generally available
リージョン別の提供状況Regional availability 詳細については、 こちらSee here すべての Azure リージョンで使用可能Available in all Azure regions
料金Price 詳細については、 価格See Pricing 詳細については、 価格See Pricing