Kümelerle kullanım için depolama Azure HDInsight karşılaştırma

HDInsight kümeleri oluştururken birkaç farklı Azure depolama hizmeti arasında seçim seçebilirsiniz:

Bu makalede, bu depolama türlerine ve bunların benzersiz özelliklerine genel bir bakış sağlar.

Depolama türleri ve özellikleri

Aşağıdaki tabloda AZURE Depolama HDInsight'ın farklı sürümleriyle desteklenen hizmetler özetlenmiştir:

Depolama hizmeti Hesap türü Ad Alanı Türü Desteklenen hizmetler Desteklenen performans katmanları Desteklenen erişim katmanları HDInsight Sürümü Küme türü
Azure Data Lake Storage Gen2 Genel amaçlı V2 Hiyerarşik (dosya sistemi) Blob Standart Hot, Cool, Archive 3.6+ Spark 2.1 ve 2.2 dışındaki tüm
Azure Depolama Genel amaçlı V2 Nesne Blob Standart Hot, Cool, Archive 3.6+ Tümü
Azure Depolama Genel amaçlı V1 Nesne Blob Standart Yok Tümü Tümü
Azure Depolama Blob Depolama** Nesne Blok Blobu Standart Hot, Cool, Archive Tümü Tümü
Azure Data Lake Storage Gen1 Yok Hiyerarşik (dosya sistemi) Yok Yok Yok Yalnızca 3.6 HBase dışında hepsi
Azure Depolama Blok Blobu Nesne Blok Blobu Premium Yok 3.6+ Hızlandırılmış yazmalar ile yalnızca HBase
Azure Data Lake Storage Gen2 Blok Blobu Hiyerarşik (dosya sistemi) Blok Blobu Premium Yok 3.6+ Hızlandırılmış yazmalar ile yalnızca HBase

**HDInsight kümeleri için yalnızca ikincil depolama hesapları BlobStorage türünde olabilir ve Sayfa Blobu desteklenen bir depolama seçeneği değildir.

Azure depolama hesabı türleri hakkında Depolama için bkz. Azure depolama hesabına genel bakış

Azure blob erişim katmanları Depolama daha fazla bilgi için bkz. Azure Blob depolama: Premium (önizleme), Hot, Cool ve Archive depolama katmanları

Birincil ve isteğe bağlı ikincil depolama için hizmet birleşimlerini kullanarak kümeler oluşturabilirsiniz. Aşağıdaki tabloda HDInsight'ta şu anda desteklenen küme depolama yapılandırmaları özetlenmiştir:

HDInsight Sürümü Birincil Depolama İkincil Depolama Desteklenir
3.6 & 4.0 Genel Amaçlı V1, Genel Amaçlı V2 Genel Amaçlı V1, Genel Amaçlı V2, BlobStorage(Blok Blobları) Yes
3.6 & 4.0 Genel Amaçlı V1, Genel Amaçlı V2 Data Lake Storage 2. Nesil No
3.6 & 4.0 Data Lake Depolama 2. Nesil* Data Lake Storage 2. Nesil Yes
3.6 & 4.0 Data Lake Depolama 2. Nesil* Genel Amaçlı V1, Genel Amaçlı V2, BlobStorage(Blok Blobları) Yes
3.6 & 4.0 Data Lake Storage 2. Nesil Data Lake Storage 1. Nesil No
3.6 Data Lake Storage 1. Nesil Data Lake Storage 1. Nesil Yes
3.6 Data Lake Storage 1. Nesil Genel Amaçlı v1, Genel Amaçlı v2, BlobStorage (blok Blobları) Yes
3.6 Data Lake Storage 1. Nesil Data Lake Storage 2. Nesil No
4.0 Data Lake Storage 1. Nesil Herhangi biri No
4.0 Genel Amaçlı v1, Genel Amaçlı v2 Data Lake Storage 1. Nesil No
  • = bu, bir veya birden çok Data Lake Storage 2. olabilir, çünkü tüm kurulum, küme erişimi için aynı yönetilen kimliği kullanır.

Not

Spark 2,1 veya 2,2 kümelerinde birincil depolama Data Lake Storage 2. desteklenmez.

Veri çoğaltma

Azure HDInsight, müşteri verilerini depolamaz. Bir küme için depolamanın birincil yolu, ilişkili depolama hesaplarıdır. Kümenizi mevcut bir depolama hesabına ekleyebilir veya küme oluşturma işlemi sırasında yeni bir depolama hesabı oluşturabilirsiniz. Yeni bir hesap oluşturulursa, yerel olarak yedekli depolama (LRS) hesabı olarak oluşturulur ve Güven Merkezi'nde belirtilenler dahil olmak üzere bölge içi veri yerleşimi gereksinimlerini karşılar.

HDInsight ile ilişkili depolama hesabının LRS veya Güven Merkezi'nde belirtilen başka bir depolama seçeneği olduğundan emin olarak HDInsight 'ın verileri tek bir bölgede depolamak için düzgün yapılandırıldığını doğrulayabilirsiniz.

Sonraki adımlar