Azure Data Lake Storage 2. Nesil'e giriş

Azure Data Lake Storage 2., Azure Blob depolamaüzerinde oluşturulmuş, büyük veri analizi için adanmış bir yetenekler kümesidir.

Data Lake Storage 2., Azure Blob depolama ile Azure Data Lake Storage 1. yeteneklerini söyleyecektir. Örneğin, Data Lake Storage 2. dosya sistemi semantiğini, dosya düzeyi güvenliği ve ölçeği sağlar. Bu yetenekler BLOB depolama üzerinde oluşturulduğundan, yüksek kullanılabilirlik/olağanüstü durum kurtarma özellikleri sayesinde düşük maliyetli, katmanlı depolama alanı da alacaksınız.

Kurumsal büyük veri analizi için tasarlandı

Data Lake Storage 2. Azure Storage 'ı Azure 'da kurumsal veri oluşturma için temel oluşturur. Başlangıçtan itibaren yüzlerce Gigabit işleme petabaytlarca, çok büyük miktarlarda veriyi kolay bir şekilde yönetmenize olanak tanılarken, Data Lake Storage 2. birden fazla bilgi için başlangıç sürümünden tasarlanan.

Data Lake Storage 2. temel bir parçası, blob depolamaya hiyerarşik bir ad alanının eklenmesinin bir parçasıdır. Hiyerarşik ad alanı, etkili veri erişimi için nesneleri/dosyaları bir dizin hiyerarşisi halinde düzenler. Ortak bir nesne deposu adlandırma kuralı, hiyerarşik bir dizin yapısını taklit etmek için adında eğik çizgiler kullanır. Bu yapı Data Lake Storage 2. ile gerçek hale gelir. Dizini yeniden adlandırma veya silme gibi işlemler, dizinde tek Atomik meta veri işlemleri haline gelir. Dizinin ad önekini paylaşan tüm nesneleri listelemeye ve işlemeye gerek yoktur.

Data Lake Storage 2. blob Storage üzerinde yapılar ve aşağıdaki yollarla performansı, yönetimi ve güvenliği geliştirir:

  • Verileri Analize bir önkoşul olarak kopyalamanız veya dönüştürmeniz gerekmiyorsa performans iyileştirilir. Blob depolamada düz ad alanı ile karşılaştırıldığında, hiyerarşik ad alanı, genel iş performansını artıran dizin yönetimi işlemlerinin performansını önemli ölçüde artırır.

  • Dosyaları dizinler ve alt dizinler aracılığıyla düzenleyebileceğiniz ve işleyebileceğiniz için Yönetim daha kolay hale getirir.

  • Dizinler veya tek dosyalarda POSIX izinleri tanımlayabilmeniz için güvenlik güvenliği uygulanabilir.

Ayrıca, düşük maliyetli Azure Blob depolamaalanının üzerine inşa edildiği için Data Lake Storage 2. çok maliyetli hale gelir. Ek özellikler, Azure 'da büyük veri analizlerini çalıştırmaya yönelik toplam sahip olma maliyetini daha düşüktür.

Data Lake Storage 2. temel özellikleri

  • Hadoop uyumlu erişim: Data Lake Storage 2., verileri Hadoop Dağıtılmış dosya sistemi (bir)ile yaptığınız gibi yönetmenizi ve erişmenize olanak tanır. Yeni ABFS sürücüsü (verilere erişmek için kullanılır) tüm Apache Hadoop ortamlarında kullanılabilir. Bu ortamlar Azure HDInsight, Azure Databricksve Azure SYNAPSE analizleriniiçerir.

  • POSIX Izinlerinin bir üst kümesi: Data Lake Gen2 için güvenlik modeli, Data Lake Storage 2. özgü bazı ayrıntı düzeyi Ile birlikte ACL 'LERI ve POSIX izinlerini destekler. Ayarlar, Depolama Gezgini veya Hive ve Spark gibi çerçeveler aracılığıyla yapılandırılabilir.

  • Uygun maliyetli: Data Lake Storage 2. düşük maliyetli depolama kapasitesi ve işlemler sunar. Azure Blob depolama yaşam döngüsü gibi özellikler yaşam döngüsü boyunca veri geçişleri olarak maliyetleri iyileştirir.

  • İyileştirilmiş sürücü: ABFS sürücüsü özellikle büyük veri analizi için iyileştirilmiştir . Karşılık gelen REST API 'Leri uç noktadan geliyor dfs.core.windows.net .

Ölçeklenebilirlik

Azure depolama, Data Lake Storage 2. veya blob depolama arabirimlerine erişip erişemeyeceğini tasarlayarak ölçeklenebilir. Birçok eksabaytlarca veri depolayıp sunabilir. Bu depolama alanı miktarı, saniye başına giriş/çıkış işlemi (ıOPS) düzeyinde Gigabit/saniye (Gbps) cinsinden ölçülen aktarım hızı ile kullanılabilir. İşleme, hizmet, hesap ve dosya düzeylerinde ölçülen istek temelli gecikme süreleriyle yürütülür.

Maliyet uygunluğu

Data Lake Storage 2. Azure Blob depolama alanı üzerinde oluşturulduğundan, depolama kapasitesi ve işlem maliyetleri düşüktür. Diğer bulut depolama hizmetlerinden farklı olarak, verileri analiz etmeden önce taşımanız veya dönüştürmeniz gerekmez. Fiyatlandırma hakkında daha fazla bilgi için bkz. Azure Depolama fiyatlandırması.

Ayrıca, hiyerarşik ad alanı gibi özellikler birçok analiz işinin genel performansını önemli ölçüde artırır. Bu performans artışı, aynı miktarda veriyi işlemek için daha az işlem gücü yapmanız gerektiği anlamına gelir ve bu, uçtan uca analiz işi için daha düşük toplam sahip olma maliyeti (TCO) ile sonuçlanır.

Tek hizmet, birden çok kavram

Data Lake Storage 2. Azure Blob Storage üzerinde oluşturulduğundan, birden çok kavram aynı paylaşılan şeyleri tanımlayabilir.

Aşağıdakiler, farklı kavramlarla açıklandığı gibi eşdeğer varlıklardır. Aksi belirtilmedikçe, bu varlıklar doğrudan eş anlamlı değildir:

Konsept Üst düzey kuruluş Alt düzey kuruluş Veri kapsayıcısı
Blob 'lar – genel amaçlı nesne depolaması Kapsayıcı Sanal dizin (yalnızca SDK – atomik düzenleme sağlamaz) Blob
Azure Data Lake Storage 2. – analiz depolaması Kapsayıcı Dizin Dosya

Desteklenen Blob depolama özellikleri

Tanılama günlüğü, erişim katmanlarıve BLOB depolama yaşam döngüsü yönetim ilkeleri gibi BLOB depolama özellikleri hesabınız için kullanılabilir.

Desteklenen BLOB depolama özelliklerinin bir listesi için, bkz. Azure Data Lake Storage 2. bulunan BLOB Storage özellikleri.

Desteklenen Azure hizmeti tümleştirmeleri

Data Lake Storage Gen2, çeşitli Azure hizmetlerini destekler. Bunları kullanarak verileri alabilir, analiz yapabilir ve görsel gösterimler oluşturabilirsiniz. Desteklenen Azure hizmetlerinin listesi için bkz. Azure Data Lake Storage 2. destekleyen Azure hizmetleri.

Desteklenen açık kaynaklı platformlar

Birçok açık kaynak platformu Data Lake Storage 2. destekler. Tüm liste için, bkz. Azure Data Lake Storage 2. destekleyen açık kaynaklı platformlar.

Ayrıca bkz.