Azure Synapse sunucusuz SQL havuzlarını kullanırken dikkat edilecek noktalar Depolama

Tamamlandı

Kuruluşlar, performansa duyarlı, bulutta yerel uygulamalar dağıtdığından, farklı performans düzeylerinde uygun maliyetli veri depolama seçeneklerine sahip olmak önemlidir.

Azure Blok Blobu depolama iki farklı performans katmanı sunar:

  • Premium: yüksek işlem hızları ve tek basamaklı tutarlı depolama gecikmesi için iyileştirildi
  • Standart: yüksek kapasite ve yüksek aktarım hızı için iyileştirilmiş

Premium performans bloğu blob depolaması, verilerin yüksek performanslı donanımla kullanılabilmesini sağlar. Veriler, düşük gecikme süresi için iyileştirilmiş katı hal sürücülerinde (SSD) depolanır. SSD 'Ler geleneksel sabit sürücülerle karşılaştırıldığında daha yüksek aktarım hızı sağlar.

Premium performans depolaması, hızlı ve tutarlı yanıt süreleri gerektiren iş yükleri için idealdir. Çok sayıda küçük işlem gerçekleştiren iş yükleri için idealdir. Örnek iş yükleri şunlardır:

Etkileşimli iş yükleri.

Bu iş yükleri, e-ticaret ve eşleme uygulamaları gibi anlık güncelleştirmeler ve Kullanıcı geri bildirimi gerektirir. Örneğin, bir e-ticaret uygulamasında daha az sıklıkta görüntülenen öğeler muhtemelen önbelleğe alınmaz. Ancak, bu müşterilerin isteğe bağlı olarak müşteriye anında gösterilmesi gerekir.

Analiz.

IoT senaryosunda, buluta her saniye çok sayıda küçük yazma işlemi itilmiş olabilir. Büyük miktarlarda veri alınabilir, analiz amacıyla toplanır ve hemen hemen silinir. Premium Blok Blobu depolamanın yüksek alım özellikleri, bu iş yükü türü için verimli hale getirir.

Yapay zeka/makine öğrenimi (AI/ML).

aı/ML, görseller, konuşma ve metin gibi farklı veri türlerinin tüketimine ve işlenmesiyle ilgilidir. Bu yüksek performanslı bilgi işlem iş yükü, veri analizi için hızlı yanıt ve verimli alma süreleri gerektiren büyük miktarda verilerle ilgilidir.

Veri dönüştürme.

Verilerin sabit düzenlemesini, değiştirilmesini ve dönüştürülmesini gerektiren süreçler anında güncelleştirmeler gerektirir. Doğru veri gösterimi için bu verilerin tüketicilerinin hemen yansıtıldığı bu değişiklikleri görmeniz gerekir.

Azure Data Lake Storage 2. hiyerarşik ad alanı özelliğini kullanarak nesne depolama ölçeğinde ve fiyatlarla dosya sistemi performansı sağlar. Bu, bir hesabın içindeki nesne/dosya koleksiyonunun, bilgisayarınızdaki dosya sistemi ile aynı şekilde bir dizin ve iç içe geçmiş alt dizinler hiyerarşisi halinde düzenlenmesine izin verir. Hiyerarşik bir ad alanı etkinken, bir depolama hesabı, analiz motorları ve çerçeveler hakkında tanıdık dosya sistemi semantiği ile, nesne depolamanın ölçeklenebilirlik ve maliyet verimliliğini sağlamalarına sahip olur.

Aşağıdaki avantajlar, blob verileri üzerinde hiyerarşik bir ad alanı uygulayan dosya sistemleriyle ilişkilendirilir:

  • Atomik dizin düzenlemesi: nesne, yol parçalarını belirtmek için nesne adında eğik çizgi (/) ekleme kuralı benimseerek yaklaşık bir dizin hiyerarşisini depolar. Bu kural nesneleri düzenleme için çalışırken, bu kural, dizinleri taşıma, yeniden adlandırma veya silme gibi eylemler için Yardım sağlamaz. Gerçek dizinler olmadan, uygulamalar, dizin düzeyindeki görevleri başarmak için milyonlarca ayrı blob 'ları işlemelidir. Buna karşılık, hiyerarşik bir ad alanı tek bir girişi (üst dizin) güncelleştirerek bu görevleri işler.

Bu ciddi iyileştirme özellikle çok büyük veri analizi çerçeveleri için önemlidir. Hive, Spark, vb. gibi araçlar genellikle geçici konumlara çıkış yazar ve ardından işin sonunda konumu yeniden adlandırır. Hiyerarşik bir ad alanı olmadan, bu yeniden adlandırma genellikle analiz sürecinin kendisinden daha uzun sürebilir. Daha düşük iş gecikmesi, analiz iş yükleri için toplam sahip olma maliyeti (TCO) değerine eşit.

  • Tanıdık arabirim stili: dosya sistemleri, geliştiriciler ve kullanıcılar tarafından iyi anlaşılır. Data Lake Storage 2. tarafından açığa çıkarılan dosya sistemi arabirimi, büyük ve küçük bilgisayarlar tarafından kullanılan paradigmadır, buluta geçtiğinizde yeni bir depolama paradigması gerekmez.

Nesne mağazalarının depolamamasının bir hiyerarşik ad alanı, hiyerarşik bir ad alanı tarafından sınırlanıyor. ancak, Data Lake Storage 2. hiyerarşik ad alanı doğrusal bir şekilde ölçeklendirilir ve veri kapasitesini veya performansını düşürür.

pratikte, sunucusuz SQL havuz için en iyi performansı arıyorsanız Azure Data Lake Storage 2. premium katmanına gitmeniz gerekir. Bu teklifin en büyük maliyetli olduğuna lütfen emin olun.