Azure'da veri işlem hattı düzenleme teknolojisi seçme

Büyük veri çözümlerinin çoğu iş akışlarında kapsüllenir ve yinelenen veri işleme işlemlerinden oluşur. İşlem hattı orchestrator, bu iş akışlarını otomatikleştirmeye yardımcı olan bir araçtır. Bir orchestrator işleri zamanlar, iş akışlarını yürütebilir ve görevler arasındaki bağımlılıkları koordine edebilirsiniz.

Veri işlem hattı düzenleme seçenekleriniz nedir?

Azure'da aşağıdaki hizmetler ve araçlar işlem hattı düzenleme, denetim akışı ve veri taşıma için temel gereksinimleri karşılar:

Bu hizmetler ve araçlar birbirinden bağımsız olarak kullanılabilir veya karma bir çözüm oluşturmak için birlikte kullanılabilir. Örneğin, Integration Runtime V2'de Azure Data Factory (IR), yönetilen bir Azure işlem ortamında SSIS paketlerini yerel olarak yürütebilirsiniz. Bu hizmetler arasında işlevsellikte bazı çakışmalar vardır ancak birkaç temel fark vardır.

Anahtar Seçim Ölçütleri

Seçenekleri daraltmak için şu soruları yanıtlayarak başlayabilirsiniz:

  • Verilerinizi taşıma ve dönüştürme için büyük veri özelliklerine mi ihtiyacınız var? Bu genellikle çok gigabayttan terabaytlarca veriye anlamına gelir. Evet ise, seçeneklerinizi büyük veriler için en uygun olan seçeneklerle daraltabilirsiniz.

  • Büyük ölçekte çalışa bir yönetilen hizmete mi ihtiyaç var? Evet ise, yerel işlem gücünüzle sınırlı olmayan bulut tabanlı hizmetlerden birini seçin.

  • Veri kaynaklarından bazıları şirket içinde mi? Yanıt evet ise hem bulut hem de şirket içi veri kaynaklarıyla veya hedeflerle çalışabilirsiniz.

  • Kaynak verileriniz HDFS dosya sistemi üzerinde Blob depolamada mı depolanıyor? Öyleyse, Hive sorgularını destekleyen bir seçenek belirleyin.

Yetenek matrisi

Aşağıdaki tablolarda, özellikler arasındaki temel farklar özetlenmiştir.

Genel özellikler

Özellik Azure Data Factory SQL Server Integration Services (SSIS) HDInsight üzerinde Oozie
Yönetilen Yes Hayır Yes
Bulut tabanlı Yes Hayır (yerel) Yes
Önkoşul Azure Aboneliği SQL Server Azure Aboneliği, HDInsight kümesi
Yönetim araçları Azure Portalı, PowerShell, CLI, .NET SDK SSMS, PowerShell Bash kabuğu, Oozie REST API, Oozie web kullanıcı arabirimi
Fiyatlandırma Kullanım başına ödeme Lisanslama /özellikler için ödeme HDInsight kümesi çalıştırmaya ek ücret ödemeden

İşlem hattı özellikleri

Özellik Azure Data Factory SQL Server Integration Services (SSIS) HDInsight üzerinde Oozie
Veri kopyalama Yes Yes Yes
Özel dönüşümler Yes Yes Evet (MapReduce, Pig ve Hive işleri)
Azure Machine Learning puanlama Yes Evet (betik ile) No
HDInsight On-Demand Yes Hayır Hayır
Azure Batch Yes Hayır Hayır
Pig, Hive, MapReduce Yes Hayır Evet
Spark Evet Hayır Hayır
SSIS Paketini Yürütme Yes Yes Hayır
Denetim akışı Yes Yes Yes
Şirket içi verilere erişim Yes Yes Hayır

Ölçeklenebilirlik özellikleri

Özellik Azure Data Factory SQL Server Integration Services (SSIS) HDInsight üzerinde Oozie
Ölçeği artırma Yes Hayır Hayır
Ölçeği genişletme Yes Hayır Evet (kümeye çalışan düğümleri ekleyerek)
Büyük veri için en iyi duruma getirilmiş Yes Hayır Yes