Azure'da veri işlem hattı düzenleme teknolojisi seçme
Büyük veri çözümlerinin çoğu iş akışlarında kapsüllenir ve yinelenen veri işleme işlemlerinden oluşur. İşlem hattı orchestrator, bu iş akışlarını otomatikleştirmeye yardımcı olan bir araçtır. Bir orchestrator işleri zamanlar, iş akışlarını yürütebilir ve görevler arasındaki bağımlılıkları koordine edebilirsiniz.
Veri işlem hattı düzenleme seçenekleriniz nedir?
Azure'da aşağıdaki hizmetler ve araçlar işlem hattı düzenleme, denetim akışı ve veri taşıma için temel gereksinimleri karşılar:
Bu hizmetler ve araçlar birbirinden bağımsız olarak kullanılabilir veya karma bir çözüm oluşturmak için birlikte kullanılabilir. Örneğin, Integration Runtime V2'de Azure Data Factory (IR), yönetilen bir Azure işlem ortamında SSIS paketlerini yerel olarak yürütebilirsiniz. Bu hizmetler arasında işlevsellikte bazı çakışmalar vardır ancak birkaç temel fark vardır.
Anahtar Seçim Ölçütleri
Seçenekleri daraltmak için şu soruları yanıtlayarak başlayabilirsiniz:
Verilerinizi taşıma ve dönüştürme için büyük veri özelliklerine mi ihtiyacınız var? Bu genellikle çok gigabayttan terabaytlarca veriye anlamına gelir. Evet ise, seçeneklerinizi büyük veriler için en uygun olan seçeneklerle daraltabilirsiniz.
Büyük ölçekte çalışa bir yönetilen hizmete mi ihtiyaç var? Evet ise, yerel işlem gücünüzle sınırlı olmayan bulut tabanlı hizmetlerden birini seçin.
Veri kaynaklarından bazıları şirket içinde mi? Yanıt evet ise hem bulut hem de şirket içi veri kaynaklarıyla veya hedeflerle çalışabilirsiniz.
Kaynak verileriniz HDFS dosya sistemi üzerinde Blob depolamada mı depolanıyor? Öyleyse, Hive sorgularını destekleyen bir seçenek belirleyin.
Yetenek matrisi
Aşağıdaki tablolarda, özellikler arasındaki temel farklar özetlenmiştir.
Genel özellikler
| Özellik | Azure Data Factory | SQL Server Integration Services (SSIS) | HDInsight üzerinde Oozie |
|---|---|---|---|
| Yönetilen | Yes | Hayır | Yes |
| Bulut tabanlı | Yes | Hayır (yerel) | Yes |
| Önkoşul | Azure Aboneliği | SQL Server | Azure Aboneliği, HDInsight kümesi |
| Yönetim araçları | Azure Portalı, PowerShell, CLI, .NET SDK | SSMS, PowerShell | Bash kabuğu, Oozie REST API, Oozie web kullanıcı arabirimi |
| Fiyatlandırma | Kullanım başına ödeme | Lisanslama /özellikler için ödeme | HDInsight kümesi çalıştırmaya ek ücret ödemeden |
İşlem hattı özellikleri
| Özellik | Azure Data Factory | SQL Server Integration Services (SSIS) | HDInsight üzerinde Oozie |
|---|---|---|---|
| Veri kopyalama | Yes | Yes | Yes |
| Özel dönüşümler | Yes | Yes | Evet (MapReduce, Pig ve Hive işleri) |
| Azure Machine Learning puanlama | Yes | Evet (betik ile) | No |
| HDInsight On-Demand | Yes | Hayır | Hayır |
| Azure Batch | Yes | Hayır | Hayır |
| Pig, Hive, MapReduce | Yes | Hayır | Evet |
| Spark | Evet | Hayır | Hayır |
| SSIS Paketini Yürütme | Yes | Yes | Hayır |
| Denetim akışı | Yes | Yes | Yes |
| Şirket içi verilere erişim | Yes | Yes | Hayır |
Ölçeklenebilirlik özellikleri
| Özellik | Azure Data Factory | SQL Server Integration Services (SSIS) | HDInsight üzerinde Oozie |
|---|---|---|---|
| Ölçeği artırma | Yes | Hayır | Hayır |
| Ölçeği genişletme | Yes | Hayır | Evet (kümeye çalışan düğümleri ekleyerek) |
| Büyük veri için en iyi duruma getirilmiş | Yes | Hayır | Yes |