Azure'da veri işlem hattı düzenleme teknolojisi seçme
Büyük veri çözümlerinin çoğu, iş akışlarında kapsüllenmiş yinelenen veri işleme işlemlerinden oluşur. İşlem hattı düzenleyici, bu iş akışlarını otomatikleştirmeye yardımcı olan bir araçtır. Düzenleyici işleri zamanlayabilir, iş akışlarını yürütebilir ve görevler arasındaki bağımlılıkları koordine edebilir.
Veri işlem hattı düzenleme seçenekleriniz nelerdir?
Azure'da aşağıdaki hizmetler ve araçlar işlem hattı düzenleme, denetim akışı ve veri taşıma için temel gereksinimleri karşılar:
Bu hizmetler ve araçlar birbirinden bağımsız olarak veya karma çözüm oluşturmak için birlikte kullanılabilir. Örneğin, Azure Data Factory V2'deki Integration Runtime (IR), yönetilen bir Azure işlem ortamında SSIS paketlerini yerel olarak yürütebilir. Bu hizmetler arasında bazı işlevlerde çakışma olsa da, bazı önemli farklar vardır.
Anahtar Seçim Ölçütleri
Seçenekleri daraltmak için şu soruları yanıtlayarak başlayın:
Verilerinizi taşımak ve dönüştürmek için büyük veri özelliklerine mi ihtiyacınız var? Bu genellikle çok gigabayt ile terabayt arasında veri anlamına gelir. Evet ise, seçeneklerinizi büyük verilere en uygun seçeneklerle daraltma.
Uygun ölçekte çalışabilen bir yönetilen hizmete ihtiyacınız var mı? Evet ise, yerel işlem gücünüzle sınırlı olmayan bulut tabanlı hizmetlerden birini seçin.
Veri kaynaklarınızdan bazıları şirket içinde mi bulunuyor? Evet ise hem bulut hem de şirket içi veri kaynakları veya hedefleriyle çalışabilecek seçenekleri arayın.
Kaynak verileriniz HDFS dosya sistemindeki Blob depolamada mı depolanıyor? Bu durumda Hive sorgularını destekleyen bir seçenek belirleyin.
Yetenek matrisi
Aşağıdaki tablolarda, özelliklerdeki temel farklar özetlemektedir.
Genel özellikler
Özellik | Azure Data Factory | SQL Server Integration Services (SSIS) | HDInsight üzerinde Oozie |
---|---|---|---|
Yönetilen | Yes | Hayı | Evet |
Bulut tabanlı | Yes | Hayır (yerel) | Yes |
Önkoşul | Azure Aboneliği | SQL Server | Azure Aboneliği, HDInsight kümesi |
Yönetim araçları | Azure Portal, PowerShell, CLI, .NET SDK | SSMS, PowerShell | Bash kabuğu, Oozie REST API, Oozie web kullanıcı arabirimi |
Fiyatlandırma | Kullanım başına ödeme | Lisanslama / özellikler için ödeme | HDInsight kümesini çalıştırmaya ek ücret alınmaz |
İşlem hattı özellikleri
Özellik | Azure Data Factory | SQL Server Integration Services (SSIS) | HDInsight üzerinde Oozie |
---|---|---|---|
Verileri kopyalama | Yes | Evet | Yes |
Özel dönüştürmeler | Yes | Yes | Evet (MapReduce, Pig ve Hive işleri) |
Azure Machine Learning puanlaması | Yes | Evet (betik ile) | Hayır |
HDInsight İsteğe Bağlı | Yes | Hayı | Hayır |
Azure Batch | Yes | Hayı | Hayır |
Pig, Hive, MapReduce | Yes | Hayı | Evet |
Spark | Yes | Hayı | Hayır |
SSIS Paketini Yürütme | Yes | Evet | Hayır |
Denetim akışı | Yes | Evet | Yes |
Şirket içi verilere erişim | Yes | Evet | Hayır |
Ölçeklenebilirlik özellikleri
Özellik | Azure Data Factory | SQL Server Integration Services (SSIS) | HDInsight üzerinde Oozie |
---|---|---|---|
Ölçeği artırma | Yes | Hayı | Hayır |
Ölçeği genişletme | Yes | Hayır | Evet (kümeye çalışan düğümleri ekleyerek) |
Büyük veriler için iyileştirilmiş | Yes | Hayı | Evet |
Katkıda Bulunanlar
Bu makale Microsoft tarafından yönetilir. Başlangıçta aşağıdaki katkıda bulunanlar tarafından yazılmıştır.
Asıl yazar:
- Zoiner Tejada | CEO ve Mimar
Sonraki adımlar
- Azure Data Factory ve Azure Synapse Analytics’teki işlem hatları ve etkinlikler
- Azure Data Factory'de Azure-SSIS tümleştirme çalışma zamanını sağlama
- HDInsight üzerinde Oozie
İlgili kaynaklar
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin