Azure’in içine ve Azure’dan dışarı veri aktarma
gereksinimlerinize bağlı olarak Azure'a ve Azure'dan veri aktarmak için çeşitli seçenekler vardır.
Fiziksel aktarım
Azure'a veri aktarmak için fiziksel donanım kullanmak aşağıdaki durumlarda iyi bir seçenektir:
- Ağınız yavaş veya güvenilir değil.
- Daha fazla ağ bant genişliği elde etme maliyeti yüksektir.
- Güvenlik veya kuruluş ilkeleri, hassas verilerle çalışırken giden bağlantılara izin vermez.
Birincil endişeniz verilerinizi aktarmanın ne kadar sürdüğüyse, ağ aktarımının fiziksel aktarımdan daha yavaş olup olmadığını doğrulamak için bir test çalıştırmak isteyebilirsiniz.
Verileri fiziksel olarak Azure'a taşımak için iki ana seçenek vardır:
Azure İçeri/Dışarı Aktarma hizmeti
Azure İçeri/Dışarı Aktarma hizmeti, bir Azure veri merkezine dahili SATA HDD'leri veya SSD'leri göndererek büyük miktarda veriyi Azure Blob Depolama veya Azure Dosyalar güvenli bir şekilde aktarmanızı sağlar. Azure Depolama'dan sabit disk sürücülerine veri aktarmak ve sürücülerin şirket içi yükleme için size gönderilmesini sağlamak için de bu hizmeti kullanabilirsiniz.
Azure Data Box
Azure Data Box , İçeri/Dışarı Aktarma hizmetine çok benzeyen, Microsoft tarafından sağlanan bir alettir. Microsoft, Data Box ile size özel, güvenli ve kurcalamaya dayanıklı bir transfer aletini sunar ve portaldan izleyebildiğiniz uçtan uca lojiskenliği işler. Data Box hizmetinin avantajlarından biri kullanım kolaylığıdır. Birkaç sabit sürücü satın almanız, bunları hazırlamanız ve dosyaları her birine aktarmanız gerekmez. Data Box, ürünlerinden buluta çevrimdışı taşımayı sorunsuz bir şekilde kullanmayı kolaylaştırmak için sektör lideri birçok Azure iş ortağı tarafından desteklenir.
Komut satırı araçları ve API'leri
Betik ve programlı veri aktarımı istediğinizde şu seçenekleri göz önünde bulundurun:
Azure CLI, Azure hizmetlerini yönetmenize ve Verileri Depolama'ya yüklemenize olanak tanıyan platformlar arası bir araçtır.
AzCopy. En iyi performansla Blob Depolama, Azure Dosya Depolama ve Azure Tablo Depolama'ya kolayca veri kopyalamak için Windows veya Linux komut satırından AzCopy kullanın. AzCopy eşzamanlılık ve paralellik desteğine ek olarak kesintiye uğrayan kopyalama işlemlerini sürdürme olanağı sunar. Aws'den Azure'a veri kopyalamak için AzCopy'yi de kullanabilirsiniz. Program aracılığıyla erişim için Microsoft Azure Depolama Veri Taşıma Kitaplığı, AzCopy'yi destekleyen temel çerçevedir. Bir .NET Core kitaplığı olarak sağlanır.
PowerShell ile Start-AzureStorageBlobCopy PowerShell cmdlet'i, PowerShell'e alışkın olan Windows yöneticileri için bir seçenektir.
AdlCopy, Blob Depolama'dan Azure Data Lake Storage veri kopyalamanızı sağlar. İki Data Lake Storage hesabı arasında veri kopyalamak için de kullanılabilir. Ancak, verileri Data Lake Storage Blob Depolama'ya kopyalamak için kullanılamaz.
Distcp, hdInsight küme depolama alanına (WASB) veri kopyalamak için Data Lake Storage bir hesaba kullanılır.
Sqoop bir Apache projesidir ve Hadoop ekosisteminin bir parçasıdır. Tüm HDInsight kümelerine önceden yüklenmiş olarak gelir. HDInsight kümesi ile SQL, Oracle, MySQL gibi ilişkisel veritabanları arasında veri aktarımına olanak tanır. Sqoop, içeri ve dışarı aktarma araçları da dahil olmak üzere ilgili araçlardan oluşan bir koleksiyondur. Sqoop, Blob Depolama veya Data Lake Storage bağlı depolama kullanarak HDInsight kümeleriyle çalışır.
PolyBase , T-SQL dili aracılığıyla veritabanı dışındaki verilere erişen bir teknolojidir. SQL Server 2016'da Hadoop'taki dış verilerde sorgu çalıştırmanıza veya Blob Depolama'dan verileri içeri veya dışarı aktarmanıza olanak tanır. Azure Synapse Analytics'te Blob Depolama ve Data Lake Storage verileri içeri veya dışarı aktarabilirsiniz. Şu anda PolyBase, verileri Azure Synapse Analytics'e aktarmanın en hızlı yöntemidir.
HDInsight kümesi baş düğümünde bulunan verileriniz varsa Hadoop komut satırını kullanın. Komutunu kullanarak
hadoop -copyFromLocal
bu verileri Blob Depolama veya Data Lake Storage gibi kümenizin ekli depolama alanına kopyalayabilirsiniz. Hadoop komutunu kullanmak için önce baş düğüme bağlanmanız gerekir. Bağlandıktan sonra bir dosyayı depolama alanına yükleyebilirsiniz.
Grafik arabirim
Yalnızca birkaç dosya veya veri nesnesi aktarıyorsanız ve işlemi otomatikleştirmeniz gerekmiyorsa aşağıdaki seçenekleri göz önünde bulundurun.
Azure Depolama Gezgini, Azure depolama hesaplarınızın içeriğini yönetmenize olanak tanıyan platformlar arası bir araçtır. Blob, dosya, kuyruk, tablo ve Azure Cosmos DB varlığı gibi nesneleri karşıya yükleyebilir, indirebilir ve yönetebilirsiniz. Blobları ve klasörleri yönetmek ve blobları yerel dosya sisteminizle Blob Depolama arasında veya depolama hesapları arasında karşıya yüklemek ve indirmek için Blob Depolama ile birlikte kullanın.
Azure portalı. Hem Blob Depolama hem de Data Lake Storage dosyaları keşfetmek ve yeni dosyaları karşıya yüklemek için web tabanlı bir arabirim sağlar. Dosyalarınızı hızla keşfetmek için araçlar yüklemek veya komutlar vermek istemiyorsanız veya birkaç yenisini karşıya yüklemek istiyorsanız bu seçenek iyi bir seçenektir.
Veri eşitleme ve işlem hatları
Azure Data Factory, birçok Azure hizmeti, şirket içi sistem veya ikisinin birleşimi arasında düzenli olarak dosya aktarmak için en uygun yönetilen hizmettir. Data Factory'yi kullanarak, farklı veri depolarından veri almak için işlem hatları olarak adlandırılan veri temelli iş akışları oluşturabilir ve zamanlayabilirsiniz. Data Factory, Azure HDInsight Hadoop, Spark, Azure Data Lake Analytics ve Azure Machine Learning gibi işlem hizmetlerini kullanarak verileri işleyebilir ve dönüştürebilir. Veri taşımayı ve veri dönüştürmeyi düzenlemeye ve otomatikleştirmeye yönelik veri temelli iş akışları oluşturabilirsiniz.
Data Factory ve Azure Synapse Analytics'teki işlem hatları ve etkinlikler, veri taşıma ve veri işleme senaryolarınız için uçtan uca veri odaklı iş akışları oluşturmak için kullanılabilir. Ayrıca, Azure Data Factory tümleştirme çalışma zamanı farklı ağ ortamlarında veri tümleştirme özellikleri sağlamak için kullanılır.
Azure Data Box Gateway , Azure'a ve Azure'dan veri aktarır, ancak bu bir sabit sürücü değil sanal bir gereçtir. Şirket içi ağınızda bulunan sanal makineler, NFS ve SMB protokollerini kullanarak Data Box Gateway'e veri yazar. Ardından cihaz verilerinizi Azure'a aktarır.
Anahtar seçim ölçütleri
Veri aktarımı senaryoları için şu soruları yanıtlayarak ihtiyaçlarınıza uygun sistemi seçin:
İnternet bağlantısı üzerinden bunu yapmanın çok uzun süreceği, güvenilir olmadığı veya çok pahalı olacağı büyük miktarda veriyi aktarmanız gerekiyor mu? Evet ise, fiziksel aktarımı göz önünde bulundurun.
Yeniden kullanılabilir olmaları için veri aktarımı görevlerinizi betik olarak kullanmayı tercih ediyor musunuz? Öyleyse, komut satırı seçeneklerinden birini veya Data Factory'yi seçin.
Ağ bağlantısı üzerinden büyük miktarda veri aktarmanız gerekiyor mu? Bu durumda büyük veri için iyileştirilmiş bir seçenek belirleyin.
İlişkisel bir veritabanına veya veritabanından veri aktarmanız gerekiyor mu? Evet ise, bir veya daha fazla ilişkisel veritabanını destekleyen bir seçenek belirtin. Bu seçeneklerden bazıları hadoop kümesi de gerektirir.
Otomatik veri işlem hattına veya iş akışı düzenlemeye ihtiyacınız var mı? Evet ise Data Factory'yi göz önünde bulundurun.
Yetenek matrisi
Aşağıdaki tablolarda, özelliklerdeki temel farklar özetlemektedir.
Fiziksel aktarım
Özellik | İçeri/Dışarı Aktarma hizmeti | Data Box |
---|---|---|
Form faktörü | İç SATA HDD'ler veya SSD'ler | Güvenli, kurcalamaya dayanıklı, tek donanım gereci |
Microsoft, sevkiyat lojistirisini yönetir | Hayır | Yes |
İş ortağı ürünleriyle tümleşir | Hayır | Yes |
Özel alet | Hayır | Yes |
Komut satırı araçları
Hadoop/HDInsight:
Özellik | Distcp | Sqoop | Hadoop CLI |
---|---|---|---|
Büyük veriler için iyileştirilmiş | Yes | Yes | Yes |
İlişkisel veritabanına kopyalama | Hayır | Yes | Hayır |
İlişkisel veritabanından kopyalama | Hayır | Yes | Hayır |
Blob Depolamaya Kopyala | Yes | Yes | Yes |
Blob Depolamadan Kopyalama | Yes | Yes | Hayır |
Data Lake Storage kopyala | Yes | Yes | Yes |
Data Lake Storage'dan kopyalama | Yes | Yes | Hayır |
Diğer:
Özellik | Azure CLI | AzCopy | PowerShell | AdlCopy | PolyBase |
---|---|---|---|---|---|
Uyumlu platformlar | Linux, OS X, Windows | Linux, Windows | Windows | Linux, OS X, Windows | SQL Server, Azure Synapse Analytics |
Büyük veriler için iyileştirilmiş | Hayır | Yes | Hayır | Evet 1 | Evet 2 |
İlişkisel veritabanına kopyalama | Hayır | Hayır | Hayır | Hayır | Yes |
İlişkisel veritabanından kopyalama | Hayır | Hayır | Hayır | Hayır | Yes |
Blob Depolamaya Kopyala | Yes | Yes | Yes | Hayır | Yes |
Blob Depolamadan Kopyalama | Yes | Yes | Yes | Yes | Yes |
Data Lake Storage kopyala | Hayır | Yes | Yes | Yes | Yes |
Data Lake Storage'dan kopyalama | Hayır | Hayır | Yes | Yes | Yes |
[1] AdlCopy, bir Data Lake Analytics hesabıyla kullanıldığında büyük verileri aktarmak için iyileştirilmiştir.
[2] SQL Server örnekleri ile Hadoop düğümleri arasında paralel veri aktarımını sağlamak için Hesaplama Hadoop'a gönderilerek ve PolyBase ölçek genişletme grupları kullanılarak PolyBaseperformansı artırılabilir.
Grafik arabirimler, veri eşitleme ve veri işlem hatları
Özellik | Azure Depolama Gezgini | Azure portal * | Data Factory | Data Box Gateway |
---|---|---|---|---|
Büyük veriler için iyileştirilmiş | Hayır | Hayır | Yes | Yes |
İlişkisel veritabanına kopyalama | Hayır | Hayır | Yes | Hayır |
İlişkisel veritabanından kopyalama | Hayır | Hayır | Yes | Hayır |
Blob Depolamaya Kopyala | Yes | Hayır | Yes | Yes |
Blob Depolamadan Kopyalama | Yes | Hayır | Yes | Hayır |
Data Lake Storage kopyala | Hayır | Hayır | Yes | Hayır |
Data Lake Storage'den kopyalama | Hayır | Hayır | Yes | Hayır |
Blob Depolama'ya yükleme | Yes | Yes | Yes | Yes |
Data Lake Storage'a yükleme | Yes | Yes | Yes | Yes |
Veri aktarımlarını düzenleme | Hayır | Hayır | Yes | Hayır |
Özel veri dönüştürmeleri | Hayır | Hayır | Yes | Hayır |
Fiyatlandırma modeli | Ücretsiz | Ücretsiz | Kullanım başına ödeme | Birim başına ödeme |
* Bu durumda Azure portal, Blob Depolama ve Data Lake Storage için web tabanlı keşif araçlarını temsil eder.
Katkıda Bulunanlar
Bu makale Microsoft tarafından yönetilir. Başlangıçta aşağıdaki katkıda bulunanlar tarafından yazılmıştır.
Asıl yazar:
- Zoiner Tejada | CEO ve Mimar
Sonraki adımlar
- Azure İçeri/Dışarı Aktarma hizmeti nedir?
- Azure Data Box nedir?
- Azure CLI nedir?
- AzCopy’yi kullanmaya başlama
- Depolama Gezgini ile çalışmaya başlama
- Azure Data Factory nedir?
- Azure Data Box Gateway nedir?
İlgili kaynaklar
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin