Azure’in içine ve Azure’dan dışarı veri aktarma
Gereksinimlerinize bağlı olarak, verileri Azure 'a veya Azure 'dan aktarmaya yönelik çeşitli seçenekler vardır.
Fiziksel aktarım
Azure 'a veri aktarmak için fiziksel donanım kullanmak, şu durumlarda iyi bir seçenektir:
- Ağınız yavaş veya güvenilir değil.
- Daha fazla ağ bant genişliği alma maliyeti düşük bir noktadır.
- Güvenlik veya kuruluş ilkeleri, hassas verilerle ilgilenirken giden bağlantılara izin vermez.
Birincil endişeniz, verilerinizi aktarmaya ne kadar süreceğine, ağ aktarımının gerçekten fiziksel aktarımdan daha yavaş olup olmadığını doğrulamak için bir test çalıştırmak isteyebilirsiniz.
Verileri Azure 'a fiziksel olarak taşıyan iki ana seçenek vardır:
Azure İçeri/Dışarı Aktarma. azure İçeri/Dışarı Aktarma hizmeti , iç SATA hdd 'leri veya sdds 'yi bir azure veri merkezine aktararak azure Blob Depolama veya azure dosyaları için büyük miktarlarda verileri güvenli bir şekilde aktarmanıza olanak tanır. bu hizmeti ayrıca Azure Depolama 'den sabit disk sürücülerine veri aktarmak ve şirket içi yükleme için bunların size sevk edilmesini sağlamak için de kullanabilirsiniz.
Azure Data Box. Azure Data Box , Azure İçeri/Dışarı Aktarma hizmetine çok benzeyen Microsoft tarafından sağlanmış bir gereç. Microsoft size özel, güvenli ve yetkisiz bir aktarım gereci sağlar ve Portal üzerinden izleyebilmeniz için uçtan uca lojistik 'yı işler. Azure Data Box hizmetin bir avantajı kullanım kolaylığıdır. Birkaç sabit sürücü satın almanız, bunları hazırlamanız ve her birine dosya aktarmanız gerekmez. Azure Data Box, çeşitli sektör lideri Azure iş ortakları tarafından, ürünlerinden daha sorunsuz bir şekilde çevrimdışı aktarım kullanımını kolaylaştırmak için desteklenir.
Komut satırı araçları ve API 'Leri
Komut dosyalı ve programlı veri aktarımı istediğinizde bu seçenekleri göz önünde bulundurun.
Azure CLI. azure clı , azure hizmetlerini yönetmenizi ve azure Depolama veri yüklemenizi sağlayan platformlar arası bir araçtır.
AzCopy. en iyi performansla Azure Blob, dosya ve tablo depolamasına veri kopyalamak için bir Windows veya Linux komut satırından azcopy kullanın. AzCopy eşzamanlılık ve paralellik desteğine ek olarak kesintiye uğrayan kopyalama işlemlerini sürdürme olanağı sunar. AWS 'den Azure 'a veri kopyalamak için AzCopy de kullanabilirsiniz. programlı erişim için Microsoft Azure Depolama veri taşıma kitaplığı , azcopy 'i destekleyen temel çerçevedir. .NET Core kitaplığı olarak sağlanır.
PowerShell. powershell cmdlet 'i , powershell için kullanılan Windows yöneticileri için bir seçenektir.
AdlCopy. adlcopy , Azure Depolama bloblarından Data Lake Store ' ye veri kopyalamanızı sağlar. Ayrıca, verileri iki Azure Data Lake Store hesabı arasında kopyalamak için de kullanılabilir. ancak, Data Lake Store verileri Depolama bloblara kopyalamak için kullanılamaz.
Distcp. Data Lake Store erişimi olan bir HDInsight kümeniz varsa, verileri bir HDInsight küme depolama alanına (ıNB) Data Lake Store hesabına kopyalamak için Distcp gibi Hadoop ekosistem araçlarını kullanabilirsiniz.
Sqoop. Sqoop , Hadoop ekosisteminin bir Apache projesi ve parçasıdır. Tüm HDInsight kümelerinde önceden yüklenmiş olarak gelir. hdınsight kümesi ile SQL, Oracle, MySQL gibi ilişkisel veritabanları arasında veri aktarımına izin verir. Sqoop, içeri ve dışarı aktarma dahil olmak üzere ilgili araçların bir koleksiyonudur. sqoop, Azure Depolama blob 'ları veya bağlı depolama Data Lake Store kullanarak hdınsight kümeleri ile çalışmaktadır.
PolyBase. polybase , T-SQL dili aracılığıyla veritabanı dışındaki verilere erişen bir teknolojidir. SQL Server 2016 ' de, Hadoop 'taki dış verilerde sorgular çalıştırmanıza veya Azure Blob Depolama içeri/dışarı aktarmaya yönelik veri almanıza izin verir. azure Synapse Analytics 'te azure Blob Depolama ve Azure Data Lake Store verileri içeri ve dışarı aktarabilirsiniz. Şu anda PolyBase, Azure SYNAPSE 'a veri almanın en hızlı yöntemidir.
Hadoop komut satırı. hdınsight kümesi baş düğümünde bulunan verileriniz varsa,
hadoop -copyFromLocalbu verileri kümenizin Azure Depolama blob veya Azure Data Lake Store gibi kümenizin bağlı depolamasına kopyalamak için komutunu kullanabilirsiniz. Hadoop komutunu kullanmak için önce baş düğümüne bağlanmanız gerekir. Bağlandıktan sonra bir dosyayı depolamaya yükleyebilirsiniz.
Grafik arabirim
Yalnızca birkaç dosyayı veya veri nesnesini aktarıyorsanız ve işlemi otomatikleştirmenize gerek yoksa aşağıdaki seçenekleri göz önünde bulundurun.
Azure Depolama Gezgini. Azure Depolama Gezgini , Azure depolama hesaplarınızın içeriğini yönetmenizi sağlayan platformlar arası bir araçtır. Blob, dosya, kuyruk, tablo ve Azure Cosmos DB varlığı gibi nesneleri karşıya yükleyebilir, indirebilir ve yönetebilirsiniz. Blob depolama alanıyla birlikte kullanarak blobları ve klasörleri yönetebilir, yerel dosya sisteminizle Blob depolama alanı veya farklı depolama hesapları arasında blobları karşıya yükleme ve indirme işlemlerini gerçekleştirebilirsiniz.
Azure portalı. BLOB depolama ve Data Lake Store her ikisi de dosyaları keşfetmeye ve yeni dosyaları tek seferde karşıya yüklemeye yönelik Web tabanlı bir arabirim sağlar. Herhangi bir araç yüklemeden veya komut kullanmadan dosyalarınıza hızlıca göz atmak veya birkaç tane dosyayı karşıya yüklemek için iyi bir seçenektir.
Veri işlem hattı
Azure Data Factory. Azure Data Factory , bir dizi Azure hizmeti, şirket içi veya ikisinin bir birleşimi arasında düzenli olarak dosya aktarmak için en uygun yönetilen bir hizmettir. Azure Data Factory kullanarak, farklı veri depolarından veri alan veri odaklı iş akışları (işlem hatları olarak adlandırılır) oluşturabilir ve zamanlayabilirsiniz. Bu platform Azure HDInsight Hadoop, Spark, Azure Data Lake Analytics ve Azure Machine Learning gibi işlem hizmetlerini kullanarak verileri işleyip dönüştürebilir. Veri hareketini ve veri dönüştürmeyi düzenlemek ve otomatikleştirmek için veri odaklı iş akışları oluşturun.
Anahtar seçim ölçütleri
Veri aktarım senaryolarında, bu soruları yanıtlayarak gereksinimlerinize uygun sistemi seçin:
Internet bağlantısının çok uzun sürme, güvenilmez veya çok pahalı olduğu durumlarda çok büyük miktarlarda veri aktarımı yapmanız gerekiyor mu? Yanıt Evet ise, fiziksel aktarımı değerlendirin.
Veri aktarım görevleriniz için betik oluşturmayı tercih ediyor musunuz, bu nedenle yeniden kullanılabilir mi? Varsa, komut satırı seçeneklerinden birini veya Azure Data Factory seçin.
Bir ağ bağlantısı üzerinden çok büyük miktarda veri aktarmanız mı gerekiyor? Bu durumda, büyük veriler için iyileştirilmiş bir seçenek belirleyin.
İlişkisel bir veritabanına veri aktarmanız mı gerekiyor? Yanıt Evet ise, bir veya daha fazla ilişkisel veritabanını destekleyen bir seçenek belirleyin. Bu seçeneklerden bazılarının de bir Hadoop kümesi gerektirdiğini unutmayın.
Otomatikleştirilmiş bir veri işlem hattı veya iş akışı düzenlemesi gerekiyor mu? Yanıt Evet ise Azure Data Factory değerlendirin.
Yetenek matrisi
Aşağıdaki tablolar, özelliklerde önemli farklılıkları özetler.
Fiziksel aktarım
| Özellik | Azure İçeri/Dışarı Aktarma hizmeti | Azure Data Box |
|---|---|---|
| Form faktörü | İç SATA HDD 'Ler veya SDD | Güvenli, prova geçirmez, tek donanım gereci |
| Microsoft, nakliye dağıtımını yönetir | Hayır | Yes |
| İş ortağı ürünleriyle tümleştirilir | Hayır | Yes |
| Özel Gereç | Hayır | Yes |
Komut satırı araçları
Hadoop/HDInsight:
| Özellik | Distcp | Sqoop | Hadoop CLI |
|---|---|---|---|
| Büyük veri için en iyi duruma getirilmiş | Yes | Yes | Yes |
| İlişkisel veritabanına kopyalama | Hayır | Yes | Hayır |
| İlişkisel veritabanından kopyalama | Hayır | Yes | Hayır |
| Blob depolamaya kopyalama | Yes | Yes | Yes |
| Blob depolamadan kopyalama | Yes | Yes | Hayır |
| Data Lake Store'a kopyalama | Yes | Yes | Yes |
| Dosyadan Data Lake Store | Yes | Yes | Hayır |
Diğer:
| Özellik | Azure CLI | AzCopy | PowerShell | AdlCopy | PolyBase |
|---|---|---|---|---|---|
| Uyumlu platformlar | Linux, OS X, Windows | Linux, Windows | Windows | Linux, OS X, Windows | SQL Server, Azure Synapse |
| Büyük veri için en iyi duruma getirilmiş | Hayır | Yes | Hayır | Evet 1 | Evet 2 |
| İlişkisel veritabanına kopyalama | Hayır | Hayır | Hayır | Hayır | Yes |
| İlişkisel veritabanından kopyalama | Hayır | Hayır | Hayır | Hayır | Yes |
| Blob depolamaya kopyalama | Yes | Yes | Yes | Hayır | Yes |
| Blob depolamadan kopyalama | Yes | Yes | Yes | Yes | Yes |
| Data Lake Store'a kopyalama | Hayır | Yes | Yes | Yes | Yes |
| Dosyadan Data Lake Store | Hayır | Hayır | Yes | Yes | Yes |
[1] AdlCopy, bir hesapta büyük veri aktarımı için Data Lake Analytics iyileştirilmiştir.
[2] PolyBase performansı, hesaplamayı Hadoop'a iterek ve SQL Server örnekleri ile Hadoop düğümleri arasında paralel veri aktarımını etkinleştirmek için PolyBase ölçek dışarı aktarma grupları kullanılarak artırılabilir.
Grafik arabirim ve Azure Data Factory
| Özellik | Azure Depolama Gezgini | Azure portal * | Azure Data Factory |
|---|---|---|---|
| Büyük veri için en iyi duruma getirilmiş | Hayır | Hayır | Yes |
| İlişkisel veritabanına kopyalama | Hayır | Hayır | Yes |
| İlişkisel veritabanından Kopyala | Hayır | Hayır | Yes |
| Blob depolamaya Kopyala | Yes | Hayır | Yes |
| Blob depolamadan Kopyala | Yes | Hayır | Yes |
| Data Lake Store Kopyala | Hayır | Hayır | Yes |
| Data Lake Store Kopyala | Hayır | Hayır | Yes |
| Blob depolamaya Upload | Yes | Yes | Yes |
| Data Lake Store Upload | Yes | Yes | Yes |
| Veri aktarımlarını düzenleme | Hayır | Hayır | Yes |
| Özel veri dönüştürmeleri | Hayır | Hayır | Yes |
| Fiyatlandırma modeli | Ücretsiz | Ücretsiz | Kullanım başına ödeme |
* Bu durumda Azure portal, BLOB depolama ve Data Lake Store için Web tabanlı araştırma araçları kullanma anlamına gelir.