Tutorial: Membuat alur pipa dengan Salinan Aktivitas menggunakan Data Factory Wizard Salinan
Catatan
Artikel ini berlaku untuk versi 1 dari Data Factory. Jika Anda menggunakan versi saat ini dari layanan Data Factory, lihat tutorial aktivitas salin.
Tutorial ini memperlihatkan kepada Anda cara menggunakan Wizard Salinan untuk menyalin data dari penyimpanan blob Azure ke Azure SQL Database.
Azure Data Factory Wizard Salinan memungkinkan Anda membuat alur data dengan cepat yang menyalin data dari penyimpanan data sumber yang didukung ke penyimpanan data tujuan yang didukung. Oleh karena itu, kami sarankan Anda menggunakan wizard sebagai langkah pertama untuk membuat sampel alur untuk skenario pergerakan data Anda. Untuk daftar penyimpanan data yang didukung sebagai sumber dan tujuan, lihat penyimpanan data yang didukung.
Tutorial ini memperlihatkan kepada Anda cara membuat pabrik data Azure, meluncurkan Wizard Salinan, melalui serangkaian langkah untuk memberikan detail tentang skenario pencernaan/pergerakan data Anda. Saat Anda menyelesaikan langkah-langkah dalam wizard, wizard secara otomatis membuat alur dengan Aktivitas Salin untuk menyalin data dari penyimpanan blob Azure ke Azure SQL Database. Untuk informasi selengkapnya tentang Aktivitas Salin, lihat aktivitas pergerakan data.
Prasyarat
Prasyarat lengkap tercantum dalam artikel Ringkasan Tutorial sebelum melakukan tutorial ini.
Buat pabrik data
Di langkah ini, Anda menggunakan portal Microsoft Azure untuk membuat pabrik data Azure bernama ADFTutorialDataFactory.
Masuk ke portal Microsoft Azure.
Klik Buat sumber daya dari sudut kiri atas, klik Data + analitik, dan klik Data Factory.
Di bilah Pabrik data baru:
Masukkan ADFTutorialDataFactory untuk namatersebut. Nama pabrik data Azure harus bersifat unik secara global. Jika Anda menerima kesalahan:
Data factory name "ADFTutorialDataFactory" is not available, ubah nama pabrik data (contohnya, yournameADFTutorialDataFactoryYYYYMMDD) dan coba membuatnya lagi. Lihat topik Data Factory - Aturan Penamaan untuk penamaan aturan untuk artefak Data Factory.
Pilih langganan Azure Anda.
Untuk Grup Sumber Daya, lakukan salah satu langkah berikut ini:
Pilih Gunakan yang sudah ada untuk memilih grup sumber daya yang sudah ada.
Pilih Buat baru untuk memasukkan nama untuk grup sumber daya.
Beberapa langkah dalam tutorial ini mengasumsikan bahwa Anda menggunakan nama: ADFTutorialResourceGroup untuk grup sumber daya. Untuk mempelajari tentang grup sumber daya, lihat Menggunakan grup sumber daya untuk mengelola sumber daya Azure Anda.
Pilih lokasi untuk pabrik data.
Pilih kotak centang Sematkan ke dasbor di bagian bawah bilah.
Klik Buat.
Setelah pembuatan selesai, Anda akan melihat bilah Data Factory seperti yang ditunjukkan pada gambar berikut:
Luncurkan Wizard Salinan
Pada bilah Data Factory, klik Salin data untuk meluncurkan Wizard Salinan.
Catatan
Jika Anda melihat bahwa browser web terjebak di "Otorisasi...", nonaktifkan/hapus centang Blokir cookie pihak ketiga dan pengaturan data situs di pengaturan browser (atau) tetap mengaktifkannya dan membuat pengecualian untuk login.microsoftonline.com lalu coba luncurkan wizard lagi.
Di halaman Properti:
Masukkan CopyFromBlobToAzureSql untuk nama Tugas
Masukkan deskripsi (opsional).
Ubah Waktu tanggal mulai dan Waktu Tanggal selesai sehingga tanggal selesai diatur ke hari ini dan tanggal mulai menjadi lima hari sebelumnya.
Klik Berikutnya.
Pada halaman Penyimpanan data sumber, klik petak peta Azure Blob Storage. Anda menggunakan halaman ini untuk menentukan penyimpanan data sumber untuk tugas salin.
Pada halaman Tentukan akun penyimpanan Azure Blob:
Masukkan AzureStorageLinkedService untuk Nama layanan tertaut.
Konfirmasikan bahwa opsi Dari Langganan Azure dipilih untuk Metode pemilihan akun.
Pilih langganan Azure Anda.
Pilih akun penyimpanan Azure dari daftar akun penyimpanan Azure yang tersedia di langganan yang dipilih. Anda juga dapat memilih untuk memasukkan pengaturan akun penyimpanan secara manual dengan memilih opsi Masukkan secara manual untuk Metode pemilihan akun, lalu klik Berikutnya.
Pada halaman Pilih file atau folder input :
Klik dua kali adftutorial (folder).
Pilih emp.txt, dan klik Pilih
Pada halaman Pilih file atau folder input, klik Berikutnya. Jangan pilih Salinan biner.
Pada halaman Pengaturan format file, Anda akan melihat pembatas dan skema yang terdeteksi secara otomatis oleh wizard dengan menguraikan file. Anda juga bisa memasukkan pembatas secara manual agar wizard salin berhenti mendeteksi otomatis atau menimpa. Klik Berikutnya setelah Anda meninjau pembatas dan mempratinjau data.
Pada halaman Penyimpanan data tujuan, pilih Azure SQL Database, dan klik Berikutnya.
Pada Tentukan halaman database Azure SQL:
Masukkan AzureSqlLinkedService untuk bidang Nama koneksi.
Konfirmasikan bahwa opsi Dari langganan Azure dipilih untuk Metode pemilihan Server / database.
Pilih langganan Azure Anda.
Pilih Nama server dan Database.
Masukkan Nama pengguna dan Kata Sandi Anda.
Klik Berikutnya.
Pada halaman Pemetaan tabel, pilih emp untuk bidang Tujuan dari daftar drop-down, klik panah bawah (opsional) untuk melihat skema dan untuk mempratinjau data.
Pada halaman Pemetaan skema, klik Berikutnya.
Pada halaman Pengaturan kinerja, klik Berikutnya.
Tinjau informasi di halaman Ringkasan, dan klik Selesai. Wizard ini membuat dua layanan tertaut, dua himpunan data (input dan output), dan satu alur di data factory (dari tempat Anda meluncurkan Wizard Salin).
Luncurkan Memantau dan Mengelola aplikasi
Pada halaman Penyebaran, klik link:
Click here to monitor copy pipeline.
Aplikasi pemantauan diluncurkan di tab terpisah di browser web Anda.
Untuk melihat status terbaru potongan per jam, klik tombol Refresh di daftar AKTIVITAS WINDOWS di bagian bawah. Anda melihat lima aktivitas windows selama lima hari antara waktu mulai dan selesai untuk alur. Daftar ini tidak di-refresh secara otomatis, jadi Anda mungkin perlu mengklik Refresh beberapa kali sebelum Anda melihat semua aktivitas windows dalam status Siap.
Pilih aktivitas windows dalam daftar. Lihat detail tentang hal tersebut di Aktivitas Windows Explorer di sebelah kanan.
Perhatikan bahwa tanggal 11, 12, 13, 14, dan 15 berwarna hijau, yang berarti bahwa irisan output harian untuk tanggal ini telah diproduksi. Anda juga melihat pengkodean warna ini pada alur dan set data output dalam tampilan diagram. Pada langkah sebelumnya, perhatikan bahwa dua irisan telah diproduksi, satu irisan saat ini sedang diproses, dan dua lainnya menunggu untuk diproses (berdasarkan pengkodean warna).
Untuk informasi selengkapnya tentang menggunakan aplikasi ini, lihat Memantau dan mengelola alur menggunakan artikel Aplikasi Pemantauan.
Langkah berikutnya
Dalam tutorial ini, Anda menggunakan penyimpanan blob Azure sebagai penyimpanan data sumber dan Azure SQL Database sebagai penyimpanan data tujuan dalam operasi salinan. Tabel berikut ini menyediakan daftar penyimpanan data yang didukung sebagai sumber dan tujuan oleh aktivitas salin:
| Kategori | Penyimpanan data | Didukung sebagai sumber | Didukung sebagai sink |
|---|---|---|---|
| Azure | Azure Blob Storage | ✓ | ✓ |
| Azure Cosmos DB (SQL API) | ✓ | ✓ | |
| Azure Data Lake Storage Gen1 | ✓ | ✓ | |
| Azure SQL Database | ✓ | ✓ | |
| Azure Synapse Analytics | ✓ | ✓ | |
| Indeks Azure Cognitive Search | ✓ | ||
| Penyimpanan Tabel Azure | ✓ | ✓ | |
| Database | Amazon Redshift | ✓ | |
| DB2* | ✓ | ||
| MySQL* | ✓ | ||
| Oracle* | ✓ | ✓ | |
| PostgreSQL* | ✓ | ||
| SAP Business Warehouse* | ✓ | ||
| SAP HANA* | ✓ | ||
| SQL Server* | ✓ | ✓ | |
| Sybase* | ✓ | ||
| Teradata* | ✓ | ||
| NoSQL | Cassandra* | ✓ | |
| MongoDB* | ✓ | ||
| File | Amazon S3 | ✓ | |
| Sistem File* | ✓ | ✓ | |
| FTP | ✓ | ||
| HDFS* | ✓ | ||
| SFTP | ✓ | ||
| Lainnya | HTTP Generik | ✓ | |
| OData Generik | ✓ | ||
| ODBC Generik* | ✓ | ||
| Salesforce | ✓ | ||
| Tabel Web (tabel dari HTML) | ✓ |
Untuk detail tentang bidang/properti yang Anda lihat dalam panduan salin untuk penyimpanan data, klik tautan untuk penyimpanan data dalam tabel.