Tutorial: Membuat alur pipa dengan Salinan Aktivitas menggunakan Data Factory Wizard Salinan

Catatan

Artikel ini berlaku untuk versi 1 dari Data Factory. Jika Anda menggunakan versi saat ini dari layanan Data Factory, lihat tutorial aktivitas salin.

Tutorial ini memperlihatkan kepada Anda cara menggunakan Wizard Salinan untuk menyalin data dari penyimpanan blob Azure ke Azure SQL Database.

Azure Data Factory Wizard Salinan memungkinkan Anda membuat alur data dengan cepat yang menyalin data dari penyimpanan data sumber yang didukung ke penyimpanan data tujuan yang didukung. Oleh karena itu, kami sarankan Anda menggunakan wizard sebagai langkah pertama untuk membuat sampel alur untuk skenario pergerakan data Anda. Untuk daftar penyimpanan data yang didukung sebagai sumber dan tujuan, lihat penyimpanan data yang didukung.

Tutorial ini memperlihatkan kepada Anda cara membuat pabrik data Azure, meluncurkan Wizard Salinan, melalui serangkaian langkah untuk memberikan detail tentang skenario pencernaan/pergerakan data Anda. Saat Anda menyelesaikan langkah-langkah dalam wizard, wizard secara otomatis membuat alur dengan Aktivitas Salin untuk menyalin data dari penyimpanan blob Azure ke Azure SQL Database. Untuk informasi selengkapnya tentang Aktivitas Salin, lihat aktivitas pergerakan data.

Prasyarat

Prasyarat lengkap tercantum dalam artikel Ringkasan Tutorial sebelum melakukan tutorial ini.

Buat pabrik data

Di langkah ini, Anda menggunakan portal Microsoft Azure untuk membuat pabrik data Azure bernama ADFTutorialDataFactory.

  1. Masuk ke portal Microsoft Azure.

  2. Klik Buat sumber daya dari sudut kiri atas, klik Data + analitik, dan klik Data Factory.

    New->DataFactory

  3. Di bilah Pabrik data baru:

    1. Masukkan ADFTutorialDataFactory untuk namatersebut. Nama pabrik data Azure harus bersifat unik secara global. Jika Anda menerima kesalahan: Data factory name "ADFTutorialDataFactory" is not available, ubah nama pabrik data (contohnya, yournameADFTutorialDataFactoryYYYYMMDD) dan coba membuatnya lagi. Lihat topik Data Factory - Aturan Penamaan untuk penamaan aturan untuk artefak Data Factory.

      Data Factory name not available

    2. Pilih langganan Azure Anda.

    3. Untuk Grup Sumber Daya, lakukan salah satu langkah berikut ini:

      • Pilih Gunakan yang sudah ada untuk memilih grup sumber daya yang sudah ada.

      • Pilih Buat baru untuk memasukkan nama untuk grup sumber daya.

        Beberapa langkah dalam tutorial ini mengasumsikan bahwa Anda menggunakan nama: ADFTutorialResourceGroup untuk grup sumber daya. Untuk mempelajari tentang grup sumber daya, lihat Menggunakan grup sumber daya untuk mengelola sumber daya Azure Anda.

    4. Pilih lokasi untuk pabrik data.

    5. Pilih kotak centang Sematkan ke dasbor di bagian bawah bilah.

    6. Klik Buat.

      New data factory blade

  4. Setelah pembuatan selesai, Anda akan melihat bilah Data Factory seperti yang ditunjukkan pada gambar berikut:

    Data factory home page

Luncurkan Wizard Salinan

  1. Pada bilah Data Factory, klik Salin data untuk meluncurkan Wizard Salinan.

    Catatan

    Jika Anda melihat bahwa browser web terjebak di "Otorisasi...", nonaktifkan/hapus centang Blokir cookie pihak ketiga dan pengaturan data situs di pengaturan browser (atau) tetap mengaktifkannya dan membuat pengecualian untuk login.microsoftonline.com lalu coba luncurkan wizard lagi.

  2. Di halaman Properti:

    1. Masukkan CopyFromBlobToAzureSql untuk nama Tugas

    2. Masukkan deskripsi (opsional).

    3. Ubah Waktu tanggal mulai dan Waktu Tanggal selesai sehingga tanggal selesai diatur ke hari ini dan tanggal mulai menjadi lima hari sebelumnya.

    4. Klik Berikutnya.

      Copy Tool - Properties page

  3. Pada halaman Penyimpanan data sumber, klik petak peta Azure Blob Storage. Anda menggunakan halaman ini untuk menentukan penyimpanan data sumber untuk tugas salin.

    Copy Tool - Source data store page

  4. Pada halaman Tentukan akun penyimpanan Azure Blob:

    1. Masukkan AzureStorageLinkedService untuk Nama layanan tertaut.

    2. Konfirmasikan bahwa opsi Dari Langganan Azure dipilih untuk Metode pemilihan akun.

    3. Pilih langganan Azure Anda.

    4. Pilih akun penyimpanan Azure dari daftar akun penyimpanan Azure yang tersedia di langganan yang dipilih. Anda juga dapat memilih untuk memasukkan pengaturan akun penyimpanan secara manual dengan memilih opsi Masukkan secara manual untuk Metode pemilihan akun, lalu klik Berikutnya.

      Copy Tool - Specify the Azure Blob storage account

  5. Pada halaman Pilih file atau folder input :

    1. Klik dua kali adftutorial (folder).

    2. Pilih emp.txt, dan klik Pilih

      Screenshot shows the Choose option for your input file.

  6. Pada halaman Pilih file atau folder input, klik Berikutnya. Jangan pilih Salinan biner.

    Screenshot shows the Binary copy option for your input.

  7. Pada halaman Pengaturan format file, Anda akan melihat pembatas dan skema yang terdeteksi secara otomatis oleh wizard dengan menguraikan file. Anda juga bisa memasukkan pembatas secara manual agar wizard salin berhenti mendeteksi otomatis atau menimpa. Klik Berikutnya setelah Anda meninjau pembatas dan mempratinjau data.

    Copy Tool - File format settings

  8. Pada halaman Penyimpanan data tujuan, pilih Azure SQL Database, dan klik Berikutnya.

    Copy Tool - Choose destination store

  9. Pada Tentukan halaman database Azure SQL:

    1. Masukkan AzureSqlLinkedService untuk bidang Nama koneksi.

    2. Konfirmasikan bahwa opsi Dari langganan Azure dipilih untuk Metode pemilihan Server / database.

    3. Pilih langganan Azure Anda.

    4. Pilih Nama server dan Database.

    5. Masukkan Nama pengguna dan Kata Sandi Anda.

    6. Klik Berikutnya.

      Copy Tool - specify Azure SQL Database

  10. Pada halaman Pemetaan tabel, pilih emp untuk bidang Tujuan dari daftar drop-down, klik panah bawah (opsional) untuk melihat skema dan untuk mempratinjau data.

    Copy Tool - Table mapping

  11. Pada halaman Pemetaan skema, klik Berikutnya.

    Copy Tool - schema mapping

  12. Pada halaman Pengaturan kinerja, klik Berikutnya.

    Screenshot shows the Performance settings page where you can select Next.

  13. Tinjau informasi di halaman Ringkasan, dan klik Selesai. Wizard ini membuat dua layanan tertaut, dua himpunan data (input dan output), dan satu alur di data factory (dari tempat Anda meluncurkan Wizard Salin).

    Screenshot shows the Summary page where you can select Next.

Luncurkan Memantau dan Mengelola aplikasi

  1. Pada halaman Penyebaran, klik link: Click here to monitor copy pipeline.

    Copy Tool - Deployment succeeded

  2. Aplikasi pemantauan diluncurkan di tab terpisah di browser web Anda.

    Monitoring App

  3. Untuk melihat status terbaru potongan per jam, klik tombol Refresh di daftar AKTIVITAS WINDOWS di bagian bawah. Anda melihat lima aktivitas windows selama lima hari antara waktu mulai dan selesai untuk alur. Daftar ini tidak di-refresh secara otomatis, jadi Anda mungkin perlu mengklik Refresh beberapa kali sebelum Anda melihat semua aktivitas windows dalam status Siap.

  4. Pilih aktivitas windows dalam daftar. Lihat detail tentang hal tersebut di Aktivitas Windows Explorer di sebelah kanan.

    Activity window details

    Perhatikan bahwa tanggal 11, 12, 13, 14, dan 15 berwarna hijau, yang berarti bahwa irisan output harian untuk tanggal ini telah diproduksi. Anda juga melihat pengkodean warna ini pada alur dan set data output dalam tampilan diagram. Pada langkah sebelumnya, perhatikan bahwa dua irisan telah diproduksi, satu irisan saat ini sedang diproses, dan dua lainnya menunggu untuk diproses (berdasarkan pengkodean warna).

    Untuk informasi selengkapnya tentang menggunakan aplikasi ini, lihat Memantau dan mengelola alur menggunakan artikel Aplikasi Pemantauan.

Langkah berikutnya

Dalam tutorial ini, Anda menggunakan penyimpanan blob Azure sebagai penyimpanan data sumber dan Azure SQL Database sebagai penyimpanan data tujuan dalam operasi salinan. Tabel berikut ini menyediakan daftar penyimpanan data yang didukung sebagai sumber dan tujuan oleh aktivitas salin:

Kategori Penyimpanan data Didukung sebagai sumber Didukung sebagai sink
Azure Azure Blob Storage
  Azure Cosmos DB (SQL API)
  Azure Data Lake Storage Gen1
  Azure SQL Database
  Azure Synapse Analytics
  Indeks Azure Cognitive Search
  Penyimpanan Tabel Azure
Database Amazon Redshift
  DB2*
  MySQL*
  Oracle*
  PostgreSQL*
  SAP Business Warehouse*
  SAP HANA*
  SQL Server*
  Sybase*
  Teradata*
NoSQL Cassandra*
  MongoDB*
File Amazon S3
  Sistem File*
  FTP
  HDFS*
  SFTP
Lainnya HTTP Generik
  OData Generik
  ODBC Generik*
  Salesforce
  Tabel Web (tabel dari HTML)

Untuk detail tentang bidang/properti yang Anda lihat dalam panduan salin untuk penyimpanan data, klik tautan untuk penyimpanan data dalam tabel.