Mulai cepat: Memuat secara massal dengan Synapse Studio

Memuat data mudah dengan wizard Muatan Massal di Synapse Studio. Synapse Studio adalah fitur dari Azure Synapse Analytics. Wizard Muat Massal memandu Anda membuat skrip T-SQL dengan pernyataan COPY untuk memuat data secara massal ke dalam kumpulan SQL khusus.

Titik entri ke wizard Muat Massal

Anda dapat memuat data secara massal dengan mengklik kanan area berikut dalam Synapse Studio: file atau folder dari akun penyimpanan Azure yang dilampirkan ke ruang kerja Anda.

Screenshot that shows right-clicking a file or folder from a storage account.

Prasyarat

  • Wizard menghasilkan pernyataan COPY, yang menggunakan pass-through Microsoft Entra untuk autentikasi. Pengguna Microsoft Entra Anda harus memiliki akses ke ruang kerja dengan setidaknya peran Azure Kontributor Data Blob Penyimpanan untuk akun Azure Data Lake Storage Gen2.

  • Anda harus memiliki izin untuk menggunakan pernyataan COPY yang diperlukan dan izin Membuat Tabel jika Anda membuat tabel baru untuk dimuat.

  • Layanan tertaut yang terkait dengan akun Data Lake Storage Gen2 harus memiliki akses ke file atau folder untuk dimuat. Misalnya, jika mekanisme autentikasi untuk layanan yang ditautkan adalah identitas terkelola, identitas yang dikelola ruang kerja harus memiliki setidaknya izin Storage Blob Data Reader pada akun penyimpanan.

  • Jika jaringan virtual diaktifkan di ruang kerja Anda, pastikan runtime terintegrasi yang terkait dengan layanan tertaut akun Data Lake Storage Gen2 untuk data sumber dan lokasi file kesalahan mengaktifkan penulisan interaktif. Penulisan interaktif diperlukan untuk deteksi skema otomatis, mempratinjau konten file sumber, dan menelusuri akun penyimpanan Data Lake Storage Gen2 dalam wizard.

Langkah-langkah

  1. Pada panel Lokasi penyimpanan sumber, pilih akun penyimpanan dan file atau folder tempat Anda memuatnya. Wizard secara otomatis mencoba mendeteksi file Parquet dan file teks dibatasi (CSV), termasuk memetakan bidang sumber dari file ke jenis data SQL target yang sesuai.

    Screenshot that shows selecting a source location.

  2. Pilih pengaturan format file, termasuk pengaturan kesalahan Anda ketika ada baris yang ditolak selama proses muat massal. Anda juga dapat memilih Pratinjau data untuk melihat bagaimana pernyataan COPY akan mengurai file untuk membantu Anda mengonfigurasi pengaturan format file. Pilih Pratinjau data setiap kali Anda mengubah pengaturan format file, untuk melihat bagaimana pernyataan COPY akan menguraikan file dengan pengaturan yang diperbarui.

    Screenshot that shows previewing data.

    Catatan

    • Wizard Muat Massal tidak mendukung pratinjau data dengan terminator bidang multi-karakter. Saat Anda menentukan terminator bidang multi-karakter, panduan akan mempratinjau data dalam satu kolom.
    • Saat Anda memilih Nama kolom infer, wizard Muat Massal akan menguraikan nama kolom dari baris pertama yang ditentukan oleh bidang Baris pertama. Wizard Muat Massal akan secara otomatis meningkatkan nilai FIRSTROW dalam pernyataan COPY dengan 1 untuk mengabaikan baris header ini.
    • Menentukan terminator baris multi-karakter didukung dalam pernyataan COPY. Namun, wizard Muat Massal tidak mendukungnya dan akan melemparkan kesalahan.
  3. Pilih kumpulan SQL khusus yang Anda gunakan untuk memuat, termasuk apakah beban akan untuk tabel yang sudah ada atau tabel baru. Screenshot that shows selecting a target location.

  4. Pilih Konfigurasi pemetaan kolom untuk memastikan Anda memiliki pemetaan kolom yang sesuai. Nama kolom catatan akan dideteksi secara otomatis jika Anda mengaktifkan Nama kolom infer. Untuk tabel baru, mengonfigurasi pemetaan kolom sangat penting untuk memperbarui jenis data kolom target.

    Screenshot that shows configuring column mapping.

  5. Pilih Buka skrip. Skrip T-SQL dihasilkan dengan pernyataan COPY untuk dimuat dari data lake Anda. Screenshot that shows opening the SQL script.

Langkah berikutnya

  • Periksa artikel pernyataan COPY untuk informasi selengkapnya tentang kemampuan COPY.
  • Periksa artikel ringkasan pemuatan data untuk informasi tentang menggunakan proses ekstrak, transformasi, dan pemuatan (ETL).