Linked services in Azure Data Factory dan Azure Synapse Analytics

BERLAKU UNTUK: Azure Data Factory Azure Synapse Analytics

Artikel ini menjelaskan apa itu layanan tertaut, bagaimana layanan tersebut didefinisikan dalam format JSON, dan bagaimana layanan tersebut digunakan di Azure Data Factory dan Azure Synapse Analytics.

Untuk mempelajari selengkapnya, baca artikel pengantar untuk Azure Data Factory atau Azure Synapse.

Gambaran Umum

Azure Data Factory dan Azure Synapse Analytics dapat memiliki satu atau lebih pipa. Alur adalah pengelompokan logis aktivitas yang melakukan tugas bersama-sama. Aktivitas dalam alur menentukan tindakan yang harus dilakukan pada data Anda. Misalnya, Anda dapat menggunakan aktivitas salin untuk menyalin data dari Microsoft SQL Server ke Azure Blob Storage. Kemudian, Anda mungkin menggunakan aktivitas Hive yang menjalankan skrip Hive pada kluster Azure HDInsight untuk memproses data dari penyimpanan Blob untuk menghasilkan data output. Terakhir, Anda mungkin menggunakan aktivitas penyalinan kedua untuk menyalin data output ke Azure Synapse Analytics pada solusi pelaporan kecerdasan bisnis (BI) yang dibuat. Untuk informasi selengkapnya tentang alur dan aktivitas, lihat Jalur dan aktivitas.

Sekarang, himpunan data adalah tampilan data bernama yang hanya menunjuk atau mereferensikan data yang ingin Anda gunakan dalam aktivitas Anda sebagai input dan output.

Sebelum membuat himpunan data, Anda harus membuat layanan tertaut untuk menautkan penyimpanan data ke Data Factory atau Ruang Kerja Synapse. Layanan tertaut sangat mirip dengan string koneksi, yang menentukan informasi koneksi yang diperlukan agar layanan terhubung ke sumber daya eksternal. Pikirkan cara ini; himpunan data mewakili struktur data dalam penyimpanan data tertaut, dan layanan tertaut menentukan koneksi ke sumber data. Misalnya, layanan tertaut Azure Storage menautkan akun penyimpanan ke layanan. Himpunan data Azure Blob mencerminkan kontainer blob dan folder dalam akun Azure Storage tersebut yang berisi blob input yang akan diproses.

Berikut adalah contoh skenario. Untuk menyalin data dari penyimpanan Blob ke Microsoft Azure SQL Database, Anda membuat dua layanan tertaut: Microsoft Azure Storage dan Database Azure SQL. Kemudian, buat dua himpunan data: Himpunan data Azure Blob (yang mengacu pada layanan tertaut Azure Storage) dan himpunan data Azure SQL Table (yang mengacu pada layanan tertaut Azure SQL Database). Layanan tertaut Azure Storage dan Azure SQL Database berisi string koneksi yang digunakan layanan saat runtime untuk terhubung ke Azure Storage dan Azure SQL Database Anda. Himpunan data Azure Blob menentukan kontainer blob dan folder blob yang berisi blob input di penyimpanan Blob Anda. Himpunan data Azure SQL Table menentukan tabel SQL dalam database SQL Anda yang akan disalin oleh data.

Diagram berikut menunjukkan hubungan antara alur, aktivitas, himpunan data, dan layanan tertaut dalam layanan:

Kaitan antara alur, aktivitas, himpunan data, layanan tertaut

Layanan tertaut JSON

Layanan tertaut didefinisikan dalam format JSON sebagai berikut:

{
    "name": "<Name of the linked service>",
    "properties": {
        "type": "<Type of the linked service>",
        "typeProperties": {
              "<data store or compute-specific type properties>"
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Tabel berikut ini menjelaskan properti di JSON di atas:

Properti Deskripsi Diperlukan
nama Nama layanan yang ditautkan. Lihat Aturan penamaan. Ya
jenis Jenis layanan yang ditautkan. Misalnya: AzureBlobStorage (penyimpanan data) atau AzureBatch (komputasi). Lihat deskripsi untuk typeProperties. Ya
typeProperties Properti jenis berbeda untuk setiap penyimpanan atau komputasi data.

Untuk jenis penyimpanan data yang didukung dan properti tipenya, lihat artikel gambaran umum konektor. Navigasi ke artikel konektor penyimpanan data untuk mempelajari tentang jenis properti khusus untuk penyimpanan data.

Untuk jenis komputasi yang didukung dan properti jenisnya, lihat Menghitung layanan tertaut.
Ya
connectVia Microsoft Runtime Integrasi yang akan digunakan untuk menyambungkan ke penyimpanan data. Anda dapat menggunakan Integration Runtime Azure atau Integration Runtime yang dihost sendiri (jika penyimpanan data Anda berada di jaringan privat). Jika tidak ditentukan, ia menggunakan Integration Runtime Azure default. Tidak

Contoh layanan tertaut

Layanan tertaut berikut ini adalah layanan penyimpanan Azure Blob yang ditautkan. Perhatikan bahwa jenisnya diatur ke penyimpanan Azure Blob. Properti jenis untuk layanan penyimpanan Azure Blob yang ditautkan menyertakan string koneksi. Layanan menggunakan string koneksi ini untuk terhubung ke penyimpanan data saat runtime.

{
    "name": "AzureBlobStorageLinkedService",
    "properties": {
        "type": "AzureBlobStorage",
        "typeProperties": {
            "connectionString": "DefaultEndpointsProtocol=https;AccountName=<accountname>;AccountKey=<accountkey>"
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Buat layanan tertaut

Runtime integrasi dapat dibuat di UX Azure Data Factory melalui hub manajemen dan aktivitas, himpunan data, atau aliran data apa pun yang mereferensikannya.

Anda dapat membuat layanan tertaut dengan menggunakan salah satu alat atau SDK ini: .NET API, PowerShell, REST API, Templat Azure Resource Manager, dan portal Microsoft Azure.

Layanan tertaut penyimpanan data

Anda dapat menemukan daftar penyimpanan data yang didukung di artikel ikhtisar konektor. Klik penyimpanan data untuk mempelajari properti koneksi yang didukung.

Dalam Layanan Komputasi Tertaut

Referensi lingkungan komputasi yang didukung untuk detail tentang berbagai lingkungan komputasi yang dapat Anda sambungkan dari layanan Anda serta konfigurasi yang berbeda.

Langkah berikutnya

Lihat tutorial berikut untuk instruksi langkah demi langkah untuk membuat jalur dan dataset menggunakan salah satu alat atau SDK ini.