Membuat dan mengelola runtime integrasi yang dihost sendiri

Artikel ini menjelaskan cara membuat dan mengelola runtime integrasi yang dihost sendiri (SHIR) yang memungkinkan Anda memindai sumber data di Azure Purview.

Catatan

Purview Integration Runtime tidak dapat dibagikan dengan Azure Synapse Analytics atau Azure Data Factory Integration Runtime pada komputer yang sama. Ini perlu diinstal pada komputer yang terpisah.

Prasyarat

  • Versi Windows yang didukung adalah:
    • Windows 8.1
    • Windows 10
    • Windows Server 2012
    • Windows Server 2012 R2
    • Server Windows 2016
    • Server Windows 2019

Instalasi runtime integrasi yang dihost sendiri pada pengendali domain tidak didukung.

  • Runtime integrasi yang dihost sendiri memerlukan Sistem Operasi 64-bit dengan .NET Framework 4.7.2 atau lebih tinggi. Lihat Persyaratan Sistem .NET Framework untuk detailnya.
  • Konfigurasi minimum yang direkomendasikan untuk mesin runtime integrasi yang dihost sendiri adalah prosesor 2-GHz dengan 4 core, RAM 8 GB, dan ruang hard drive 80 GB yang tersedia. Untuk detail persyaratan sistem, lihat Mengunduh.
  • Jika mesin host berhibernasi, runtime integrasi yang dihost sendiri tidak merespons permintaan data. Konfigurasikan paket daya yang sesuai di komputer sebelum Anda menginstal runtime integrasi yang dihost sendiri. Jika mesin dikonfigurasikan untuk hibernasi, penginstal runtime integrasi yang dihost sendiri akan meminta pesan.
  • Anda harus menjadi admin pada mesin agar berhasil menginstal dan mengonfigurasikan runtime integrasi yang dihost sendiri.
  • Pemindaian berjalan terjadi dengan frekuensi tertentu sesuai jadwal yang telah Anda siapkan. Penggunaan prosesor dan RAM pada mesin mengikuti pola yang sama dengan waktu puncak dan menganggur. Penggunaan sumber daya juga sangat tergantung pada jumlah data yang dipindai. Ketika beberapa pekerjaan pemindaian sedang berlangsung, Anda melihat penggunaan sumber daya naik selama waktu sibuk.
  • Tugas mungkin gagal selama ekstraksi data dalam format Parquet, ORC, atau Avro.

Penting

Jika Anda akan menggunakan runtime Integrasi yang Dihost Sendiri untuk memindai file Parket, Anda perlu memasang 64-bit JRE 8 (Java Runtime Environment) atau OpenJDK pada komputer runtime integrasi Anda. Periksa bagian Java Runtime Environment di bagian bawah halaman untuk panduan penginstalan.

Menyiapkan runtime integrasi yang dihost sendiri

Untuk membuat dan menyiapkan runtime integrasi yang dihost sendiri, gunakan prosedur berikut.

Membuat rutime integrasi yang dihost sendiri

  1. Di halaman beranda Purview Studio, pilih Peta Data dari panel navigasi kiri.

  2. Di bawah Sumber dan pemindaian di panel kiri, pilih runtime integrasi, lalu pilih + Baru.

    Pilih di IR.

  3. Pada halaman penyiapan runtime integrasi, pilih Dihost Sendiri untuk membuat Self-Hosted IR (IR yang dihost sendiri), lalu pilih Lanjutkan.

    Membuat SHIR baru.

  4. Masukkan nama untuk runtime integrasi Anda, dan pilih Buat.

  5. Pada halaman pengaturan Integration Runtime, ikuti langkah-langkah di bawah bagian Penyiapan manual. Anda harus mengunduh runtime integrasi dari situs unduhan ke VM atau komputer tempat Anda ingin menjalankannya.

    mendapatkan kunci

    • Salin dan tempel kunci autentikasi.

    • Unduh runtime integrasi yang dihost sendiri dari Microsoft Integration Runtime di komputer Windows lokal. Jalankan penginstal. Versi runtime integrasi yang dihost sendiri seperti 5.4.7803.1 dan 5.6.7795.1 didukung.

    • Pada halaman Daftarkan Integration Runtime (Dihost sendiri) , tempelkan salah satu dari dua kunci yang Anda simpan sebelumnya, dan pilih Daftarkan.

      kunci input.

    • Pada halaman Simpul Integration Runtime (Dihost sendiri) baru , pilih Selesai.

  6. Setelah Runtime integrasi yang dihost sendiri berhasil didaftarkan, Anda akan melihat jendela berikut:

    berhasil didaftarkan.

Mengonfigurasikan pengaturan proksi

Jika Anda memilih opsi Gunakan proksi sistem untuk proksi HTTP, runtime integrasi yang dihost sendiri menggunakan pengaturan proksi di diahost.exe.config dan diawp.exe.config. Ketika file-file ini tidak menentukan proksi, runtime integrasi yang dihost sendiri akan tersambung ke layanan cloud secara langsung tanpa melalui proksi. Prosedur berikut ini menyediakan instruksi untuk memperbarui file diahost.exe.config:

  1. Di File Explorer, buat salinan aman dari C:\Program Files\Microsoft Integration Runtime\5.0\Shared\diahost.exe.config sebagai cadangan dari file asli.

  2. Buka Notepad yang berjalan sebagai admin.

  3. Di Notepad, buka file teks C:\Program Files\Microsoft Integration Runtime\5.0\Shared\diahost.exe.config.

  4. Temukan tag system.net default seperti yang diperlihatkan dalam kode berikut:

    <system.net>
        <defaultProxy useDefaultCredentials="true" />
    </system.net>
    

    Anda kemudian dapat menambahkan detail server proksi seperti yang diperlihatkan dalam contoh berikut:

    <system.net>
        <defaultProxy enabled="true">
              <proxy bypassonlocal="true" proxyaddress="http://proxy.domain.org:8888/" />
        </defaultProxy>
    </system.net>
    

    Tag proksi memungkinkan properti tambahan untuk menentukan pengaturan yang diperlukan seperti scriptLocation. Lihat <proxy>Elemen (Pengaturan Jaringan) untuk sintaks.

    <proxy autoDetect="true|false|unspecified" bypassonlocal="true|false|unspecified" proxyaddress="uriString" scriptLocation="uriString" usesystemdefault="true|false|unspecified "/>
    
  5. Simpan file konfigurasi di lokasi aslinya. Kemudian hidupkan ulang layanan host runtime integrasi yang dihost sendiri, yang mengambil perubahan.

    Untuk menghidupkan ulang layanan, gunakan applet layanan dari Panel Kontrol. Atau dari Integration Runtime Configuration Manager, pilih tombol Hentikan Layanan, lalu pilih Mulai Layanan.

    Jika layanan tidak dimulai, Anda mungkin menambahkan sintaks tag XML yang salah dalam file konfigurasi aplikasi yang Anda edit.

Penting

Jangan lupa untuk memperbarui diahost.exe.config dan diawp.exe.config.

Anda juga perlu memastikan bahwa Microsoft Azure ada dalam daftar izin perusahaan Anda. Anda dapat mengunduh daftar alamat IP Azure yang valid. Rentang IP untuk setiap cloud, dibagi berdasarkan wilayah dan layanan yang ditandai di cloud tersebut kini tersedia di Unduhan MS:

Jika Anda melihat pesan kesalahan seperti yang berikut ini, kemungkinan alasannya adalah konfigurasi firewall atau server proksi yang tidak tepat. Konfigurasi tersebut mencegah runtime integrasi yang dihost sendiri untuk menyambungkan ke akun penyimpanan terkelola Azure atau sumber data. Untuk memastikan bahwa firewall dan server proksi Anda dikonfigurasikan dengan benar, lihat bagian sebelumnya.

  • Ketika Anda mencoba mendaftarkan runtime integrasi yang dihost sendiri, Anda menerima pesan kesalahan berikut: "Gagal mendaftarkan simpul Microsoft Integration Rutime ini! Konfirmasikan bahwa kunci Autentikasi valid dan layanan host layanan integrasi berjalan pada mesin ini."

  • Saat Anda membuka Integration Runtime Configuration Manager, Anda akan melihat status Terputus atau Menyambungkan. Saat Anda melihat log peristiwa Windows, di bawah Aplikasi Pemantau Peristiwa > dan Aplikasi Layanan Log > Microsoft Integration Runtime, Anda melihat pesan kesalahan seperti ini:

    Unable to connect to the remote server
    A component of Integration Runtime has become unresponsive and restarts automatically. Component name: Integration Runtime (Self-hosted).
    

Persyaratan jaringan

Mesin runtime integrasi yang dihosting sendiri perlu terhubung ke beberapa sumber daya untuk bekerja dengan benar:

  • Sumber yang ingin Anda pindai menggunakan runtime integrasi yang dihosting sendiri.
  • Setiap Azure Key Vault yang digunakan untuk menyimpan info masuk untuk sumber daya Purview.
  • Akun Storage yang dikelola dan sumber daya Event Hub yang dibuat oleh Purview.

Sumber daya Storage dan Event Hub yang dikelola dapat ditemukan di langganan Anda di bawah grup sumber daya yang berisi nama sumber daya Purview Anda. Azure Purview menggunakan sumber daya ini untuk menelan hasil pemindaian, di antara banyak hal lainnya, sehingga runtime integrasi yang dihosting sendiri harus dapat terhubung langsung dengan sumber daya ini.

Berikut adalah domain dan port yang perlu diizinkan melalui firewall perusahaan dan mesin.

Catatan

Untuk domain yang tercantum dengan ‘<managed Purview storage account>’, Anda akan menambahkan nama akun penyimpanan terkelola yang terkait dengan sumber daya Purview Anda. Anda dapat menemukan sumber daya di Portal. Cari Grup Sumber Daya Anda untuk grup bernama: managed-rg-<your Purview Resource name>. Misalnya: managed-rg-contosoPurview. Anda akan menggunakan nama akun penyimpanan dalam grup sumber daya ini.

Untuk domain yang tercantum dengan ‘<managed Event Hub resource>’, Anda akan menambahkan nama akun penyimpanan terkelola yang terkait dengan sumber daya Purview Anda. Anda dapat menemukan ini di Grup Sumber Daya yang sama dengan akun penyimpanan terkelola.

Nama domain Port keluar Deskripsi
*.servicebus.windows.net 443 Infrastruktur global yang digunakan Purview untuk menjalankan pemindaiannya. Wildcard diperlukan karena tidak ada sumber daya khusus.
<managed Event Hub resource>.servicebus.windows.net 443 Purview menggunakan ini untuk terhubung dengan bus layanan terkait. Ini akan dicakup dengan mengizinkan domain di atas, tetapi jika Anda menggunakan Titik Akhir Privat, Anda perlu menguji akses ke domain tunggal ini.
*.frontend.clouddatahub.net 443 Infrastruktur global yang digunakan Purview untuk menjalankan pemindaiannya. Wildcard diperlukan karena tidak ada sumber daya khusus.
<managed Purview storage account>.core.windows.net 443 Digunakan oleh runtime integrasi yang dihost sendiri untuk terhubung ke akun penyimpanan Azure terkelola.
<managed Purview storage account>.queue.core.windows.net 443 Antrian yang digunakan oleh purview menjalankan proses pemindaian.
download.microsoft.com 443 Opsional untuk pembaruan SHIR.

Berdasarkan sumber Anda, Anda mungkin juga perlu mengizinkan domain dari sumber Azure atau eksternal lainnya. Beberapa contoh disediakan di bawah ini, serta domain Azure Key Vault jika Anda menyambungkan ke info masuk apa pun yang disimpan di Key Vault.

Nama domain Port keluar Deskripsi
<storage account>.core.windows.net 443 Opsional, untuk menyambungkan ke akun Microsoft Azure Storage.
*.database.windows.net 1433 Opsional, untuk menyambungkan ke Azure SQL Database atau Azure Synapse Analytics.
*.azuredatalakestore.net
login.microsoftonline.com/<tenant>/oauth2/token
443 Opsional, untuk menyambungkan ke Azure Data Lake Store Gen 1.
<datastoragename>.dfs.core.windows.net 443 Opsional, untuk menyambungkan ke Azure Data Lake Store Gen 2.
<your Key Vault Name>.vault.azure.net 443 Diperlukan jika ada info masuk yang disimpan di Azure Key Vault.
Berbagai Domain Tergantung Domain untuk sumber lain yang akan terhubung dengan SHIR.

Penting

Di sebagian besar lingkungan, Anda juga perlu mengonfirmasi bahwa DNS Anda dikonfigurasi dengan benar. Untuk mengonfirmasi bahwa Anda dapat menggunakan nslookup dari mesin SHIR untuk memeriksa konektivitas ke masing-masing domain di atas. Setiap nslookup harus mengembalikan IP sumber daya. Jika Anda menggunakan Titik Akhir Privat, IP privat harus dikembalikan dan bukan IP Publik. Jika tidak ada IP yang dikembalikan, atau jika saat menggunakan Titik Akhir Privat, IP publik dikembalikan, Anda perlu mengatasi asosiasi DNS/ VNET Anda, atau peering Titik Akhir /VNET Pribadi Anda.

Mengelola runtime integrasi yang dihost sendiri

Anda dapat mengedit runtime integrasi yang dihost sendiri dengan menavigasikan ke Runtime integrasi di Pusat manajemen, memilih runtime integrasi lalu mengeklik edit. Sekarang Anda dapat memperbarui deskripsi, menyalin kunci, atau meregenerasi kunci baru.

edit runtime integrasi.

edit detail runtime integrasi.

Anda dapat menghapus runtime integrasi yang dihost sendiri dengan menavigasikan ke Runtime integrasi di Pusat manajemen, memilih runtime integrasi lalu memilih Hapus. Setelah runtime integrasi dihapus, pemindaian yang sedang berlangsung yang mengandalkannya akan gagal.

Penginstalan Java Runtime Environment

Jika Anda akan memindai file Parket menggunakan runtime Integrasi yang Dihost Sendiri dengan Purview, Anda perlu memasang Java Runtime Environment atau OpenJDK pada komputer runtime integrasi yang dihost sendiri.

Saat memindai file Parket menggunakan runtime integrasi yang Dihost sendiri, layanan menemukan runtime Java dengan terlebih dahulu memeriksa registri (SOFTWARE\JavaSoft\Java Runtime Environment\{Current Version}\JavaHome) untuk JRE, jika tidak ditemukan, kedua memeriksa variabel sistem JAVA_HOME untuk OpenJDK.

  • Untuk menggunakan JRE: IR 64-bit membutuhkan JRE 64-bit. Anda dapat menemukannya dari sini.
  • Untuk menggunakan OpenJDK: Ini didukung sejak IR versi 3.13. Kemas jvm.dll dengan semua rakitan OpenJDK lain yang diperlukan ke dalam komputer IR yang dihost sendiri, dan atur variabel lingkungan sistem JAVA_HOME dengan sesuai.

Pertimbangan server proksi

Jika lingkungan jaringan perusahaan Anda menggunakan server proksi untuk mengakses internet, konfigurasikan runtime integrasi yang dihost sendiri untuk menggunakan pengaturan proksi yang sesuai. Anda dapat mengatur proksi selama fase pendaftaran awal.

Tentukan proksi

Saat dikonfigurasikan, runtime integrasi yang dihost sendiri menggunakan server proksi untuk terhubung ke sumber dan tujuan layanan cloud (yang menggunakan protokol HTTP atau HTTPS). Inilah sebabnya mengapa Anda memilih Ubah tautan selama penyetelan awal.

Mengatur proksi

Ada tiga opsi konfigurasi:

  • Jangan gunakan proksi: Runtime integrasi yang dihost sendiri tidak secara eksplisit menggunakan proksi apa pun untuk tersambung ke layanan cloud.
  • Gunakan proksi sistem: Runtime integrasi yang dihost sendiri menggunakan pengaturan proksi yang dikonfigurasikan diahost.exe.config dan diawp.exe.config. Jika file-file ini menentukan tidak ada konfigurasi proksi, runtime integrasi yang dihost sendiri tersambung ke layanan cloud secara langsung tanpa melalui proksi.
  • Gunakan proksi kustom: Konfigurasikan pengaturan proksi HTTP untuk digunakan untuk runtime integrasi yang dihost sendiri, alih-alih menggunakan konfigurasi di diahost.exe.config dan diawp.exe.config. Alamat dan nilai Port diperlukan. Nama Pengguna dan Kata Sandi bersifat opsional, bergantung pada pengaturan autentikasi proksi Anda. Semua pengaturan dienkripsi dengan Windows DPAPI pada runtime integrasi yang dihost sendiri dan disimpan secara lokal pada komputer.

Layanan host runtime integrasi dihidupkan ulang secara otomatis setelah Anda menyimpan pengaturan proksi yang diperbarui.

Setelah Anda mendaftarkan runtime integrasi yang dihost sendiri, jika Anda ingin melihat atau memperbarui pengaturan proksi, gunakan Microsoft Integration Runtime Configuration Manager.

  1. Buka Microsoft Integration Runtime Configuration Manager.
  2. Di bawah Proksi HTTP, pilih tautan Ubah untuk membuka kotak dialog Atur Proksi HTTP.
  3. Pilih Selanjutnya. Anda kemudian melihat peringatan yang meminta izin Anda untuk menyimpan pengaturan proksi dan menghidupkan ulang layanan host runtime integrasi.

Anda dapat menggunakan alat manajer konfigurasi untuk melihat dan memperbarui proksi HTTP.

Catatan

Jika Anda menyiapkan server proksi dengan autentikasi NTLM, layanan host runtime integrasi berjalan di bawah akun domain. Jika nanti Anda mengubah kata sandi untuk akun domain, ingatlah untuk memperbarui pengaturan konfigurasi untuk layanan dan menghidupkan ulang layanan. Karena persyaratan ini, kami menyarankan Agar Anda mengakses server proksi dengan menggunakan akun domain khusus yang tidak mengharuskan Anda untuk sering memperbarui kata sandi.

Praktik terbaik penginstalan

Anda dapat menginstal runtime integrasi yang dihost sendiri dengan mengunduh paket penyiapan Identitas Terkelola dari Pusat Unduhan Microsoft.

  • Konfigurasikan rencana daya pada mesin host untuk runtime integrasi yang dihost sendiri sehingga mesin tidak berhibernasi. Jika mesin host berhibernasi, runtime integrasi yang dihost sendiri akan offline.
  • Cadangkan info masuk yang terkait dengan runtime integrasi yang dihost sendiri secara berkala.

Langkah berikutnya