Menentukan aturan yang cocok untuk penyatuan data

Langkah dalam penyatuan ini mendefinisikan urutan pertandingan dan aturan untuk pencocokan lintas tabel. Langkah ini memerlukan setidaknya dua tabel. Saat rekaman dicocokkan, rekaman tersebut digabungkan menjadi satu rekaman dengan semua bidang dari setiap tabel. Baris alternatif (baris nonpemenang dari langkah Deduplikasi) dipertimbangkan saat mencocokkan. Namun, jika baris cocok dengan baris alternatif dalam tabel, catatan akan dicocokkan dengan baris pemenang.

Catatan

Setelah membuat kondisi kecocokan dan memilih Berikutnya, Anda tidak dapat menghapus tabel atau kolom yang dipilih. Jika diperlukan, pilih Kembali untuk meninjau tabel dan kolom yang dipilih sebelum melanjutkan.

Langkah-langkah dan gambar berikut mencerminkan pertama kali Anda melalui proses penyatuan. Untuk mengedit pengaturan penyatuan yang ada, lihat Memperbarui pengaturan penyatuan.

Menyertakan tabel yang diperkaya (pratinjau)

Jika Anda memperkaya tabel pada tingkat sumber data untuk membantu meningkatkan hasil penyatuan Anda, pilih tabel tersebut. Untuk informasi selengkapnya, lihat Pengayaan untuk sumber data. Jika Anda memilih tabel yang diperkaya di halaman Aturan deduplikasi, Anda tidak perlu memilihnya lagi.

  1. Pada halaman Aturan yang cocok, pilih Gunakan tabel yang diperkaya di bagian atas halaman.

  2. Dari panel Gunakan tabel yang diperkaya, pilih satu atau beberapa tabel yang diperkaya.

  3. Pilih Selesai.

Tentukan urutan kecocokan

Setiap pertandingan menyatukan dua atau lebih tabel menjadi satu tabel terkonsolidasi. Pada waktu bersamaan, ia menyimpan rekaman pelanggan unik. Urutan kecocokan menunjukkan urutan di mana sistem mencoba mencocokkan catatan.

Penting

Tabel pertama disebut tabel utama, yang berfungsi sebagai dasar untuk profil terpadu Anda. Tabel tambahan yang dipilih akan ditambahkan ke tabel ini.

Pertimbangan penting:

  • Pilih tabel dengan data profil terlengkap dan terpercaya tentang pelanggan Anda sebagai tabel utama.
  • Pilih tabel yang memiliki beberapa kolom yang sama dengan tabel lain (misalnya, nama, nomor telepon, atau alamat email) sebagai tabel utama.
  • Tabel hanya dapat dicocokkan dengan tabel lain yang prioritasnya lebih tinggi. Jadi Table2 hanya bisa bertanding melawan Table1, dan Table3 bisa bertanding melawan Table2 atau Table1.
  1. Pada halaman Aturan yang cocok, gunakan panah pindahkan ke atas dan ke bawah untuk memindahkan tabel dalam urutan yang Anda inginkan, atau seret dan letakkan. Misalnya, pilih eCommerceContacts sebagai tabel utama dan loyCustomer sebagai tabel kedua.

  2. Untuk memiliki setiap rekaman dalam tabel sebagai pelanggan unik terlepas dari apakah kecocokan ditemukan, pilih Sertakan semua rekaman. Setiap rekaman dalam tabel ini yang tidak cocok dengan rekaman di tabel lain disertakan dalam profil terpadu. Catatan yang tidak memiliki kecocokan disebut singleton.

Tabel utama eCommerceContacts dicocokkan dengan tabel berikutnya loyCustomer . Himpunan data yang dihasilkan dari langkah pencocokan pertama dicocokkan dengan tabel berikut jika Anda memiliki lebih dari dua tabel. Jika duplikat masih ada di eCommerceContacts, saatloyCustomer dicocokkan dengan eCommerceContacts, baris duplikat eCommerceContacts tidak akan dikurangi menjadi satu catatan pelanggan. Namun, jika baris duplikat di loyCustomer cocok dengan baris dieCommerceContacts, baris tersebut akan dikurangi menjadi satu catatan pelanggan.

Cuplikan layar urutan kecocokan yang dipilih untuk tabel.

Menentukan aturan untuk pasangan yang cocok

Aturan kecocokan menentukan logika yang dengannya pasangan tabel tertentu akan dicocokkan. Aturan terdiri dari satu atau beberapa kondisi.

Peringatan di samping nama tabel berarti bahwa tidak ada aturan kecocokan yang ditentukan untuk pasangan kecocokan.

  1. Pilih Tambahkan aturan untuk pasangan tabel untuk menentukan aturan kecocokan.

  2. Di panel Tambahkan aturan, konfigurasikan kondisi untuk aturan .

    Cuplikan layar panel Tambahkan aturan.

    • Pilih Tabel/Bidang (baris pertama): Pilih tabel dan kolom yang mungkin unik untuk pelanggan. Contohnya, nomor telepon atau alamat email. Hindari pencocokan menurut kolom tipe aktivitas. Misalnya, ID pembelian kemungkinan tidak akan menemukan kecocokan pada jenis rekaman lain.

    • Pilih Tabel/Bidang (baris kedua): Pilih kolom yang terkait dengan kolom tabel yang ditentukan di baris pertama.

    • Normalisasi: Pilih dari opsi normalisasi berikut untuk kolom yang dipilih.

      • Angka: Mengonversi sistem angka lain, seperti angka Romawi, ke angka Arab. VIII menjadi 8.
      • Simbol: Menghapus semua simbol dan karakter khusus. Head & Shoulder menjadi HeadShoulder.
      • Teks menjadi huruf kecil: Mengonversi semua karakter menjadi huruf kecil. ALL CAPS dan Title Case menjadi semua huruf besar dan title case.
      • Jenis (Telepon, Nama, Alamat, Organisasi): Membakukan nama, jabatan, nomor telepon, alamat, dan organisasi.
      • Unicode ke ASCII: Mengonversi notasi unicode menjadi karakter ASCII. /u00B2 menjadi 2.
      • Spasi: Menghapus semua spasi. Hello World menjadi HelloWorld.
    • Presisi: Atur tingkat presisi untuk diterapkan pada kondisi ini. Presisi digunakan dengan pencocokan fuzzy, dan menentukan seberapa dekat dua senar harus agar dianggap cocok.

      • Dasar: Pilih dari Rendah (30%), Sedang (60%), Tinggi (80%), dan Tepat (100%). Pilih Tepat untuk hanya mencocokkan rekaman yang cocok dengan 100 persen.
      • Kustom: Tetapkan persentase yang harus dicocokkan dengan rekaman. Sistem hanya akan mencocokkan rekaman yang melewati ambang batas ini.
    • Nama: Nama untuk aturan.

  3. Untuk mencocokkan tabel hanya jika kolom memenuhi beberapa kondisi, pilih Tambahkan Tambahkan>kondisi untuk menambahkan kondisi lainnya ke aturan kecocokan. Kondisi terhubung dengan operator AND logis dan dengan demikian hanya dijalankan jika semua kondisi terpenuhi.

  4. Secara opsional, pertimbangkan opsi lanjutan seperti pengecualian atau kondisi pencocokankustom.

  5. Pilih Selesai untuk menyelesaikan aturan.

  6. Secara opsional, tambahkan lebih banyak aturan.

  7. Pilih Selanjutnya.

Menambahkan aturan ke pasangan yang cocok

Aturan kecocokan menunjukkan rangkaian kondisi. Untuk mencocokkan tabel menurut kondisi berdasarkan beberapa kolom, tambahkan aturan lainnya.

  1. Pilih Tambahkan aturan pada tabel yang ingin Anda tambahkan aturannya.

  2. Ikuti langkah-langkah dalam Menentukan aturan untuk pasangan yang cocok.

Catatan

Urutan aturan itu penting. Algoritme pencocokan mencoba mencocokkan catatan pelanggan tertentu berdasarkan aturan pertama Anda dan berlanjut ke aturan kedua hanya jika tidak ada kecocokan yang diidentifikasi dengan aturan pertama.

Pilihan tingkat lanjut

Menambahkan pengecualian ke aturan

Dalam kebanyakan kasus, pencocokan tabel mengarah ke profil pelanggan unik dengan data konsolidasi. Untuk mengatasi kasus positif palsu dan negatif palsu yang jarang terjadi, tentukan pengecualian untuk aturan kecocokan. Pengecualian diterapkan setelah memproses aturan pertandingan dan menghindari pencocokan semua catatan, yang memenuhi kriteria pengecualian.

Misalnya, jika aturan kecocokan Anda menggabungkan nama belakang, kota, dan tanggal lahir, sistem akan mengidentifikasi anak kembar dengan nama belakang yang sama yang tinggal di kota yang sama dengan profil yang sama. Anda dapat menentukan pengecualian yang tidak cocok dengan profil jika nama depan dalam tabel yang Anda gabungkan tidak sama.

  1. Di panel Edit aturan , pilih Tambahkan Tambahkan>pengecualian.

  2. Tentukan kriteria pengecualian.

  3. Pilih Selesai untuk menyimpan aturan.

Menentukan kondisi kecocokan kustom

Tentukan kondisi yang menggantikan logika pencocokan default. Ada empat opsi yang tersedia:

Opsi Description Contoh
Selalu cocok Menentukan nilai untuk kunci utama yang selalu cocok. Selalu cocokkan baris dengan primary key 12345 dengan baris dengan primary key54321.
Tidak pernah cocok Menentukan nilai untuk kunci utama yang tidak pernah cocok. Jangan pernah mencocokkan baris dengan primary key 12345 dengan baris dengan primary key54321.
Lewati Mendefinisikan nilai yang harus selalu diabaikan sistem dalam fase pencocokan. Abaikan nilai 11111 dan Tidak diketahui selama pertandingan.
Pemetaan alias Mendefinisikan nilai yang harus dipertimbangkan sistem sebagai nilai yang sama. Anggaplah Joe setara dengan Yusuf.
  1. Pilih Kustom.

    Tombol kustom

  2. Pilih Jenis kustom dan pilih Unduh template. Ganti nama templat tanpa menggunakan spasi. Gunakan template terpisah untuk setiap opsi kecocokan.

  3. Buka file template yang diunduh dan isi detailnya. Templat berisi bidang untuk menentukan tabel dan nilai kunci utama tabel yang akan digunakan dalam pencocokan kustom. Nama tabel peka huruf besar/kecil. Misalnya, jika Anda ingin kunci utama 12345 dari tabel Penjualan selalu cocok dengan kunci utama 34567 daritabel Kontak , isi templat:

    • Tabel 1: Penjualan
    • Tabel1Kunci: 12345
    • Table2: Kontak
    • Table2Key: 34567

    File template yang sama dapat menentukan rekaman pencocokan kustom dari beberapa tabel.

    Jika Anda ingin menentukan pencocokan kustom untuk deduplikasi pada tabel, berikan tabel yang sama seperti Table1 dan Table2 dan atur nilai kunci utama yang berbeda. Anda harus menentukan setidaknya satu aturan deduplikasi pada tabel untuk menggunakan pencocokan kustom.

  4. Setelah menambahkan semua penggantian, simpan file template.

  5. Buka Sumber> data Data dan serap file template sebagai tabel baru.

  6. Setelah mengunggah file, pilih opsi Custom lagi. Pilih tabel yang diperlukan dari menu tarik-turun dan pilih Selesai.

    Cuplikan layar dialog untuk memilih penggantian untuk skenario pencocokan kustom.

  7. Menerapkan pencocokan kustom bergantung pada opsi pencocokan yang ingin Anda gunakan.

    • Untuk Selalu cocokkan atau Jangan pernah cocok, lanjutkan ke langkah berikutnya.
    • Untuk Bypass atau pemetaan Alias , pilihEdit pada aturan kecocokan yang ada atau buat aturan baru. Di menu dropdown Normalisasi, pilih opsi Bypass kustom atau Pemetaan alias dan pilihSelesai.
  8. Pilih Selesai pada panel Kustom untuk menerapkan konfigurasi pencocokan kustom.

    Setiap file template yang diserap adalah sumber data sendiri. Jika ditemukan catatan yang memerlukan perlakuan pencocokan khusus, perbarui sumber data yang sesuai. Pembaruan akan digunakan selama proses penyatuan berikutnya. Misalnya, Anda mengidentifikasi anak kembar dengan nama yang hampir sama yang tinggal di alamat yang sama yang telah digabungkan sebagai satu orang. Perbarui sumber data untuk mengidentifikasi si kembar sebagai catatan terpisah dan unik.