Share via


Дефиниране на правила за съвпадение за унифициране на данни

Тази стъпка в унифицирането определя реда на съвпадение и правилата за съвпадение между таблици. Тази стъпка изисква поне две таблици. Когато записите съвпадат, те се съединяват в един запис с всички полета от всяка таблица. Алтернативните редове (редове, които не са победители от стъпката на дедупликация) се вземат предвид при съвпадение. Но ако даден ред съвпада с алтернативен ред в таблица, записът съвпада с реда победител.

Бележка

След като създадете условията за съвпадение и изберете Напред, не можете да премахнете избрана таблица или колона. Ако е необходимо, изберете "Назад ", за да прегледате избраните таблици и колони, преди да продължите.

Следващите стъпки и изображения отразяват първия път, когато преминавате през процеса на обединение. За да редактирате съществуващите настройки за обединение, вижте Актуализиране на настройките за обединение.

Включване на обогатени таблици (предварителен преглед)

Ако сте обогатили таблици на ниво източник на данни, за да подобрите резултатите от обединението, изберете ги. За повече информация вижте Обогатяване за източници на данни. Ако сте избрали обогатени таблици на страницата с правила за дедупликация, не е необходимо да ги избирате отново.

  1. На страницата Правила за съвпадение изберете Използване на обогатени таблици в горната част на страницата.

  2. От екрана Използване на обогатени таблици изберете една или повече обогатени таблици .

  3. Изберете Готово.

Укажете реда на съвпадението

Всяко съвпадение обединява две или повече маси в една консолидирана таблица. В същото време той поддържа уникалните клиентски записи. Редът на съвпадение показва реда, в който системата се опитва да съпостави записите.

Важно

Първата таблица се нарича основна таблица, която служи като основа за вашите унифицирани профили. Към тази таблица ще бъдат добавени допълнителни таблици.

Важни съображения:

  • Изберете таблицата с най-пълните и надеждни профилни данни за вашите клиенти като основна таблица.
  • Изберете таблицата, която има няколко колони общо с други таблици (например име, телефонен номер или имейл адрес) като основна таблица.
  • Таблиците могат да съвпадат само с други таблици, които са с по-висок приоритет. Така че Таблица2 може да съвпада само с Таблица1, а Таблица3 може да съвпада с Таблица2 или Таблица1.
  1. На страницата Правила за съвпадение използвайте стрелките за преместване нагоре и надолу, за да преместите таблиците в желания ред, или ги плъзнете и пуснете. Например, изберете eCommerceContacts като основна таблица и loyCustomer като втора таблица.

  2. За да имате всеки запис в таблицата като уникален клиент, независимо дали е намерено съвпадение, изберете Включи всички записи. Всички записи в тази таблица, които не съвпадат със записите в никоя друга таблица, се включват в единния профил. Записите, които нямат съвпадение, се наричат сингълтони.

Основната таблица eCommerceContacts съвпада със следващата таблицаloyCustomer. Наборът от данни, който се получава от първата стъпка на съвпадение, съвпада със следната таблица, ако имате повече от две таблици. Ако дубликатите все още съществуват в eCommerceContacts, когатоloyCustomer е съпоставен с eCommerceContacts , дублиращите се редове на eCommerceContacts не се свеждат до един клиентски запис. Ако обаче дублираните редове в loyCustomer съвпадат с ред в eCommerceContacts , те се намаляват в един клиентски запис.

Екранна снимка на избрания ред на съвпадение за таблиците.

Определете правила за двойки мачове

Правилата за съвпадение определят логиката, по която определена двойка таблици ще бъде съчетана. Правилото се състои от едно или повече условия.

Предупреждението до име на таблица означава, че не е дефинирано правило за съвпадение за двойка мачове.

  1. Изберете Добавяне на правило за двойка таблици, за да дефинирате правила за съвпадение.

  2. В екрана Добавяне на правило конфигурирайте условията за правилото.

    Екранна снимка на екрана Добавяне на правило.

    • Изберете Таблица/поле (първи ред): Изберете таблица и колона, които вероятно са уникални за клиента. Например телефонен номер или имейл адрес. Избягвайте съвпадението по колони от тип дейност. Например идентификатор на покупка вероятно няма да намери съответствие в други типове записи.

    • Изберете Таблица/поле (втори ред): Изберете колона, която се отнася до колоната на таблицата, зададена в първия ред.

    • Нормализиране: Изберете от следните опции за нормализиране за избраните колони.

      • Цифри: Преобразува други бройни системи, като например римски цифри, в арабски цифри. VIII става 8.
      • Символи: Премахва всички символи и специални знаци. Head&Shoulder се превръща в HeadShoulder .
      • Текст с малки букви: Преобразува всички знаци в малки букви. ALL CAPS и Title Case става всички главни букви и главни букви.
      • Тип (телефон, име, адрес, организация): Стандартизира имена, титли, телефонни номера, адреси и организации.
      • Unicode в ASCII: Преобразува нотация на Unicode в ASCII знаци. /u00B2 става 2.
      • Интервал: Премахва всички интервали. Hello World се превръща в HelloWorld.
    • Точност: Задайте нивото на точност, за да кандидатствате за това условие. Прецизността се използва с размито съвпадение и определя колко близо трябва да бъдат два низа, за да се считат за съвпадение.

      • Основни: Изберете между Ниско (30%), Средно (60%), Високо (80%) и Точно (100%). Изберете Точно , за да съвпадне само със записи, които съответстват на 100 процента.
      • По избор: Задайте процент, който записите трябва да съвпадат. Системата ще съвпада само със записи, преминали този праг.
    • Име: Име на правилото.

  3. За да съпоставите таблиците само ако колоните отговарят на няколко условия, изберете Добавяне>на условие , за да добавите още условия към правило за съвпадение. Условията са свързани с логически оператор И и по този начин се изпълняват само ако са изпълнени всички условия.

  4. По желание обмислете разширени опции, като например изключения или условия за съвпадение поизбор.

  5. Изберете Готово , за да финализирате правилото.

  6. По желание добавете още правила.

  7. Изберете Напред.

Добавете правила към двойка съвпадения

Правилата за съвпадение представляват набор от условия. За да съпоставите таблиците по условия, базирани на няколко колони, добавете още правила.

  1. Изберете Добавяне на правило в таблицата, към която искате да добавите правила.

  2. Следвайте стъпките в Дефиниране на правила за двойки мачове.

Бележка

Редът на правилата има значение. Алгоритъмът за съвпадение се опитва да съответства на даден клиентски запис въз основа на първото ви правило и продължава към второто правило само ако не са идентифицирани съвпадения с първото правило.

Разширени опции

Добавяне на изключения към правило

В повечето случаи съвпадението на таблиците води до уникални клиентски профили с консолидирани данни. За да адресирате редки случаи на фалшиви положителни и фалшиви отрицателни резултати, определете изключения за правило за съвпадение. Изключенията се прилагат след обработка на правилата за съвпадение и се избягва съвпадението на всички записи, които отговарят на критериите за изключение.

Например, ако вашето правило за съвпадение комбинира фамилно име, град и дата на раждане, системата ще идентифицира близнаци със същия фамилно име, които живеят в същия град като същия профил. Можете да зададете изключение, което не съответства на профилите, ако собствено име в таблиците, които комбинирате, не са еднакви.

  1. В екрана Редактиране на правило изберете Добавяне на>изключение.

  2. Задайте критериите за изключение.

  3. Изберете Готово , за да запишете правилото.

Посочете персонализирани условия на съвпадение

Задайте условия, които заместват логиката на съвпадението по подразбиране. Налични са четири опции:

Опция Описание Пример
Съвпадение винаги Дефинира стойности за първичните ключове, които винаги съвпадат. Винаги съпоставяйте реда с първичен ключ 12345 с реда с първичен ключ54321.
Липса на съвпадение винаги Дефинира стойности за първичните ключове, които никога не съвпадат. Никога не съпоставяйте реда с първичен ключ 12345 с реда с първичен ключ54321.
Заобикаляне Дефинира стойности, които системата винаги трябва да игнорира във фазата на съвпадение. Игнорирайте стойностите 11111 и Unknown по време на съвпадение.
Съпоставяне на псевдоним Дефинира стойности, които системата трябва да разглежда като една и съща стойност. Считайте Джо за равен на Джоузеф .
  1. Изберете Персонализирано.

    Бутон по избор

  2. Изберете типа По избор и изберете Изтегляне на шаблон. Преименувайте шаблона, без да използвате интервали. Използвайте отделен шаблон за всяка опция за съвпадение.

  3. Отворете изтегления файл с шаблон и попълнете подробностите. Шаблонът съдържа полета за задаване на таблицата и стойностите на първичния ключ на таблицата, които да се използват в персонализираното съвпадение. Имената на таблиците различават малки и главни букви. Ако например искате първичен ключ 12345 от таблицата "Продажби" винаги да съвпада с първичен ключ34567 от таблицата "Контакт ", попълнете шаблона:

    • Таблица1: Продажби
    • Таблица1Ключ: 12345
    • Таблица2: Контакт
    • Таблица2Ключ: 34567

    Един и същ файл с шаблон може да задава записи за съвпадение по избор от множество таблици.

    Ако искате да зададете съвпадение по избор за дедупликация в таблица, предоставете същата таблица като Таблица1 и Таблица2 и задайте различните стойности на първичния ключ. Трябва да дефинирате поне едно правило за дедупликация в таблицата, за да използвате съвпадение по избор.

  4. След като добавите всички замествания, запишете файла на шаблона.

  5. Отидете на Източници на данни >и поглъщайте файловете на шаблона като нови таблици.

  6. След като качите файловете, изберете отново опцията По избор . Изберете необходимите таблици от падащото меню и изберете Готово.

    Екранна снимка на диалоговия прозорец, за да изберете замествания за сценарий на съвпадение по избор.

  7. Прилагането на персонализираното съвпадение зависи от опцията за съвпадение, която искате да използвате.

    • За Винаги съвпадение или Никога съвпадение , преминете към следващата стъпка.
    • За съпоставяне на байпас или псевдоним изберете Редактиранена съществуващо правило за съвпадение или създайте ново правило. В падащото меню Нормализиране изберете опцията Персонализиран байпас или Псевдоним за съпоставяне и изберете Готово .
  8. Изберете Готово в екрана по избор, за да приложите конфигурацията на съвпадението по избор .

    Всеки погълнат шаблонен файл е свой собствен източник на данни. Ако се открият записи, които се нуждаят от специално съвпадение, актуализирайте съответния източник на данни. Актуализацията ще бъде използвана по време на следващия обединителен процес. Например, идентифицирате близнаци с почти едно и също име, живеещи на същия адрес, който е бил обединен като един човек. Актуализирайте източник на данни, за да идентифицирате близнаците като отделни, уникални записи.