Сопоставление качества данных в надстройке MDS для Excel

Со временем в репозиторий MDS потребуется добавить дополнительные данные. Перед добавлением может быть полезно сравнить новые данные с данными, которые уже управляются в MDS, чтобы избежать дублирования или добавления неточных данных.

MDS Надстройка для Excel использует службы Data Quality Services (DQS) из SQL Server для сопоставления данных. При использовании функции сопоставления в надстройке одинаковые записи группируются вместе и выводится показатель, отражающий точность результата. Дополнительные сведения о возможностях сопоставления в службах DQS см. в разделе Сопоставление данных.

Рабочий процесс для сопоставления качества данных

При использовании служб DQS с MDS Надстройка для Excel используйте следующий рабочий процесс.

  1. Получите список данных, управляемых MDS, и объедините его со списком данных, которые не управляются в MDS. Дополнительные сведения см. в разделе Объединение данных (надстройка MDS для Excel).

  2. Используйте базу набора знаний служб DQS для сравнения данных в объединенном списке. Дополнительные сведения см. в разделе Сопоставление схожих данных (надстройка MDS для Excel).

  3. Чтобы просмотреть дополнительные сведения о схожести, обнаруженной службами DQS, отобразите столбцы со сведениями.

  4. Просмотрите результаты и определите, какие данные следует добавить в репозиторий MDS и какие данные дублируются.

  5. Опубликуйте новые и/или обновленные данных в репозитории MDS.

Базы знаний

Результаты сопоставления, предлагаемые в надстройке, основаны на базе знаний служб DQS.

  • База знаний по умолчанию (DQS Data) создается при установке служб DQS. Если выбрать для использования базу знаний по умолчанию (без добавления политики сопоставления по умолчанию в базу знаний клиента DQS Data Quality), необходимо сопоставить столбцы в листе с доменами в базе знаний, затем присвоить значение веса с выбранными доменами.

  • Для создания новой базы знаний с политикой маршрутов вы можете использовать клиент DQS, а можно добавить политику сопоставления в базе знаний по умолчанию. В этом случае значения веса определяются уже созданной политикой сопоставления, и потребуется только сопоставить столбцы и домены. Дополнительные сведения см. в разделе Создание политики сопоставления.

Дополнительные сведения о базах знаний см. в разделе Базы знаний и домены DQS.

Связанные задачи

Описание задачи

Раздел

Объедините внешние данные с данными, управляемыми MDS, и подготовьтесь к их сравнению.

Объединение данных (надстройка MDS для Excel)

Воспользуйтесь базой набора знаний служб DQS для определения схожести данных.

Сопоставление схожих данных (надстройка MDS для Excel)

См. также