Поделиться через


Изменение значений домена

В этом разделе описывается, как изменить и дополнить метаданные в базе знаний в службах Службы Data Quality Services (DQS). После создания набора знаний путем обнаружения набора знаний, импорта знаний в базу знаний или домены или подготовки базы знаний на основе другой базы знаний можно интерактивно изменять значения данных. Создание базы знаний не является строго автоматическим процессом. Можно использовать собственные знания для проверки и изменения значений данных следующими способами.

  • Добавить значение домена в список значений или выбрать значение и удалить его из списка.

  • Изменить состояние значения домена, назначенное на этапе анализа службами DQS, на одно из следующих: «верно», «ошибочно» или «недопустимо».

  • Ввести значение для замены ошибочного или недопустимого значения. Значение недопустимо, если оно не принадлежит домену, например если оно не соответствует типу данных домена или нарушает правило домена. Значение ошибочно, если принадлежит домену, но содержит синтаксическую ошибку.

  • Задать два значения или несколько в качестве синонимов и изменить ведущее значение, назначенное в процессе обнаружения, в результате чего ведущее значение заменяет значение синонима, если при создании домена было установлено свойство Использование ведущего значения

  • Импортировать значения в домен из файла Excel

В этом разделе

  • Перед началом работы выполните следующие действия.

    Предварительные требования

    Безопасность

  • Изменение значений домена

  • Дальнейшие действия: после изменения значений домена

  • Смысл правильного, ошибочного и недопустимого значений

  • Как отобразить соответствующие значения

  • Как обрабатывать значения, эквивалентные NULL

Перед началом

Предварительные требования

Чтобы изменить значение домена, необходима база знаний и домен, открытый в операции управления доменами.

Безопасность

Разрешения

Для изменения значений домена необходимо иметь роль dqs_kb_editor или dqs_administrator в базе данных DQS_MAIN.

Значок стрелки, используемый со ссылкой «В начало»[Top]

Изменение значений домена

В таблице Значение отображаются знания, добавленные в базу знаний для отдельного домена. В любое время вы можете выбрать другой домен в списке доменов для отображения значений для данного домена. Поле содержит следующие столбцы.

  • Столбец Значение отображает все значения, добавленные процессом обнаружения к выбранному домену из поля в образце данных. Любое значение, рассматриваемое как ошибочное, будет показано в качестве синонима для значения, рассматриваемого как верное.

  • Столбец Тип отображает состояние значения, определенное процессом обнаружения. Зеленый флажок указывает, что значение верно или исправлено; красный крест — что значение ошибочно, а оранжевый треугольник с восклицательным знаком — что значение недопустимо. Недопустимое значение не соответствует требованиям к данным для домена. Ошибочное значение может быть допустимым, но некорректным по причинам, связанным с данными.

  • В столбце Исправить на показано правильное значение, на которое изменяется исходное значение, отмеченное как ошибочное или недопустимое. По результатам процесса обнаружения службы DQS могут предложить правильное значение.

Чтобы изменить значения, выполните следующие действия.

  1. Запустите клиент DQS. Дополнительные сведения об этой процедуре см. в разделе Запуск клиентского приложения DQS.

  2. На главном экране клиента Клиент Data Quality откройте или создайте базу знаний. Выберите операцию Управление доменами, а затем нажмите кнопку Открыть или Создать. Дополнительные сведения см. в разделе Создание базы знаний или Открытие базы знаний.

    ПримечаниеПримечание

    Управление доменами осуществляется на странице клиента службы Data Quality Services, которая содержит пять вкладок для отдельных операций управления доменом. Это не процесс, управляемый мастером; любая операция управления может быть выполнена отдельно.

  3. В области Список доменов страницы Управление доменами выберите домен, для которого необходимо изменить значения, или создайте новый домен. Если нужно создать новый домен, см. раздел Создание домена. Выберите вкладку Значения домена.

  4. Отобразите значения, которые нужно изменить в таблице Значение. Дополнительные сведения см. в разделе Как отобразить соответствующие значения ниже.

  5. Чтобы изменить состояние значения, выполните следующие действия.

    • Задать выбранные значения домена как исправленные: Чтобы изменить состояние значения с ошибочного или недопустимого на исправленное, выберите значение и щелкните флажок Задать выбранные значения домена как исправленные на направленной вниз стрелке на панели значков или в раскрывающемся списке «Тип». Если ошибочное или недопустимое значение сгруппировано с правильным значением, удалите это значение после операции.

    • Задать выбранные значения домена как ошибочные: Чтобы изменить состояние значения с верного или недопустимого на ошибочное, выберите значение и щелкните крест Задать выбранные значения домена как ошибочные в меню направленной вниз стрелки на панели значков или в раскрывающемся списке «Тип». Вы можете ввести исправление в столбце Исправить на или оставить его пустым.

    • Задать выбранные значения домена как недопустимые: Чтобы изменить состояние значения с верного или ошибочного на недопустимое, выберите значение и щелкните треугольник Задать выбранные значения домена как недопустимые на направленной вниз стрелке на панели значков или в раскрывающемся списке «Тип». Вы можете ввести исправление в столбце Исправить на или оставить его пустым.

    • Исправить на: После задания значения как ошибочного или недопустимого введите новое значение в столбец Исправить на. При этом службы DQS добавляют новую строку для замещающего значения и назначают его верным, а затем группируют оба эти значения. Новое значение будет показано как ведущее значение, ведущее значение выделено полужирным шрифтом, а ошибочное или недопустимое значение показано с отступами.

  6. Чтобы определить значения как группы синонимов, выберите несколько значений, которые являются правильными, а затем выполните следующие действия.

    • Задать выбранные значения домена как синонимы: Чтобы задать синонимы, выберите несколько правильных значений и щелкните значок Задать выбранные значения домена как синонимы. Службы DQS сгруппируют значения и назначат одно из значений в качестве ведущего, которым будут заменяться другие. Обратите внимание, что, если два значения сгруппированы, но одно из них ошибочно или недопустимо, эти значения не являются синонимами.

      ПримечаниеПримечание

      Если выбрано два или несколько значений или несколько в группе и другое значение вне этой группы, а затем они назначены синонимами, будет получено неверное сообщение об ошибке. После закрытия всплывающего сообщения об ошибке значения будут правильно назначены синонимами.

    • Разорвать связь между выбранными синонимами. Чтобы отменить назначение синонимов для двух или нескольких значений, выберите значения и щелкните значок Разорвать связь между выбранными синонимами. Для успешного разгруппирования синонимов значения должны быть сгруппированы и быть правильными.

    • Задать выбранное значение домена в качестве ведущего значения соответствующей группы. Чтобы изменить ведущее значение группы, выберите в группе значение, не назначенное ведущим, и нажмите кнопку Задать выбранное значение домена в качестве ведущего значения соответствующей группы. В результате ведущее значение будет назначено в качестве замены для другого значения. Эта операция выполняется, только если два значения или несколько объединены в группу и требуется изменить ведущее значение, назначенное службами DQS. Обратите внимание, что ведущее значение обозначается синей строкой со значением, выделенным полужирным шрифтом.

  7. Средство проверки орфографии: Если значение подчеркнуто волнистой красной линией, это означает, что средство проверки орфографии предлагает исправление для значения. Щелкните правой кнопкой мыши подчеркнутое значение и выберите одно из исправлений, если оно применимо. Тип значения становится ошибочным (или остается таковым), а исправление добавляется в столбец Исправить на. Щелкните стрелку «вниз» для просмотра дополнительных предложенных исправлений. Введите исправление вручную, чтобы добавить его к словарю средства проверки орфографии, с учетом того, что это значение должно быть выбрано как исправление. Дополнительные сведения см. в разделах Использование средства проверки орфографии DQS и Установка свойств домена.

    ПримечаниеПримечание

    Для использования средства проверки орфографии вы можете либо включить его на странице Свойства домена, либо, если оно отключено на странице Свойства домена, щелкнуть значок Включить/отключить средство проверки орфографии на странице Значения домена, чтобы включить его на этой странице.

  8. Добавление нового значения домена: Щелкните, чтобы добавить строку в конец таблицы. После ввода значения строка будет позиционирована в алфавитном порядке и определена в качестве нового элемента предшествующим символом звездочки.

  9. Импорт значений в домен из файла Excel: Чтобы добавить новые значения из электронной таблицы Excel, щелкните стрелку «вниз » для значка Импорт значений и выберите Импорт значений в домен из файла Excel. Введите имя файла, выберите Использовать первую строку в качестве заголовка, если это возможно, и нажмите кнопку ОК. Дополнительные сведения см. в разделе Импорт значений из файла Excel в домен.

  10. Импорт значений в домен из файла Excel: Для добавления новых значений из проекта служб DQS щелкните стрелку «вниз » для значка Импорт значений и выберите Импорт значений проекта. Введите имя файла, выберите Использовать первую строку в качестве заголовка, если это возможно, и нажмите кнопку ОК. Выберите проект, из которого нужно импортировать значения, и нажмите кнопку ОК. Будут отображены импортированные значения. Нажмите кнопку Готово. Дополнительные сведения см. в разделе «Импорт значений проекта в домен».

  11. Удалить выбранные значения домена. Чтобы удалить одно или несколько существующих значений из домена, выберите значения из таблицы «Значения» и щелкните значок Удалить выбранные значения домена. Удалить элемент DQS_NULL нельзя, поэтому, если удаляется несколько значений, одно из которых — элемент DQS_NULL, операция завершится ошибкой.

  12. Нажмите кнопку Готово, чтобы завершить операцию управления доменами, как описано в разделе Завершение операции по управлению доменами.

Значок стрелки, используемый со ссылкой «В начало»[Top]

Дальнейшие действия. после изменения значений домена

Изменив значения домена, можно выполнить другие задачи управления доменами для этого домена, провести обнаружение знаний для добавления знаний в домен или добавить в домен политику сопоставления. Дополнительные сведения см. в разделе Обнаружение набора знаний, Управление доменом или Создание политики сопоставления.

Значок стрелки, используемый со ссылкой «В начало»[Top]

Смысл правильного, ошибочного и недопустимого значений

Каждому значению в таблице Значение на странице Значения домена назначается параметр ТипПравильно, Ошибка или Недопустимо. Тип значения первоначально назначается операцией обнаружения знаний, и его вы можете изменить по своему усмотрению. Последний тип, основанный на обнаружении и интерактивных изменениях, формируется операцией очистки. Эти значения имеют следующий смысл.

  • Правильно. Это значение принадлежит к домену и не имеет каких-либо синтаксических ошибок. Например, значение «Чикаго» в домене «Город» — правильное.

  • Ошибка. Это значение, которое принадлежит домену, но является неверным. Например, «Шикаго» вместо «Чикаго» в домене «Город» — ошибка. Службы DQS определяют значение как ошибочное, если выявлена синтаксическая ошибка, и назначают связанное исправление в процессе обнаружения. Орфографические ошибки относятся к числу синтаксических ошибок.

  • Недопустимо. Это значение не принадлежит к домену и не имеет исправления. Например, значение «12345» в домене «Город» является недопустимым. Службы DQS определяют значение как недопустимое, если оно не соответствует правилу домена.

Тип значения вы можете изменить вручную на любое из двух других значений. Службы DQS не обеспечивают правильность и семантику ошибок при ручных операциях. Исправление для недопустимого значения вы можете ввести без изменения его статуса. Вы можете объявить значение недопустимым, даже если оно не нарушает правила домена. Службы DQS могут определить значение как ошибочное, даже если в процессе обнаружения не выявлены синтаксические ошибки. Вы можете также удалить исправление ошибочного значения, которое отмечено как правильное, без изменения его статуса.

При интерактивной очистке данных на странице Управление результатами и их просмотр операции Очистка как недопустимые, так и ошибочные значения представлены на вкладке Недопустимые на странице Управление результатами и их просмотр.

Значок стрелки, используемый со ссылкой «В начало»[Top]

Как отобразить соответствующие значения

Вы можете изменять отображаемые сведения следующим образом.

  • Фильтровать результаты, которые нужно внести в таблицу, по их состоянию, выбирая состояние в раскрывающемся списке Фильтр.

  • Найти данные, которые нужно проверить или изменить, добавляя по одной букве для поиска в текстовое поле Найти. В результате эти буквы будут выделяться всегда, когда они встречаются в любом отображаемом значении.

  • Выберите Показывать только новые, чтобы отображать в таблице только значения, обнаруженные только в текущем сеансе.

  • Нажмите кнопку Развернуть все, чтобы показать все значения в любой группе синонимов, если текущее состояние свернутое.

  • Нажмите кнопку Свернуть все, чтобы скрыть все значения, кроме ведущего, в любой группе синонимов, если текущее состояние развернутое.

  • Нажмите кнопку Показать/скрыть панель журнала изменений значений домена, чтобы отобразить всплывающее окно предварительного вида в нижней части таблицы значений, которое показывает недавние изменения в наборе значений домена.

Значок стрелки, используемый со ссылкой «В начало»[Top]

Как обрабатывать значения, эквивалентные NULL

Каждая таблица значений на вкладке Значения домена содержит значение DQS_NULL. Значение NULL в источнике данных будет отображаться как SQL_NULL в таблице значений. Вы можете задать одно или несколько значений, эквивалентных NULL, в качестве синонимов для DQS_NULL. После этого все значения NULL и значения, эквивалентные NULL, будут обрабатываться как DQS_NULL.