Data Quality Services の概念

このトピックでは、Data Quality Services (DQS) のナレッジ マネージメント、データ品質プロジェクト、およびデータ品質管理の概念を簡単に説明します。

このトピックの内容

  • ナレッジ マネージメントの概念

  • データ品質プロジェクトの概念

  • データ品質管理の概念

ナレッジ マネージメントの概念

DQS のナレッジ ベースは、データ クレンジングやデータ照合を通じてデータの品質を向上させるために使用される、データ スチュワードまたは IT プロフェッショナルが作成するメタデータのリポジトリです。 DQS のナレッジ マネージメントには、ナレッジ ベースを作成および管理するためのコンピューター支援型のプロセスと対話形式のプロセスが含まれます。

ナレッジ検出

ナレッジ検出は、組織のデータのサンプルを分析してデータに関するナレッジを構築するコンピューター支援型のプロセスです。 この分析の結果に基づいて、ナレッジを検証および強化し、それを適用してデータのクレンジング、照合、プロファイルを行うことができます。 詳細については、「DQS のナレッジ ベースとドメイン」を参照してください。

ドメイン管理

ドメイン管理プロセスでは、ナレッジ検出プロセスで生成されたナレッジを変更したり拡張したりできます。 ナレッジ ベースのナレッジは対話形式で編集、更新、確認できます。 ナレッジ ベースは、ドメインの値とその状態、ドメイン ルール、用語ベースのリレーション、および参照データを含むデータ ドメインで構成されます。 ドメイン管理では、ドメインのプロパティの変更、ドメインへの参照データのアタッチ、ドメイン ルールの管理、ドメイン値の管理、データのリレーションの入力、ドメインの作成、削除、インポート、エクスポートを行うことができます。 また、複数の単一ドメインをまとめた複合ドメインを使用することもできます。 詳細については、「DQS のナレッジ ベースとドメイン」を参照してください。

照合ポリシー

照合ポリシーには、データ重複除去の実行に使用される照合ルールが含まれます。 照合ポリシー プロセスでは、照合ルールを作成し、照合結果やプロファイル データに基づいてそれらを調整したり、ナレッジ ベースにポリシーを追加したりできます。 詳細については、「データ照合」を参照してください。

参照データ サービス

参照データを使用すると、参照データの品質を保証する企業のサービスを利用して、データを検証、修正、および強化することができます。 参照データ プロバイダーには、Windows Azure MarketPlace のサービスを使用して接続できます。また、プロバイダーに直接接続することもできます。 詳細については、「DQS の参照データ サービス」を参照してください。

DQS のナレッジ マネージメントの詳細については、「DQS のナレッジ ベースとドメイン」を参照してください。

[トップに戻る] リンクで使用される矢印アイコン[先頭に戻る]

データ品質プロジェクトの概念

データ スチュワードは、データ品質に関する操作 (クレンジングおよび照合) を Data Quality クライアント アプリケーションでデータ品質プロジェクトを使用して実行します。

データ クレンジング

DQS でのデータ クレンジングは、DQS ナレッジ ベースのナレッジに基づいて行われます。 DQS のデータ クレンジングは、2 段階のプロセスから成ります。

  • コンピューター支援型のクレンジング: DQS では、クレンジング プロジェクト用に選択したナレッジ ベースのナレッジを使用して、データ ソースの値に対する修正または提案を提示します。

  • インタラクティブなクレンジング: データ スチュワードは、インタラクティブなクレンジング プロセスを実行して、コンピューター支援型のデータ クレンジング プロセスで提示されたデータ修正を変更したり拡張したりできます。 このプロセスでは、データ クレンジング プロセスで識別された信頼レベルや統計情報を使用することも、プロジェクトにおける独自の変更を手動で入力することもできます。

データ クレンジングの後で、データ スチュワードは、処理されたデータを SQL Server データベース、.csv ファイル、または Excel ファイルにエクスポートできます。 詳細については、「データ クレンジング」を参照してください。

データ照合

データ スチュワードは、照合プロセスを使用して、わずかに異なる類似データを重複除去プロセスで調整できるようにデータを比較することができます。 DQS により、ナレッジ ベースに格納された照合ルールに基づいて重複除去が実行されます。照合プロセスのパラメーターは、データ スチュワードがデータ品質プロジェクトから指定します。 詳細については、「データ照合」を参照してください。

プロファイルと通知

データ プロファイリングでは、データ品質プロジェクト実行中のクレンジングおよび照合アクティビティのために DQS で処理されているデータに関する統計と情報が、データ スチュワードに対してリアルタイムに表示されます。 データ プロファイルは、データ品質プロジェクトのクレンジングおよび照合アクティビティの有効性を評価するときに役立ちます。通知は、ユーザーがデータ クレンジングおよびデータ照合アクティビティを拡張する手段として使用できます。 詳細については、「DQS でのデータ プロファイルと通知」を参照してください。

DQS のデータ品質プロジェクトの詳細については、「データ品質プロジェクト (DQS)」を参照してください。

[トップに戻る] リンクで使用される矢印アイコン[先頭に戻る]

データ品質管理の概念

DQS 管理者は、Data Quality クライアント アプリケーションを使用して、さまざまな管理タスクを実行できます。

アクティビティ監視

アクティビティ監視では、データ範囲内で実行された各アクティビティの状態が表示され、DQS 管理者は各アクティビティのデータを確認しながらアクティビティを制御することができます。 詳細については、「DQS アクティビティの監視」を参照してください。

構成

構成オプションでは、次の操作を実行できます。

DQS セキュリティ

DQS のセキュリティの設定には、SQL Server のセキュリティ メカニズムのロールを使用します。 Data Quality クライアント アプリケーションにおけるユーザーのアクセス レベルを決定する、3 つの DQS ロール (dqs_administrator、dqs_kb_editor、および dqs_kb_operator) があります。 Data Quality クライアント アプリケーションを使用して、ユーザーにロールを付与することはできません。SQL Server Management Studio を使用して行います。 詳細については、「DQS セキュリティ」を参照してください。

DQS 管理の詳細については、「DQS 管理」を参照してください。

[トップに戻る] リンクで使用される矢印アイコン[先頭に戻る]

関連項目

概念

Data Quality Services