管理タグ付け用のビジネス用語集を設定する

重要

Azure Data Catalog は、2024 年 5 月 15 日に廃止されます。

新しい Azure Data Catalog アカウントは作成できなくなります。

データ カタログ機能については、新しい Microsoft Purview サービスを使用してください。データ資産全体に対する一元化されたデータ ガバナンスが得られます。

Azure Data Catalog を既に使用している場合は、2024 年 5 月 15 日までに Microsoft Purview に移行するための移行計画を組織で作成する必要があります。

はじめに

Azure Data Catalog では、データ ソースの検出が可能なため、分析や意思決定を行うために必要なデータ ソースを容易に検出し、把握することができます。 この機能が最も高い利便性を発揮するのは、利用できる最大範囲のデータ ソースを探し出し、把握できたときです。

資産データの理解を深めることができる Data Catalog 機能の 1 つは、タグ付けです。 タグ付けを使用すると、キーワードを資産や列と関連付けることができます。その結果、検索や閲覧で資産を簡単に見つけられるようになります。 また、資産のコンテキストや意図を理解しやすくなります。

ただし、タグ付け自体が問題の原因になることもあります。 タグ付けによって引き起こされる可能性がある問題の例をいくつか示します。

  • 一部の資産に省略形を使用し、他の資産で非省略形を使用する場合。 複数の資産に同じタグを付けたつもりでも、このような不一致があると資産を検出できなくなります。
  • 文脈によって意味が異なる可能性がある場合。 たとえば、顧客データ セットの収益タグは顧客からの収益を示し、四半期別売上データ セットの収益タグは会社の四半期の収益を示す場合があります。

このような課題に対処できるように Data Catalog にはビジネス用語集が含まれています。

組織は Data Catalog のビジネス用語集を使用して主なビジネス用語と定義を文書化し、一般的なビジネス語彙を作成できます。 用語集を管理することで、組織全体のデータ使用で一貫性を保つことができます。 用語をビジネス用語集で定義すると、それをカタログのデータ資産に割り当てることができます。 この管理タグ付けの方法は、タグ付けと同じ方法です。

用語集の可用性と特権

ビジネス用語集は、Azure Data Catalog の Standard Edition でのみ使用できます。 Data Catalog の Free Edition には、用語集は含まれていません。また、管理タグ付け機能も提供していません。

ビジネス用語集には、Data Catalog ポータルのナビゲーション メニューにある [用語集] オプションでアクセスできます。

[用語集] タブが強調表示されているデータ カタログ ナビゲーション メニュー。

Data Catalog 管理者と用語集管理者ロールのメンバーは、ビジネス用語集の用語を作成、編集、削除できます。 すべての Data Catalog ユーザーは用語定義を表示し、資産に用語集の用語でタグを付けることができます。

[用語の名前]、[親の用語]、[定義]、[説明]、[利害関係者] などの情報を含む [新しいビジネス用語] メニュー。この情報は編集できます。

用語集の用語を作成する

Data Catalog 管理者や用語集管理者は、[新しい用語] ボタンをクリックして、用語集の用語を作成できます。 用語集の各用語には、次のフィールドが含まれます。

  • 用語のビジネスの定義
  • 資産または列の使用意図やビジネス ルールを示す説明
  • 用語について最も知っている関係者の一覧
  • 用語が構成される階層が定義された親用語

用語集の用語の階層

組織は、Data Catalog のビジネス用語集を使用して、用語の階層としてビジネス語彙を説明したり、業務分類をより適切に表す用語の分類を作成したりすることができます。

用語は、特定のレベルの階層で一意である必要があります。 重複する名前は使用できません。 階層のレベル数に制限はありませんが、3 レベル以下にすると、階層がわかりやすくなります。

ビジネス用語集の階層の使用はオプションです。 用語集の用語の親用語フィールドを空にすると、用語集にフラットな (階層がない) 用語一覧が作成されます。

用語集の用語で資産にタグを付ける

カタログ内の用語集の用語を定義すると、資産にタグを付ける操作が最適化され、ユーザーがタグを入力するときに用語集を検索できるようになります。 Data Catalog ポータルには一致する用語集の用語一覧が表示され、そこから選択できます。 ユーザーが一覧から用語集の用語を選択すると、タグ (用語集タグ) として資産に追加されます。 ユーザーは、用語集にない用語を入力して新しいタグ (ユーザー タグ) を作成することもできます。

データ資産の例が選択され、カードの中央でそのタグが強調表示されています。[プロパティ] ペインが開いていて、[タグ] セクションが強調表示されています。タグを追加するために使用できる [追加] ボタンがあります。

Note

ユーザー タグは、Free Edition の Data Catalog でサポートされる唯一のタグの種類です。

タグのホバー動作

Data Catalog ポータルでは、2 種類のタグは区別して表示され、ホバー動作も異なります。 ユーザー タグにマウスを移動すると、タグ テキストと、タグを追加した 1 人以上のユーザーが表示されます。 用語集タグにマウスを移動すると、用語集の用語の定義と、ビジネス用語集を開いて用語の詳細な定義を表示するためのリンクが表示されます。

タグの検索フィルター

用語集タグとユーザータグはどちらも検索可能です。また、検索でフィルターとして適用できます。

まとめ

Azure Data Catalog のビジネス用語集と、それで有効になる管理タグ付けを使用すると、データ資産の識別、管理、検出を一貫した方法で行うことができます。 ビジネス用語集は、組織のメンバーによるビジネス語彙の学習を推進できます。 用語集は、資産の検出と把握を容易にする、意味のあるメタデータのキャプチャもサポートしています。

次のステップ