Azure Data Catalog の用語集

重要

Azure Data Catalog は、2024 年 5 月 15 日に廃止されます。

新しい Azure Data Catalog アカウントは作成できなくなります。

データ カタログ機能については、新しい Microsoft Purview サービスを使用してください。データ資産全体に対する一元化されたデータ ガバナンスが得られます。

Azure Data Catalog を既に使用している場合は、2024 年 5 月 15 日までに Microsoft Purview に移行するための移行計画を組織で作成する必要があります。

この記事では、Azure Data Catalog のドキュメントで使用される概念と用語について説明します。

カタログCatalog

Azure Data Catalog は、データ ソースとデータ資産を登録できるクラウドベースのメタデータ リポジトリです。 カタログは、データ ソースから抽出された構造メタデータとユーザーが追加した記述メタデータの一元的な保存場所です。

データ ソース

データ ソースは、データ資産を管理するシステムまたはコンテナーです。 たとえば、SQL Server データベース、Oracle データベース、SQL Server Analysis Services データベース (表形式または多次元)、SQL Server Reporting Services サーバーなどです。

データ資産

データ資産は、カタログに登録することができるデータ ソース内のオブジェクトです。 たとえば、SQL Server のテーブルとビュー、Oracle のテーブルとビュー、SQL Server Analysis Services のメジャー、次元と KPI、SQL Server Reporting Services のレポートなどです。

データ資産の場所

カタログには、データ ソースまたはデータ資産の場所が格納されています。クライアント アプリケーションから、この場所を使用してソースに接続できます。 場所の形式と詳細は、データ ソースの種類によって変わります。 たとえば、SQL Server テーブルは、サーバー名、データベース名、スキーマ名、オブジェクト名という 4 つの名前で識別できます。SQL Server Reporting Services のレポートは、URL で識別できます。

構造メタデータ

構造メタデータは、データ ソースから抽出され、データ資産の構造を説明するメタデータです。 構造メタデータには、資産の場所、オブジェクトの名前と種類、およびその他の種類固有の特性が含まれます。 たとえば、テーブルとビューの構造メタデータには、オブジェクトの列の名前とデータ型が含まれます。

記述メタデータ

記述メタデータは、データ資産の目的または意図を説明するメタデータです。 通常、記述メタデータは、カタログ ユーザーが Azure Data Catalog ポータルを使用して追加しますが、登録時にデータ ソースから抽出することもできます。 たとえば、SQL Server Analysis Services と SQL Server Reporting Services の場合は Description プロパティ、SQL Server データベースの場合は ms_description 拡張プロパティから、Azure Data Catalog 登録ツールで説明を抽出します (これらのプロパティに値が設定されている場合)。

アクセスの要求

データ資産の説明用のメタデータには、データ資産またはデータ ソースへのアクセスを要求する方法に関する情報を含めることができます。 この情報にはデータ資産の場所が示され、次のオプションの 1 つ以上を含めることができます。

  • データ ソースへのアクセス権の付与を担当するユーザーまたはチームの電子メール アドレス。
  • ユーザーがデータ ソースにアクセスするために従う必要があるプロセスを示すドキュメントの URL。
  • データ ソースにアクセスするために使用できる ID およびアクセス管理ツール (Microsoft Identity Manager など) の URL。
  • ユーザーがデータ ソースにアクセスする方法が示された自由書式のエントリ。

プレビュー

Azure Data Catalog のプレビューは、最大 20 レコードのスナップショットです。登録時にデータ ソースから抽出し、データ資産メタデータと共にカタログに格納できます。 プレビューを使用すると、データ資産の機能と目的を理解しやすくなります。 言い換えると、列名とデータ型だけではなく、サンプル データも確認できるので、わかりやすくなります。 テーブルとビューのプレビューのみがサポートされています。登録時にユーザーが明示的にプレビューを選択する必要があります。

データ プロファイル

Azure Data Catalog のデータ プロファイルは、登録済みデータ資産に関するテーブルレベルおよび列レベルのメタデータのスナップショットです。 この情報は、登録時にデータ ソースから抽出し、データ資産メタデータと共にカタログに格納できます。 データ プロファイルを使用すると、データ資産の機能と目的を理解しやすくなります。 データ プロファイルは、プレビューのように、登録時にユーザーから明示的に選択される必要があります。

Note

大規模なテーブルおよびビューでデータ プロファイルを抽出する場合、リソースは大量に消費され、データ ソースの登録に必要な時間が大幅に増加する可能性があります。

ユーザーの観点

Azure Data Catalog では、登録されているデータ資産についての記述メタデータをあらゆるユーザーが指定できます。 すべてのユーザーは、データとその使用方法について独自の観点を持っています。 たとえば、サーバーを担当する管理者は、サービス レベル アグリーメント (SLA) またはバックアップ ウィンドウの詳細情報を提供する場合があります。 データ スチュワードは、データがサポートするビジネス プロセスに関するドキュメントへのリンクを提供する場合があります。 アナリストは、他のアナリストに最も関連する用語の説明を提供する場合があります。このことは、データを検出して理解する必要があるこれらのユーザーにとって最も価値がある可能性があります。

このような各観点は本質的に価値があり、各ユーザーは Azure Data Catalog を使用して、自分にとって意味がある情報を指定できます。また、すべてのユーザーは、その情報を使用して、データとその用途を理解することができます。

エキスパート

エキスパートとは、データ資産について知識がある "専門家" の観点を持つ人物と認められたユーザーです。 すべてのユーザーは、自分または他のユーザーを資産のエキスパートとして追加することができます。 エキスパートに登録された場合でも、Azure Data Catalog に他の特権は付与されませんが、観点を簡単に特定できるようになります。たとえば、資産の記述メタデータを確認するときに役に立ちます。

所有者

所有者は、Azure Data Catalog のデータ資産を管理する追加の特権を持つユーザーです。 ユーザーは、登録したデータ資産の所有権を得ることができます。また、所有者は他のユーザーを共同所有者として追加することができます。 詳細については、データ資産を管理する方法に関する記事を参照してください。

Note

所有権と管理は、Azure Data Catalog の Standard Edition でのみ使用できます。

登録

登録は、データ資産メタデータをデータ ソースから抽出し、Azure Data Catalog サービスにコピーする操作です。 登録されたデータ資産は、注釈を付けて検索することができます。

次のステップ

クイック スタート:Azure データ カタログを作成する