Data Catalog検索構文リファレンス

Azure Data Catalog は、Microsoft Azure でホストされるフル マネージド サービスであり、エンタープライズ データ ソースの登録システムと検出システムとして機能します。 Azure Data Catalogには、技術ユーザーと非技術ユーザーがデータ ソースを検出、理解、使用できるようにする機能があります。

データ検出の重要な側面は、Azure Data Catalogに登録されているデータ ソースを検索できることです。 Azure Data Catalog には、ユーザーが必要なデータを返すクエリを簡単に作成できる強力な検索構文があります。

検索構文の概要

Azure Data Catalog検索は、Microsoft Windows および Microsoft Outlook で使用される検索と似ていますが、これらのツールのユーザーにはなじみのあるものにする必要があります。

クエリ手法

手法 vmmblue_2
基本的な検索 1 つまたは複数の検索語句を使用した基本的な検索です。 任意のプロパティで、指定した 1 つまたは複数の語句と一致する任意の資産が返されます。 sales data
プロパティ スコープ 検索語句が指定したプロパティと一致する場合にのみデータ ソースを返します。 name:finance
ブール演算子 ブール演算子を使用して検索の範囲を広げたり狭めたりします。 finance NOT corporate
かっこを使用したグループ化 かっこを使用してクエリの一部をグループ化し、論理的に分離します。特にブール演算子と組み合わせて使用します。 name:finance AND (tags:tag1 OR tags:tag2)
比較演算子 数値データ型および日付データ型を持つプロパティについて、等値演算子以外の比較演算子を使用します。 creationTime>"11/05/2014"

照合、比較、およびブール演算子

キーワード/シンボル 使用例 機能
: experts:user@domain.com tags:tag1 プロパティスコープを使用し、特定のプロパティに検索対象のテキストが含まれている資産のみを返します。 クエリのセマンティクスは"プレフィックス一致" です。
= name=Sales name="Soft Drink Sales" ユーザーが完全一致を指定できるようにします。 検索語句の値を正確に持つ プロパティを含む資産のみが返されます。
<> experts<>user1 tags<>tag2 "等しくない" 演算子。 検索クエリで指定された値を持たない資産のみが返されます。
"" "social security" 社会保障という正確な語句を含むアイテムを検索します。 引用符を使用するには、1 つの特別なケースがあります。 プロパティスコープで引用符が使用される場合、セマンティクスはグループ化されますが、正確な言い回しではありません。 この場合の動作は、名前付きプロパティを 2 回指定する場合と同じです。 例: name:"social security" は、"social" という単語が含まれる name プロパティ、または"security" という単語が含まれる name プロパティを持つ資産を検索します。
() (tags:tag1 AND tags:tag2) OR (name:sales AND database:salesfy15) tag1 と tag2 を含むアイテム、またはデータベース salesfy15 の sales という名前のアイテムを検索します。 通常、ブール演算子と組み合わせて使用されます
>,>= timestamp>"11/05/2014" 2014 年 11 月 5 日以降に更新日が設定されたアイテムを検索します。
<,<= timestamp<"11/05/2014" 2014 年 11 月 5 日より前の日付のアイテムを検索します。
NOT social NOT security ソーシャルを含むアイテムを検索しますが、セキュリティは含まれません。
AND social AND security 社会保障とセキュリティを含むアイテムを検索します。
OR social OR security 社会保障またはセキュリティを含むアイテムを検索します。
Hsa: has:tags has:description フィルター処理を許可し、特定のプロパティが設定されている資産のみを返します (または、プロパティがコレクションを表す場合は、少なくとも 1 つの要素を保持します)。

Notes

プレフィックス セマンティクス

既定では、Azure Data Catalog内のすべての検索は、プレフィックス 一致セマンティクスと呼ばれる手法を使用して実行されます。 つまり、すべての検索用語は、資産のプロパティの先頭で一致を開始します。

たとえば、次の名前で Azure Data Catalogに登録されている 2 つの架空の資産を考えてみましょう。

  • SalesData
  • Salesman Quotes

"sales" を検索すると、両方の資産が返されます。両方の名前は "sales" という単語で始まるためです。 Azure Data Catalogの今後のリリースには、完全一致演算子のサポートが含まれています。

プロパティ スコープ検索

Azure Data Catalog クエリ文法では、プロパティスコープがサポートされています。 現在のプレビューでは、 プロパティ スコープでは大文字と小文字が区別されます。 つまり、クエリを機能させるには、検索クエリのプロパティの実際の大文字と小文字がインデックス内のプロパティと一致している必要があります。

無効なプロパティ (存在しないプロパティ) を検索すると、エラーが発生します。

プロパティスコープを使用する場合、引用符は特別な方法で動作します。 その他のコンテキストの引用符は、正確な言い回しを示します。 ただし、プロパティのスコープで引用符が使用される場合、セマンティクスはグループ化されます。 たとえば、 name:"Sales Products" "Sales" または "Products" を検索する name プロパティのコンテンツを検索するフリー テキスト検索を実行します。 したがって、 の name:"Sales Products" セマンティクスは とまったく同じです name:Sales name:Products

Searchable Properties のプロパティ名の一般的な原則はキャメル ケースです。つまり、最初の文字は小文字で、次に各単語の先頭文字は大文字です。

最も便利なプロパティを次に示します。

プロパティ vmmblue_2
name データ ソース名に検索語句が表示されるアイテムを検索します name:finance
description データ ソースの説明に検索語句が表示されるアイテムを検索します description:finance
objectType テーブル、ビュー、KPI など、特定のオブジェクトの種類のアイテムを検索します objectType:table
sourceType SQL ServerやSQL Server Analysis Services多次元など、特定のデータ ソースの種類のアイテムを検索します sourceType:"tabular"
tags データ ソース タグに検索語句が表示されるアイテムを検索します tags:finance
timestamp メタデータが最後に変更された日時に基づいてアイテムを検索します timestamp:>"11/05/2014"
lastRegisteredTime メタデータが登録された日時に基づいてアイテムを検索します lastRegisteredTime:>"11/05/2014"
friendlyName データ ソースのフレンドリ名に検索語句が表示されるアイテムを検索します friendlyName: finance
専門家 データ ソースエキスパートが検索用語と一致するアイテムを検索します experts:user@example.com experts:user
termName データ資産に適用されるビジネス用語集の用語に検索用語が表示されるアイテムを検索します termName:marketing

次のプロパティ名と "has:" フィルターを使用して、資産に特定のプロパティが設定されている場所をチェックすることもできます。

プロパティ vmmblue_2
プレビュー プレビューを含むアイテムを検索します has:preview
ドキュメント ドキュメントを含むアイテムを検索します has:documentation
tableDataProfiles テーブル プロファイル (サイズ、行数など) を持つアイテムを検索します。 has:tableDataProfiles
columnsDataProfiles 列データ プロファイル (個別の値の数、最小値、最大値など) を持つアイテムを検索します。 has:columnsDataProfiles

検索の例

次のセクションでは、検索の例をいくつか示します。

名前に "sales" が含まれるすべての資産を返します

name:sales

2015 年 4 月 20 日以降に登録されたすべての資産を返します。これには、任意のプロパティに "sales" が含まれます

sales AND lastRegisteredTime&gt;"4/20/2015"

任意のプロパティに売上を含み、Q1FY2013 タグを持たないすべての資産を返します

sales AND tags&lt;&gt;"Q1FY2013"

専門家もドキュメントも割り当てられていないすべての資産を返す

not has:experts and not has:documentation