Microsoft Graph コネクタのAzure Data Lake Storage Gen2

Azure Data Lake Storage Gen2 Microsoft Graph コネクタを使用すると、organizationのユーザーは、Azure Blob Storageおよび Azure Data Lake Gen 2 ストレージ アカウントに格納されているファイルを検索できます。

注:

一般的な コネクタのセットアップ手順については、Microsoft Graph コネクタ のセットアップに関する記事を参照してください。

この記事は、Azure Data Lake Storage Gen2 コネクタを構成、実行、監視するすべてのユーザーを対象とします。 一般的なセットアップ プロセスを補完し、Azure Data Lake Storage Gen2 コネクタにのみ適用される手順を示します。 この記事には、 制限事項に関する情報も含まれています。

この記事では、Azure Blob StorageAzureData Lake Gen 2 Storage の総称として Azure Storage を使用します

手順 1: Microsoft 365 管理センターにコネクタを追加する

コネクタAzure Data Lake Storage Gen2追加する

(詳細については、一般的な セットアップ手順 を参照してください)

手順 2: 接続に名前を指定する

一般的な セットアップ手順に従います。

手順 3. 接続設定を構成する

プライマリ ストレージ 接続文字列を入力します。 この文字列は、ストレージ アカウントへのアクセスを許可するために必要です。 接続文字列を見つけるには、Azure portalに移動し、関連する Azure Storage アカウントの [キー] セクションに移動します。

AccountKey (プライマリ ストレージ 接続文字列のパラメーター) を指定しない場合は、次のロールに対して Microsoft Graph コネクタ サービスへのアクセス権を付与します。

  • ストレージ BLOB データ リーダー
  • ストレージ キュー データ共同作成者
  • Storage Blob Delegator

Azure Storage アカウントの [Access Control] タブに移動し、次のアプリへのアクセスを許可する手順に従います。

  • ファースト パーティ アプリ ID: 56c1da01-2129-48f7-9355-af6d59d42766
  • ファースト パーティ アプリ名: Graph コネクタ サービス

ストレージ アカウントとキューの通知 (省略可能)

Graph コネクタ サービスでの変更をリアルタイムで処理するためのサポートは、今後追加される可能性があります。 その場合は、キューに格納されている Azure Storage の変更通知を監視します。 Azure Storage アカウントと同じアカウントにキューを作成する必要があります。

キューを作成したら、キュー ページの [ イベント ] タブに移動して 、イベント サブスクリプションを構成します。 キューが受信するすべての BLOB イベントを選択し、キューを Azure Storage アカウントに接続します。

接続をテストします。

[接続のテスト] ボタンをクリックして 接続をテスト する

注:

次の構成セクションに移動するには、 テスト接続 が成功する必要があります。 ADLS Gen 2 が有効なストレージ アカウントには、テスト接続を成功させるために、コンテナー少なくとも 1 つのファイルが含まれている必要があります。 コンテンツが存在しない場合、接続エラーが発生します。

手順 4: プロパティ ラベルを割り当てる

各ラベルにソース プロパティを割り当てるには、オプションのメニューからを選択します。 この手順は必須ではありませんが、一部のプロパティ ラベルを使用すると、検索の関連性が向上し、エンド ユーザーの検索結果が向上します。

手順 5: スキーマを管理する

[ スキーマの管理 ] 画面では、プロパティに関連付けられているスキーマ属性を変更できます。オプションは [クエリ]、[ 検索]、[ 取得]、[ 絞り込み] です。 オプションのエイリアスを追加し、[ コンテンツ ] プロパティを選択することもできます。

手順 6: 検索アクセス許可を管理する

Azure Data Lake Gen 2

Azure Data Lake Gen 2 Storage アカウントからAccess Control リスト (ACL) を取り込むことができます。 これらの検索アクセス許可が設定されると、Microsoft Entra ID にサインインしているユーザーのアクセス許可に基づいて検索コンテンツトリミングされます。 または、ストレージ アカウントからインデックスが作成されたすべてのコンテンツを、organizationのすべてのユーザーに表示するように選択することもできます。 この場合、organizationのすべてのユーザーがストレージ アカウント内のすべてのデータにアクセスできます。

Azure Data Lake Storage Gen2 コネクタは、Everyone に表示される検索アクセス許可、またはこのデータ ソースへのアクセス権を持つユーザーのみサポートします。 検索結果に表示されるインデックス付きデータは、各項目にアクセスできるorganizationのユーザーに表示できます。

Azure Blob Storage

Azure Blob Storageへの接続では、構成されたソースからインデックスが作成されたすべてのコンテンツが、organizationのすべてのユーザーに表示されます。 アクセス制御リストは、Azure Blob Storageの BLOB レベルではサポートされていません。

手順 7: 更新スケジュールを設定する

[ 更新設定] 画面で、増分クロール間隔とフル クロール間隔を設定できます。 Azure Data Lake Storage Gen2 コネクタの既定の間隔は、増分クロールでは 15 分、フル クロールでは 1 週間です。

手順 8: 接続を確認する

一般的な セットアップ手順に従います。

制限事項

Azure Blob Storageの公開された接続は、Azure Data Lake Storage Gen2ソースとその逆の方法では再構成できません。 このようなシナリオでは、新しい接続を構成することをお勧めします。

また、クロールするには、ファイルのサイズが 4 MB 以下である必要があります。 現在サポートされているファイルの種類は次のとおりです。

  • Word (docx、.docm、.dotx、.dotm)
  • PowerPoint (.pptm、.pptx、.potm、.potx、.ppam、.ppsm、.ppsx)
  • Excel (.xlsx、.xlsm)
  • 従来の Office 形式 (.doc、.dot など)
  • テキスト (.txt)
  • HTML
  • PDF

イメージ (.jpg、.bmp など) などのバイナリ ファイルはサポートされていません。 たとえば、.docx ファイルにイメージのみが含まれている場合、コンテンツが返されないため、スキップされる可能性があります。