Microsoft Purview で MongoDB に接続して管理する

この記事では、MongoDB を登録する方法と、Microsoft Purview で MongoDB を認証して操作する方法について説明します。 Microsoft Purview の詳細については、 入門記事を参照してください。

サポートされている機能

メタデータ抽出 フル スキャン 増分スキャン スコープスキャン 分類 ラベル付け アクセス ポリシー 系統 データ共有 ライブ ビュー
はい いいえ はい いいえ 不要 不要 不要 不要 不要

サポートされている MongoDB バージョンは 2.6 から 5.1 です。

MongoDB ソースをスキャンする場合、Microsoft Purview では次のような技術的なメタデータの抽出がサポートされます。

  • サーバー
  • Databases
  • スキーマを含むコレクション
  • スキーマを含むビュー

スキャン中、Microsoft Purview はサンプル ドキュメントを取得して分析し、コレクション/ビュー スキーマを推論します。 サンプル サイズは構成可能です。

スキャンを設定する場合は、1 つ以上の MongoDB データベースを完全にスキャンするか、指定された名前または名前パターンに一致するコレクションのサブセットにスキャンのスコープを設定することもできます。

既知の制限

オブジェクトがデータ ソースから削除された場合、現在、後続のスキャンでは、Microsoft Purview の対応する資産は自動的に削除されません。

前提条件

登録

このセクションでは、 Microsoft Purview ガバナンス ポータルを使用して、Microsoft Purview に MongoDB を登録する方法について説明します。

登録手順

データ カタログに新しい MongoDB ソースを登録するには、次の操作を行います。

  1. Microsoft Purview ガバナンス ポータルで Microsoft Purview アカウントに移動します。
  2. 左側のナビゲーションで [ データ マップ ] を選択します。
  3. [ 登録] を選択します
  4. [ソースの登録] で、[ MongoDB] を選択します。 [続行] を選択します。

[ ソースの登録 (MongoDB)] 画面で、次の操作を行います。

  1. カタログ内にデータ ソースが一覧表示される 名前 を入力します。

  2. サーバー名を入力します。 会社の MongoDB インスタンスを一意に識別する名前を指定します。 たとえば、 host スタンドアロンデプロイの場合、 MyReplicaSetName レプリカ セットの場合はシャード MyClusterName 化されたクラスターの場合です。 この値は資産修飾名で使用され、変更できません。

  3. コレクションを選択するか、新しいコレクションを作成します (省略可能)。

  4. 完了してデータ ソースを登録します。

    ソースの登録オプション

スキャン

MongoDB をスキャンして資産を自動的に識別するには、次の手順に従います。 スキャン全般の詳細については、スキャン とインジェストの概要に関するページを参照してください。

スキャンの認証

MongoDB ソースでサポートされている認証の種類は、 基本認証です。

スキャンの作成と実行

新しいスキャンを作成して実行するには、次の操作を行います。

  1. 管理センターで、[統合ランタイム] を選択します。 セルフホステッド統合ランタイムが設定されていることを確認します。 設定されていない場合は、 ここで 説明する手順を使用して、セルフホステッド統合ランタイムを作成します。

  2. [ ソース] に移動します。

  3. 登録済みの MongoDB ソースを選択します。

  4. [ + 新しいスキャン] を選択します。

  5. 以下の詳細を指定します。

    1. 名前: スキャンの名前

    2. 統合ランタイム経由で接続する: スキャンの実行に使用するセルフホステッド統合ランタイムを選択します。

    3. 資格情報: データ ソースに接続する資格情報を選択します。 次のことを確認してください。

      • 資格情報の作成時に [ 基本認証 ] を選択します。
      • [ユーザー名] 入力フィールドに、MongoDB への接続に使用するユーザー名を指定します。
      • MongoDB への接続に使用するユーザー パスワードを秘密キーに格納します。
    4. 接続文字列: ユーザー名とパスワードを除き、MongoDB への接続に使用する MongoDB 接続文字列を指定します。 たとえば、「 mongodb://mongodb0.example.com:27017,mongodb1.example.com:27017/?replicaSet=myRepl 」のように入力します。

    5. データベース: インポートする MongoDB データベースの一覧を指定します。 リストには、セミコロン (;) など) で区切られた 1 つ以上のデータベース名を指定できます。 database1; database2

    6. コレクション: インポートするコレクションのサブセットを、コレクションのセミコロン区切りのリスト (例: ) として表します。 collection1; collection2 リストが空の場合、すべてのコレクションがインポートされます。

      SQL LIKE 式構文を使用する受け入れ可能なコレクション名パターンには、 を使用するものが含まれます。 例: : A%; %B; %C%; D

      • A または から始める
      • B または で終わる
      • C または を含む
      • 等しい D

      NOT 文字と特殊文字の使用は許可されません。

    7. サンプル ドキュメントの数: スキーマ抽出のために分析するサンプル ドキュメントの数。 既定値は 10 です。

    8. 使用可能な最大メモリ (セルフホステッド統合ランタイムを使用する場合に適用可能): プロセスのスキャンによって使用される、お客様の VM で使用可能な最大メモリ (GB 単位)。 スキャンする MongoDB ソースのサイズによって異なります。

      scan MongoDB

  6. [ 接続のテスト] を選択して構成を検証します。

  7. [続行] を選択します。

  8. スキャン トリガーを選択します。 スケジュールを設定することも、スキャンを 1 回実行することもできます。

  9. スキャンを確認し、[ 保存して実行] を選択します。

スキャンとスキャンの実行を表示する

既存のスキャンを表示するには:

  1. Microsoft Purview ガバナンス ポータルに移動します。 左側のウィンドウで、[ データ マップ] を選択します。
  2. データ ソースを選択します。 [最近のスキャン] で、そのデータ ソースの既存の スキャンの一覧を表示したり、[ スキャン ] タブですべてのスキャンを表示したりできます。
  3. 表示する結果を含むスキャンを選択します。 このウィンドウには、以前のすべてのスキャン実行と、各スキャン実行の状態とメトリックが表示されます。
  4. 実行 ID を選択して、スキャン実行の詳細をチェックします

スキャンを管理する

スキャンを編集、取り消し、または削除するには:

  1. Microsoft Purview ガバナンス ポータルに移動します。 左側のウィンドウで、[ データ マップ] を選択します。

  2. データ ソースを選択します。 [最近のスキャン] で、そのデータ ソースの既存の スキャンの一覧を表示したり、[ スキャン ] タブですべてのスキャンを表示したりできます。

  3. 管理するスキャンを選択します。 次のことを実行できます。

    • [スキャンの編集] を選択して スキャンを編集します
    • [スキャンの実行の取り消し] を選択して、進行中 のスキャンを取り消します
    • [スキャンの削除] を選択して スキャンを削除します

注:

  • スキャンを削除しても、以前のスキャンから作成されたカタログ資産は削除されません。
  • ソース テーブルが変更され、Microsoft Purview の [スキーマ] タブで説明を編集した後にソース テーブルを再スキャンした場合、資産は スキーマ の変更で更新されなくなります。

次の手順

ソースを登録したので、次のガイドに従って、Microsoft Purview とデータの詳細を確認してください。