予測コーディングモデルの作成 (プレビュー)

[アーティクル]
10/01/2023

電子情報開示 (Premium) で予測コーディングの機械学習機能を使用する最初の手順は、予測コーディングモデルを作成することです。モデルを作成した後、レビューセット内の関連コンテンツと関連性のないコンテンツをトレーニングできます。

予測コーディングワークフローを確認するには、「電子情報開示 (Premium) での予測コーディングの詳細」を参照してください。

ヒント

E5 のお客様でない場合は、90 日間の Microsoft Purview ソリューション試用版を使用して、Purview の追加機能が組織のデータセキュリティとコンプライアンスのニーズの管理にどのように役立つかを確認してください。 Microsoft Purview コンプライアンスポータルのトライアルハブで今すぐ開始してください。サインアップと試用期間の詳細については、こちらをご覧ください。

モデルを作成する前に

予測コーディングモデルを作成するには、レビューセットに少なくとも 2,000 個の項目が必要です。
モデルを作成する前に、すべてのコレクションをレビューセットにコミットしてください。モデルの作成後にレビューセットに追加されたアイテムは処理されず、モデルによって生成された予測スコアが割り当てられます。
テキストを含まないレビューセット内の項目は、モデルによって処理されたり、予測スコアが割り当てられたりすることはありません。テキストを含む項目は、コントロールセットまたはトレーニングセットに含まれます。

モデルを作成する

Microsoft Purview コンプライアンスポータルで電子情報開示 (Premium) ケースを開き、[レビューセット] タブを選択します。
レビューセットを開き、[ Analytics>Manage 予測コーディング (プレビュー)] を選択します。
[ 予測コーディングモデル (プレビュー)] ページで 、[ 新しいモデル] を選択します。
ポップアップページで、モデルの名前と説明 (省略可能) を入力します。
必要に応じて、信頼レベルとエラーのマージンに関連する詳細設定 (ポップアップページで [詳細オプション ] を選択) を構成できます。これらの設定は、コントロールセットに含まれる項目の数に影響します。 コントロールセットは、トレーニングプロセス中に使用され、トレーニングラウンド中に実行するラベル付けを使用して、モデルが項目に割り当てる予測スコアを評価します。 organizationに、ドキュメントレビューの信頼レベルとエラーの余白に関するガイドラインがある場合は、適切なボックスで指定します。それ以外の場合は、既定の設定を使用します。
[ 保存] を 選択してモデルを作成します。

システムがモデルを準備するまでに数分かかります。準備ができたら、トレーニングの最初のラウンドを実行できます。

モデルを作成した後の動作

モデルを作成した後、モデルの作成と準備中にバックグラウンドで次のものが発生します。

コントロールセットの項目数が計算されます。このサイズは、レビューセット内の項目の数と、信頼レベルとエラーの余白の設定に基づいています。コントロールセットの項目はランダムに選択され、コントロールセット項目として指定されます。システムには、トレーニングの最初のラウンドで設定されたコントロールから 10 個の項目が含まれています。
システムは、最初のトレーニングラウンドのトレーニングセットに含まれるレビューセットから 40 項目をランダムに選択します。そのため、トレーニングの第 1 ラウンドには、ラベル付け用の 50 項目 (トレーニングセットから 40 項目、コントロールセットから 10 項目) が含まれます。

次の手順

レビューセットのモデルを作成した後、次の手順は、調査に関連するコンテンツを特定するためにモデルを "教える" トレーニングラウンドを実行することです。詳細については、「予測コーディングモデルのトレーニング」を参照してください。

予測コーディングモデルの作成 (プレビュー)

モデルを作成する前に

モデルを作成する

モデルを作成した後の動作

次の手順

フィードバック

フィードバック

その他のリソース

予測コーディング モデルの作成 (プレビュー)

モデルを作成する前に

モデルを作成する

モデルを作成した後の動作

次の手順

フィードバック

フィードバック

その他のリソース

予測コーディングモデルの作成 (プレビュー)