オフライン評価で学習ループを分析する

重要

2023 年 9 月 20 日以降は、新しい Personalizer リソースを作成できなくなります。 Personalizer サービスは、2026 年 10 月 1 日に廃止されます。

オフライン評価を作成し、その結果を解釈する方法について説明します。

オフライン評価を使用すると、ログ (履歴) データの期間におけるアプリケーションの既定の動作と比較して Personalizer がどの程度効果的であるかを測定し、ご使用のモデルに対して他のモデル構成設定がどの程度優れたパフォーマンスを示すかを評価できます。

オフライン評価を作成すると、"最適化検出" オプションは、さまざまな学習ポリシー値に対してオフライン評価を実行して、モデルのパフォーマンスを向上させる可能性のある値を見つけます。オフライン評価で評価する追加ポリシーを提供することもできます。

詳細については、「オフライン評価」を参照してください。

前提条件

構成済みの Personalizer リソース
Personalizer リソースには、代表的な量のログデータが含まれている必要があります。意味のある評価結果を得るには、おおよそ、50,000 個以上のイベントをログに記録することをお勧めします。必要に応じて、この評価でテストおよび比較する "学習ポリシー" ファイルを事前にエクスポートしておくこともできます。

Azure portal で、Personalizer リソースを見つけます。
Azure portal で、 [評価] セクションに移動し、 [評価の作成] を選択します。
[評価の作成] ウィンドウでオプションを入力します。
- 評価名。
- [開始日] と [終了日] - これらの日付では、評価で使用するデータの範囲を指定します。このデータは、[Data Retention](データ保有期間) 値で指定したとおりにログに存在する必要があります。
- Personalizer がより最適な学習ポリシーを探すようにしたい場合は、[最適化の検出] を [はい] に設定します。
- 学習設定の追加 - カスタムまたは以前にエクスポートされたポリシーを評価する場合は、学習ポリシーファイルをアップロードします。
[Start evaluation] (評価を開始) を選択して評価を開始します。