Azure AI Search でのセマンティックランク付け

[アーティクル]
02/08/2024

Azure AI Search のセマンティックランク付けでは、検索結果を再ランク付けするために、言語理解を利用して検索結果の関連性をある程度高めます。この記事では、概要について説明します。最後のセクションでは、販売状況と価格について説明します。

セマンティックランカーはプレミアム機能であり、使用量に基づいて課金されます。最初にこの記事を読んで基礎知識を得ることをお勧めしますが、それはかまわないのですぐに使いたいという方は、これらの手順を実行してください。

リージョン別の提供状況を確認する
Azure portal にサインインして、検索サービスが Basic 以上であることを確認する
セマンティックランク付けを有効にして価格プランを選択する
検索インデックスでセマンティック構成を設定する
セマンティックキャプションとハイライトを返すようにクエリを設定する
必要に応じて、セマンティック回答を返す

Note

セマンティックランク付けでは、生成 AI やベクトルは使用されません。ベクトルのサポートと類似性検索をお探しの場合、「Azure AI Search でのベクトル検索」で詳細をご確認いただけます。

セマンティックランク付けとは

セマンティックランカーは、テキストベースのクエリに対する、BM25 でランク付けされたあるいは RRF でランク付けされた最初の検索結果の品質を高めるクエリ関連機能のコレクションです。これを検索サービスで有効にすると、セマンティックランク付けによってクエリの実行パイプラインに 2 つの機能が追加されます。

1 つ目として、BM25 または RRF を使用してスコア付けされた、最初の結果セットに対する二次ランク付けが追加されます。この二次ランク付けでは多言語の、Microsoft Bing から変化したディープラーニングモデルが使用されて、セマンティック的に最も関連性の高い結果が奨励されます。
2 つ目として、キャプションと回答が抽出されて応答で返されます。これを検索ページにレンダリングして、ユーザーの検索エクスペリエンスを向上させることができます。

セマンティックリランカーの機能を次に示します。

特徴量	説明
セマンティックランク付け	クエリのコンテキストまたはセマンティックの意味を利用して、事前にランク付けされた結果に対して新しい関連スコアを計算します。
セマンティックキャプションとハイライト	コンテンツを最もよく要約している逐語的な文やフレーズをドキュメントから抽出し、スキャンを簡単にするために重要な部分を強調表示します。結果を要約するキャプションは、個々のコンテンツフィールドが検索結果ページに対して高密度である場合に便利です。強調表示されたテキストにより、最も関連性の高い用語とフレーズが目立つため、ユーザーはその一致が関連していると見なされた理由を迅速に判断できます。
セマンティック回答	セマンティッククエリから返される省略可能な追加のサブ構造体。これにより、質問のようなクエリに直接回答することができます。ドキュメントには、回答の特性を持つテキストが含まれている必要があります。

セマンティックランカーのしくみ

セマンティックランク付けは、クエリと結果を Microsoft がホストする言語理解モデルにフィードし、より適切な一致をスキャンします。

コンセプトを次の図で説明します。 "capital" という用語を考えてみましょう。これは、コンテキストが財務、法律、地理、文法なのかによって意味が異なります。言語理解では、セマンティックのランカーによってコンテキストが検出され、クエリの意図に沿う結果が昇格されます。

セマンティックの順位付けは、リソースと時間の両方を消費します。クエリ操作の予想待機時間内に処理を完了するために、セマンティックランク付けへの入力が統合され、削減されるため、再ランク付けの手順をできるだけ早く完了できます。

セマンティックランク付けには、サマライゼーションとスコアリングという 2 つの手順があります。出力が再スコアリングされた結果、キャプション、および回答で構成されます。

入力が収集されて要約されるしくみ

セマンティックランク付けでは、クエリのサブシステムからサマライゼーションモデルとランク付けモデルに検索結果が入力として渡されます。ランク付けモデルには入力サイズに制約があり、集中的に処理されるため、検索結果は効率的に処理できるようなサイズで構造化 (要約) されている必要があります。

セマンティックランク付けは、テキストクエリの BM25 でランク付けされた検索結果から、またはハイブリッドクエリの RRF でランク付けされた結果から開始されます。テキストフィールドのみが再ランク付け実行で使用され、結果の数が 50 個を超える場合でも、セマンティックランク付けが行われるのは上位 50 個の結果のみです。通常、セマンティックランク付けで使用されるフィールドは、情報を提供する説明的なものです。
検索結果の中の各ドキュメントで、サマライゼーションモデルが受け入れるのは 2,000 トークンまでで、この場合、1 トークンはおよそ 10 文字です。入力がセマンティック構成の一覧にある "title"、"keyword"、および "content" フィールドからアセンブルされます。
長さが非常に長い文字列は、全体の長さが概要作成手順の入力要件を満たすようにトリミングされます。優先順位の高い順序でセマンティック構成にフィールドを追加することが重要なのは、このトリミングの実行があるためです。テキストを多用するフィールドを持つ非常に大きいドキュメントがある場合は、最大値制限を超えたテキストは無視されます。

セマンティックフィールドトークンの限度

「タイトル」 128 トークン

"keywords 128 トークン

"content" 残りのトークン
サマライゼーション出力は各ドキュメントの要約文字列であり、各フィールドの中の最も関連した情報で構成されます。要約文字列がスコアリングのためランカーへ送られて、キャプションと回答を求めて機械読み取り理解モデルへ送られます。

セマンティックランカーへ渡されるそれぞれの生成後の要約文字列の最大長さは、256 トークンです。

セマンティックフィールド	トークンの限度
「タイトル」	128 トークン
"keywords	128 トークン
"content"	残りのトークン

セマンティックランカーの出力

各要約文字列から、機械読み取り理解モデルは最も代表的な一節を見つけ出します。

出力は次のようになります:

ドキュメントのセマンティックキャプション。各キャプションは、プレーンテキストバージョンと強調表示バージョンで使用できます。また、多くの場合、ドキュメントあたり 200 語未満です。
answers パラメーターを指定した場合、クエリが質問として提示された場合、その質問に対して適していそうな回答を提供する長い文字列で文節が見つかる場合を想定し、オプションのセマンティック回答が返されます。

キャプションと回答は、常にインデックスからの逐語的なテキストです。このワークフローには、新しいコンテンツを作成または構成する生成 AI モデルはありません。

要約がスコアリングされるしくみ

スコアリングは、キャプションと、256 のトークン長を埋める要約文字列の中の他のあらゆるコンテンツに対して行われます。

キャプションは、指定されたクエリに対して相対的な概念とセマンティックの関連性に対して評価されます。
@search.rerankerScore が各ドキュメントに、指定のクエリのドキュメントのセマンティック関連性に基づいて割り当てられます。スコアの範囲は 4 から 0 (高から低) です。スコアが高いほど関連性が高いことを示します。
一致は、スコア順に一覧表示され、クエリ応答ペイロードに含められます。ペイロードには、回答、プレーンテキスト、強調表示されたキャプション、select 句で取得または指定されたフィールドが含まれます。

Note

2023 年 7 月 14 日より、@search.rerankerScore の分布が変更されます。スコアの結果を、テスト以外で判断することはできません。この応答プロパティにハードしきい値の依存関係がある場合、テストを返して、しきい値に適切な新しい値を確認してください。

セマンティック機能と制限

セマンティックランカーは新しいテクノロジなので、実行できることとできないことについての期待値を設定することが重要です。 "できること" は、次のようなことです。

セマンティック的に元のクエリの意図に近い一致を昇格させます。
キャプションおよび回答として使用できる文字列を見つけ出します。キャプションと回答は応答で返され、検索結果ページに表示できる文字列が検出されます。

セマンティックランク付けで "できない" ことは、コーパス全体に対してクエリを再実行して、セマンティックな関連がある結果を検出することです。セマンティックランク付けでは、既定のランク付けアルゴリズムによってスコアリングされた上位 50 個の結果で構成される既存の結果セットが再ランク付けされます。さらに、セマンティックランク付けで新しい情報や文字列を作成することはできません。キャプションと回答は、コンテンツから逐語的に抽出されるので、結果に回答のようなテキストが含まれていない場合、その言語モデルではキャプションや回答は生成されません。

セマンティックランク付けはすべてのシナリオで有益なわけではありませんが、特定のコンテンツではその機能から多くのメリットが得られます。セマンティックランク付けの言語モデルは、情報が豊富で、散文として構造化された検索可能なコンテンツに最適です。ナレッジベース、オンラインドキュメント、説明的なコンテンツを含むドキュメントでは、セマンティックランク付け機能から最も多くのメリットが得られます。

テクノロジは Bing と Microsoft Research が基になっており、Azure AI Search インフラストラクチャにアドオン機能として統合されます。研究と AI 投資でバックアップされるセマンティックランク付けに関する詳細については、「Bing の AI が Azure AI Search にパワーを与えるしくみ (Microsoft Research ブログ)」を参照してください。

次の動画では、機能の概要について説明しています。

可用性と料金

セマンティックランカーは、利用可能なリージョンにおいて、Basic レベル以上の検索サービスで使用できます。

セマンティックランカーを有効にする場合は、機能に対応する価格プランを選択します。

クエリボリュームが低い場合 (月間 1000 件未満)、セマンティックランク付けは無料です。
クエリのボリュームが大きい場合、標準価格プランを選択します。

Azure AI Search の価格ページでは、さまざまな通貨とサイクル間隔での課金レートが表示されます。

セマンティックランク付けの料金は、queryType=semantic を含む、検索文字列が空でないクエリ要求 (たとえば search=pet friendly hotels in New York) を使用した場合に発生します。検索文字が空の場合 (search=*)、queryType が semantic に設定されていても課金されません。

Azure AI Search でのセマンティックランク付け

セマンティックランク付けとは

セマンティックランカーのしくみ

入力が収集されて要約されるしくみ

セマンティックランカーの出力

要約がスコアリングされるしくみ

セマンティック機能と制限

可用性と料金

関連項目

その他のリソース

Azure AI Search でのセマンティック ランク付け

セマンティック ランク付けとは

セマンティック ランカーのしくみ

入力が収集されて要約されるしくみ

セマンティック ランカーの出力

要約がスコアリングされるしくみ

セマンティック機能と制限

可用性と料金

関連項目

その他のリソース

Azure AI Search でのセマンティックランク付け

セマンティックランク付けとは

セマンティックランカーのしくみ

セマンティックランカーの出力