Azure AI マルチサービス リソースを Azure AI Search のスキルセットにアタッチする

Azure AI Search でオプションの AI エンリッチメント パイプライン を構成する場合は、限られた数のドキュメントを無料でエンリッチできます。 大規模で頻繁なワークロードの場合は、請求可能なAzure AI マルチサービス リソースをアタッチする必要があります。

マルチサービス リソースは、個々のサービスではなく、一連の Azure AI サービスを、単一の API キーを介して付与されたアクセス権を持つオファリングとして参照します。 このキーは、 スキルセット で指定され、Microsoft はこれらのサービスの使用に対して課金できます:

  • 画像分析と光学式文字認識 (OCR) のための Azure AI Vision
  • 言語検出、エンティティ認識、感情分析、およびキー フレーズ抽出のためのAzure AI 言語
  • 音声テキスト変換およびテキスト読み上げのAzure AI 音声
  • マシン テキスト翻訳のための Azure AI 翻訳

ヒント

Azure には、課金と予算を監視するためのインフラストラクチャが用意されています。 Azure AI サービスの監視の詳細については、「 Azure AI サービスのコストを計画および管理する」を参照してください。

リソース キーを設定する

Azure portal、REST API、または Azure SDK を使って、課金対象のリソースをスキルセットにアタッチすることができます。

プロパティを未指定のままにすると、検索サービスでは、インデクサーが 1 日単位で利用できる無料のエンリッチメントの使用を試行します。 課金対象のスキルの実行は、インデクサーの呼び出しごとに 20 トランザクションで停止し、インデクサーの実行履歴に "タイムアウト" のメッセージが表示されます。

  1. Azure portal にサインインします。

  2. 検索サービスと同じリージョンAzure AI マルチサービス リソースを作成します。

  3. スキルセット定義にキーを追加します。

    • データのインポート ウィザードを使用する場合は、2 番目の手順である [Add AI enrichments]\(AI エンリッチメントを追加する\) でキーを入力します。

    • 新規または既存のスキルセットにキーを追加する場合は、Azure AI サービス タブでキーを指定します。

    Screenshot of the key page.

キーを削除します

エンリッチメントは課金対象の操作です。 Azure AI サービスを呼び出す必要がなくなった場合は、次の手順に従ってマルチリージョン キーを削除し、外部リソースの使用をやめます。 キーがないと、スキルセットは、インデクサーごとに 1 日あたり 20 個の無料トランザクションの既定の割り当てに戻ります。 課金対象のスキルの実行は、20 トランザクションで停止し、割り当てを使い切るとインデクサーの実行履歴に "タイムアウト" のメッセージが表示されます。

  1. Azure portal にサインインして、検索サービスの概要ページを開きます。

  2. スキルセットで、削除するキーを含むスキルセットを選択します。

    Screenshot of the skillset page.

  3. ファイルの末尾までスクロールします。

  4. JSON からキーを削除し、スキルセットを保存します。

    Screenshot of the skillset JSON.

キーの使用方法

キーベースの課金は、Azure AI サービス リソースへの API 呼び出しが、インデクサーごとに 1 日あたり 20 回を超えた場合に適用されます。

キーは課金に使用されますが、エンリッチメント操作の接続には使用されません。 接続の場合、検索サービスは、内部ネットワーク経由で、同じ物理リージョンにある Azure AI サービス リソースに接続します。 Azure AI Search を提供するほとんどのリージョンでは、言語などの他の Azure AI サービスも提供されています。 両方のサービスがないリージョンで AI エンリッチメントを試行した場合、"Provided key is not a valid CognitiveServices type key for the region of your search service (指定されたキーは、検索サービスのリージョンに対して有効な CognitiveServices タイプのキーではありません)" というメッセージが表示されます。

現時点では、 組み込みのスキル の課金には、Azure AI Search から別の Azure AI サービスへのパブリック接続が必要です。 公衆ネットワークへのアクセスを無効にすると、課金ができなくなります。 パブリック ネットワークを無効にする必要がある場合は、 プライベート エンドポイント をサポートする Azure Functionを実装したカスタム Web API スキルを構成し、 同じ VNETに Azure AI サービス リソースを追加します。 この方法では、プライベート エンドポイントを使用して、カスタム スキルから直接 Azure AI サービス リソースを呼び出すことができます。

Note

一部の組み込みスキルは、非リージョンの Azure AI サービス (テキスト翻訳スキルなど) をベースとしています。 リージョン以外のスキルを使用すると、Azure AI Search リージョン以外のリージョンで要求が処理される可能性があります。 リージョン以外のサービスの詳細については、「リージョン別の Azure AI サービス製品 」ページを参照してください。

重要な要件の特別なケース

カスタム エンティティ検索 は、Azure AI サービスではなく Azure AI Search によって測定されますが、インデクサーあたりで 1 日あたり 20 を超えるトランザクションのロックを解除するには、Azure AI マルチサービス リソース キーが必要です。 このスキルの場合のみ、リソース キーによってトランザクション数のブロックが解除されますが、課金とは無関係です。

無料エンリッチメント

AI エンリッチメントでは、課金対象のエンリッチメントを少量無料で処理できるため、Azure AI マルチサービス リソースをアタッチしなくても短い演習を完了できます。 無料のエンリッチメントは、インデクサーごとに 1 日あたり 20 ドキュメントです。 演習を繰り返す場合は、インデクサーをリセットすることで、カウンターをリセットできます。

一部のエンリッチメントは常に無料です。

  • Azure AI サービスを呼び出さないユーティリティ スキル (つまり、 条件付きドキュメント抽出Shaperテキストマージ、および テキスト分割スキル) は課金されません。

  • PDF ドキュメントやその他のアプリケーション ファイルからのテキスト抽出は、課金対象外です。 ドキュメントクラッキング中に発生するテキスト抽出は AI エンリッチメントではありませんが、AI エンリッチメント中に発生するため、ここに記載されています。

課金対象のエンリッチメント

AI エンリッチメント中、Azure AI Search は、Azure AI Vision、Translator、Azure AI Language に基づく 組み込みのスキル のために Azure AI サービス API を呼び出します。

Azure AI サービスへのバックエンド呼び出しを行う課金対象の組み込みスキルには、エンティティ リンクエンティティ認識画像分析キー フレーズ抽出言語検出OCR個人を特定できる情報 (PII) 検出センチメントテキスト翻訳があります。

画像抽出は、エンリッチメントの前にドキュメントが解読されたときに発生する Azure AI Search 操作です。 画像抽出は、Free レベルでの 1 日 20 回の無料抽出を除き、すべてのレベルで課金対象です。 画像抽出コストは、BLOB 内の画像ファイル、他のファイル (PDF および他のアプリ ファイル) に埋め込まれた画像、およびドキュメント抽出を使用して抽出された画像に適用されます。 画像抽出の価格については、Azure AI Search の 価格に関するページを参照してください。

ヒント

スキルセット処理のコストを削減するには、インクリメンタル エンリッチメント (プレビュー) を有効にして、スキルセットに加えた変更の影響を受けないエンリッチメントをキャッシュして再利用します。 キャッシュには Azure Storage が必要です (価格を参照してください)。ただし、既存のエンリッチメントを再利用できる場合は、スキルセットの実行の累積コストが低くなります (特に画像の抽出と分析を使用するスキルセットの場合)。

例: コストの見積もり

Azure AI Search のインデックス作成に関連するコストを見積もるために、いくつかの数値を実行できるように、平均ドキュメントがどのように表示されるかを考え始めます。 たとえば、次のように概算することができます。

  • 1000 PDF。
  • それぞれ 6 ページ。
  • 1 ページに 1 画像 (6000 画像)。
  • 1 ページあたり 3,000 文字。

各 PDF のドキュメント解析、画像とテキストの抽出、画像の光学式文字認識 (OCR)、組織のエンティティ認識からなるパイプラインを想定します。

この記事に示されている価格は仮定上のものです。 これらは、見積もりプロセスを説明するために使用されています。 お客様のコストはこれより低い可能性があります。 トランザクションの実際の価格については、「Azure AI サービス価格」をご覧ください。

  1. テキストと画像のコンテンツを含むドキュメント解読の場合、現在、テキスト抽出は無料です。 6,000 個の画像の場合、1,000 個の画像が抽出されるごとに 1 ドルと想定します。 このステップの場合、6.00 ドルのコストになります。

  2. 6,000 画像の英語での OCR については、OCR コグニティブ スキルでは最適なアルゴリズム (DescribeText) が使用されます。 1,000 個のイメージを分析するたびに $2.50 かかるとすると、この手順に対して $15.00 が課金されることになります。

  3. エンティティの抽出では、1 ページごとに合計 3 個のテキスト レコードがあります。 各レコードは 1,000 文字です。 1 ページあたり 3 個のテキスト レコードに 6,000 ページを掛けると、18,000 個のテキスト レコードになります。 1,000 個のテキスト レコードごとに $2.00 かかるとすると、この手順のコストは $36.00 になります。

まとめると、示されたスキルセットでこの種類の PDF ドキュメントを 1,000 個取り込むには、約 $57.00 を支払うことなります。

次のステップ