Azure Document Intelligence の概要

完了

Azure Document Intelligence サービスを使用してプロジェクトを開始するには、次を準備する必要があります。

  • Azure リソース サブスクリプション
  • データ抽出用のフォーム ファイルの選択

リソースにサブスクライブする

Azure Document Intelligence サービスには、次を経由してアクセスできます。

  • Azure AI サービス リソース: マルチサービスのサブスクリプション キー (複数の Azure AI サービスにまたがって使用されます)

OR

  • Azure Document Intelligence リソース: 単一サービスのサブスクリプション キー (特定の Azure AI サービスでのみ使用されます)

Note

1 つのエンドポイント/キーで複数の Azure AI サービスにアクセスする予定の場合は、Azure AI サービス リソースを作成します。 Azure Document Intelligence へのアクセスのみの場合は、Azure Document Intelligence リソースを作成します。 Microsoft Entra 認証を使用する場合は、単一のサービス リソースが必要になることに注意してください。

Azure portal で、または Azure コマンドライン インターフェイス (CLI) を使用してサービスにサブスクライブすることができます。 CLI コマンドの詳細については、こちらを参照してください。

Azure Document Intelligence ファイルの入力要件を理解する

Azure Document Intelligence は、次の要件を満たす入力ドキュメントを処理します。

  • 形式は、JPG、PNG、BMP、PDF (テキストまたはスキャン)、または TIFF である必要があります。
  • ファイル サイズは、有料 (S0) レベルでは 500 MB 未満、Free (F0) レベルでは 4 MB 未満である必要があります。
  • 画像の寸法は、50 x 50 ピクセルから 10,000 x 10,000 ピクセルの間である必要があります。
  • トレーニング データ セットの合計サイズは、500 ページ以下にする必要があります。

入力要件の詳細については、特定のモデルのドキュメントを参照してください。

使用する Azure Document Intelligence のコンポーネントを決定する

ファイルを収集したら、何を達成する必要があるかを決定します。

  • OCR 機能を使用してドキュメント分析をキャプチャするには、レイアウト モデル読み取りモデル、または一般ドキュメント モデルを使用します。

  • W-2、請求書、領収書、身分証明書、健康保険証、ワクチン接種証明書、名刺からデータを抽出するアプリケーションを作成するには、事前構築済みモデルを使用します。 これらのモデルをトレーニングする必要はありません。 Azure Document Intelligence サービスがドキュメントを分析し、JSON 出力を返します。

  • 業界固有のフォームからデータを抽出するアプリケーションを作成するには、カスタム モデルを作成します。 このモデルは、サンプル ドキュメントでトレーニングする必要があります。 トレーニング後は、カスタム モデルを使用して新しいドキュメントを分析し、JSON 出力を返すことができるようになります。