Azure AI Document Intelligence とは?

重要

  • Document Intelligence パブリック プレビュー リリースは、開発中の機能への早期アクセスを提供します。
  • 機能、アプローチ、およびプロセスは、一般提供 (GA) の前に、ユーザーからのフィードバックに基づいて変更される可能性があります。
  • Document Intelligence クライアント ライブラリのパブリック プレビュー バージョンは、REST API バージョン2024-02-29-preview にデフォルトで設定されます。
  • パブリック プレビュー バージョン 2024-02-29-preview は、現在、次の Azure リージョンでのみ使用できます。
  • 米国東部
  • 米国西部 2
  • "西ヨーロッパ"

このコンテンツの適用対象:checkmarkv4.0 (プレビュー) | 以前のバージョン:青のチェックマークv3.1 (GA)青のチェックマークv3.0 (GA)青のチェックマークv2.1 (GA)

このコンテンツの対象:checkmarkv3.1 (GA) | 最新バージョン:紫のチェックマークv4.0 (プレビュー) | 以前のバージョン:青のチェックマークv3.0青のチェックマークv2.1

このコンテンツの対象:checkmarkv3.0 (GA) | 最新バージョン:紫のチェックマークv4.0 (プレビュー)紫のチェックマークv3.1 | 以前のバージョン:青のチェックマークv2.1

このコンテンツの適用対象:checkmarkv2.1 | 最新バージョン:青のチェックマークv4.0 (プレビュー)

Note

Form Recognizer は Azure AI Document Intelligence になりました。

  • 2023 年 7 月時点で、Azure AI サービスには、以前 Cognitive Services および Azure Applied AI Services と呼ばれていたものすべてが含まれています。
  • 価格に変更はありません。
  • Cognitive Services および Azure Applied AI という名前は、Azure の課金、コスト分析、価格表、および Price API で引き続き使用されます。
  • v3.1 を含むそれ以前のアプリケーション プログラミング インターフェイス (API) や SDK に対する破壊的変更はありません。 v4.0 以降、API と SDK は Document Intelligence に更新されます。
  • 一部のプラットフォームでは、まだ名前が更新されていません。 ドキュメントで Form Recognizer または Document Intelligence に言及している場合は、同じ Azure サービスを参照しています。

Azure AI Document Intelligence は、クラウドベースの Azure AI サービスで、インテリジェントなドキュメント処理ソリューションの構築を可能とします。 さまざまなデータ型にまたがる大量のデータが、フォームとドキュメントに格納されます。 Document Intelligence は、データの収集と処理の速度を効果的に管理することを可能とし、運用の改善、情報に基づくデータ主導の意思決定、知見に基づくイノベーションの鍵となります。

|✔️ ドキュメント分析モデル |✔️ 事前構築済みモデル |✔️ カスタム モデル |

ドキュメント分析モデル

ドキュメント分析モデルを使用して、フォームやドキュメントからテキストを抽出し、組織のアクション、運用、進捗などに利用できる、構造化されたビジネス対応コンテンツを返すことができます。


読み取り | 印刷されたテキスト
や手書きテキストを抽出します。


レイアウト | テキスト、テーブル、
ドキュメントの構造を抽出します。


読み取り | 印刷されたテキスト
や手書きテキストを抽出します。


レイアウト | テキスト、テーブル、
ドキュメントの構造を抽出します。


一般的なドキュメント | テキスト、
構造、キーと値のペアを抽出します。

事前構築済みのモデル

事前構築済みモデルを使用して、独自モデルのトレーニングや構築をしなくても、インテリジェントなドキュメント処理をアプリやフローに追加できます。


請求書 | 顧客
とベンダーの詳細を抽出します。


領収書 | 販売
トランザクションの詳細を抽出します。


ID | 識別
と検証の詳細を抽出します。


1003 EULA | 住宅ローンの詳細を抽出します。


フォーム 1008 | 住宅ローンの詳細を抽出します。


クロージング ディスクロージャー | 住宅ローンの詳細を抽出します。


健康保険証 |
健康保険の詳細を抽出します。


契約 |契約
とパーティーの詳細を抽出します。


クレジット/デビット カード | 銀行カードから情報を抽出します。


婚姻証明書 | 婚姻証明書から情報を抽出します。


米国税 W-2 フォーム | 課税対象の報酬の詳細を
抽出します。


米国税 1098 フォーム | 住宅ローンの利息の詳細を抽出します。


米国税 1098-E フォーム | 学生ローンの利息の詳細を抽出します。


米国税 1098-T フォーム | 適格な学費の詳細を抽出します。


米国税 1099 フォーム |1099 フォームのバリエーションから情報を抽出します。


米国税 1040 フォーム | 1040 フォームのバリエーションから情報を抽出します。


請求書 | 顧客
とベンダーの詳細を抽出します。


領収書 | 販売
トランザクションの詳細を抽出します。


ID | 識別
と検証の詳細を抽出します。


健康保険証 | 健康保険の詳細を抽出します。


名刺 | ビジネス用の連絡先の詳細を抽出します。


契約 |契約
とパーティーの詳細を抽出します。


米国税 W-2 フォーム | 課税対象の報酬の詳細を
抽出します。


米国税 1098 フォーム | 住宅ローンの利息の詳細を抽出します。


米国税 1098-E フォーム | 学生ローンの利息の詳細を抽出します。


米国税 1098-T フォーム | 適格な学費の詳細を抽出します。

カスタム モデル

  • カスタム モデルは、ラベル付きデータセットを使用してトレーニングされ、ユース ケースに固有のフォームとドキュメントから個別のデータを抽出します。
  • スタンドアロンのカスタム モデルを組み合わせて、作成済みモデルを作成できます。
  • 抽出モデル
    ✔️ カスタム抽出モデルをトレーニングして、ドキュメントからラベル付きフィールドを抽出します。


カスタム テンプレート | 静的レイアウトからデータを抽出します。


カスタム ニューラル | 混在型ドキュメントからデータを抽出します。


カスタム構成 | モデルのコレクションを使用してデータを抽出します。

  • 分類モデル
    ✔️ カスタム分類器は、抽出モデルを呼び出す前に、ドキュメントの種類を特定します。


カスタム分類器 |
抽出モデルを呼び出す前に、指定されたドキュメントの種類 (クラス) を特定します。

アドオン機能

Document Intelligence では、ドキュメント抽出シナリオに応じて有効または無効にできるオプション機能がサポートされています。 次のアドオン機能は、2023-07-31 (GA) 以降のリリースで使用できます。

Document Intelligence では、ドキュメント抽出シナリオに応じて有効または無効にできるオプション機能がサポートされています。 次のアドオン機能は、2024-02-29-preview2023-10-31-preview、およびそれ以降のリリースで使用できます。

分析機能

モデル ID テキストの抽出 クエリ フィールド 段落 段落の役割 選択マーク テーブル キーと値のペア 言語 バーコード ドキュメント分析 数式* スタイルのフォント* 高解像度*
prebuilt-read O O O O O
事前構築済みレイアウト O O O O O
事前構築済みドキュメント O O O O O
事前構築された名刺
prebuilt-contract O O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
prebuilt-invoice O O O O O O
prebuilt-receipt O O O O O
prebuilt-marriageCertificate.us O O O O O
prebuilt-creditCard O O O O O
prebuilt-mortgage.us.1003 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099 (バリエーション) O O O O O
prebuilt-tax.us.1040(variations) O O O O O
{ customModelName } O O O O O

✓ - 有効
O - 省略可能
* - 追加コストが発生する Premium 機能

モデルと開発のオプション

注意

以下のドキュメント解釈モデルと開発オプションは Document Intelligence サービス v3.0 でサポートされています。

Document Intelligence を使用して、アプリケーションとワークフローでのドキュメント処理を自動化し、データ主導戦略を強化し、ドキュメント検索機能を強化することができます。 表のリンクから、各モデルの詳細や開発のオプションを参照できます。

Read

Document Intelligence Studio を使用した読み取りモデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
prebuilt-read ● 文書からテキストを抽出します。
データ抽出
● 文書をデジタル化します。
● コンプライアンスと監査。
● 手書きのメモの翻訳前の処理。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

レイアウト

Document Intelligence Studio を使用したレイアウト モデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
事前構築済みレイアウト ● 文書からテキストおよびレイアウト情報を抽出します。
データ抽出
● 構造によるドキュメントのインデックス作成と取得。
● 財務および医療レポートの分析。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

一般的なドキュメント (2023-10-31 プレビューで非推奨)

Document Intelligence Studio を使用した一般ドキュメント モデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
事前構築済みドキュメント ● ドキュメントからテキスト、レイアウト、キーと値のペアを抽出します。
データとフィールドの抽出
● キーと値のペアの抽出。
● フォーム処理。
● 調査データの収集と解析。
Document Intelligence Studio
REST API

請求書

Document Intelligence Studio を使用した請求書モデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
prebuilt-invoice ● 請求書から主要な情報を抽出します。
データとフィールドの抽出
● 買掛金勘定処理。
● 自動的な税の記録とレポート。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Receipt

Document Intelligence Studio を使用した領収書モデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
prebuilt-receipt ● レシートから主要な情報を抽出します。
データとフィールドの抽出
● 領収書モデル v3.0 では、単一ページのホテル領収書の処理がサポートされています。
● 経費管理。
● コンシューマーの行動データ分析。
● 顧客ロイヤルティ プログラム。
● 商品返品処理。
● 自動的な税の記録とレポート。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

アイデンティティ (ID)

Document Intelligence Studio を使用した ID ドキュメント モデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
prebuilt-idDocument ● パスポートや ID カードから主要な情報を抽出します。
ドキュメントの種類
● 米国の運転免許証から保証、制限、車両分類を抽出します。
● Know Your Customer (KYC) 金融サービス ガイドラインのコンプライアンス。
● 医療アカウント管理。
ID チェックポイントとゲートウェイ。
● ホテルの登録。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

医療保険カード

Document Intelligence Studio を使用した医療保険カード モデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
prebuilt-healthInsuranceCard.us ● 米国の健康保険カードから主要な情報を抽出します。
データとフィールドの抽出
● カバレッジと適格性の検証。
● 予測モデリング。
● 価値ベースの分析。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

コントラクト モデル

Document Intelligence Studio を使用した契約書モデル抽出のスクリーンショット。

モデル ID 説明 開発オプション
事前構築済みコントラクト 契約書とパーティーの詳細を抽出します。 Document Intelligence Studio
REST API

米国税 W-2 モデル

Document Intelligence Studio を使用した W-2 モデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
prebuilt-tax.us.W-2 ● IRS US W2 税フォーム (2018 年から 2021 年) から主要な情報を抽出します。
データとフィールドの抽出
● 自動化された税ドキュメントの管理。
● 住宅ローンの申し込み処理。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国税 1098 フォーム

Document Intelligence Studio で分析した米国 1098 納税様式のスクリーンショット。

モデル ID 説明 開発オプション
prebuilt-tax.us.1098 住宅ローンの利息に関する情報と詳細を抽出します。 Document Intelligence Studio
REST API

米国税 1098-E フォーム

Document Intelligence Studio で分析した米国 1098-E 納税様式のスクリーンショット。

モデル ID 説明 開発オプション
prebuilt-tax.us.1098E 学生ローンの情報と詳細を抽出します。 Document Intelligence Studio
REST API

米国税 1098-T フォーム

Document Intelligence Studio で分析した米国 1098-T 納税様式のスクリーンショット。

モデル ID 説明 開発オプション
prebuilt-tax.us.1098T 学費の情報と詳細を抽出します。 Document Intelligence Studio
REST API

米国税 1099 (およびバリエーション) フォーム

Document Intelligence Studio で分析した米国 1099 納税様式のスクリーンショット。

モデル ID 説明 開発オプション
prebuilt-tax.us.1099 (バリエーション) 1099 フォームのバリエーションから情報を抽出します。 Document Intelligence Studio
REST API

名刺

Document Intelligence Studio を使用した名刺モデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
事前構築された名刺 ● 名刺から主要な情報を抽出します。
データとフィールドの抽出
● リードとマーケティングの管理。 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

カスタム モデルの概要

Document Intelligence Studio を使用したカスタム モデル トレーニングのスクリーンショット。

詳細 説明 自動化のユース ケース 開発オプション
カスタム モデル 一連の代表的なトレーニング ドキュメントのセットから作成されたモデルに基づいて、フォームとドキュメントから構造化データとして情報を抽出します。 ビジネスやユース ケースに固有のフォームとドキュメントから個別のデータを抽出します。 Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

カスタム テンプレート

Document Intelligence Studio を使用したカスタム テンプレート モデル分析のスクリーンショット。

注意

カスタム テンプレート モデルをトレーニングするには、buildMode プロパティを template に設定します。 詳細については、テンプレート モデルのトレーニング」を参照してください。

詳細 説明 自動化のユース ケース 開発オプション
カスタム テンプレート モデル カスタム テンプレート モデルは、構造化ドキュメントと半構造化ドキュメントからラベル付きの値とフィールドを抽出します。
定義されたビジュアル テンプレートや一般的なビジュアル レイアウト、フォームを使用して、高度に構造化されたドキュメントから主要データを抽出します。 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK

カスタム ニューラル

Document Intelligence Studio を使用したカスタム ニューラル モデル分析のスクリーンショット。

注意

カスタム ニューラル モデルをトレーニングするには、buildMode プロパティを neural に設定します。 詳細については、「ニューラル モデルのトレーニング」を参照してください

詳細 説明 自動化のユース ケース 開発オプション
カスタム ニューラル モデル カスタム ニューラル モデルを使用して、構造化されたドキュメント (アンケート、調査)、半構造化されたドキュメント (請求書、発注書)、構造化されていないドキュメント (契約書、レター) からラベル付けされたデータを抽出します。 構造化されたドキュメントと構造化されていないドキュメントから、テキスト データ、チェックボックス、表形式フィールドを抽出します。 Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

カスタム構成

Document Intelligence Studio の構成済みカスタム モデル リストのスクリーンショット。

詳細 説明 自動化のユース ケース 開発オプション
作成済みカスタム モデル 作成済みモデルは、カスタム モデルのコレクションを取得し、目的のフォームの種類から構築された 1 つのモデルに割り当てることで作成します。 複数のモデルをトレーニングし、それらをグループ化して類似したフォームの種類を分析する場合に役立ちます (発注書など)。 Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

カスタム分類モデル

{alt-text}

詳細 説明 自動化のユース ケース 開発オプション
作成済みの分類モデル カスタム分類モデルは、レイアウト機能と言語機能を組み合わせて、入力ファイル内のドキュメントを検出、識別、分類します。 ● 申込書、給与明細、銀行明細書を含むローン申請パッケージ。
● スキャンされた請求書のコレクション。
Document Intelligence Studio
REST API

Azure AI Document Intelligence は、開発者がインテリジェントなドキュメント処理ソリューションを構築することを可能とするクラウドベースの Azure AI サービスです。 Document Intelligence は、機械学習ベースの光学式文字認識 (OCR) およびドキュメント解釈テクノロジを適用して、ドキュメントからテキスト、テーブル、構造、キーと値のペアを抽出します。 また、カスタム モデルにラベルを付けてトレーニングし、構造化ドキュメント、半構造化ドキュメント、非構造化ドキュメントからのデータ抽出を自動化することもできます。 各モデルについて詳しくは、概念に関する記事を "ご覧ください"。

モデルの種類 モデル名
ドキュメント分析モデル レイアウト分析モデル
事前構築済みのモデル 請求書モデル
領収書モデル
身分証明書 (ID) モデル
名刺モデル
カスタム モデル カスタム モデル
作成済みモデル

このコンテンツの適用対象: checkmarkv2.1 | 最新バージョン: 青のチェックマークv4.0 (プレビュー)

Document Intelligence のモデルおよび開発オプション

ヒント

  • 強化されたエクスペリエンスと高度なモデル品質のためには、Document Intelligence v3.0 Studio をお試しください。
  • v3.0 Studio では、v2.1 ラベル付きデータでトレーニングされたすべてのモデルがサポートされます。
  • v2.1 から v3.0 への移行の詳細については、API 移行ガイドを参照してください。

Note

以下のモデルと開発オプションは Document Intelligence サービス v2.1 でサポートされています。

表のリンクを使用して、各モデルの詳細を確認したり、API リファレンスを参照したりしてください。

モデル 説明 開発オプション
レイアウト分析 フォームとドキュメントからのテキスト、選択マーク、テーブル、境界ボックス座標の抽出と分析。 Document Intelligence ラベル付けツール
REST API
クライアントライブラリ SDK
Document Intelligence Docker コンテナー
カスタム モデル 個別のビジネス データおよびユース ケースに固有のフォームおよびドキュメントからのデータの抽出と分析。 Document Intelligence ラベル付けツール
REST API
サンプル ラベル付けツール
Document Intelligence Docker コンテナー
請求書モデル 売上請求書の重要な情報の自動データ処理と抽出。 Document Intelligence ラベル付けツール
REST API
クライアントライブラリ SDK
Document Intelligence Docker コンテナー
レシート モデル レシートの重要な情報の自動データ処理と抽出。 Document Intelligence ラベル付けツール
REST API
クライアントライブラリ SDK
Document Intelligence Docker コンテナー
身分証明書 (ID) モデル 米国の運転免許証と国際パスポートの重要な情報の自動データ処理と抽出。 Document Intelligence ラベル付けツール
REST API
クライアントライブラリ SDK
Document Intelligence Docker コンテナー
名刺モデル 名刺の重要な情報の自動データ処理と抽出。 Document Intelligence ラベル付けツール
REST API
クライアントライブラリ SDK
Document Intelligence Docker コンテナー

データのプライバシーとセキュリティ

AI サービス全般に言えることですが、Document Intelligence サービスを使用する開発者は、顧客データに関する Microsoft のポリシーに留意する必要があります。 Document Intelligence のデータ、プライバシー、セキュリティに関するページを参照してください。

次のステップ