Azure AI Document Intelligence の新機能

[アーティクル]
02/29/2024

このコンテンツの適用対象: v4.0 (プレビュー)v3.1 (GA)v3.0 (GA)v2.1 (GA)

Document Intelligence サービスは、継続的に更新されます。このページをブックマークして、リリースノート、機能強化、最新のドキュメントを入手してください。

重要

GA API がリリースされると、プレビュー API バージョンが廃止されます。 2023-02-28-preview API バージョンは廃止処理中です。このプレビュー API または関連する SDK バージョンをまだ使用している場合は、最新の API バージョンである 2023-07-31 (GA) をターゲットにするようにコードを更新してください。

2024 年 2 月

現在、Document Intelligence 2024-02-29-preview REST API をご利用になれます。このプレビュー版の API には、次の新機能と更新機能が導入されています。

パブリックプレビューバージョン 2024-02-29-preview は、現在、次の Azure リージョンでのみ使用できます。
- 米国東部
- 米国西部 2
- "西ヨーロッパ"
レイアウトモデルでは、図の検出がサポートされ、階層型ドキュメント構造分析 (セクションとサブセクション) ができるようになりました。読み取り順序と論理ロール検出の AI 品質も向上しています。
カスタム抽出モデル
- カスタム抽出モデルで、セル、行、テーブルレベルの信頼度スコアがサポートされるようになりました。テーブル、行、セルの信頼度についての詳細情報。
- カスタム抽出モデルでは、フィールド抽出の AI 品質が向上しています。
- カスタムテンプレート抽出モデルで、重複するフィールドの抽出がサポートされるようになりました。重複するフィールドとその使用方法の詳細情報。
カスタム分類モデル
- カスタム分類モデルが、分類モデルを追加のサンプルまたは追加のクラスで更新する必要があるシナリオでの、増分トレーニングをサポートするようになりました。増分トレーニングについての詳細情報。
- カスタム分類モデルに、Office ドキュメントの型 (.docx、.pptx、.xls) のサポートが追加されました。ドキュメントの型のサポート拡張についての詳細情報。

請求書モデル

以下の新しいロケールをサポートします。

ロケール	コード
アラビア語	(`ar`)
ブルガリア語	(`bg`)
ギリシャ語	(`el`)
ヘブライ語	(`he`)
マケドニア語	(`mk`)
ロシア語 (`ru`)	セルビア系キリル語 (`sr-cyrl`)
ウクライナ語	(`uk`)
タイ語	(`th`)
トルコ語	(`tr`)
ベトナム語	(`vi`)

新しい通貨コードをサポート:

通貨	Locale	コード
BAM	ボスニア兌換マルク	(`ba`)
BGN	ブルガリアレフ	(`bg`)
ILS	イスラエル新シェケル	(`il`)
MKD	マケドニアディナール	(`mk`)
RUB	ロシアルーブル	(`ru`)
THB	タイバーツ	(`th`)
TRY	トルコリラ	(`tr`)
UAH	ウクライナフリヴニャ	(`ua`)
VND	ベトナムドン	(`vn`)

税項目で、ドイツ (de)、スペイン (es)、ポルトガル (pt)、英語圏カナダ en-CA を拡張サポートしました。

ID モデル
- 欧州連合 ID と運転免許証のフィールドサポートが拡張されました。
🆕 住宅ローンドキュメント
- 統一住宅ローン申請書 (フォーム 1003) から情報を抽出します。
- 統一引受転送概要書またはフォーム 1008 から、情報を抽出します。
- 住宅ローンの決算開示から情報を抽出します。
🆕 クレジット/デビットカードモデル
- 銀行カードから情報を抽出します。
🆕 結婚証明書
- 結婚証明書から情報を抽出するため新たに事前構築。

2023 年 12 月

REST API 2023-10-31-preview を対象とした Document Intelligence クライアントライブラリを使用できるようになりました。

2023 年 11 月

Document Intelligence 2023-10-31-preview REST API を使用できるようになりました。このプレビュー版の API には、次の新機能と更新機能が導入されています。

パブリックプレビューバージョン 2023-10-31-preview は、現在、次の Azure リージョンでのみ使用できます。
- 米国東部
- 米国西部 2
- "西ヨーロッパ"
読み取りモデル
- 手書き入力用の言語の拡大: ロシア語 (ru)、アラビア語 (ar)、タイ語 (th)。
- サイバーエグゼクティブオーダー (EO) へのコンプライアンス。
レイアウトモデル
- Office ファイルと HTML ファイルをサポートします。
- マークダウンでの出力のサポート。
- テーブルの抽出、読み取り順序、セクション見出し検出の機能強化。
- Document Intelligence 2023-10-31-preview では、一般的なドキュメントモデル (事前構築済みドキュメント) が非推奨になりました。今後、キーと値のペアを抽出するには、オプションのクエリ文字列パラメーター features=keyValuePairs が有効になっている prebuilt-layout モデルを使用してください。
レシートモデル
- すべての価格関連フィールドの通貨が抽出されるようになりました。
保険証モデル
- メディケアとメディケイド情報の新しいフィールドのサポート。
米国の税務書類モデル
- 新しい 1099 税モデル。ベース 1099 フォームと、バリエーション (A、B、C、CAP、DIV、G、H、INT、K、LS、LTC、MISC、NEC、OID、PATR、Q、QA、R、S、SA、SB) 。
請求書モデル
- KVK フィールドのサポート。
- BPAY フィールドのサポート。
- フィールドに関する多くの微調整。
カスタム分類
- 多言語ドキュメントのサポート。
- 新しいページ分割オプション: 自動分割、常にページごとに分割、分割なし。
アドオン機能
- クエリフィールドは 2023-10-31-preview リリースで使用できます。
- アドオン機能は、読み取りモデルを除くすべてのモデル内で使用できます。

Note

2022-08-31 API の一般提供 (GA) リリースに伴い、関連するプレビュー API は非推奨とされます。 2021-09-30-preview、2022-01-30-preview、または 2022-06-30-preview API バージョンを使用している場合は、2022-08-31 API バージョンをターゲットとするようにアプリケーションを更新してください。いくつかのマイナー変更が必要です。詳細については、「移行ガイド」を参照してください。

2023 年 7 月

Note

Form Recognizer は Azure AI Document Intelligence になりました。

ドキュメント、Azure AI サービスには、以前 Cognitive Services および Azure Applied AI Services と呼ばれていたものすべてが含まれています。
価格に変更はありません。
Cognitive Services および Azure Applied AI という名前は、Azure の課金、コスト分析、価格表、および Price API で引き続き使用されます。
アプリケーションプログラミングインターフェイス (API) やクライアントライブラリに破壊的変更はありません。
一部のプラットフォームでは、まだ名前が更新されていません。ドキュメントで Form Recognizer または Document Intelligence に言及している場合は、同じ Azure サービスを参照しています。

Document Intelligence v3.1 (GA)

Document Intelligence バージョン 3.1 API が一般提供 (GA) されました。 API のバージョンは 2023-07-31 に対応しています。 v3.1 API には、新機能と更新機能が導入されています。

Document Intelligence API ではモジュール性が高まり、オプション機能がサポートされています。必要な機能を具体的に含むように出力をカスタマイズできるようになりました。省略可能なパラメーターの詳細を参照してください。
1 つのファイルを個々のドキュメントに分割するためのドキュメント分類 API。ドキュメント分類に関する詳細情報。
事前構築済みコントラクトモデル。
事前構築済みの米国 1098 税フォームモデル。
Read API を使用した Office ファイルの種類のサポート。
ドキュメント内のバーコード認識。
数式認識アドオン機能。
フォント認識アドオン機能。
高解像度ドキュメントのサポート。
カスタムニューラルモデルでは、トレーニングにラベル付けされたサンプルが 1 つ必要になりました。
カスタムニューラルモデルの言語の増加。 30 の言語でドキュメントのニューラルモデルをトレーニングします。サポートされている言語の完全な一覧については、言語サポートを参照してください。
🆕 事前構築済みの医療保険カードモデル
事前構築済みの請求書モデルのロケールの増加。
100 を超える言語がサポートされている事前構築済みのレシートモデルの言語とロケールの増加。
事前構築済み ID モデルで、ヨーロッパの ID がサポートされるようになりました。

Document Intelligence Studio UX 更新プログラム

✔️ 分析オプション

Document Intelligence では、より高度な分析機能がサポートされるようになりました。Studio では、アドオン機能を簡単に構成するための 1 つのエントリポイント ([分析オプション] ボタン) を使用できます。
ドキュメント抽出シナリオに応じて、分析範囲、ドキュメントページ範囲、オプションの検出、プレミアム検出機能を構成します。

Note

Document Intelligence Studio では、フォントの抽出は視覚化されません。ただし、フォントの検出結果については JSON 出力のスタイルセクションで確認できます。

✔️ 事前構築済みモデルまたは独自のモデルのいずれかを使用してドキュメントに自動ラベル付けする

カスタム抽出モデルラベル付けページで、Document Intelligent Service の事前構築済みモデルまたは自分が以前にトレーニングしたモデルのいずれかを使用して、ドキュメントの自動ラベル付けが行えるようになりました。
一部のドキュメントでは、自動ラベル付けを実行した後に重複ラベルが存在する場合があります。後でラベル付けページでラベルが重複しないように、ラベルを変更してください。

✔️ 自動ラベル付けテーブル

カスタム抽出モデルのラベル付けページで、手動でテーブルにラベル付けしなくても、ドキュメント内のテーブルに自動ラベル付けできるようになりました。

✔️ テストファイルをトレーニングデータセットに直接追加する

カスタム抽出モデルをトレーニングしたら、テストページを使用して、必要に応じてテストドキュメントをトレーニングデータセットにアップロードすることで、モデルの品質を改善します。
一部のラベルに対して低い信頼度スコアが返される場合は、それらが正しくラベル付けされていることを確認します。正しくない場合は、モデルの品質を改善するために、それらをトレーニングデータセットに追加し再ラベル付けを行います。

Animated screenshot showing how to add test files to training dataset.

✔️ カスタムプロジェクトでドキュメントリストオプションとフィルターを使用する

カスタム抽出モデルのラベル付けページを使用します。検索、フィルター、並べ替えを使用することで、トレーニングドキュメント間を簡単に移動できるようになりました。
グリッドビューを使用してドキュメントをプレビューするか、リストビューを使用してドキュメント内をより簡単にスクロールできます。

✔️ プロジェクト共有

カスタム抽出プロジェクトを簡単に共有できます。詳細については、「プロジェクト共有とカスタムモデル」を参照してください。

2023 年 5 月

Build 2023 で更新されたドキュメントの紹介

🆕 Document Intelligence の概要では、ナビゲーションが強化され、アクセスポイントが体系化され、イメージがエンリッチされました。
🆕 Document Intelligence モデルの選択は、プロジェクトとワークフローに最適な Document Intelligence ソリューションを選ぶためのガイダンスを提供します。

2023 年 4 月

最新の Document Intelligence クライアントライブラリのパブリックプレビューリリースの発表

Document Intelligence REST API バージョン 2023-02-28-preview では、パブリックプレビューリリースのクライアントライブラリがサポートされています。このリリースには、.NET/C# (4.1.0-beta-1)、Java (4.1.0-beta-1)、JavaScript (4.1.0-beta-1)、Python (3.3.0b.1) クライアントライブラリで使用できる次の新機能が含まれています。
詳細については、Document Intelligence SDK (パブリックプレビュー)、および 2023 年 3 月リリースのノートを参照してください

2023 年 3 月

重要

2023-02-28-preview 機能は現在、次のリージョンでのみご利用いただけます:

西ヨーロッパ
米国西部 2
米国東部

カスタム分類モデルは、2023-02-28-preview API 以降の Document Intelligence の新機能です。 Document Intelligence Studio や REST API を使用した、ドキュメント分類機能をお試しください。
一般ドキュメントモデルに追加されたクエリフィールド機能では、Azure OpenAI モデルを使用して、ドキュメントから特定のフィールドを抽出します。 Document Intelligence Studio を使用して、クエリフィールドを含む一般ドキュメント機能をお試しください。クエリフィールドは現在、East US リージョンのリソースに対してのみアクティブです。
アドオン機能:
- フォント抽出が 2023-02-28-preview API で認識されるようになりました。
- 数式抽出が 2023-02-28-preview API で認識されるようになりました。
- 高解像度抽出が 2023-02-28-preview API で認識されるようになりました。
カスタム抽出モデルの更新:
- カスタムニューラルモデルで、トレーニングと分析用に追加された言語がサポートされるようになりました。オランダ語、フランス語、ドイツ語、イタリア語、スペイン語のニューラルモデルをトレーニングします。
- カスタムテンプレートモデルの署名検出機能が強化されました。
Document Intelligence Studio 更新プログラム:
- 分類やクエリフィールドなどのすべての新機能のサポートに加えて、Studio ではカスタムモデルプロジェクトのプロジェクト共有が可能になりました。
- 限定的なプレビューの新しいモデルとして、ワクチン接種カード、契約、米国税 1098、米国税 1098-E、米国税 1098-T が追加されました。限定的なプレビューモデルのアクセスを要求するには、Document Intelligence プライベートプレビュー要求フォームに入力して送信してください。
レシートモデルの更新:
- レシートモデルでは、熱レシートのサポートが追加されました。
- レシートモデルでは、18 言語と 3 つのリージョン言語 (英語、フランス語、ポルトガル語) の言語サポートが追加されました。
- レシートモデルで TaxDetails 抽出がサポートされるようになりました。
レイアウトモデルでテーブル認識が改善されました。
読み取りモデルで、1 桁の文字認識が改善されました。

2023 年 2 月

v3.0 用の Document Intelligence コンテナーを選択できるようになりました。
現在、Read v3.0 と Layout v3.0 のコンテナーを使用できます。

詳細については、Document Intelligence コンテナーをインストールして実行するに関するページを "参照" してください。

2023 年 1 月

事前構築済みのレシートモデル - サポートされている言語が追加されました。レシートモデルで、これらの追加された言語とロケールがサポートされるようになりました
- 日本語 - 日本 (ja-JP)
- フランス語 - カナダ: (fr-CA)
- オランダ語 - オランダ (nl-NL)
- 英語 - アラブ首長国連邦 (en-AE)
- ポルトガル語 - ブラジル (pt-BR)
事前構築済みの請求書モデル - サポートされている言語が追加されました。請求書モデルで、これらの追加された言語とロケールがサポートされるようになりました
- 英語 - 米国 (en-US)、オーストラリア (en-AU)、カナダ (en-CA)、英国 (en-GB)、インド (en-IN)
- スペイン語 - スペイン (es-ES)
- フランス語 - フランス (fr-FR)
- イタリア語 - イタリア (it-IT)
- ポルトガル語 - ポルトガル (pt-PT)
- オランダ語 - オランダ (nl-NL)
事前構築済みの請求書モデル - 認識されるフィールドが追加されました。請求書モデルで、これらの追加されたフィールドが認識されるようになりました
- Currency code
- 支払いオプション
- 割引合計
- 税目 (en-IN のみ)
事前構築済みの ID モデル - サポートされているドキュメントの種類が追加されました。 ID モデルで、これらの追加されたドキュメントの種類がサポートされるようになりました
- 米国の軍 ID

ヒント

2023 年 1 月のすべての更新プログラムは、REST API バージョン 2022-08-31 (GA) で入手できます。

事前構築済みのレシートモデル — 追加の言語サポート:

事前構築済みのレシートモデルで、次の言語のサポートが追加されました。
- 英語 - アラブ首長国連邦 (en-AE)
- オランダ語 - オランダ (nl-NL)
- フランス語 - カナダ: (fr-CA)
- ドイツ語 - (de-DE)
- イタリア語 - (it-IT)
- 日本語 - 日本 (ja-JP)
- ポルトガル語 - ブラジル (pt-BR)
事前構築済みの請求書モデル - 追加の言語サポートとフィールド抽出

事前構築済みの請求書モデルで、次の言語のサポートが追加されました。
- 英語 - オーストラリア (en-AU)、カナダ (en-CA)、英国 (en-UK)、インド (en-IN)
- ポルトガル語 - ブラジル (pt-BR)
事前構築済みの請求書モデルで、次のフィールド抽出のサポートが追加されました。
- Currency code
- 支払いオプション
- 割引合計
- 税目 (en-IN のみ)
事前構築済みの身分証明書モデル - 追加の証明書の種類のサポート

事前構築済みの身分証明書モデルで、次の証明書の種類のサポートが追加されました。
- インド、カナダ、英国、オーストラリアをサポートする運転免許証の拡張
- 米国の軍 ID カードと証明書
- インドの ID カードと証明書 (PAN および Aadhaar)
- オーストラリアの ID カードと証明書 (フォトカード、Key-pass ID)
- カナダの ID カードと証明書 (ID カード、メープルカード)
- 英国の ID カードと証明書 (国/地域の ID カード)

2022 年 12 月

Document Intelligence Studio 更新プログラム

12 月の Document Intelligence Studio リリースには、Document Intelligence Studio の最新の更新プログラムが含まれています。カスタムモデルのラベル付けサポートを中心に、ユーザーエクスペリエンスが大幅に改善されています。
- ページ範囲。 Studio で、ドキュメントの指定ページの分析がサポートされるようになりました。
- カスタムモデルのラベル付け
  - Layout API の自動実行。カスタムモデルのセットアッププロセスで、BLOB ストレージ内のすべてのドキュメントに対して Layout API を自動的に実行するように選択できます。
  - 検索。 Studio に、ドキュメント内の単語を検索する検索機能が追加されました。この改良により、ラベル付けしながらの操作が容易になります。
  - ナビゲーション。ラベルを選択して、ドキュメント内のラベル付き単語をターゲットにすることができます。
  - テーブルの自動ラベル付け。ドキュメント内のテーブルアイコンを選択すると、ラベル付けビューで、抽出されたテーブルの自動ラベル付けを選択できます。
  - ラベルのサブタイプと第 2 レベルのサブタイプ Studio で、テーブル列、テーブル行のサブタイプ、および日付や数値などの型の第 2 レベルのサブタイプがサポートされるようになりました。
カスタムニューラルモデルの構築が、US Gov バージニアリージョンでサポートされるようになりました。
プレビュー API バージョン 2022-01-30-preview および 2021-09-30-preview が、2023 年 1 月 31 日に廃止されます。サービスの中断を避けるために、2022-08-31 API バージョンに更新してください。

2022 年 11 月

Azure AI Document Intelligence ライブラリの最新の安定したリリースを発表
- このリリースには、.NET、Java、JavaScript、Python クライアントライブラリの重要な変更と更新が含まれています。詳細については、「Azure SDK DevBlog」を参照してください。
- 最も重要な機能強化は、 DocumentAnalysisClient と DocumentModelAdministrationClient の 2 つの新しいクライアントの導入です。

2022 年 10 月

Document Intelligence のバージョン管理されたコンテンツ
- Document Intelligence ドキュメントが更新され、バージョン管理されたエクスペリエンスが提供されるようになりました。これで、v3.0 GA エクスペリエンスまたは v2.1 GA エクスペリエンスを対象とするコンテンツを表示することを選択できます。 v3.0 エクスペリエンスが既定です。
Document Intelligence Studio のサンプルコード
- Document Intelligence Studio ラベル付けエクスペリエンスのサンプルコードは、GitHub で使用できるようになりました。顧客は、Document Intelligence を開発して独自の UX に統合したり、Document Intelligence Studio サンプルコードを使用して独自の新しい UX を構築したりすることができます。
言語の増加
- 最新のプレビューリリースでは、Document Intelligence の Read (OCR)、Layout、Custom テンプレートモデルで 134 の新しい言語がサポートされています。これらの言語の追加には、ギリシャ語、ラトビア語、セルビア語、タイ語、ウクライナ語、ベトナム語、いくつかのラテン語とキリル語が含まれます。 Document Intelligence の最新の GA と新しいプレビューバージョンでサポートされる言語は、合計 299 個になりました。サポートされているすべての言語については、サポートされている言語のページを参照してください。
- API または対応する SDK を使用してアプリケーションで新しい言語をサポートする場合は、REST API パラメーター api-version=2022-06-30-preview を使用します。
新しい事前構築済みコントラクトモデル
- パーティ、タイトル、コントラクト ID、実行日などの情報をコントラクトから抽出する新しい事前構築。コントラクトは現在プレビュー段階です。こちらからアクセスを要求してください。
カスタムニューラルモデルをトレーニングするためのリージョンの拡大
- カスタムニューラルモデルのトレーニングは、追加リージョンでサポートされるようになりました。
  - 米国東部
  - 米国東部 2
  - US Gov アリゾナ

2022 年 9 月

Note

バージョン 4.0.0 以降、Document Intelligence サービスの最新機能を活用するために、新しいクライアントセットが導入されています。

SDK バージョン 4.0.0 GA リリースには、次の更新が含まれています。

バージョン 4.0.0 GA (2022-09-08)
REST API v3.0 および v2.0 クライアントをサポート

カスタムニューラルモデルをトレーニングするための領域拡張が、6 つの新しい領域でサポートされるようになりました
- オーストラリア東部
- 米国中部
- 東アジア
- フランス中部
- 英国南部
- 米国西部 2
- トレーニングがサポートされているリージョンの完全な一覧については、カスタムニューラルモデルに関する記事を参照してください。
- Document Intelligence SDK のバージョン 4.0.0 GA リリース:
  - Document Intelligence クライアントライブラリバージョン 4.0.0 (.NET/C#、Java、JavaScript) とバージョン 3.2.0 (Python) が一般公開され、実稼働アプリケーションで使用できます。
  - Document Intelligence クライアントライブラリの詳細については、SDK の概要に関するページを参照してください。
  - プログラミング言語の移行ガイドを使用してアプリケーションを更新します。

2022 年 8 月

Document Intelligence SDK ベータ版 2022 年 8 月のプレビューリリースには、次の更新が含まれています。

バージョン 4.0.0-beta.5 (2022-08-09)

変更ログ/リリース履歴

パッケージ (NuGet)

SDK のリファレンスドキュメント

Document Intelligence v3.0 の一般提供
- Document Intelligence REST API v3.0 が一般公開され、運用アプリケーションで使用できるようになりました。 REST API バージョン 2022-08-31 でアプリケーションを更新してください。
Document Intelligence Studio 更新プログラム
- 次の手順。 Studio の各モデルページの下に、[次の手順] セクションが追加されました。ユーザーは、サンプルコード、トラブルシューティングガイドライン、価格情報をすばやく参照できます。
- カスタムモデル。 Studio には、ラベル付けの効率を向上させるために、カスタムモデルプロジェクトでラベルを並べ替える機能が含まれるようになりました。
- モデルのコピー: カスタムモデルは、Studio 内から Document Intelligence サービス間でコピーできます。この操作により、トレーニング済みのモデルを他の環境やリージョンに昇格できます。
- ドキュメントの削除。 Studio では、カスタムプロジェクト内のラベル付きデータセットからドキュメントを削除できるようになりました。
Document Intelligence サービス更新プログラム
- prebuilt-read。 Read OCR モデルは Document Intelligence でも使用できるようになり、2 つの新機能として、段落と言語検出を備えています。 Document Intelligence の読み取りは、Document Intelligence のより広範なドキュメントインテリジェンス機能に合わせた高度なドキュメントシナリオを対象とします。
- 事前構築済みレイアウト。レイアウトモデルでは、段落が抽出され、抽出されたテキストが段落、タイトル、セクション見出し、脚注、ページヘッダー、ページフッター、またはページ番号のいずれであるかが抽出されます。
- 事前構築済みの請求書。 TotalVAT フィールドと Line/VAT フィールドが、それぞれ既存のフィールド TotalTax と Line/Tax に解決されるようになりました。
- 事前構築済みの ID ドキュメント。データ抽出で、米国の州 ID、社会保障、グリーンカードがサポートされます。パスポートビザ情報がサポートされます。
- 事前構築済みのレシート。フランス語 (fr-FR)、スペイン語 (es-ES)、ポルトガル語 (pt-PT)、イタリア語 (it-IT)、ドイツ語 (de-DE) のロケールサポートが拡張されました。
- 事前構築済みの名刺。住所、市区町村、都道府県、国および地域、郵便番号などの住所コンポーネントのサブフィールドを抽出するためのアドレス解析のサポート。
AI 品質の改善
- prebuilt-read。単一文字、手書きの日付、金額、名前、領収書や請求書でよく見られるその他キーデータのサポートが強化され、デジタル PDF ドキュメントの処理が改善されました。
- 事前構築済みレイアウト。トリミングされたテーブルの検出、罫線のないテーブルの検出、長いスパンセルの認識の向上をサポートします。
- 事前構築済みドキュメント。値とチェックボックスの検出が改善されました。
- カスタムニューラル。テーブルの検出と抽出の精度が向上しました。

2022 年 6 月

Document Intelligence SDK ベータ版 2022 年 6 月のプレビューリリースには、次の更新プログラムが含まれています。

バージョン 4.0.0-beta.4 (2022-06-08)

変更ログ/リリース履歴

パッケージ (NuGet)

SDK のリファレンスドキュメント

6 月の Document Intelligence Studio のリリースは、Document Intelligence Studio の最新の更新プログラムです。この更新プログラムでは、ユーザーエクスペリエンスとユーザー補助に関するかなりの機能強化が行われました。
- JavaScript と C# のコードサンプル。既にある Python のコードサンプルに加え、JavaScript と C# コードサンプルが Studio の [コード] タブに追加されました。
- 新しいドキュメントアップロード UI。 Studio では、ドキュメントを新しいアップロードユーザーインターフェイスにドラッグアンドドロップしてアップロードできるようになりました。
- カスタムプロジェクトの新機能。カスタムプロジェクトでは、プロジェクトの構成時にストレージアカウントと BLOB の作成ができるようになりました。さらに、カスタムプロジェクトでは、Studio 内でのトレーニングファイルの直接アップロードや、既存のカスタムモデルのコピーができるようになりました。
Document Intelligence v3.0 2022 年 6 月 30 日プレビュー リリースでは、機能 API 全体に広範な更新が行われています。
- レイアウトでは、構造の抽出が拡張されています。レイアウトに、セクション、セクションヘッダー、段落などの構造要素が追加されています。この更新プログラムを使用すると、ドキュメントのセグメント化シナリオをより詳細に設定できます。識別された構造要素の完全な一覧については、拡張構造に関するページを参照してください。
- カスタムニューラルモデルの表形式フィールドがサポートされます。カスタムドキュメントモデルで表形式フィールドがサポートされるようになりました。既定では、表形式フィールドも複数ページです。カスタムニューラルモデルの表形式フィールドの詳細については、表形式フィールドに関するページを参照してください。
- カスタムテンプレートモデルの表形式フィールドでは、ページ間テーブルがサポートされます。カスタムフォームモデルで、ページ間の表形式フィールドがサポートされるようになりました。カスタムテンプレートモデルの表形式フィールドの詳細については、「表形式フィールドに関するページを参照してください。
- 請求書モデルの出力に、一般的なドキュメントのキーと値のペアが含まれるようになりました。請求書に、事前構築済みモデルに含まれるフィールド以外の必須フィールドが含まれている場合、一般的なドキュメントモデルでは、キーと値のペアで出力が補完されます。キーと値のペアに関するページを参照してください。
- 請求書言語の拡張。請求書モデルには、拡張された言語サポートが含まれています。サポートされる言語に関するページを参照してください。
- 事前構築済みの名刺に、日本語サポートが含まれるようになりました。サポートされる言語に関するページを参照してください。
- 事前構築済みの ID ドキュメントモデル。 ID ドキュメントモデルで、米国の運転免許証から DateOfIssue、Height、Weight、EyeColor、HairColor、DocumentDiscriminator が抽出されるようになりました。フィールドの抽出に関するページを参照してください。
- 読み取りモデルで、一般的な Microsoft Office ドキュメントの種類がサポートされるようになりました。 Word (docx)、Excel (xlsx)、PowerPoint (pptx) などのドキュメントの種類が、Read API でサポートされるようになりました。読み取りデータ抽出に関するページを参照してください。

2022 年 2 月

バージョン 4.0.0-beta.3 (2022-02-10)

変更ログ/リリース履歴

パッケージ (NuGet)

SDK のリファレンスドキュメント

Document Intelligence v3.0 プレビューリリースでは、いくつかの新機能、機能と機能強化が導入されています。
- カスタムニューラルモデルまたはカスタムドキュメントモデルは、構造化フォーム、半構造化ドキュメント、非構造化ドキュメントからテキストと選択マークを抽出する、新しいカスタムモデルです。
- W-2 事前構築済みモデル は、税務報告および所得検証シナリオのために W-2 フォームからフィールドを抽出するための新しい事前構築モデルです。
- 読み取り API は、印刷されたテキスト行、単語、テキスト位置、検出された言語、および手書きテキストを抽出します (検出された場合)。
- 一般的なドキュメント事前トレーニング済みモデルが更新され、フォームとドキュメントからの API テキスト、テーブル、構造、キーと値のペアに加えて、選択マークがサポートされます。
- Invoice API 請求書の事前構築済みモデルは、スペイン語の請求書もサポートするように拡張されています。
- Document Intelligence Studio では、Read、W2、Hotel のレシートサンプルの新しいデモと、新しいカスタムニューラルモデルのトレーニングのサポートが追加されます。
- 言語拡張: Document Intelligence の読み取り、レイアウト、カスタムフォームでは、アラビア語、ヒンディ語、およびアラビア文字とデーヴァナーガリー文字を使用したその他の言語を含む 42 の新しい言語のサポートが追加され、164 の言語に範囲が広がっています。手書き言語のサポートが、日本語と韓国語に拡張されています。
v3.0 プレビュー API の新しい REST API、Python、または .NET SDK を利用できます。

Document Intelligence モデルのデータ抽出:

モデル	テキストの抽出	キーと値のペア	選択マーク	テーブル	シグネチャ
Read	✓
一般ドキュメント	✓	✓	✓	✓
Layout	✓		✓	✓
請求書	✓	✓	✓	✓
Receipt	✓	✓			✓
身分証明書	✓	✓
名刺	✓	✓
カスタムテンプレート	✓	✓	✓	✓	✓
カスタムニューラル	✓	✓	✓	✓

Document Intelligence SDK ベータ版のプレビューリリースには、次の更新プログラムが含まれています。
- カスタムドキュメントモデルとモード:
  - カスタムテンプレート (以前のカスタムフォーム)。
  - カスタムニューラル
  - カスタムモデル - ビルドモード
- W-2 事前構築済みモデル (prebuilt-tax.us.w2)。
- 読み取り事前構築済みモデル (prebuilt-read)。
- 請求書の事前構築済みモデル (スペイン語) (prebuilt-invoice)。

2021 年 11 月

バージョン 4.0.0-beta.2 (2021-11-09)

| パッケージ (NuGet) | 変更ログ/リリース履歴 | API リファレンスドキュメント

Document Intelligence v3.0 プレビュー SDK リリース更新プログラム (ベータ 2) には、バグ修正とマイナーな機能更新プログラムが組み込まれています。

2021 年 10 月

Document Intelligence v3.0 プレビューリリースバージョン 4.0.0-beta.1 (2021 年 10 月 7 日) では、いくつかの新機能が導入されています
- 一般的なドキュメント モデルは新しい API であり、事前トレーニング済みのモデルを使用して、フォームとドキュメントからテキスト、テーブル、構造、キーと値のペアを抽出します。
- ホテルの領収書モデルが、構築済みの受信確認処理に追加されました。
- 身分証明書の展開されたフィールド ID モデルでは、米国の運転免許証からの署名、制限、車両分類の抽出がサポートされています。
- 署名フィールドは、フォームフィールド内の署名の有無を検出するカスタムフォームの新しいフィールドの種類です。
- 言語の展開 122 言語 (印刷) と 7 言語 (手書き) のサポート。 Document Intelligence のレイアウトとカスタムフォームでは、最新のプレビューでサポートされる言語が 122 個に拡大されました。このプレビューには、49 個の新しい言語 (ロシア語、ブルガリア語、その他のキリル語系やラテン語系など) での印刷テキストに対するテキスト抽出が含まれています。また、手書きテキストの抽出では、英語を含む 7 個の言語と、新たに簡体字中国語、フランス語、ドイツ語、イタリア語、ポルトガル語、スペイン語の新しいプレビューがサポートされるようになりました。
- テーブルとテキスト抽出の機能強化 レイアウトは、キーと値のテーブルとも呼ばれる単一行テーブルの抽出をサポートするようになりました。テキスト抽出の機能強化には、デジタル PDF や身分証明書内の機械可読ゾーン (MRZ) テキストの処理の向上、全般的なパフォーマンスの向上が含まれます。
- Document Intelligence Studio サービスの使用を簡単にするために、Document Intelligence Studio にアクセスして、さまざまな事前構築済みモデルをテストしたり、カスタムモデルにラベルを付けてトレーニングしたりすることができるようになりました。
- v3.0 プレビュー API の新しい REST API、Python、または .NET SDK を利用できます。

Document Intelligence モデルのデータ抽出

モデル	テキストの抽出	キーと値のペア	選択マーク	テーブル
一般ドキュメント	✓	✓	✓	✓
Layout	✓		✓	✓
請求書	✓	✓	✓	✓
Receipt	✓	✓
身分証明書	✓	✓
名刺	✓	✓
Custom	✓	✓	✓	✓

2021 年 9 月

Azure portal の Document Intelligence リソースの概要ページで、Azure メトリックスエクスプローラーの高度な機能を使用できます。
監視メニュー:
グラフ:
身分証明書モデルの更新: サフィックスを含む名前がある場合、ピリオド (フルストップ) の有無にかかわらず、正常に処理されます。

入力テキスト更新された結果

William Isaac Kirby Jr. FirstName: William Isaac

LastName: Kirby Jr.

Henry Caleb Ross Sr FirstName: Henry Caleb

LastName: Ross Sr.

入力テキスト	更新された結果
William Isaac Kirby Jr.	FirstName: William Isaac LastName: Kirby Jr.
Henry Caleb Ross Sr	FirstName: Henry Caleb LastName: Ross Sr.

2021 年 7 月

システム割り当てマネージド ID のサポート: システム割り当てマネージド ID を有効にして、プライベートストレージアカウントへの制限付きアクセスを Document Intelligence に許可できるようになりました。これには、Virtual Network またはファイアウォールで保護されているアカウントや、BYOS (Bring Your Own Storage) が有効になっているアカウントが含まれます。詳細については、「Document Intelligence リソース用のマネージド ID を作成して使用する」を参照してください。

2021 年 6 月

| リファレンスドキュメント | NuGet パッケージバージョン 3.1.1 |

Document Intelligence コンテナー v2.1 はゲートプレビューでリリースされ、レイアウト、名刺、ID ドキュメント、領収書、請求書、カスタムの 6 つの機能コンテナーでサポートされるようになりました。これらを使用するには、オンラインリクエストを送信し、承認を受ける必要があります。
- 「Document Intelligence 向け Docker コンテナーをインストールおよび実行する」と「Document Intelligence コンテナーを構成する」を参照してください。
プレビューでリリースされた Document Intelligence コネクタ: Document Intelligence コネクタは、Azure Logic Apps、Microsoft Power Automate、および Microsoft Power Apps と統合されます。このコネクタは、カスタムおよび事前構築済みのフォーム、請求書、レシート、名刺、身分証明書から、ドキュメントのデータと構造を抽出および分析するワークフローのアクションとトリガーをサポートしています。
Document Intelligence SDK v3.1.0 に、C#、Java、Python 用のパッチが適用され、v3.1.1 になりましたこのパッチは、FormField に Text があるが BoundingBox や Page の情報がないなど、サブ行項目フィールドが検出されない請求書に対処しています。

2021 年 5 月

バージョン 3.1.0 (2021-05-26)

変更ログ/リリース履歴| リファレンスドキュメント | NuGet パッケージバージョン 3.0.1 |

Document Intelligence 2.1 は一般提供されています。 GA リリースは、以前の 2.1 プレビューパッケージバージョンで導入された変更の安定性を示しています。このリリースでは、次の種類のドキュメントから情報とデータを検出して抽出することができます。
開始するには、Document Intelligence サンプルツールを試し、クイックスタートに従ってください。
更新された Layout API テーブル機能では、複数の行にまたがることができる列ヘッダーを使用してヘッダーが認識されます。各テーブルセルには、ヘッダーの一部であるかどうかを示す属性があります。この更新は、テーブルヘッダーを構成する行を識別するために使用できます。

2021 年 4 月

NuGet パッケージバージョン 3.1.0-ベータ.4
変更ログ/リリース履歴。
身分証明書のデータ分析用の新しいメソッド:

StartRecognizeIdDocumentsFromUriAsync

StartRecognizeIdDocumentsAsync

フィールド値の一覧については、Document Intelligence ドキュメントの「抽出されるフィールド」を参照してください。
StartRecognizeContent メソッドに指定できるドキュメント言語のセットが拡大されました。
新しいプロパティ Pages が次のクラスでサポートされました:

RecognizeBusinessCardsOptions
RecognizeCustomFormsOptions
RecognizeInvoicesOptions
RecognizeReceiptsOptions

Pages プロパティを使用すると、複数のページがある PDF および TIFF ドキュメントの個々のページまたはページの範囲を選択できます。個々のページの場合は、「3」のようにページ番号を入力します。ページの範囲 (ページ 2 とページ 5 - 7 など) の場合は、「2, 5-7」のようにページ番号と範囲をコンマで区切って入力します。
新しいプロパティ ReadingOrder が次のクラスでサポートされました:

RecognizeContentOptions

ReadingOrder プロパティは省略可能なパラメーターであり、これを使用すると、テキスト要素の抽出順序を決めるために、basic または natural のどちらの読み取り順序アルゴリズムを適用するかを指定できます。指定しない場合は、既定値の basic が使用されます。

Maven アーティファクトパッケージの依存関係バージョン 3.1.0-beta.3

身分証明書のデータ分析用の新しいメソッド:

[beginRecognizeIdDocumentsFromUrl]

[beginRecognizeIdDocuments]

フィールド値の一覧については、Document Intelligence ドキュメントの「抽出されるフィールド」を参照してください。
** FormContentType フィールドでのカスタムのフォームおよびトレーニング方法を対象にしたビットマップ画像ファイル (.bmp) のサポート:
- image/bmp
- 新しいプロパティ Pages が次のクラスでサポートされました:
RecognizeBusinessCardsOptions
RecognizeCustomFormOptions
RecognizeInvoicesOptions
RecognizeReceiptsOptions
- Pages プロパティを使用すると、複数のページがある PDF および TIFF ドキュメントの個々のページまたはページの範囲を選択できます。個々のページの場合は、「3」のようにページ番号を入力します。ページの範囲 (ページ 2 とページ 5 - 7 など) の場合は、「2, 5-7」のようにページ番号と範囲をコンマで区切って入力します。
新しいキーワード引数 ReadingOrder が次のメソッドでサポートされました:
- beginRecognizeContent.
- beginRecognizeContentFromUrl.
- ReadingOrder キーワード引数は省略可能なパラメーターであり、これを使用すると、テキスト要素の抽出順序を決めるために、basic または natural のどちらの読み取り順序アルゴリズムを適用するかを指定できます。指定しない場合は、既定値の basic が使用されます。
既定により、クライアントは、サポートされている最新のサービスバージョンになります。現在は 2.1-preview.3 です。

npm パッケージバージョン 3.1.0-beta.3

身分証明書のデータ分析用の新しいメソッド:

azure-ai-form-recognizer-formrecognizerclient-beginrecognizeidentitydocumentsfromurl

beginRecognizeIdDocuments

フィールド値の一覧については、Document Intelligence ドキュメントの「抽出されるフィールド」を参照してください。
新しいフィールド値が FieldValue インターフェイスに追加されました:

gender—使用可能な値は MFX のいずれかです。
country—使用可能な値は gender の 3 文字の国番号文字列に従います。
すべてのドキュメントインテリジェンスメソッド (カスタムフォームおよびすべての事前構築済みモデル) でサポートされている新しいオプション pages。この引数を使用すると、複数のページがある PDF および TIFF ドキュメントの個々のページまたはページの範囲を選択できます。個々のページの場合は、「3」のようにページ番号を入力します。ページの範囲 (ページ 2 とページ 5 - 7 など) の場合は、「2, 5-7」のようにページ番号と範囲をコンマで区切って入力します。
コンテンツ認識メソッドに ReadingOrder 型のサポートが追加されました。このオプションを使用すると、認識されたテキスト行の順序を決定するためにサービスで使用されるアルゴリズムを制御できます。テキスト要素の抽出順序を決めるために、basic または natural のどちらの読み取り順序アルゴリズムを適用するかを指定できます。指定しない場合は、既定値の basic が使用されます。
FormField 型が複数の異なるインターフェイスに分割されました。この更新によって、特定のエッジケース (未定義の valueType) を除き、API 互換性の問題は発生しません。
すべての REST API 呼び出しで 2.1-preview.3 の Document Intelligence サービスエンドポイントに移行しました。

pip パッケージバージョン 3.1.0b4

身分証明書のデータ分析用の新しいメソッド:

begin_recognize_id_documents_from_url

begin_recognize_id_documents

フィールド値の一覧については、Document Intelligence ドキュメントの「抽出されるフィールド」を参照してください。
新しいフィールド値が FieldValueType 列挙型に追加されました:

gender—使用可能な値は MFX のいずれかです。

country—使用可能な値は ISO alpha-3 国別コードに従います。
FormContentType 列挙型でのカスタムのフォームおよびトレーニング方法を対象にしたビットマップ画像ファイル (.bmp) のサポート:
新しいキーワード引数 pages が次のメソッドでサポートされました:

begin_recognize_receipts

begin_recognize_receipts_from_url

begin_recognize_business_cards

begin_recognize_business_cards_from_url

begin_recognize_invoices

begin_recognize_invoices_from_url

begin_recognize_content

begin_recognize_content_from_url

pages キーワード引数を使用すると、複数のページがある PDF および TIFF ドキュメントの個々のページまたはページの範囲を選択できます。個々のページの場合は、「3」のようにページ番号を入力します。ページの範囲 (ページ 2 とページ 5 - 7 など) の場合は、「2, 5-7」のようにページ番号と範囲をコンマで区切って入力します。
新しいキーワード引数 readingOrder が次のメソッドでサポートされました:

begin_recognize_content

begin_recognize_content_from_url

readingOrder キーワード引数は省略可能なパラメーターであり、これを使用すると、テキスト要素の抽出順序を決めるために、basic または natural のどちらの読み取り順序アルゴリズムを適用するかを指定できます。指定しない場合は、既定値の basic が使用されます。

API バージョン 2.1-preview.3 の SDK プレビューの更新では、機能の更新と機能強化が導入されています。

2021 年 3 月

Document Intelligence v2.1 パブリックプレビュー v2.1-preview.3 がリリースされ、次の機能が含まれています。

新しい事前構築済み ID モデル 新しい事前構築済み ID モデルを使用すると、お客様は ID を取得して構造化データを返し、処理を自動化できます。強力な光学式文字認識 (OCR) 機能と ID 理解モデルを組み合わせて、パスポートと米国の運転免許証から重要な情報を抽出します。

事前作成された ID モデルの詳細情報
請求書モデルの品目抽出 - 事前構築済み請求書モデルは品目抽出をサポートするようになりました。完全な項目とその一部 (説明、金額、数量、製品 ID、日付など) が抽出されるようになりました。簡単な API または SDK の呼び出しにより、請求書から有用なデータ (テキスト、テーブル、キーと値のペア、品目) を抽出できます。

請求書モデルの詳細情報。
監視対象テーブルのラベル付けとトレーニング、空の値のラベル付け - Document Intelligence の最先端のディープラーニング自動テーブル抽出機能に加えて、お客様がテーブルに対してラベル付けとトレーニングを行えるようになりました。この新しいリリースには、品目とテーブル (動的と固定) にラベルを付けてトレーニングし、キーと値のペアと品目を抽出するカスタムモデルをトレーニングする機能が含まれています。モデルのトレーニングが完了すると、モデルにより documentResults セクションの JSON 出力の一部として品目が抽出されます。

テーブルにラベルを付けるだけでなく、空の値と領域にラベルを付けることができるようになりました。トレーニングセット内の一部のドキュメントに特定のフィールドの値がない場合、それらにラベルを付けることで、分析対象のドキュメントから値を適切に抽出するようにモデルに認識させることができます。
66 の新しい言語のサポート - Document Intelligence の Layout API とカスタムモデルは 73 の言語をサポートするようになりました。

Document Intelligence の言語サポートの詳細情報。
自然な読み取り順序、手書きの分類、およびページ選択 - この更新により、既定の左から右、また上から下の順序ではなく、自然な読み取り順序でテキスト行の出力を取得することを選択できます。新しい readingOrder クエリパラメーターを使用して "自然な" 値に設定すると、より人間にとってわかりやすい読み取り順序の出力が得られます。さらに、ラテン系言語の場合、Document Intelligence により、テキスト行が手書きスタイルかどうかが分類され、信頼スコアが与えられます。
事前構築済み領収書モデルの品質改善 この更新には、特に品目の抽出に関する、事前構築済み領収書モデルの品質改善が多数含まれています。

2020 年 11 月

Document Intelligence v2.1-preview.2 がリリースされ、次の機能が含まれています。
- 新しい事前構築済み請求書モデル - 新しい事前構築済み請求書モデルにより、お客様はさまざまな形式で請求書を取得し、構造化されたデータを返して、請求書の処理を自動化することができます。強力な光学式文字認識 (OCR) 機能と、請求書を解釈するディープラーニングモデルを組み合わせて、英語の請求書から重要な情報を抽出します。顧客、仕入先、請求書 ID、請求書の期限、合計、請求額、課税額、出荷先、請求先などの重要なテキスト、テーブル、情報が抽出されます。
  
  事前作成された請求書モデルの詳細情報
- 強化されたテーブル抽出 - Document Intelligence によって、強力な光学式文字認識 (OCR) 機能とディープラーニングテーブル抽出モデルを組み合わせた拡張テーブル抽出が提供されるようになりました。 Document Intelligence では、テーブル (結合された列、行、境界線を含む複雑なテーブルなど) からデータを抽出できます。
  
  レイアウト抽出の詳細情報。
- クライアントライブラリの更新 - .NET、Python、Java、JavaScript 用のクライアントライブラリの最新バージョンでは、Document Intelligence 2.1 API がサポートされています。
- 新たに日本語をサポート - AnalyzeLayout と AnalyzeCustomForm で新たに日本語 (ja) がサポートされます。言語サポート。
- テキスト行のスタイルの表示 (手書き/その他) (ラテン言語のみ) - Document Intelligence では、信頼度スコアと共に、各テキスト行が手書きスタイルであるかどうかを分類する appearance オブジェクトが出力されるようになりました。この機能は、ラテン語系の言語でのみサポートされています。
- 品質の向上 - 1 桁の抽出の改善を含め、抽出の品質が向上しました。
- Document Intelligence のサンプルラベル付けツールの新しい試用機能 - Document Intelligence サンプルラベル付けツールを使用して、事前作成された請求書、領収書、およびビジネスカードモデルと Layout API を試すことができます。コードを記述することなく、データがどのように抽出されるかを確認してください。
- Document Intelligence サンプルラベル付けツールを試す
  - フィードバックループ - サンプルラベル付けツールを使用してファイルを分析するときに、それをトレーニングセットに追加し、必要に応じてラベルを調整して、モデルを改善するためにトレーニングできるようになりました。
  - ドキュメントの自動ラベル付け - プロジェクト内のラベル付けされた以前のドキュメントに基づいて、追加のドキュメントが自動的にラベル付けされます。

2020 年 8 月

**Document Intelligence v2.1-preview.1 には、次の機能が含まれています。
- REST API リファレンスが利用可能です。v2.1-preview.1 reference を参照。
- 英語の他に新たに言語をサポート。Layout と Train Custom Model で新たに、英語 (en)、簡体中国語 (zh-Hans)、オランダ語 (nl)、フランス語 (fr)、ドイツ語 (de)、イタリア語 (it)、ポルトガル語 (pt)、スペイン語 (es) の各言語がサポートされます。
- チェックボックス、選択マークの検出 – Document Intelligence では、チェックボックスやオプションボタンなどの選択マークの検出および抽出がサポートされています。選択マークは Layout で抽出されます。また、Train Custom Model - [ラベルを使用したトレーニング] でラベル付けおよびトレーニングを行って、選択マーク用のキーと値のペアを抽出することもできるようになりました。
- [モデルの作成] を使用すると、1 つのモデル ID で複数のモデルを構成して呼び出すことができます。作成済みのモデル ID を使用して分析するドキュメントを送信すると、分類ステップが最初に実行され、適切なカスタムモデルにルーティングされます。モデルの作成は、Train Custom Model - Train Custom Model で使用できます。
- モデル名。管理と追跡が容易になるように、カスタムモデルにわかりやすい名前を追加します。
- 新しく事前に構築された名刺のモデル。英語の名刺内の共通のフィールドを抽出するためのものです。
- 事前構築レシートの新しいロケールが、EN-US に加えて、EN-AU、EN-CA、EN-GB、EN-IN でもサポートされ、利用が可能になりました。
- 品質向上。Layout、Train Custom Model - [ラベルを使用しないトレーニング]、および [ラベルを使用したトレーニング] が対象となります。
v2.0 には、次の更新が含まれています。
- NET、Python、Java、JavaScript 用のクライアントライブラリは一般提供されています。
新しいサンプルは GitHub で入手できます。
- 知識抽出レシピ - Forms Playbook では、Document Intelligence の実際のカスタマーエンゲージメントからベストプラクティスが収集され、これらのプロジェクトの開発時に使用する便利なコードサンプル、チェックリスト、およびサンプルパイプラインが提供されます。
- サンプルラベル付けツールが更新され、新しい v2.1 機能がサポートされるようになりました。ツールの概要については、こちらのクイックスタートを参照してください。
- インテリジェントキオスク Document Intelligence サンプルでは、Analyze Receipt と Train Custom Model - [ラベルを使用しないトレーニング] を統合する方法について示します。

2020 年 7 月

Document Intelligence v2.0 リファレンスが使用可能 - v2.0 API リファレンスと、.NET、Python、Java、および JavaScript 用のアップデートされたクライアントライブラリを参照できます。
- テーブルの機能強化と抽出の機能強化には、精度の向上とテーブル抽出の機能強化が含まれています。特に、"ラベルのないカスタムトレーニング" でテーブルのヘッダーと構造を学習する機能が追加されています。
- 通貨のサポート - グローバル通貨記号の検出と抽出。
- Azure Gov - Document Intelligence が、Azure Gov でも使用できるようになりました。
- 強化されたセキュリティ機能:
  - Bring Your Own Key - Document Intelligence は、クラウドに永続化されたときにデータを自動的に暗号化して保護し、セキュリティとコンプライアンスに関する組織のコミットメントを満たすのに役立つようにします。サブスクリプションでは、Microsoft が管理する暗号化キーが既定で使用されます。ユーザー独自の暗号化キーを使用してサブスクリプションを管理することもできるようになりました。カスタマーマネージドキー (Bring Your Own Key (BYOK) とも呼ばれます) を使用すると、アクセス制御の作成、ローテーション、無効化、取り消しを、いっそう柔軟に行うことができますまた、データを保護するために使われる暗号化キーを監査することもできます。
  - プライベートエンドポイント – 仮想ネットワークを使用して、Private Link を介してデータに安全にアクセスできるようになります。

2020 年 6 月

クライアントライブラリへの CopyModel API の追加 - クライアントライブラリを使用して、サブスクリプション間でモデルをコピーできるようになりました。この機能の全般的な情報については、モデルのバックアップと復旧に関する記事を参照してください。
Azure Active Directory の統合 - Azure AD の資格情報を使用して、クライアントライブラリで Document Intelligence クライアントオブジェクトを認証できるようになりました。
SDK 固有の変更 - この変更には、小さな機能追加と破壊的な変更の両方が含まれます。詳細については、SDK の変更ログを参照してください。

2020 年 4 月

Document Intelligence API v2.0 パブリックプレビューの SDK サポート - 今月、サービスサポートが拡張され、Document Intelligence v2.0 リリースのプレビュー SDK が含まれるようになりました。以下のリンクを使用して、任意の言語で作業を開始してください。
.NET SDK
Java SDK
Python SDK
JavaScript SDK

新しい SDK では、Document Intelligence 用の v2.0 REST API のすべての機能がサポートされています。クライアントライブラリに関するフィードバックは、SDK フィードバックフォームを通じて共有できます。

カスタムモデルのコピー 新しいカスタムモデルのコピー機能を使用して、リージョン間やサブスクリプション間でモデルをコピーできるようになりました。 Copy Custom Model API を呼び出す前に、まずターゲットリソースにコピーするための認可を取得する必要があります。この認可は、ターゲットリソースエンドポイントに対してコピー認可操作を呼び出すとセキュリティ保護されます。
コピー承認 REST API の生成。
カスタムモデル REST API のコピー。
セキュリティの強化。
FormRecognizer でカスタマーマネージドキーが利用できるようになりました。詳細については、「Document Intelligence による保存データの暗号化」を参照してください。
Azure Active Directory を使用した Azure リソースへのアクセスにマネージド ID を使用します。詳細については、マネージド ID に対するアクセスの承認に関するページを参照してください。

2020 年 3 月

ラベル付けの値の種類 Document Intelligence サンプルラベル付けツールを使用して、ラベル付けする値の種類を指定できるようになりました。現在、次の値の型とバリエーションがサポートされています。
string
- 既定値、no-whitespaces、alphanumeric
number
- 既定値、currency
date
- 既定値、dmy、mdy、ymd
time
integer

この機能の使用方法については、サンプルラベル付けツールガイドを参照してください。

テーブルの視覚化 サンプルラベル付けツールで、ドキュメントで認識されたテーブルが表示されるようになりました。この機能により、ラベル付けおよび分析を行う前に、ドキュメントから認識されて抽出されたテーブルを表示できます。この機能は、レイヤーオプションを使用してオンとオフを切り替えることができます。
次の図に、テーブルが認識されて抽出される方法の例を示します。
抽出されたテーブルは、"pageResults" の JSON 出力で使用できます。

重要

テーブルのラベル付けはサポートされていません。テーブルの認識と抽出が自動的に行われない場合は、キーと値のペアとしてのみラベルを付けることができます。キーと値のペアとしてテーブルのラベル付けを行うときは、各セルに固有の値としてラベルを付けます。
抽出機能の強化。
このリリースでは、抽出の機能強化と精度の向上が行われています。具体的には、テキストの同じ行に複数のキーと値のペアが含まれる場合の、ラベル付けと抽出の機能です。
サンプルのラベル付けツールがオープンソースになりました。
Document Intelligence のサンプルラベル付けツールが、オープンソースプロジェクトとして使用できるようになりました。ソリューションにそれを統合し、ニーズに合わせて顧客固有の変更を行うことができます。
Document Intelligence のサンプルラベル付けツールの詳細については、GitHub で入手できるドキュメントを参照してください。
TLS 1.2 の適用。
TLS 1.2 は現在、このサービスへのすべての HTTP 要求に適用されるようになりました。詳しくは、Azure AI サービスのセキュリティをご覧ください。

2020 年 1 月

このリリースでは、Document Intelligence 2.0 が導入されています。次のセクションでは、新機能、機能強化、および変更の詳細について説明します。

新機能
- カスタムモデル
  - ラベルを使用したトレーニング 手動でラベル付けされたデータを使用して、カスタムモデルをトレーニングできるようになりました。この方法より、性能の高いモデルが得られ、複雑なフォームやキーのない値を含んだフォームでも機能するモデルを作成することが可能です。
  - 非同期 API 非同期 API 呼び出しを使用して、大規模なデータセットおよびファイルをトレーニングして分析できます。
  - TIFF ファイルのサポート TIFF ドキュメントからのデータをトレーニングして、抽出できるようになりました。
  - 抽出精度の向上。
- 構築済みのレシートモデル
  - チップの金額 チップの金額とその他の手書きの値を抽出できるようになりました。
  - 品目の抽出 レシートから品目の値を抽出できます。
  - 信頼値 抽出された各値のモデルの信頼度を表示できます。
  - 抽出精度の向上。
  - レイアウトの抽出 レイアウト API を使用して、フォームからテキストデータとテーブルデータを抽出できるようになりました。
カスタムモデル API の変更点

カスタムモデルのトレーニングと使用のための API 名がすべて変更され、一部の同期メソッドは非同期になりました。主な変更点は次のとおりです。
- モデルのトレーニングプロセスが非同期になりました。 /custom/models API 呼び出し経由で、トレーニングを開始します。この呼び出しでは、操作 ID が返されます。この ID を custom/models/{modelID} に渡すと、トレーニング結果を返すことができます。
- キー/値の抽出は、 /custom/models/{modelID}/analyze API 呼び出しによって開始されるようになりました。この呼び出しでは操作 ID が返され、それを custom/models/{modelID}/analyzeResults/{resultID} に渡すと、抽出結果を返すことができます。
- トレーニング操作の操作 ID は、Operation-Location ヘッダーではなく、HTTP 応答の Location ヘッダー内に配置されるようになりました。
レシート API の変更点
- 販売レシートを読み取るための API の名前が変更されました。
- レシートデータの抽出は、 /prebuilt/receipt/analyze API 呼び出しによって開始されるようになりました。この呼び出しでは操作 ID が返され、それを /prebuilt/receipt/analyzeResults/{resultID} に渡すと、抽出結果を返すことができます。
出力形式の変更点
- すべての API 呼び出しへの JSON 応答には、新しい形式が用意されています。一部のキーと値が追加、削除、または名前変更されました。現在の JSON 形式の例については、クイックスタートを参照してください。

次のステップ

Document Intelligence Studio を使用して独自のフォームとドキュメントの処理を試す。
Document Intelligence クイックスタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。

Document Intelligence サンプルラベル付けツールを使用して独自のフォームとドキュメントの処理を試す。
Document Intelligence クイックスタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。

Azure AI Document Intelligence の新機能

2024 年 2 月

2023 年 12 月

2023 年 11 月

2023 年 7 月

2023 年 5 月

2023 年 4 月

2023 年 3 月

2023 年 2 月

2023 年 1 月

2022 年 12 月

2022 年 11 月

2022 年 10 月

2022 年 9 月

2022 年 8 月

2022 年 6 月

2022 年 2 月

2021 年 11 月

2021 年 10 月

2021 年 9 月

2021 年 7 月

2021 年 6 月

2021 年 5 月

2021 年 4 月

2021 年 3 月

2020 年 11 月

2020 年 8 月

2020 年 7 月

2020 年 6 月

2020 年 4 月

2020 年 3 月

2020 年 1 月

次のステップ

その他のリソース