Azure Form Recognizer の新機能

Form Recognizer サービスは、継続的に更新されます。 このページにブックマークを設定して、リリースノート、機能の強化、およびドキュメントの更新についての最新情報を入手してください。

2021 年 11 月

Form Recognizer v3.0 プレビュー SDK リリースの更新 (beta.2)

Azure Form Recognizer SDK の beta.2 バージョンがリリースされました。 この新しいベータ リリースには、バグ修正とマイナー機能更新プログラムが含まれています。

| | 変更ログAPI リファレンス ドキュメント

修正されたバグ

BuildModelOperationCopyModelOperationPercentCompleted プロパティが正しく設定されるようになり、定数値 0 が返されることがなくなりました。

2021 年 10 月

Form Recognizer v3.0 プレビュー リリース (beta.1)

Form Recognizer v3.0 プレビュー リリースでは、いくつかの新機能が導入されています。

  • 一般的なドキュメント モデルは新しい API であり、事前トレーニング済みのモデルを使用して、テキスト、テーブル、構造、キーと値のペア、名前付きエンティティがフォームとドキュメントから抽出されます。

  • ホテルの領収書モデルが、構築済みの受信確認処理に追加されました。

  • 身分証明書の展開されたフィールド ID モデルでは、米国の運転免許証からの署名、制限、車両分類の抽出がサポートされています。

  • 署名フィールドは、フォーム フィールド内の署名の有無を検出するカスタム フォームの新しいフィールドの種類です。

  • 言語の展開 122 言語 (印刷) と 7 言語 (手書き) のサポート。 Form Recognizer のレイアウトとカスタム フォームでは、最新のプレビューでサポートされる言語が 122 個に拡大されました。 このプレビューには、49 個の新しい言語 (ロシア語、ブルガリア語、その他のキリル語系やラテン語系など) での印刷テキストに対するテキスト抽出が含まれています。 また、手書きテキストの抽出では、英語を含む 7 個の言語と、新たに簡体字中国語、フランス語、ドイツ語、イタリア語、ポルトガル語、スペイン語の新しいプレビューがサポートされるようになりました。

  • テーブルとテキスト抽出の機能強化 レイアウトは、キーと値のテーブルとも呼ばれる単一行テーブルの抽出をサポートするようになりました。 テキスト抽出の機能強化には、デジタル PDF や身分証明書内の機械可読ゾーン (MRZ) テキストの処理の向上、全般的なパフォーマンスの向上が含まれます。

  • Form Recognizer Studio サービスの使用を簡単にするために、Form Recognizer Studio にアクセスして、さまざまな事前構築済みモデルをテストしたり、カスタム モデルにラベルを付けてトレーニングしたりすることができるようになりました。

v3.0 プレビュー API の新しい REST APIPython、または .NET SDK を利用できます。

Form Recognizer モデルのデータ抽出

Model テキストの抽出 キーと値のペア 選択マーク テーブル エンティティ
🆕一般ドキュメント
Layout
請求書
Receipt
身分証明書
名刺
Custom

2021 年 9 月

  • Azure portal の Form Recognizer リソースの概要ページで、Azure メトリックス エクスプローラーの高度な機能を使用できます。

    監視メニュー

    Azure portal の監視メニューを示すスクリーンショット

    グラフ

    Azure portal のサンプルのメトリック グラフを示すスクリーンショット。

  • 身分証明書モデルの更新: サフィックスを含む名前がある場合、ピリオド (フル ストップ) の有無にかかわらず、正常に処理されます。

    入力テキスト 更新された結果
    William Isaac Kirby Jr. FirstName: William Isaac

    : Kirby Jr.
    Henry Caleb Ross Sr FirstName: Henry Caleb

    : Ross Sr

2021 年 7 月

システム割り当てマネージド ID のサポート

システム割り当てマネージド ID を有効にして、プライベート ストレージ アカウントへの制限付きアクセスを Form Recognizer に許可できるようになりました。これには、Virtual Network (VNet) またはファイアウォールで保護されているアカウントや、BYOS (Bring Your Own Storage) が有効になっているアカウントが含まれます。 詳細については、「Form Recognizer リソース用のマネージド ID を作成して使用する」を "参照" してください。

2021 年 6 月

Form Recognizer コンテナー v2.1 が限定的なプレビューとしてリリースされました

Form Recognizer 機能は、レイアウト名刺身分証明書レシート請求書カスタムの 6 つの機能コンテナーでサポートされるようになりました。 これらを使用するには、オンライン リクエストを送信し、承認を受ける必要があります。

Form Recognizer の Docker コンテナーのインストールと実行」と「Form Recognizer コンテナーの構成」を "参照" してください

Form Recognizer コネクタがプレビューとしてリリースされました

Form Recognizer コネクタは、Azure Logic AppsMicrosoft Power AutomateMicrosoft Power Apps と統合されます。 このコネクタは、カスタムおよび事前構築済みのフォーム、請求書、レシート、名刺、身分証明書から、ドキュメントのデータと構造を抽出および分析するワークフローのアクションとトリガーをサポートしています。

Form Recognizer SDK v3.1.0 に、C#、Java、Python 用のパッチが適用され、v3.1.1 になりました

このパッチは、FormFieldText があるが BoundingBoxPage の情報がないなど、サブ行項目フィールドが検出されない請求書に対処しています。

| | | | |

2021 年 5 月

Form Recognizer 2.1 API 一般提供 (GA) リリース

  • Form Recognizer 2.1 は、一般提供されています。 この一般提供 (GA) リリースは、前の 2.1 プレビュー パッケージ バージョンで導入された変更が安定していることを示しています。 このリリースでは、次の種類のドキュメントから情報とデータを検出して抽出することができます。

  • ドキュメント

  • Receipts

  • 名刺

  • Invoices

  • ID ドキュメント

  • カスタム フォーム

はじめに

Form Recognizer サンプル ツールにアクセスし、クイックスタートに従ってください

レイアウトによってテーブル ヘッダーが追加される

更新された Layout API テーブル機能では、複数の行にまたがることができる列ヘッダーを使用してヘッダーが認識されます。 各テーブル セルには、ヘッダーの一部であるかどうかを示す属性があります。 これは、テーブル ヘッダーを構成する行を識別するために使用できます。

SDK の更新

| | | | |

非破壊的変更

  • FormRecognizerModelFactory クラスが、TextAppearance および ReadingOrder の更新と TextStyle モデルの削除に対応しました。 「破壊的変更」を参照してください

破壊的変更 (5 月)

  • クライアントは、既定でサポートされている最新のサービス バージョン (現在は v2.1) になります。 FormRecognizerClientOptions オブジェクトの Version プロパティでバージョン 2.0 を指定できます。

  • StartRecognizeIdentityDocuments。 関連するすべての ID ドキュメント認識 API 機能で、メソッドおよびメソッド パラメーターの名前が Identity を使用するように変更され、Id キーワードから置き換えられました。

  • FormReadingOrderReadingOrder の名前が FormReadingOrder に変更されました。

  • AsCountryRegionAsCountryCode の名前が AsCountryRegion に変更されました。

  • TextAppearanceStyleName および StyleConfidence プロパティが含まれるようになりました (以前は TextStyle オブジェクトの一部でした)。

  • FieldValueType。 値 Gender がモデルから削除されました。

  • TextStyle モデルが削除されました。

  • FieldValueGender の種類が削除されました。

2021 年 4 月

API バージョン 2.1-preview.3 の SDK プレビュー更新プログラム

NuGet パッケージ バージョン 3.1.0-beta.4

  • 身分証明書のデータ分析用の新しいメソッド:

    StartRecognizeIdDocumentsFromUriAsync

    StartRecognizeIdDocumentsAsync

    フィールド値の一覧については、Form Recognizer ドキュメントの「抽出されるフィールド」を "参照" してください。

  • StartRecognizeContent メソッドに指定できるドキュメント言語のセットが拡大されました。

  • 新しいプロパティ が次のクラスでサポートされました:

    RecognizeBusinessCardsOptionsRecognizeCustomFormsOptionsRecognizeInvoicesOptionsRecognizeReceiptsOptions

    Pages プロパティを使用すると、複数のページがある PDF および TIFF ドキュメントの個々のページまたはページの範囲を選択できます。 個々のページの場合は、「3」のようにページ番号を入力します。 ページの範囲 (ページ 2 とページ 5 - 7 など) の場合は、「2, 5-7」のようにページ番号と範囲をコンマで区切って入力します。

  • 新しいプロパティ が次のクラスでサポートされました:

    RecognizeContentOptions

    ReadingOrder プロパティは省略可能なパラメーターであり、これを使用すると、テキスト要素の抽出順序を決めるために、basic または natural のどちらの読み取り順序アルゴリズムを適用するかを指定できます。 指定しない場合は、既定値の basic が使用されます。

破壊的変更 (4 月)

  • 既定により、クライアントは、サポートされている最新のサービス バージョンになります。現在は 2.1-preview.3 です。

  • StartRecognizeCustomForms メソッドで、無効なファイルが渡された場合に がスローされるようになりました。

2021 年 3 月

Form Recognizer v2.1 パブリック プレビュー 3 が利用可能になりました。 v2.1-preview.3 がリリースされました。次の機能を備えています。

  • 新しい事前構築済み ID モデル 新しい事前構築済み ID モデルを使用すると、お客様は ID を取得して構造化データを返し、処理を自動化できます。 強力な光学式文字認識 (OCR) 機能と ID 理解モデルを組み合わせて、パスポートや米国の運転免許証から、名前、生年月日、発行日、有効期限などの重要な情報を抽出することができます。

    事前作成された ID モデルの詳細情報

    パスポートの例

  • 請求書モデルの品目抽出 - 事前構築済み請求書モデルは品目抽出をサポートするようになりました。完全な項目とその一部 (説明、金額、数量、製品 ID、日付など) が抽出されるようになりました。 簡単な API または SDK の呼び出しにより、請求書から有用なデータ (テキスト、テーブル、キーと値のペア、品目) を抽出できます。

    請求書モデルの詳細について確認してください

  • 監視対象テーブルのラベル付けとトレーニング、空の値のラベル付け - Form Recognizer の最先端のディープ ラーニング自動テーブル抽出機能に加えて、お客様がテーブルに対してラベル付けとトレーニングを行えるようになりました。 この新しいリリースには、品目とテーブル (動的と固定) にラベルを付けてトレーニングし、キーと値のペアと品目を抽出するカスタム モデルをトレーニングする機能が含まれています。 モデルのトレーニングが完了すると、モデルにより documentResults セクションの JSON 出力の一部として品目が抽出されます。

    テーブルのラベル付け

    テーブルにラベルを付けることに加え、空の値と領域にラベルを付けることができるようになりました。トレーニング セット内の一部のドキュメントに特定のフィールドの値がない場合、それらにラベルを付けることで、分析対象のドキュメントから値を適切に抽出するようにモデルに認識させることができます。

  • 66 の新しい言語のサポート - Form Recognizer の Layout API とカスタム モデルは 73 の言語をサポートするようになりました。

    Form Recognizer の言語サポートの詳細

  • 自然な読み取り順序、手書きの分類、およびページ選択 - この更新により、既定の左から右、また上から下の順序ではなく、自然な読み取り順序でテキスト行の出力を取得することを選択できます。 新しい readingOrder クエリ パラメーターを使用して "自然な" 値に設定すると、より人間にとってわかりやすい読み取り順序の出力が得られます。 さらに、ラテン語の場合、Form Recognizer により、テキスト行が手書きスタイルかどうかが分類され、信頼スコアが与えられます。

  • 事前構築済み領収書モデルの品質改善 この更新には、特に品目の抽出に関する、事前構築済み領収書モデルの品質改善が多数含まれています。

2020 年 11 月

新機能

Form Recognizer v2.1 パブリック プレビュー 2 が利用可能になりました。 v2.1-preview.2 がリリースされました。次の機能を備えています。

  • 新しい事前構築済み請求書モデル - 新しい事前構築済み請求書モデルにより、お客様はさまざまな形式で請求書を取得し、構造化されたデータを返して、請求書の処理を自動化することができます。 強力な光学式文字認識 (OCR) 機能と、請求書を解釈するディープ ラーニング モデルを組み合わせて、英語の請求書から重要な情報を抽出します。 顧客、仕入先、請求書 ID、請求書の期限、合計、請求額、課税額、出荷先、請求先などの重要なテキスト、テーブル、情報が抽出されます。

    事前作成された請求書モデルの詳細情報

    請求書の例

  • 強化されたテーブル抽出 - Form Recognizer によって、強力な光学式文字認識 (OCR) 機能とディープ ラーニング テーブル抽出モデルを組み合わせた拡張テーブル抽出が提供されるようになりました。 Form Recognizer では、テーブル (結合された列、行、境界線を含む複雑なテーブルなど) からデータを抽出できます。

    テーブルの例

    レイアウト抽出の詳細情報

  • クライアント ライブラリの更新 - .NET、Python、Java、JavaScript 用のクライアント ライブラリの最新バージョンでは、Form Recognizer 2.1 API がサポートされています。

  • 新たに日本語をサポート - AnalyzeCustomForm で新たに日本語 (ja) がサポートされます。 言語サポート

  • テキスト行のスタイルの表示 (手書き/その他) (ラテン言語のみ) - Form Recognizer では、信頼度スコアと共に、各テキスト行が手書きスタイルであるかどうかを分類する オブジェクトが出力されるようになりました。 この機能は、ラテン語系の言語でのみサポートされています。

  • 品質の向上 - 1 桁の抽出の改善を含め、抽出の品質が向上しました。

  • Form Recognizer のサンプル ラベル付けツールの新しい試用機能 - Form Recognizer サンプル ラベル付けツールを使用して、事前作成された請求書、領収書、およびビジネス カード モデルと Layout API を試すことができます。 コードを記述せずにデータがどのように抽出されるかを確認してください。

    Form Recognizer のサンプル ラベル付けツールをお試しください

    サンプル ラベル付けツールのスクリーンショット。

  • フィードバック ループ - サンプル ラベル付けツールを使用してファイルを分析するときに、それをトレーニング セットに追加し、必要に応じてラベルを調整して、モデルを改善するためにトレーニングできるようになりました。

  • ドキュメントの自動ラベル付け - プロジェクト内のラベル付けされた以前のドキュメントに基づいて、追加のドキュメントが自動的にラベル付けされます。

2020 年 8 月

新機能

Form Recognizer v2.1 パブリック プレビューが利用可能になりました。 V2.1-preview.1 がリリースされました。次の機能を備えています。

  • REST API リファレンスが利用可能 - v2.1-preview.1 リファレンスを参照してください
  • 英語の他に新たに言語をサポート で新たに、英語 (en)、簡体中国語 (zh-Hans)、オランダ語 (nl)、フランス語 (fr)、ドイツ語 (de)、イタリア語 (it)、ポルトガル語 (pt)、スペイン語 (es) の各言語がサポートされます。
  • チェックボックス、選択マークの検出 – Form Recognizer では、チェックボックスやオプション ボタンなどの選択マークの検出および抽出がサポートされています。 選択マークは Layout で抽出されます。また、Train Custom ModelLayout でラベル付けおよびトレーニングを行って、選択マーク用のキーと値のペアを抽出することもできるようになりました。
  • [モデルの作成] を使用すると、1 つのモデル ID で複数のモデルを構成して呼び出すことができます。 作成済みのモデル ID を使用して分析するドキュメントを送信すると、分類ステップが最初に実行され、適切なカスタム モデルにルーティングされます。 モデルの作成は、Train Custom Model - Train Custom Model で使用できます。
  • モデル名。管理と追跡が容易になるように、カスタム モデルにわかりやすい名前を追加します。
  • 名刺用の新しい事前構築されたモデル 。英語の名刺内の共通のフィールドを抽出するためのものです。
  • 事前に作成された領収書の新しいロケール 。EN-US に加えて、EN-AU、EN-CA、EN-GB、EN-IN でもサポートが利用できるようになりました。
  • 品質向上Train Custom Model - Train Custom Model、および - が対象となります。

v2.0 には、次の更新が含まれています。

新しいサンプルは GitHub で入手できます。

  • 知識抽出レシピ - Forms Playbook では、Form Recognizer の実際のカスタマー エンゲージメントからベスト プラクティスが収集され、これらのプロジェクトの開発時に使用する便利なコード サンプル、チェックリスト、およびサンプル パイプラインが提供されます。
  • サンプルラベル付けツール が、v2.1 の新機能をサポートするように更新されました。 ツールの概要については、こちらのクイックスタートを参照してください。
  • インテリジェント キオスク Form Recognizer サンプルでは、Train Custom Model - Train Custom Model を統合する方法について示します。

2020 年 7 月

新機能

  • v2.0 リファレンスが使用可能v2.0 API リファレンスと、.NETPythonJava、および JavaScript 用のアップデートされた SDK を参照できます。

  • テーブルの機能強化と抽出の機能強化には、精度の向上とテーブル抽出の機能強化が含まれています。特に、"ラベルのないカスタム トレーニング" でテーブルのヘッダーと構造を学習する機能が追加されています。

  • 通貨のサポート - グローバル通貨記号の検出と抽出。

  • Azure Gov - Form Recognizer が、Azure Gov でも使用できるようになりました。

  • 強化されたセキュリティ機能:

    • Bring Your Own Key - Form Recognizer は、クラウドに永続化されたときにデータを自動的に暗号化して保護し、セキュリティとコンプライアンスに関する組織のコミットメントを満たすのに役立つようにします。 サブスクリプションでは、Microsoft が管理する暗号化キーが既定で使用されます。 ユーザー独自の暗号化キーを使用してサブスクリプションを管理することもできるようになりました。 カスタマー マネージド キー (Bring Your Own Key (BYOK) とも呼ばれます) を使用すると、アクセス制御の作成、ローテーション、無効化、取り消しを、いっそう柔軟に行うことができます また、データを保護するために使われる暗号化キーを監査することもできます。
    • プライベート エンドポイント – 仮想ネットワークを使用して、Private Link を介してデータに安全にアクセスできるようになります。

2020 年 6 月

新機能

2020 年 4 月

新機能

  • Form Recognizer API v2.0 パブリック プレビューの SDK サポート - 今月、サービス サポートが拡張され、Form Recognizer v2.0 (プレビュー) リリースのプレビュー SDK が含まれるようになりました。 以下のリンクを使用して、任意の言語で作業を開始してください。

    新しい SDK では、Form Recognizer 用の v2.0 REST API のすべての機能がサポートされています。 たとえば、モデルをラベルの有無にかかわらずトレーニングしたり、フォームからテキスト、キーと値のペア、およびテーブルを抽出したり、事前構築済みの領収書サービスを使用してレシートからデータを抽出したり、レイアウト サービスを使用してドキュメントからテキストやテーブルを抽出したりすることができます。 SDK に関するフィードバックは、SDK フィードバック フォームを通じて共有できます。

  • カスタム モデルのコピー 新しいカスタム モデルのコピー機能を使用して、リージョン間やサブスクリプション間でモデルをコピーできるようになりました。 Copy Custom Model API を呼び出す前に、ターゲット リソース エンドポイントに対してコピー承認操作を呼び出して、ターゲット リソースにコピーするための承認を取得する必要があります。

セキュリティの強化

2020 年 3 月

新機能

  • ラベル付けの値の種類 Form Recognizer サンプル ラベル付けツールを使用して、ラベル付けする値の種類を指定できるようになりました。 現在、次の値の型とバリエーションがサポートされています。

    • string
      • 既定値、no-whitespacesalphanumeric
    • number
      • 既定値、currency
    • date
      • 既定値、dmymdyymd
    • time
    • integer

    この機能の使用方法については、サンプル ラベル付けツール ガイドを参照してください。

  • テーブルの視覚化 サンプル ラベル付けツールで、ドキュメントで認識されたテーブルが表示されるようになりました。 この機能により、ラベル付けおよび分析を行う前に、ドキュメントから認識されて抽出されたテーブルを表示できます。 この機能は、レイヤー オプションを使用してオンとオフを切り替えることができます。

    次の図に、テーブルが認識されて抽出される方法の例を示します。

    サンプル ラベル付けツールを使用したテーブルの視覚化

    抽出されたテーブルは、"pageResults" の JSON 出力で使用できます。

    重要

    テーブルのラベル付けはサポートされていません。 テーブルの認識と抽出が自動的に行われない場合は、キーと値のペアとしてのみラベルを付けることができます。 キーと値のペアとしてテーブルのラベル付けを行うときは、各セルに固有の値としてラベルを付けます。

抽出の機能強化

このリリースでは、抽出の機能強化と精度の向上が行われています。具体的には、テキストの同じ行に複数のキーと値のペアが含まれる場合の、ラベル付けと抽出の機能です。

サンプル ラベル付けツールがオープンソースになりました

Form Recognizer のサンプル ラベル付けツールが、オープンソース プロジェクトとして使用できるようになりました。 ソリューションにそれを統合し、ニーズに合わせて顧客固有の変更を行うことができます。

Form Recognizer のサンプル ラベル付けツールの詳細については、GitHub で入手できるドキュメントを参照してください。

TLS 1.2 の適用

TLS 1.2 は現在、このサービスへのすべての HTTP 要求に適用されるようになりました。 詳細については、Azure Cognitive Services のセキュリティに関するページを参照してください。

2020 年 1 月

このリリースでは、Form Recognizer 2.0 (プレビュー) が導入されています。 以下のセクションでは、新機能、機能強化、および変更の詳細について説明します。

新機能

  • カスタム モデル

    • ラベルを使用したトレーニング 手動でラベル付けされたデータを使用して、カスタム モデルをトレーニングできるようになりました。 この方法より、性能の高いモデルが得られ、複雑なフォームやキーのない値を含んだフォームでも機能するモデルを作成することが可能です。
    • 非同期 API 非同期 API 呼び出しを使用して、大規模なデータ セットおよびファイルをトレーニングして分析できます。
    • TIFF ファイルのサポート TIFF ドキュメントからのデータをトレーニングして、抽出できるようになりました。
    • 抽出精度の向上
  • 構築済みのレシート モデル

    • チップの金額 チップの金額とその他の手書きの値を抽出できるようになりました。
    • 品目の抽出 レシートから品目の値を抽出できます。
    • 信頼値 抽出された各値のモデルの信頼度を表示できます。
    • 抽出精度の向上
  • レイアウトの抽出 レイアウト API を使用して、フォームからテキスト データとテーブル データを抽出できるようになりました。

カスタム モデル API の変更点

カスタム モデルのトレーニングと使用のための API 名がすべて変更され、一部の同期メソッドは非同期になりました。 主な変更点は次のとおりです。

  • モデルのトレーニング プロセスが非同期になりました。 /custom/models API 呼び出し経由で、トレーニングを開始します。 この呼び出しでは、操作 ID が返されます。この ID を custom/models/{modelID} に渡すと、トレーニング結果を返すことができます。
  • キー/値の抽出は、 /custom/models/{modelID}/analyze API 呼び出しによって開始されるようになりました。 この呼び出しでは操作 ID が返され、それを custom/models/{modelID}/analyzeResults/{resultID} に渡すと、抽出結果を返すことができます。
  • トレーニング操作の操作 ID は、Operation-Location ヘッダーではなく、HTTP 応答の Location ヘッダー内に配置されるようになりました。

レシート API の変更点

販売レシートを読み取る API の名前が変更されました。

  • レシート データの抽出は、 /prebuilt/receipt/analyze API 呼び出しによって開始されるようになりました。 この呼び出しでは操作 ID が返され、それを /prebuilt/receipt/analyzeResults/{resultID} に渡すと、抽出結果を返すことができます。

出力形式の変更点

すべての API 呼び出しへの JSON 応答には、新しい形式が用意されています。 一部のキーと値は、追加、削除、または名前の変更が行われています。 現在の JSON 形式の例については、クイックスタートを参照してください。

次のステップ

選択した開発言語で Form Recognizer を使用してフォーム処理アプリの作成を開始するには、クイックスタートを完了します。

関連項目