Form Recognizer とはWhat is Form Recognizer?

重要

TLS 1.2 は現在、このサービスへのすべての HTTP 要求に適用されるようになりました。TLS 1.2 is now enforced for all HTTP requests to this service. 詳細については、Azure Cognitive Services のセキュリティに関するページを参照してください。For more information, see Azure Cognitive Services security.

Azure Form Recognizer は、機械学習テクノロジを利用して自動データ処理ソフトウェアを構築ことを可能にするコグニティブ サービスです。Azure Form Recognizer is a cognitive service that lets you build automated data processing software using machine learning technology. ドキュメントからテキスト、キーと値のペア、選択マーク、テーブル、構造を特定して抽出します。このサービスによって、元のファイル、境界ボックス、信頼度などのリレーションシップを含む構造化データが出力されます。Identify and extract text, key/value pairs, selection marks, tables, and structure from your documents—the service outputs structured data that includes the relationships in the original file, bounding boxes, confidence and more. 手作業による操作やデータ サイエンスに関する専門知識があまりなくても、特定のコンテンツに合わせた正確な結果がすばやく得られます。You quickly get accurate results that are tailored to your specific content without heavy manual intervention or extensive data science expertise. Form Recognizer を使用して、アプリケーションのデータ入力を自動化し、ドキュメントの検索機能を強化します。Use Form Recognizer to automate data entry in your applications and enrich your documents search capabilities.

Form Recognizer は、カスタム ドキュメント処理モデル、および請求書、レシート、名刺に対する事前構築済みモデル、およびレイアウト モデルで構成されています。Form Recognizer is composed of custom document processing models, prebuilt models for invoices, receipts and business cards, and the layout model. REST API またはクライアント ライブラリ SDK を使用して Form Recognizer モデルを呼び出すことにより、複雑さを軽減し、自分のワークフローやアプリケーションに統合することができます。You can call Form Recognizer models by using a REST API or client library SDKs to reduce complexity and integrate it into your workflow or application.

Form Recognizer は、次のサービスで構成されています。Form Recognizer is composed of the following services:

  • Layout API - テキスト、選択マーク、およびテーブルの構造を、対応する境界ボックスの座標と共にドキュメントから抽出します。Layout API - Extract text, selection marks, and tables structures, along with their bounding box coordinates, from documents.
  • カスタム モデル - フォームからテキスト、キーと値のペア、選択マーク、およびテーブル データを抽出します。Custom models - Extract text, key/value pairs, selection marks, and table data from forms. これらのモデルは自分が用意した独自のデータでトレーニングされるため、実際のフォームに合わせて調整されます。These models are trained with your own data, so they're tailored to your forms.
  • 事前構築済みモデル - 事前構築済みモデルを使用して、一意のフォームの種類からデータを抽出します。Prebuilt models - Extract data from unique form types using prebuilt models. 現在使用できるのは、次の事前構築済みモデルです。Currently available are the following prebuilt models

試してみるTry it out

Form Recognizer サービスを試してみるには、オンラインのサンプル UI ツールにアクセスしてください。To try out the Form Recognizer Service, go to the online Sample UI Tool:

Form Recognizer サービスを試すには、Azure サブスクリプション (無料で作成) と Form Recognizer リソース エンドポイントおよびキーが必要です。You will need an Azure subscription (create one for free) and a Form Recognizer resource endpoint and key to try out the Form Recognizer service.

Layout APILayout API

Form Recognizer では、高精細の光学式文字認識 (OCR) とドキュメントからの高度なディープ ラーニング モデルを使用して、テキスト、選択マーク、およびテーブル構造 (テキストに関連付けられた行および列番号) を抽出できます。Form Recognizer can extract text, selection marks, and table structure (the row and column numbers associated with the text) using high-definition optical character recognition (OCR) and an enhanced deep learning model from documents. 詳細については、レイアウトの概念ガイドを参照してください。See the Layout conceptual guide for more info.

テーブルの例

カスタム モデルCustom models

Form Recognizer のカスタム モデルでは、独自のデータでトレーニングを行います。また、5 つのサンプル入力フォームだけで開始できます。Form Recognizer custom models train to your own data, and you only need five sample input forms to start. トレーニング済みのドキュメント処理モデルは、元の form ドキュメント内の関係を含む構造化データを出力できます。A trained document processing model can output structured data that includes the relationships in the original form document. モデルをトレーニングした後、モデルをテストおよび再トレーニングでき、最終的にはモデルを使用して、ニーズに従ってより多くのフォームから正確にデータを抽出できます。After you train the model, you can test and retrain it and eventually use it to reliably extract data from more forms according to your needs.

カスタム モデルをトレーニングする際は、ラベル付けされたデータを使用したトレーニングとラベル付けされたデータを使用しないトレーニングのどちらかを選択できます。You have the following options when you train custom models: training with labeled data and without labeled data.

ラベルを使用しないトレーニングTrain without labels

Form Recognizer は、既定では教師なし学習を使用して、フォーム内のレイアウトを解釈し、フィールドとエントリ間の関係を解釈します。By default, Form Recognizer uses unsupervised learning to understand the layout and relationships between fields and entries in your forms. 入力フォームを送信すると、アルゴリズムによって種類別にフォームが分類されて、存在するキーとテーブルが検出されます。また、値がキーに、エントリがテーブルに関連付けられます。When you submit your input forms, the algorithm clusters the forms by type, discovers what keys and tables are present, and associates values to keys and entries to tables. 手動によるデータのラベル付けは不要であり、大量のコーディングやメンテナンスも必要ありません。最初は、この方法を試すようお勧めします。This doesn't require manual data labeling or intensive coding and maintenance, and we recommend you try this method first.

トレーニング ドキュメントを収集する方法のヒントについては、「トレーニング データ セットの作成」を参照してください。See Build a training data set for tips on how to collect your training documents.

ラベルを使用したトレーニングTrain with labels

ラベル付けされたデータによるモデルのトレーニングでは、ラベル付けされた指定のフォームを使用して教師あり学習を行うことで、目的とする値が抽出されます。When you train with labeled data, the model does supervised learning to extract values of interest, using the labeled forms you provide. こちらの方が、複雑なフォームや、キーのない値を含んだフォームでも機能する性能のよいモデルが得られます。This results in better-performing models and can produce models that work with complex forms or forms containing values without keys.

Form Recognizer は、印刷されたテキストや手書きのテキストの要素について、Layout API を使用して予想されるサイズや位置を学習します。Form Recognizer uses the Layout API to learn the expected sizes and positions of printed and handwritten text elements. その後、ユーザーによって指定されたラベルを使用して、ドキュメントに含まれるキーと値の関係を学習します。Then it uses user-specified labels to learn the key/value associations in the documents. 新しいモデルをトレーニングする際はまず、手動でラベル付けされた同じタイプ (同じ構造) のフォーム 5 つを使用し、そのうえで、モデルの精度を改善するために必要であれば、ラベル付けされたデータを追加することをお勧めします。We recommend that you use five manually labeled forms of the same type (same structure) to get started when training a new model and add more labeled data as needed to improve the model accuracy.

ラベルを使用したトレーニングを開始するGet started with Train with labels

事前構築済みのモデルPrebuilt models

Form Recognizer には、固有のフォームの種類を持つ自動データ処理用の事前構築済みモデルも含まれています。Form Recognizer also includes Prebuilt models for automated data processing of unique form types.

事前構築済みの請求書モデルPrebuilt Invoice model

事前構築済みの請求書モデルでは、さまざまな形式の請求書からデータが抽出されて、構造化データが返されます。The Prebuilt Invoice model extracts data from invoices in a variety of formats and returns structured data. このモデルでは、請求書 ID、顧客の詳細、仕入先の詳細、出荷先、請求先、合計金額、税金、小計などの主要な情報が抽出されます。This model extracts key information such as the invoice ID, customer details, vendor details, ship to, bill to, total, tax, subtotal and more. さらに、事前構築済みの請求書モデルは、請求書にあるすべてのテキストとテーブルを認識して返すようにトレーニングされています。In addition, the prebuilt invoice model is trained to recognize and return all of the text and tables on the invoice. 詳細については、請求書の概念ガイドを参照してください。See the Invoices conceptual guide for more info.

サンプル請求書

事前構築済みのレシート モデルPrebuilt Receipt model

事前構築済みのレシート モデルは、オーストラリア、カナダ、英国、インド、および米国のレストランやガソリン スタンド、小売店などで使用されている種類の英語のレシートを読み取るために使用されます。The Prebuilt Receipt model is used for reading English sales receipts from Australia, Canada, Great Britain, India, and the United States—the type used by restaurants, gas stations, retail, and so on. このモデルでは、取引日時、販売店情報、税額、明細項目、合計金額などの主要な情報が抽出されます。This model extracts key information such as the time and date of the transaction, merchant information, amounts of taxes, line items, totals and more. さらに、あらかじめ構築されたレシート モデルは、レシート内のすべてのテキストを認識して返すようにトレーニングされています。In addition, the prebuilt receipt model is trained to recognize and return all of the text on a receipt. 詳細については、レシートの概念ガイドを参照してください。See the Receipts conceptual guide for more info.

サンプルのレシート

事前構築済みの名刺モデルPrebuilt Business Cards model

名刺モデルを使用すると、個人の名前、役職、住所、電子メール、会社、電話番号などの情報を英語の名刺から抽出できます。The Business Cards model enables you to extract information such as the person's name, job title, address, email, company, and phone numbers from business cards in English. 詳細については、名刺の概念ガイドを参照してください。See the Business cards conceptual guide for more info.

サンプルの名刺

はじめにGet started

サンプル Form Recognizer ツールを使用するか、クイックスタートに従って、フォームからのデータの抽出を開始します。Use the Sample Form Recognizer tool or follow a quickstart to get started extracting data from your forms. テクノロジを学習している場合は、無料のサービスを使用することをお勧めします。We recommend that you use the free service when you're learning the technology. 無料のページは 1 か月あたり 500 ページに制限されていることに注意してください。Remember that the number of free pages is limited to 500 per month.

REST API を確認しますReview the REST APIs

次の API を使用して、モデルのトレーニングを行い、フォームから構造化データを抽出します。You'll use the following APIs to train models and extract structured data from forms.

名前Name 説明Description
Analyze LayoutAnalyze Layout ストリームとして渡されたドキュメントを分析して、ドキュメントからテキスト、選択マーク、テーブル、および構造を抽出しますAnalyze a document passed in as a stream to extract text, selection marks, tables and structure from the document
Train Custom ModelTrain Custom Model 同じ種類の 5 つのフォームを使用して、フォームを分析する新しいモデルをトレーニングします。Train a new model to analyze your forms by using five forms of the same type. 手動でラベル付けしたデータを使ってトレーニングを行うには、useLabelFile パラメーターを true に設定します。Set the useLabelFile parameter to true to train with manually labeled data.
Analyze FormAnalyze Form ストリームとして渡されたフォームを分析して、カスタム モデルを使用してフォームからテキスト、キーと値のペア、およびテーブルを抽出します。Analyze a form passed in as a stream to extract text, key/value pairs, and tables from the form with your custom model.
Analyze InvoiceAnalyze Invoice 請求書を分析して、主要な情報、テーブル、およびその他の請求書テキストを抽出します。Analyze a invoice to extract key information, tables, and other invoice text.
Analyze ReceiptAnalyze Receipt レシート ドキュメントを分析して、主要な情報と、レシートのその他のテキストを抽出します。Analyze a receipt document to extract key information, and other receipt text.
名刺を分析するAnalyze Business Card 名刺を分析し、主要な情報とテキストを抽出します。Analyze a business card to extract key information and text.

詳しくは、REST API のリファレンス ドキュメントをご覧ください。Explore the REST API reference documentation to learn more. 以前のバージョンの API をご利用の方は、「新機能」の記事で、レシートに関する最新の変更点をご確認ください。If you're familiar with a previous version of the API, see the What's new article to learn about recent changes.

入力の要件Input requirements

Form Recognizer は、次の要件を満たす入力ドキュメントを処理します。Form Recognizer works on input documents that meet these requirements:

  • 形式は、JPG、PNG、PDF (テキストまたはスキャン済み)、TIFF のいずれかである必要があります。Format must be JPG, PNG, PDF (text or scanned), or TIFF. テキストが埋め込まれている PDF は、文字の抽出と場所にエラーが生じる可能性がないため、最適です。Text-embedded PDFs are best because there's no possibility of error in character extraction and location.
  • ファイル サイズは 50 MB 未満である必要があります。File size must be less than 50 MB.
  • 画像の寸法は、50 x 50 ピクセルから 10,000 x 10,000 ピクセルの間である必要があります。Image dimensions must be between 50 x 50 pixels and 10000 x 10000 pixels.
  • PDF の寸法は、最大で 17 x 17 インチにする必要があります (リーガル サイズまたは A3 サイズ以下の用紙に対応します)。PDF dimensions must be at most 17 x 17 inches, corresponding to Legal or A3 paper sizes and smaller.
  • PDF および TIFF の場合、最初の 200 ページのみが処理されます (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。For PDF and TIFF, only the first 200 pages are processed (with a free tier subscription, only the first two pages are processed).
  • トレーニング データ セットの合計サイズは、500 ページ以下にする必要があります。The total size of the training data set must be 500 pages or less.
  • PDF がパスワードでロックされている場合は、送信前にロックを解除する必要があります。If your PDFs are password-locked, you must remove the lock before submitting them.
  • 紙のドキュメントからスキャンする場合、フォームは高品質のスキャンでなければなりません。If scanned from paper documents, forms should be high-quality scans.
  • テキストでは、ラテン アルファベット (英語の文字) を使用する必要があります。Text must use the Latin alphabet (English characters).
  • 教師なし学習 (ラベル付けされたデータ不使用) の場合、データには、キーと値を含める必要があります。For unsupervised learning (without labeled data), data must contain keys and values.
  • 教師なし学習 (ラベル付けされたデータ不使用) の場合、キーは、値の上または左に配置する必要があります。下や右に配置されていてはいけません。For unsupervised learning (without labeled data), keys must appear above or to the left of the values; they can't appear below or to the right.

Form Recognizer は現在、次の種類の入力データをサポートしていません。Form Recognizer doesn't currently support these types of input data:

  • 複雑なテーブル (入れ子になったテーブル、マージされたヘッダーまたはセルなど)。Complex tables (nested tables, merged headers or cells, and so on).
  • チェックボックスまたはラジオ ボタン。Checkboxes or radio buttons.

Docker コンテナーを使用してオンプレミスにデプロイするDeploy on premises using Docker containers

Form Recognizer コンテナー (プレビュー) を使用して、API 機能をオンプレミスにデプロイします。Use Form Recognizer containers (preview) to deploy API features on-premises. この Docker コンテナーを使用すると、コンプライアンス、セキュリティ、またはその他の運用上の理由により、データにより近いところでサービスを使用できます。This Docker container enables you to bring the service closer to your data for compliance, security or other operational reasons.

サービスの可用性と冗長性Service availability and redundancy

Form Recognizer サービスにゾーン回復性はありますか?Is Form Recognizer service zone-resilient?

はい。Yes. Form Recognizer サービスには、ゾーン回復性が既定で備わっています。The Form Recognizer service is zone-resilient by default.

Form Recognizer サービスにゾーン回復性を構成するにはどうすればよいですか?How do I configure the Form Recognizer service to be zone-resilient?

ゾーン回復性を有効にするために、顧客による構成は必要ありません。No customer configuration is necessary to enable zone-resiliency. Form Recognizer リソースのゾーン回復性は、既定で使用できるようになっており、サービス自体によって管理されます。Zone-resiliency for Form Recognizer resources is available by default and managed by the service itself.

データのプライバシーとセキュリティData privacy and security

Cognitive Services 全般に言えることですが、Form Recognizer サービスを使用する開発者は、顧客データに関する Microsoft のポリシーに留意する必要があります。As with all the cognitive services, developers using the Form Recognizer service should be aware of Microsoft policies on customer data. 詳細については、Microsoft セキュリティ センターの Cognitive Services のページを参照してください。See the Cognitive Services page on the Microsoft Trust Center to learn more.

次のステップNext steps

選択した言語で Form Recognizer を使用してフォーム処理アプリの作成を開始するには、クイックスタートを完了します。Complete a quickstart to get started writing a forms processing app with Form Recognizer in the language of your choice.