サンプル ラベル付けツールを使用してカスタム モデルをトレーニングするTrain a custom model using the sample labeling tool

このクイックスタートでは、Form Recognizer REST API とサンプル ラベル付けツールを使用して、手動でラベル付けされたデータを使ってカスタム ドキュメント処理モデルをトレーニングします。In this quickstart, you'll use the Form Recognizer REST API with the sample labeling tool to train a custom document processing model with manually labeled data. Form Recognizer を使用した教師あり学習の詳細については、概要に関するページの「ラベルを使用したトレーニング」を参照してください。See the Train with labels section of the overview to learn more about supervised learning with Form Recognizer.

前提条件Prerequisites

このクイック スタートを完了するには、以下が必要です。To complete this quickstart, you must have:

  • Azure サブスクリプション - 無料アカウントを作成しますAzure subscription - Create one for free
  • Azure サブスクリプションを用意できたら、Azure portal で Form Recognizer リソースを作成し、自分のキーとエンドポイントを取得します。Once you have your Azure subscription, create a Form Recognizer resource in the Azure portal to get your key and endpoint. デプロイされたら、 [リソースに移動] を選択します。After it deploys, select Go to resource.
    • 自分のアプリケーションを Form Recognizer API に接続するには、作成したリソースのキーとエンドポイントが必要になります。You will need the key and endpoint from the resource you create to connect your application to the Form Recognizer API. このクイックスタートで後に示すコードに、自分のキーとエンドポイントを貼り付けます。You'll paste your key and endpoint into the code below later in the quickstart.
    • Free 価格レベル (F0) を使用してサービスを試用し、後から運用環境用の有料レベルにアップグレードすることができます。You can use the free pricing tier (F0) to try the service, and upgrade later to a paid tier for production.
  • 同じ種類の少なくとも 6 つのフォームのセット。A set of at least six forms of the same type. このデータを使用して、モデルのトレーニングとフォームのテストを行います。You'll use this data to train the model and test a form. このクイックスタートでは、サンプル データセットを使用できます (sample_data.zip をダウンロードして展開します)。You can use a sample data set (download and extract sample_data.zip) for this quickstart. Standard パフォーマンス レベルの Azure Storage アカウントの BLOB ストレージ コンテナーのルートに、トレーニング ファイルをアップロードします。Upload the training files to the root of a blob storage container in a standard-performance-tier Azure Storage account.

Form Recognizer リソースを作成するCreate a Form Recognizer resource

Azure portal に移動し、新しい Form Recognizer リソースを作成します Go to the Azure portal and create a new Form Recognizer resource . [作成] ウィンドウには以下の情報が表示されます。In the Create pane, provide the following information:

プロジェクトの詳細Project details 説明Description
サブスクリプションSubscription アクセスが許可されている Azure サブスクリプションを選択します。Select the Azure subscription which has been granted access.
リソース グループResource group リソースを含む Azure リソース グループThe Azure resource group that will contain your resource. 新しいグループを作成することも、既存のグループに追加することもできます。You can create a new group or add it to a pre-existing group.
リージョンRegion Cognitive Services インスタンスの場所。The location of your cognitive service instance. 別の場所を選択すると待機時間が生じる可能性がありますが、リソースのランタイムの可用性には影響しません。Different locations may introduce latency, but have no impact on the runtime availability of your resource.
名前Name リソースのわかりやすい名前。A descriptive name for your resource. わかりやすい名前 (MyNameFaceAPIAccount など) を使用することをお勧めします。We recommend using a descriptive name, for example MyNameFormRecognizer.
価格レベルPricing tier リソースのコストは、選択した価格レベルと使用量に依存します。The cost of your resource depends on the pricing tier you choose and your usage. 詳細については、「API の価格の詳細」をご覧ください。For more information, see the API pricing details.

注意

Azure portal で Cognitive Service リソースを作成するときに、マルチ サービスのサブスクリプション キー (複数の Cognitive Services で使用) または単一サービスのサブスクリプション キー (特定の Cognitive Services でのみ使用) を作成するオプションがあります。When you create a Cognitive Service resource in the Azure portal, you have the option to create a multi-service subscription key (used across multiple cognitive services) or a single-service subscription key (used only with a specific cognitive service). 現在、マルチサービス サブスクリプションには、Form Recognizer は含まれていません。Currently, Form Recognizer is not included in the multi-service subscription.

Form Recognizer リソースがデプロイが完了すると、ポータルの [すべてのリソース] の一覧からこれを検索して選択します。When your Form Recognizer resource finishes deploying, find and select it from the All resources list in the portal. キーとエンドポイントは、リソースの [key and endpoint](キーとエンドポイント) ページの [リソース管理] にあります。Your key and endpoint will be located on the resource's key and endpoint page, under resource management. これらの両方を一時的な場所に保存してから、先に進んでください。Save both of these to a temporary location before going forward.

試してみるTry it out

Form Recognizer サンプル ラベル付けツールをオンラインで試すには、FOTT の Web サイトにアクセスします。To try out the Form Recognizer Sample Labeling Tool online, go to the FOTT website.

Form Recognizer サービスを試すには、Azure サブスクリプション (無料で作成) と Form Recognizer リソース エンドポイントおよびキーが必要です。You will need an Azure subscription (create one for free) and a Form Recognizer resource endpoint and key to try out the Form Recognizer service.

サンプル ラベル付けツールを設定するSet up the sample labeling tool

サンプル ラベル付けツールを実行するには、Docker エンジンを使用します。You'll use the Docker engine to run the sample labeling tool. 次の手順に従って、Docker コンテナーを設定します。Follow these steps to set up the Docker container. Docker やコンテナーの基礎に関する入門情報については、「Docker overview」(Docker の概要) を参照してください。For a primer on Docker and container basics, see the Docker overview.

ヒント

GitHub のオープンソース プロジェクトの OCR Form Labeling Tool を使用することもできます。The OCR Form Labeling Tool is also available as an open source project on GitHub. このツールは、React + Redux を使用して作成された TypeScript Web アプリケーションです。The tool is a TypeScript web application built using React + Redux. 詳細または共同作成については、OCR Form Labeling Tool リポジトリを参照してください。To learn more or contribute, see the OCR Form Labeling Tool repo. ツールをオンラインで試すには、FOTT Web サイトにアクセスします。To try out the tool online, go to the FOTT website.

  1. まず、ホスト コンピューターに Docker をインストールします。First, install Docker on a host computer. このガイドでは、ローカル コンピューターをホストとして使用する方法について説明します。This guide will show you how to use local computer as a host. Azure で Docker ホスティング サービスを使用する場合は、「サンプルのラベル付けツールのデプロイ」攻略ガイドを参照してください。If you want to use a Docker hosting service in Azure, see the Deploy the sample labeling tool how-to guide.

    ホスト コンピューターは、次のハードウェア要件を満たしている必要があります。The host computer must meet the following hardware requirements:

    コンテナーContainer 最小値Minimum 推奨Recommended
    サンプル ラベル付けツールSample labeling tool 2 コア、4 GB メモリ2 core, 4-GB memory 4 コア、8 GB メモリ4 core, 8-GB memory

    お使いのオペレーティング システムに該当する手順に従って、マシンに Docker をインストールします。Install Docker on your machine by following the appropriate instructions for your operating system:

  2. docker pull コマンドを使用して、サンプル ラベル付けツールのコンテナーを取得します。Get the sample labeling tool container with the docker pull command.

 docker pull mcr.microsoft.com/azure-cognitive-services/custom-form/labeltool:latest-preview

3. これで、`docker run` を使用してコンテナーを実行する準備が整いました。Now you're ready to run the container with `docker run`.
 docker run -it -p 3000:80 mcr.microsoft.com/azure-cognitive-services/custom-form/labeltool:latest-preview eula=accept

このコマンドを実行すると、Web ブラウザーからサンプル ラベル付けツールを使用できるようになります。This command will make the sample labeling tool available through a web browser. http://localhost:3000 にアクセスします。Go to http://localhost:3000.

注意

Form Recognizer REST API を使用して、ドキュメントにラベルを付けたり、モデルをトレーニングしたりすることもできます。You can also label documents and train models using the Form Recognizer REST API. REST API を使用してトレーニングおよび分析を行うには、REST API と Python によるラベルを使用したトレーニングに関するページを参照してください。To train and Analyze with the REST API, see Train with labels using the REST API and Python.

入力データを設定するSet up input data

まず、すべてのトレーニング ドキュメントが同じ形式であることを確認します。First, make sure all the training documents are of the same format. 複数の形式のフォームがある場合は、共通する形式に基づいてサブフォルダーに分類します。If you have forms in multiple formats, organize them into subfolders based on common format. トレーニング時には、API に対してサブフォルダーを指定する必要があります。When you train, you'll need to direct the API to a subfolder.

クロスドメイン リソース共有 (CORS) を構成するConfigure cross-domain resource sharing (CORS)

ストレージ アカウントで CORS を有効にします。Enable CORS on your storage account. Azure portal で自分のストレージ アカウントを選択し、左側のペインで [CORS] タブを選択します。Select your storage account in the Azure portal and then choose the CORS tab on the left pane. 一番下の行に、次の値を入力します。On the bottom line, fill in the following values. 上部にある [保存] を選択します。Select Save at the top.

  • [許可されたドメイン] = *Allowed origins = *
  • [許可されたメソッド] = [すべて選択]Allowed methods = [select all]
  • [許可されたヘッダー] = *Allowed headers = *
  • [公開されるヘッダー] = *Exposed headers = *
  • [最長有効期間] = 200Max age = 200

Azure portal での CORS の設定CORS setup in the Azure portal

サンプル ラベル付けツールに接続するConnect to the sample labeling tool

サンプル ラベル付けツールは、ソース (元のアップロードされたフォーム) とターゲット (作成されたラベルと出力データ) に接続されます。The sample labeling tool connects to a source (your original uploaded forms) and a target (created labels and output data).

接続は、複数のプロジェクトにまたがって設定および共有できます。Connections can be set up and shared across projects. 拡張可能なプロバイダー モデルが使用されるため、新しいソースまたはターゲット プロバイダーを簡単に追加できます。They use an extensible provider model, so you can easily add new source/target providers.

新しい接続を作成するには、左側のナビゲーション バーにある 新しい接続 (プラグ) アイコンを選択します。To create a new connection, select the New Connections (plug) icon, in the left navigation bar.

フィールドに次の値を入力します。Fill in the fields with the following values:

  • [表示名] - 接続の表示名。Display Name - The connection display name.

  • [説明] - プロジェクトの説明。Description - Your project description.

  • [SAS URL] - Azure Blob Storage コンテナーの Shared Access Signature (SAS) URL。SAS URL - The shared access signature (SAS) URL of your Azure Blob Storage container. カスタム モデルのトレーニング データの SAS URL を取得するには、Azure portal のストレージ リソースに移動し、 [Storage Explorer] タブを選択します。コンテナーに移動して右クリックし、 [Get shared access signature](Shared Access Signature の取得) を選択します。To retrieve the SAS URL for your custom model training data, go to your storage resource in the Azure portal and select the Storage Explorer tab. Navigate to your container, right-click, and select Get shared access signature. ストレージ アカウント自体ではなく、コンテナー用の SAS を取得することが重要です。It's important to get the SAS for your container, not for the storage account itself. [読み取り][書き込み][削除] 、および [表示] 権限がオンになっていることを確認し、 [作成] をクリックします。Make sure the Read, Write, Delete and List permissions are checked, and click Create. 次に、URL セクションの値を一時的な場所にコピーします。Then copy the value in the URL section to a temporary location. それは次の書式になりますhttps://<storage account>.blob.core.windows.net/<container name>?<SAS value>It should have the form: https://<storage account>.blob.core.windows.net/<container name>?<SAS value>.

    SAS URL の取得

サンプル ラベル付けツールの接続設定。

新しいプロジェクトを作成するCreate a new project

サンプル ラベル付けツールでは、プロジェクトに構成と設定が保存されます。In the sample labeling tool, projects store your configurations and settings. 新しいプロジェクトを作成し、フィールドに次の値を入力します。Create a new project and fill in the fields with the following values:

  • [表示名] - プロジェクトの表示名Display Name - the project display name
  • [セキュリティ トークン] - 一部のプロジェクト設定には、API キーや他の共有シークレットなどの機密性の高い値を含めることができます。Security Token - Some project settings can include sensitive values, such as API keys or other shared secrets. 各プロジェクトでは、機密性の高いプロジェクト設定の暗号化または暗号化解除に使用できるセキュリティ トークンが生成されます。Each project will generate a security token that can be used to encrypt/decrypt sensitive project settings. セキュリティ トークンは、左側のナビゲーション バーの下部にある歯車アイコンを選択すると、[アプリケーション設定] に表示されます。You can find security tokens in the Application Settings by selecting the gear icon at the bottom of the left navigation bar.
  • [基になる接続] - このプロジェクトに使用する、前の手順で作成した Azure Blob Storage 接続。Source Connection - The Azure Blob Storage connection you created in the previous step that you would like to use for this project.
  • [フォルダー パス] (省略可能) - ソース フォームが BLOB コンテナー上のフォルダーに配置されている場合は、ここにフォルダー名を指定します。Folder Path - Optional - If your source forms are located in a folder on the blob container, specify the folder name here
  • [Form Recognizer Service Uri](Form Recognizer サービスの URI) - Form Recognizer のエンドポイント URL。Form Recognizer Service Uri - Your Form Recognizer endpoint URL.
  • [API キー] - Form Recognizer のサブスクリプション キー。API Key - Your Form Recognizer subscription key.
  • [説明] (省略可能) - プロジェクトの説明Description - Optional - Project description

サンプル ラベル付けツールの新規プロジェクト ページ。

フォームにラベルを付けるLabel your forms

プロジェクトを作成するか開くと、メインのタグ エディター ウィンドウが開きます。When you create or open a project, the main tag editor window opens. このタグ エディターは、次の 3 つの部分で構成されます。The tag editor consists of three parts:

  • サイズ変更可能なプレビュー ペイン。基になる接続にあるフォームのスクロール可能な一覧が表示されます。A resizable preview pane that contains a scrollable list of forms from the source connection.
  • メインのエディター ペイン。ここで、タグを適用できます。The main editor pane that allows you to apply tags.
  • タグ エディター ペイン。ここで、タグの変更、ロック、並べ替え、削除を行うことができます。The tags editor pane that allows users to modify, lock, reorder, and delete tags.

テキストとテーブルを特定するIdentify text and tables

左側のペインにある [Run OCR on all files](すべてのファイルに対して OCR を実行) を選択して、各ドキュメントのテキストとテーブルのレイアウト情報を取得します。Select Run OCR on all files on the left pane to get the text and table layout information for each document. ラベル付けツールによって、各テキスト要素の周囲に境界ボックスが描画されます。The labeling tool will draw bounding boxes around each text element.

ラベル付けツールでは、どのテーブルが自動的に抽出されたかも示されます。The labeling tool will also show which tables have been automatically extracted. ドキュメントの左側にあるテーブル (グリッド) アイコンを選択すると、抽出されたテーブルが表示されます。Select the table/grid icon on the left hand of the document to see the extracted table. テーブルの内容は自動的に抽出されるため、このクイックスタートではテーブルの内容に対するラベル付けは行わず、自動化された抽出を信頼することにします。In this quickstart, because the table content is automatically extracted, we will not be labeling the table content, but rather rely on the automated extraction.

サンプル ラベル付けツールでのテーブルの視覚化。

v2.1 では、トレーニング ドキュメントに値が入力されていない場合は、値が入る枠を描画できます。In v2.1, if your training document does not have a value filled in, you can draw a box where the value should be. ウィンドウの左上隅にある 描画領域 を使用して、領域をタグ付け可能にします。Use Draw region on the upper left corner of the window to make the region taggable.

ラベルをテキストに適用するApply labels to text

次に、タグ (ラベル) を作成し、モデルに分析させるテキスト要素に適用します。Next, you'll create tags (labels) and apply them to the text elements that you want the model to analyze.

  1. まず、タグ エディター ペインを使用して、識別するタグを作成します。First, use the tags editor pane to create the tags you'd like to identify.
    1. + を選択して、新しいタグを作成します。Select + to create a new tag.
    2. タグ名を入力します。Enter the tag name.
    3. Enter キーを押して、タグを保存します。Press Enter to save the tag.
  2. メインのエディターで、強調表示されたテキスト要素または描画した領域から単語を選択します。In the main editor, select words from the highlighted text elements or a region you drew in.
  3. 適用するタグを選択するか、対応するキーボード キーを押します。Select the tag you want to apply, or press the corresponding keyboard key. 数字キーは、最初の 10 個のタグのホットキーとして割り当てられます。The number keys are assigned as hotkeys for the first 10 tags. タグの順序は、タグ エディター ペインの上矢印と下矢印のアイコンを使用して変更できます。You can reorder your tags using the up and down arrow icons in the tag editor pane.

    ヒント

    フォームにラベルを付けるときは、次のヒントに留意してください。Keep the following tips in mind when you're labeling your forms:

    • 適用できるタグは、選択したテキスト要素ごとに 1 つのみです。You can only apply one tag to each selected text element.
    • 各タグは、1 ページにつき 1 回のみ適用できます。Each tag can only be applied once per page. 同じフォームに同じ値が複数回出現する場合は、インスタンスごとに異なるタグを作成します。If a value appears multiple times on the same form, create different tags for each instance. たとえば、"invoice # 1"、"invoice # 2" などとします。For example: "invoice# 1", "invoice# 2" and so on.
    • タグは複数のページにまたがることはできません。Tags cannot span across pages.
    • フォームに表示されるラベル値は、2 つの異なるタグを使用して 2 つの部分に分割しないでください。Label values as they appear on the form; don't try to split a value into two parts with two different tags. たとえば、アドレス フィールドが複数の行にまたがる場合でも、1 つのタグを使用してラベルを付ける必要があります。For example, an address field should be labeled with a single tag even if it spans multiple lines.
    • タグが付けられたフィールドには値のみを含めます。キーは含めないでください。Don't include keys in your tagged fields—only the values.
    • テーブル データは自動的に検出され、最終的な出力 JSON ファイルに表示されます。Table data should be detected automatically and will be available in the final output JSON file. ただし、モデルが一部のテーブル データを検出できない場合は、これらのフィールドに手動でタグを付けることもできます。However, if the model fails to detect all of your table data, you can manually tag these fields as well. テーブル内のセルごとに異なるラベルを使用してタグ付けします。Tag each cell in the table with a different label. さまざまな行数を含むテーブルがフォームにある場合は、できるだけ大きなテーブルを含む 1 つ以上のフォームにタグを付けてください。If your forms have tables with varying numbers of rows, make sure you tag at least one form with the largest possible table.
    • + の右にあるボタンを使用して、タグの検索、名前の変更、順序変更、削除を行います。Use the buttons to the right of the + to search, rename, reorder, and delete your tags.
    • タグそのものは削除せずに、適用されているタグを解除するには、タグ付けされた四角形をドキュメント ビューで選択し、Delete キーを押します。To remove an applied tag without deleting the tag itself, select the tagged rectangle on the document view and press the delete key.

サンプル ラベル付けツールのメインのエディター ウィンドウ。

上記の手順に従って、少なくとも 5 つのフォームにラベルを付けてください。Follow the steps above to label at least five of your forms.

タグの値の型を指定するSpecify tag value types

それぞれのタグに予期されるデータ型を設定できます。You can set the expected data type for each tag. タグの右側にあるコンテキスト メニューを開いて型を選択します。Open the context menu to the right of a tag and select a type from the menu. この機能により、検出アルゴリズムは、テキスト検出精度の向上につながる仮説を立てることができます。This feature allows the detection algorithm to make assumptions that will improve the text-detection accuracy. また、最終的な JSON 出力では、検出された値が確実に標準化された形式で返されます。It also ensures that the detected values will be returned in a standardized format in the final JSON output. 値の型に関する情報は、ラベル ファイルと同じパスにある fields.json ファイルに保存されます。Value type information is saved in the fields.json file in the same path as your label files.

サンプル ラベル付けツールでの値の型の選択Value type selection with sample labeling tool

現在、次の値の型とバリエーションがサポートされています。The following value types and variations are currently supported:

  • string

    • 既定値、no-whitespacesalphanumericdefault, no-whitespaces, alphanumeric
  • number

    • 既定値、currencydefault, currency
  • date

    • 既定値、dmymdyymddefault, dmy, mdy, ymd
  • time

  • integer

  • selectionMark – "v2.1-preview.1 の新機能"selectionMarkNew in v2.1-preview.1!

注意

日付の書式設定については、次の規則を参照してください。See these rules for date formatting:

日付書式設定を機能させるには、形式 (dmymdyymd) を指定する必要があります。You must specify a format (dmy, mdy, ymd) for date formatting to work.

, - / . \ は日付区切り記号として使用できます。The following characters can be used as date delimiters: , - / . \. 空白を区切り記号として使用することはできません。Whitespace cannot be used as a delimiter. 次に例を示します。For example:

  • 01,01,202001,01,2020
  • 01-01-202001-01-2020
  • 01/01/202001/01/2020

日付と月はそれぞれ 1 桁または 2 桁の数字として、年は 2 桁または 4 桁の数字として記述することができます。The day and month can each be written as one or two digits, and the year can be two or four digits:

  • 1-1-20201-1-2020
  • 1-01-201-01-20

日付文字列が 8 桁の場合、区切り文字は任意です。If a date string has eight digits, the delimiter is optional:

  • 0101202001012020
  • 01 01 202001 01 2020

月は、完全な名前または短い名前で記述することもできます。The month can also be written as its full or short name. 名前が使用されている場合、区切り文字は省略可能です。If the name is used, delimiter characters are optional. ただし、この形式は他の形式より正確ではないと認識されることがあります。However, this format may be recognized less accurately than others.

  • 01/Jan/202001/Jan/2020
  • 01Jan202001Jan2020
  • 01 Jan 202001 Jan 2020

テーブルにラベルを付ける (v2.1 のみ)Label tables (v2.1 only)

場合によって、データは、キーと値のペアではなくテーブルとしてラベル付けした方が役立つことがあります。At times, your data might lend itself better to being labeled as a table rather than key-value pairs. この場合は、[Add a new table tag](新しいテーブル タグの追加) をクリックしてテーブル タグを作成し、ドキュメントに応じてテーブルで固定行数と可変行数のどちらを使用するかを指定し、スキーマを定義できます。In this case, you can create a table tag by clicking on "Add a new table tag," specify whether the table will have a fixed number of rows or variable number of rows depending on the document, and define the schema.

テーブル タグの構成。

テーブル タグを定義したら、セルの値にタグを付けます。Once you have defined your table tag, tag the cell values.

テーブルのラベル付け。

カスタム モデルをトレーニングするTrain a custom model

左側のペインでトレーニング アイコンを選択して、[トレーニング] ページを開きます。Choose the Train icon on the left pane to open the Training page. 次に、 [Train](トレーニング) ボタンを選択して、モデルのトレーニングを開始します。Then select the Train button to begin training the model. トレーニング プロセスが完了すると、次の情報が表示されます。Once the training process completes, you'll see the following information:

  • [Model ID] - 作成およびトレーニングされたモデルの ID。Model ID - The ID of the model that was created and trained. トレーニングの呼び出しごとに、独自の ID を持つ新しいモデルが作成されます。Each training call creates a new model with its own ID. この文字列を安全な場所にコピーしてください。REST API またはクライアント ライブラリを使用して予測呼び出しを行う場合に必要になります。Copy this string to a secure location; you'll need it if you want to do prediction calls through the REST API or client library.
  • [Average Accuracy](平均精度) - モデルの平均精度。Average Accuracy - The model's average accuracy. 追加のフォームにラベルを付け、再度トレーニングを行って新しいモデルを作成することにより、モデルの精度を向上させることができます。You can improve model accuracy by labeling additional forms and retraining to create a new model. 最初は 5 つのフォームにラベルを付け、必要に応じてフォームの数を増やすことをお勧めします。We recommend starting by labeling five forms and adding more forms as needed.
  • タグの一覧と、タグごとの予測精度。The list of tags, and the estimated accuracy per tag.

トレーニング ビュー。

トレーニングが完了したら、 [Average Accuracy](平均精度) の値を確認します。After training finishes, examine the Average Accuracy value. 低い場合は、入力ドキュメントをさらに追加して、上記の手順を繰り返す必要があります。If it's low, you should add more input documents and repeat the steps above. 既にラベルを付けたドキュメントは、プロジェクトのインデックスに残ります。The documents you've already labeled will remain in the project index.

ヒント

REST API 呼び出しを使用してトレーニング プロセスを実行することもできます。You can also run the training process with a REST API call. これを行う方法については、Python によるラベルを使用したトレーニングに関するページを参照してください。To learn how to do this, see Train with labels using Python.

トレーニング済みのモデルを作成するCompose trained models

[Model Compose](モデルの作成) では、1 つのモデル ID に最大 100 個のモデルを作成できます。With Model Compose, you can compose up to 100 models to a single model ID. 作成された modelID で Analyze を呼び出すと、まず送信されたフォームが分類され、最も適合するモデルが選択され、そのモデルに対する結果が返されます。When you call Analyze with the composed modelID, Form Recognizer will first classify the form you submitted, choose the best matching model, and then return results for that model. この操作は、受信フォームが複数のテンプレートのいずれかに属している場合に役立ちます。This operation is useful when incoming forms may belong to one of several templates.

サンプル ラベル付けツールでモデルを作成するには、左側にある [Model Compose](モデルの作成) (結合する矢印) アイコンを選択します。To compose models in the sample labeling tool, select the Model Compose (merging arrow) icon on the left. 左側で、一緒に作成したいモデルを選択します。On the left, select the models you wish to compose together. 矢印アイコンの付いたモデルは、既に作成済みのモデルです。Models with the arrows icon are already composed models. [作成] ボタン を選択します。Choose the Compose button. ポップアップで、新しく作成するモデルに名前を付け、 [作成] をクリックします。In the pop-up, name your new composed model and select Compose. 操作が完了すると、新しく作成されたモデルが一覧に表示されます。When the operation completes, your newly composed model should appear in the list.

モデルの作成の UX ビュー。

フォームを分析するAnalyze a form

左側の予測 (電球) アイコンを選択して、モデルをテストします。Select the Predict (light bulb) icon on the left to test your model. トレーニング プロセスで使用しなかったフォーム ドキュメントをアップロードします。Upload a form document that you haven't used in the training process. 次に、右側にある [予測] ボタンを選択して、フォームのキーと値の予測を取得します。Then choose the Predict button on the right to get key/value predictions for the form. このツールでは、境界ボックスにタグが適用され、各タグの信頼度がレポートされます。The tool will apply tags in bounding boxes and will report the confidence of each tag.

ヒント

REST 呼び出しを使用して Analyze API を実行することもできます。You can also run the Analyze API with a REST call. これを行う方法については、Python によるラベルを使用したトレーニングに関するページを参照してください。To learn how to do this, see Train with labels using Python.

結果を改善するImprove results

レポートされる精度によっては、モデルを改善するために、さらにトレーニングを行う必要が生じる場合があります。Depending on the reported accuracy, you may want to do further training to improve the model. 予測が完了したら、適用されている各タグの信頼度の値を確認します。After you've done a prediction, examine the confidence values for each of the applied tags. トレーニングの平均精度値が高くても信頼度スコアが低い (または結果が不正確である) 場合は、予測ファイルをトレーニング セットに追加してラベルを付け、再度トレーニングを行う必要があります。If the average accuracy training value was high, but the confidence scores are low (or the results are inaccurate), you should add the prediction file to the training set, label it, and train again.

分析されたドキュメントがトレーニングで使用されたドキュメントと異なる場合は、レポートされる平均精度、信頼度スコア、および実際の精度に一貫性がなくなる場合があります。The reported average accuracy, confidence scores, and actual accuracy can be inconsistent when the analyzed documents differ from documents used in training. ドキュメントには、人間が見た場合に似ていても AI モデルにとっては異なって見えるものがあることに留意してください。Keep in mind that some documents look similar when viewed by people but can look distinct to the AI model. たとえば、2 つのバリエーションがあるフォームの種類を使ってトレーニングするとします。ここでは、トレーニング セットはバリエーション A 20%、バリエーション B 80% で構成されています。この場合、予測の際にバリエーション A のドキュメントの信頼度スコアが低くなる可能性があります。For example, you might train with a form type that has two variations, where the training set consists of 20% variation A and 80% variation B. During prediction, the confidence scores for documents of variation A are likely to be lower.

プロジェクトを保存して後で再開するSave a project and resume later

プロジェクトを時を改めて再開したり、別のブラウザーで再開したりするには、プロジェクトのセキュリティ トークンを保存し、後で再入力する必要があります。To resume your project at another time or in another browser, you need to save your project's security token and reenter it later.

プロジェクトの資格情報を取得するGet project credentials

プロジェクトの設定ページ (スライダー アイコン) に移動し、セキュリティ トークンの名前を書き留めます。Go to your project settings page (slider icon) and take note of the security token name. 次に、アプリケーション設定 (歯車アイコン) に移動します。ここには、現在のブラウザー インスタンスのセキュリティ トークンがすべて表示されます。Then go to your application settings (gear icon), which shows all of the security tokens in your current browser instance. プロジェクトのセキュリティ トークンを検索し、その名前とキー値を安全な場所にコピーします。Find your project's security token and copy its name and key value to a secure location.

プロジェクトの資格情報を復元するRestore project credentials

プロジェクトを再開する場合は、まず、同じ Blob Storage コンテナーへの接続を作成する必要があります。When you want to resume your project, you first need to create a connection to the same blob storage container. これを行うには、前述の手順を繰り返します。To do so, repeat the steps above. 次に、アプリケーション設定ページ (歯車アイコン) に移動し、プロジェクトのセキュリティ トークンがそこにあるかどうかを確認します。Then, go to the application settings page (gear icon) and see if your project's security token is there. ない場合は、新しいセキュリティ トークンを追加し、前の手順で保存したトークン名とキーをコピーします。If it isn't, add a new security token and copy over your token name and key from the previous step. [保存] を選択して設定を保持します。Select Save to retain your settings..

プロジェクトを再開するResume a project

最後に、メイン ページ (家のアイコン) に移動し、 [Open Cloud Project](クラウド プロジェクトを開く) を選択します。Finally, go to the main page (house icon) and select Open Cloud Project. その後、Blob Storage 接続を選択し、プロジェクトの .fott ファイルを選択します。Then select the blob storage connection, and select your project's .fott file. これにはセキュリティ トークンが含まれているため、アプリケーションによってプロジェクトの設定がすべて読み込まれます。The application will load all of the project's settings because it has the security token.

次のステップNext steps

このクイックスタートでは、Form Recognizer のサンプル ラベル付けツールを使用し、手動でラベル付けされたデータを使ってモデルをトレーニングする方法について説明しました。In this quickstart, you've learned how to use the Form Recognizer sample labeling tool to train a model with manually labeled data. トレーニング データにラベルを付ける独自のユーティリティを作成したい場合は、ラベル付けされたデータのトレーニングを扱う REST API を使用してください。If you'd like to build your own utility to label training data, use the REST APIs that deal with labeled data training.