OCR
OCR 関連の活動を実行するために OCR エンジンを開始
テキストが画面に表示される場合 (OCR)
テキストが画面に表示されるまで待機 (OCR)
OCR を使ってテキストを抽出
OCR アクションの使用を開始する
Power Automate を使用すると、ユーザーは光学式文字認識 (OCR) を通じてさまざまなファイルの中からデータの読み込み、抽出、管理を行うことができます。
OCR エンジンを作成し、OCR を使用して画像やドキュメントからテキストを抽出するには、OCRでテキストを抽出する アクションを使用します。 次の図では、エンジンはこのアクションのみを目的として作成されており、OCR ソースはローカルに保存されたイメージです。 アクションは、画像全体からテキストを抽出するように設定されています。 Power Automate は、Windows OCR エンジンと Tesseract エンジンの両方をサポートします。
OCR エンジンが作成されるアクションには、エンジン設定が含まれます。 これらには、言語と画像の幅と高さの乗数が含まれます。 OCR エンジン変数は、OCR 機能を含むすべてのアクションで使用できます。
Warning
画像の乗数は画像のサイズを大きくし、テキストの抽出や検索をより効果的におこなえるようにします。 3 より大きい値を設定すると、誤った結果が生じる可能性があることに注意してください。
Windows OCR エンジンの使用
Power Automate のすべての OCR アクションの既定エンジンは、Windows OCR エンジンです。 Windows OCR エンジンを使用してテキストを抽出するには、抽出する言語に適した言語パックをインストールする必要があります。
適切な言語パックがインストールされていない場合は、Power Automate インストールを促すエラーがスローされます。 言語パックのダウンロードとインストールに関する詳細については、Windows 用の言語パックを参照してください。
適切な言語パックをインストールした後、OCR アクションの OCR エンジン設定 を選択し、目的の言語を選択します。 Windows OCR エンジンは、中国語 (簡体字および繁体字)、チェコ語、デンマーク語、オランダ語、英語、フィンランド語、フランス語、ドイツ語、ギリシャ語、ハンガリー語、イタリア語、日本語、韓国語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、セルビア語 (キリル文字とラテン語)、スロバキア語、スペイン語、スウェーデン語、およびトルコ語の 25 言語をサポートしています。
Tesseract OCR エンジンの使用
Windows OCRエンジンとは別に、Power Automate は Tesseract エンジンをサポートします。 このエンジンは、英語、ドイツ語、スペイン語、フランス語、イタリア語の 5 つの言語でテキストを抽出できます。
上記のリスト以外の言語でテキストを抽出するには、OCR アクションの OCR エンジン設定 で 他の言語を使用する オプションを有効にします。 このオプションを有効にすると、アクションに 言語の省略形 と 言語データ パス フィールドの 2 つの追加設定が表示されます。
言語の略語 フィールドは、OCR 中に検索する言語をエンジンに示します。 言語データ パス フィールドには、OCR エンジンのトレーニングに使用される言語データ ファイル (.traineddata) が含まれます。 利用可能なすべての言語の言語データファイルは、この GitHub リポジトリにあります。
Tesseract エンジンは、多言語ドキュメントからテキストを抽出するためにも使用できます。 多言語ドキュメントからのテキストの抽出に関する詳細については、多言語ドキュメントで OCR を実行するを参照してください。
Note
Tesseract OCR エンジンを利用するには、コンピューターの CPU が AVX2 命令セットをサポートしていることを確認してください。
OCR アクション
テキストが画面に表示される場合 (OCR)
特定のテキストが画面に表示されるかどうかに応じて、OCR を使ってアクションの条件付きブロックの開始位置を示します
入力パラメーター
引数 | 省略可能 | 承認 | 既定 | 内容 |
---|---|---|---|---|
If text | N/A | 存在する、存在しない | 存在する | 分析する特定のソースにテキストが存在するかどうかを確認するかどうかを指定します |
OCR engine type | 無効 | Windows OCR エンジン、Tesseract エンジン、OCR エンジン変数 | OCR engine variable | 使用する OCR エンジン タイプ。 設定済みの OCR エンジンを選択するか、新しいエンジンを設定します。 |
OCR engine variable | 無効 | OCREngineObject | OCR 操作に使うエンジン | |
Text to find | 無効 | テキスト値 | 指定されたソース内で検索するテキスト | |
Is regular expression | N/A | ブール値 | 無効 | 指定されたテキストを検索するために正規表現を使うかどうかを指定します |
Search for text on | N/A | スクリーン全体、前景ウィンドウ | 画面全体 | 指定されたテキストを表示された画面全体で検索するかフォアグラウンド ウィンドウだけで検索するかを指定します |
Search mode | N/A | 特定のソース全体、特定のサブ領域のみ、イメージを基準としたサブ領域 | 指定されたすべてのソース | 画面 (またはウィンドウ) 全体をスキャンするか、そのサブ領域に絞り込むかを指定します |
画像 | いいえ | 画像のリスト | 指定されたテキストをスキャンするサブ領域 (画像の左上隅に対する相対値) を指定する画像 | |
X1 | 有効 | 数値 | 指定されたテキストをスキャンするサブ領域の開始 X 座標 | |
Tolerance | 有効 | 数値 | 10 | 最初に選択した画像に一致するまで、何回検索を繰り返すかを指定します |
Y1 | 有効 | 数値 | 指定されたテキストをスキャンするサブ領域の開始 Y 座標 | |
X1 | 有効 | 数値 | 指定されたテキストをスキャンする指定された画像に対するサブ領域の開始相対 X 座標 | |
X2 | 有効 | 数値 | 指定されたテキストをスキャンするサブ領域の終了 X 座標 | |
Y1 | 有効 | 数値 | 指定されたテキストをスキャンする指定された画像に対するサブ領域の開始相対 Y 座標 | |
Y2 | 有効 | 数値 | 指定されたテキストをスキャンするサブ領域の終了 Y 座標 | |
X2 | 有効 | 数値 | 指定されたテキストをスキャンする指定された画像に対するサブ領域の終了相対 X 座標 | |
Y2 | 有効 | 数値 | 指定されたテキストをスキャンする指定された画像に対するサブ領域の終了相対 Y 座標 | |
Windows OCR の言語 | N/A | 中国語 (簡体字および繁体字)、チェコ語、デンマーク語、オランダ語、英語、フィンランド語、フランス語、ドイツ語、ギリシャ語、ハンガリー語、イタリア語、日本語、韓国語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、セルビア語 (ラテン語)、スロバキア語、スペイン語、スウェーデン語、トルコ語 | English | Windows OCR エンジンが検出するテキストの言語 |
Use other language | N/A | ブール値 | 偽 | [Tesseract 言語] フィールドに指定されていない言語を使用するかどうかを指定します |
Tesseract language | N/A | 英語、ドイツ語、スペイン語、フランス語、イタリア語 | English | Tesseract エンジンにより検出されるテキストの言語 |
Language abbreviation | 無効 | テキスト値 | 使用する言語の Tesseract 言語コードです。 たとえば、データが 'eng.traineddata' の場合、これを 'eng' に設定します | |
言語データ パス | 無効 | テキスト値 | 指定された言語の Tesseract データを含むフォルダーのパス | |
Image width multiplier | 無効 | 数値 | 1 | 画像の幅の乗数 |
画像の高さの乗数 | 番号 | 数値 | 1 | 画像の高さの乗数 |
画像照合アルゴリズム | N/A | 基本、上級 | 基本 | 画像を検索するときに使用する画像のアルゴリズムです |
Note
- Power Automate の正規表現エンジンは .NET です。 詳細については、正規表現言語 - クイック リファレンス を参照してください。
- OCR エンジン変数 オプションは非推奨になる予定です。
作成された変数
引数 | タイプ | Description |
---|---|---|
LocationOfTextFoundX | 数値 | 画面上にテキストが表示されるポイントの X 座標。 検索が前景ウィンドウで行われた場合、返される座標はウィンドウの左上隅を基準とした相対座標となります |
LocationOfTextFoundY | 数値 | 画面上にテキストが表示されるポイントの X 座標。 検索が前景ウィンドウで行われた場合、返される座標はウィンドウの左上隅を基準とした相対座標となります |
例外
例外 | 内容 |
---|---|
非インタラクティブ モードではテキストが存在するかどうかをチェックできません | 非インタラクティブ モードの場合に、画面上のテキストをチェックできないことを示します |
無効なサブ領域座標 | 指定されたサブ領域の座標が無効であることを示します |
OCR を使ってテキストを分析できません | OCR を使ってテキストの分析中にエラーが発生したことを示します |
OCR エンジンを作成できません | OCR エンジンの作成中にエラーが発生したことを示します |
データ パス フォルダーが存在しません | 言語データの指定されたフォルダーが存在しないことを示します |
選択した Windows 言語パックがコンピューターにインストールされていません | 選択した Windows 言語パックがコンピューターにインストールされていないことを示します |
OCR エンジンが利用できません | OCR エンジンが利用できないことを示します |
テキストが画面に表示されるまで待機 (OCR)
画面、フォアグラウンド ウィンドウ、または OCR を使って画面またはフォアグラウンド ウィンドウの画像に対する相対位置に、特定のテキストが表示されるか消えるまで待機
入力パラメーター
引数 | 省略可能 | 承認 | 既定 | 内容 |
---|---|---|---|---|
Wait for text to | N/A | 表示、非表示 | 表示される | テキストが表示されるか消えるまで待機するかどうかを指定します |
OCR engine type | 無効 | Windows OCR エンジン、Tesseract エンジン、OCR エンジン変数 | OCR engine variable | 使用する OCR エンジン タイプ。 設定済みの OCR エンジンを選択するか、新しいエンジンを設定します。 |
OCR engine variable | 無効 | OCREngineObject | OCR 操作に使うエンジン | |
Text to find | 無効 | テキスト値 | 指定されたソース内で検索するテキスト | |
Is regular expression | N/A | ブール値 | 無効 | 指定されたテキストを検索するために正規表現を使うかどうかを指定します |
Search for text on | N/A | スクリーン全体、前景ウィンドウ | 画面全体 | 指定されたテキストを表示された画面全体で検索するかフォアグラウンド ウィンドウだけで検索するかを指定します |
Search mode | N/A | 特定のソース全体、特定のサブ領域のみ、イメージを基準としたサブ領域 | 指定されたすべてのソース | 画面 (またはウィンドウ) 全体をスキャンするか、そのサブ領域に絞り込むかを指定します |
画像 | いいえ | 画像のリスト | 指定されたテキストをスキャンするサブ領域 (画像の左上隅に対する相対値) を指定する画像 | |
X1 | 有効 | 数値 | 指定されたテキストをスキャンするサブ領域の開始 X 座標 | |
Tolerance | 有効 | 数値 | 10 | 最初に選択した画像に一致するまで、何回検索を繰り返すかを指定します |
Y1 | 有効 | 数値 | 指定されたテキストをスキャンするサブ領域の開始 Y 座標 | |
X1 | 有効 | 数値 | 指定されたテキストをスキャンする指定された画像に対するサブ領域の開始相対 X 座標 | |
X2 | 有効 | 数値 | 指定されたテキストをスキャンするサブ領域の終了 X 座標 | |
Y1 | 有効 | 数値 | 指定されたテキストをスキャンする指定された画像に対するサブ領域の開始相対 Y 座標 | |
Y2 | 有効 | 数値 | 指定されたテキストをスキャンするサブ領域の終了 Y 座標 | |
X2 | 有効 | 数値 | 指定されたテキストをスキャンする指定された画像に対するサブ領域の終了相対 X 座標 | |
Y2 | 有効 | 数値 | 指定されたテキストをスキャンする指定された画像に対するサブ領域の終了相対 Y 座標 | |
Windows OCR の言語 | N/A | 中国語 (簡体字および繁体字)、チェコ語、デンマーク語、オランダ語、英語、フィンランド語、フランス語、ドイツ語、ギリシャ語、ハンガリー語、イタリア語、日本語、韓国語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、セルビア語 (ラテン語)、スロバキア語、スペイン語、スウェーデン語、トルコ語 | English | Windows OCR エンジンが検出するテキストの言語 |
Use other language | N/A | ブール値 | 偽 | [Tesseract 言語] フィールドに指定されていない言語を使用するかどうかを指定します |
Tesseract language | N/A | 英語、ドイツ語、スペイン語、フランス語、イタリア語 | English | Tesseract エンジンにより検出されるテキストの言語 |
Language abbreviation | 無効 | テキスト値 | 使用する言語の Tesseract 言語コードです。 たとえば、データが 'eng.traineddata' の場合、これを 'eng' に設定します | |
言語データ パス | 無効 | テキスト値 | 指定された言語の Tesseract データを含むフォルダーのパス | |
Image width multiplier | 無効 | 数値 | 1 | 画像の幅の乗数 |
画像の高さの乗数 | 番号 | 数値 | 1 | 画像の高さの乗数 |
画像照合アルゴリズム | N/A | 基本、上級 | 基本 | 画像を検索するときに使用する画像のアルゴリズムです |
タイムアウト エラーで失敗しました | N/A | ブール値 | False | アクションを無期限に待機するか、設定した期間後にエラーにするかを指定します |
Note
- Power Automate の正規表現エンジンは .NET です。 詳細については、正規表現言語 - クイック リファレンス を参照してください。
- OCR エンジン変数 オプションは非推奨になる予定です。
作成された変数
引数 | タイプ | Description |
---|---|---|
LocationOfTextFoundX | 数値 | 画面上にテキストが表示されるポイントの X 座標。 検索が前景ウィンドウで行われた場合、返される座標はウィンドウの左上隅を基準とした相対座標となります |
LocationOfTextFoundY | 数値 | 画面上にテキストが表示されるポイントの X 座標。 検索が前景ウィンドウで行われた場合、返される座標はウィンドウの左上隅を基準とした相対座標となります |
例外
例外 | 内容 |
---|---|
非インタラクティブ モードではテキストが存在するかどうかをチェックできません | 非インタラクティブ モードの場合に、画面上のテキストをチェックできないことを示します |
無効なサブ領域座標 | 指定されたサブ領域の座標が無効であることを示します |
OCR を使ってテキストを分析できません | OCR を使ってテキストの分析中にエラーが発生したことを示します |
OCR エンジンを作成できません | OCR エンジンの作成中にエラーが発生したことを示します |
データ パス フォルダーが存在しません | 言語データの指定されたフォルダーが存在しないことを示します |
選択した Windows 言語パックがコンピューターにインストールされていません | 選択した Windows 言語パックがコンピューターにインストールされていないことを示します |
OCR エンジンが利用できません | OCR エンジンが利用できないことを示します |
タイムアウト エラー | 設定した時間が経過した後にアクションが失敗したことを示します |
OCR を使ってテキストを抽出
指定された OCR エンジンを使って指定されたソースからテキストを抽出
入力パラメーター
引数 | 任意出席者 | 承認 | 既定値 | Description |
---|---|---|---|---|
OCR engine | 無効 | Windows OCR エンジン、Tesseract エンジン、OCR エンジン変数 | OCR engine variable | 使用する OCR エンジン タイプ。 事前構成済みの OCR エンジンまたは新しい OCR エンジンを選択します |
OCR エンジン変数 | 番号 | OCREngineObject | OCR 操作に使うエンジン | |
OCR source | N/A | スクリーン、前景ウィンドウ、ディスク上のイメージ | スクリーン | OCR 操作を実行する画像のソース |
Image file path | 無効 | ファイル | OCR 操作を実行する画像のパス | |
Search mode | N/A | 特定のソース全体、特定のサブ領域のみ、イメージを基準としたサブ領域 | 指定されたすべてのソース | OCR 操作に選択したモード |
画像 | いいえ | 画像のリスト | 指定した画像に対するサブ領域の相対位置にスキャンを絞り込むために使う画像 | |
Tolerance | 有効 | 数値 | 10 | 最初に選択した画像と比較して、画像がどれだけ異なるかを指定します |
X1 | 有効 | 数値 | スキャンを絞り込むサブ領域の開始 X 座標 | |
X2 | 有効 | 数値 | スキャンを絞り込むサブ領域の終了 X 座標 | |
Y1 | 有効 | 数値 | スキャンを絞り込むサブ領域の開始 Y 座標 | |
Y2 | 有効 | 数値 | スキャンを絞り込むサブ領域の終了 Y 座標 | |
Windows OCR の言語 | N/A | 中国語 (簡体字および繁体字)、チェコ語、デンマーク語、オランダ語、英語、フィンランド語、フランス語、ドイツ語、ギリシャ語、ハンガリー語、イタリア語、日本語、韓国語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、セルビア語 (ラテン語)、スロバキア語、スペイン語、スウェーデン語、トルコ語 | English | Windows OCR エンジンが検出するテキストの言語 |
Use other language | N/A | ブール値 | 偽 | [Tesseract 言語] フィールドに指定されていない言語を使用するかどうかを指定します |
Tesseract language | N/A | 英語、ドイツ語、スペイン語、フランス語、イタリア語 | English | Tesseract エンジンにより検出されるテキストの言語 |
Language abbreviation | 無効 | テキスト値 | 使用する言語の Tesseract 言語コードです。 たとえば、データが 'eng.traineddata' の場合、これを 'eng' に設定します | |
言語データ パス | 無効 | テキスト値 | 指定された言語の Tesseract データを含むフォルダーのパス | |
Image width multiplier | 無効 | 数値 | 1 | 画像の幅の乗数 |
Image height multiplier | 番号 | 数値 | 1 | 画像の高さの乗数 |
画像が表示されるまで待機 | N/A | ブール値 | True | 画面や前景ウィンドウに画像が表示されるのを待機するかどうかを指定します |
タイムアウト | 番号 | 数値 | 5 | アクションが失敗するまで操作の完了を待機する時間を指定します |
画像照合アルゴリズム | N/A | 基本、上級 | 基本 | 画像を検索するときに使用する画像のアルゴリズムです |
Note
OCR エンジン変数 オプションは非推奨になる予定です。
作成された変数
引数 | タイプ | Description |
---|---|---|
OcrText | テキスト値 | テキスト抽出後の結果 |
例外
例外 | 内容 |
---|---|
OCR を使ってテキストを抽出できません | 指定されたソースから OCR を使ってテキストを抽出しているときにエラーが発生したことを示します |
画像ファイルが見つかりません | 指定されたパスにファイルが存在しないことを示します |
ランドマーク画像が見つかりません | ランドマーク画像が存在しないことを示します |
非インタラクティブ モードでは画面からテキストを取得できません | 非インタラクティブ モードの場合に、画面からテキストを取得できないことを示します |
OCR エンジンを作成できません | OCR エンジンの作成中にエラーが発生したことを示します |
データ パス フォルダーが存在しません | 言語データの指定されたフォルダーが存在しないことを示します |
選択した Windows 言語パックがコンピューターにインストールされていません | 選択した Windows 言語パックがコンピューターにインストールされていないことを示します |
OCR エンジンが利用できません | OCR エンジンが利用できないことを示します |
Note
ドキュメントの言語設定についてお聞かせください。 簡単な調査を行います。 (この調査は英語です)
この調査には約 7 分かかります。 個人データは収集されません (プライバシー ステートメント)。
フィードバック
フィードバックの送信と表示