OCR

OCR 関連の活動を実行するために OCR エンジンを開始

テキストが画面に表示される場合 (OCR)
テキストが画面に表示されるまで待機 (OCR)
OCR を使ってテキストを抽出

OCR アクションの使用を開始する

Power Automate を使用すると、ユーザーは光学式文字認識 (OCR) を通じてさまざまなファイルの中からデータの読み込み、抽出、管理を行うことができます。

OCR エンジンを作成し、OCR を使用して画像やドキュメントからテキストを抽出するには、OCRでテキストを抽出する アクションを使用します。 次の図では、エンジンはこのアクションのみを目的として作成されており、OCR ソースはローカルに保存されたイメージです。 アクションは、画像全体からテキストを抽出するように設定されています。 Power Automate は、Windows OCR エンジンと Tesseract エンジンの両方をサポートします。

[OCR でテキストを抽出] アクションのスクリーンショット。

OCR エンジンが作成されるアクションには、エンジン設定が含まれます。 これらには、言語と画像の幅と高さの乗数が含まれます。 OCR エンジン変数は、OCR 機能を含むすべてのアクションで使用できます。

Warning

画像の乗数は画像のサイズを大きくし、テキストの抽出や検索をより効果的におこなえるようにします。 3 より大きい値を設定すると、誤った結果が生じる可能性があることに注意してください。

Windows OCR エンジンの使用

Power Automate のすべての OCR アクションの既定エンジンは、Windows OCR エンジンです。 Windows OCR エンジンを使用してテキストを抽出するには、抽出する言語に適した言語パックをインストールする必要があります。

適切な言語パックがインストールされていない場合は、Power Automate インストールを促すエラーがスローされます。 言語パックのダウンロードとインストールに関する詳細については、Windows 用の言語パックを参照してください。

適切な言語パックをインストールした後、OCR アクションの OCR エンジン設定 を選択し、目的の言語を選択します。 Windows OCR エンジンは、中国語 (簡体字および繁体字)、チェコ語、デンマーク語、オランダ語、英語、フィンランド語、フランス語、ドイツ語、ギリシャ語、ハンガリー語、イタリア語、日本語、韓国語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、セルビア語 (キリル文字とラテン語)、スロバキア語、スペイン語、スウェーデン語、およびトルコ語の 25 言語をサポートしています。

Tesseract OCR エンジンの使用

Windows OCRエンジンとは別に、Power Automate は Tesseract エンジンをサポートします。 このエンジンは、英語、ドイツ語、スペイン語、フランス語、イタリア語の 5 つの言語でテキストを抽出できます。

上記のリスト以外の言語でテキストを抽出するには、OCR アクションの OCR エンジン設定他の言語を使用する オプションを有効にします。 このオプションを有効にすると、アクションに 言語の省略形言語データ パス フィールドの 2 つの追加設定が表示されます。

言語の略語 フィールドは、OCR 中に検索する言語をエンジンに示します。 言語データ パス フィールドには、OCR エンジンのトレーニングに使用される言語データ ファイル (.traineddata) が含まれます。 利用可能なすべての言語の言語データファイルは、この GitHub リポジトリにあります。

Tesseract エンジンは、多言語ドキュメントからテキストを抽出するためにも使用できます。 多言語ドキュメントからのテキストの抽出に関する詳細については、多言語ドキュメントで OCR を実行するを参照してください。

Note

Tesseract OCR エンジンを利用するには、コンピューターの CPU が AVX2 命令セットをサポートしていることを確認してください。

OCR アクション

テキストが画面に表示される場合 (OCR)

特定のテキストが画面に表示されるかどうかに応じて、OCR を使ってアクションの条件付きブロックの開始位置を示します

入力パラメーター
引数 省略可能 承認 既定 内容
If text N/A 存在する、存在しない 存在する 分析する特定のソースにテキストが存在するかどうかを確認するかどうかを指定します
OCR engine type 無効 Windows OCR エンジン、Tesseract エンジン、OCR エンジン変数 OCR engine variable 使用する OCR エンジン タイプ。 設定済みの OCR エンジンを選択するか、新しいエンジンを設定します。
OCR engine variable 無効 OCREngineObject OCR 操作に使うエンジン
Text to find 無効 テキスト値 指定されたソース内で検索するテキスト
Is regular expression N/A ブール値 無効 指定されたテキストを検索するために正規表現を使うかどうかを指定します
Search for text on N/A スクリーン全体、前景ウィンドウ 画面全体 指定されたテキストを表示された画面全体で検索するかフォアグラウンド ウィンドウだけで検索するかを指定します
Search mode N/A 特定のソース全体、特定のサブ領域のみ、イメージを基準としたサブ領域 指定されたすべてのソース 画面 (またはウィンドウ) 全体をスキャンするか、そのサブ領域に絞り込むかを指定します
画像 いいえ 画像リスト 指定されたテキストをスキャンするサブ領域 (画像の左上隅に対する相対値) を指定する画像
X1 有効 数値 指定されたテキストをスキャンするサブ領域の開始 X 座標
Tolerance 有効 数値 10 最初に選択した画像に一致するまで、何回検索を繰り返すかを指定します
Y1 有効 数値 指定されたテキストをスキャンするサブ領域の開始 Y 座標
X1 有効 数値 指定されたテキストをスキャンする指定された画像に対するサブ領域の開始相対 X 座標
X2 有効 数値 指定されたテキストをスキャンするサブ領域の終了 X 座標
Y1 有効 数値 指定されたテキストをスキャンする指定された画像に対するサブ領域の開始相対 Y 座標
Y2 有効 数値 指定されたテキストをスキャンするサブ領域の終了 Y 座標
X2 有効 数値 指定されたテキストをスキャンする指定された画像に対するサブ領域の終了相対 X 座標
Y2 有効 数値 指定されたテキストをスキャンする指定された画像に対するサブ領域の終了相対 Y 座標
Windows OCR の言語 N/A 中国語 (簡体字および繁体字)、チェコ語、デンマーク語、オランダ語、英語、フィンランド語、フランス語、ドイツ語、ギリシャ語、ハンガリー語、イタリア語、日本語、韓国語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、セルビア語 (ラテン語)、スロバキア語、スペイン語、スウェーデン語、トルコ語 English Windows OCR エンジンが検出するテキストの言語
Use other language N/A ブール値 [Tesseract 言語] フィールドに指定されていない言語を使用するかどうかを指定します
Tesseract language N/A 英語、ドイツ語、スペイン語、フランス語、イタリア語 English Tesseract エンジンにより検出されるテキストの言語
Language abbreviation 無効 テキスト値 使用する言語の Tesseract 言語コードです。 たとえば、データが 'eng.traineddata' の場合、これを 'eng' に設定します
言語データ パス 無効 テキスト値 指定された言語の Tesseract データを含むフォルダーのパス
Image width multiplier 無効 数値 1 画像の幅の乗数
画像の高さの乗数 番号 数値 1 画像の高さの乗数
画像照合アルゴリズム N/A 基本、上級 基本 画像を検索するときに使用する画像のアルゴリズムです

Note

作成された変数
引数 タイプ Description
LocationOfTextFoundX 数値 画面上にテキストが表示されるポイントの X 座標。 検索が前景ウィンドウで行われた場合、返される座標はウィンドウの左上隅を基準とした相対座標となります
LocationOfTextFoundY 数値 画面上にテキストが表示されるポイントの X 座標。 検索が前景ウィンドウで行われた場合、返される座標はウィンドウの左上隅を基準とした相対座標となります
例外
例外 内容
非インタラクティブ モードではテキストが存在するかどうかをチェックできません 非インタラクティブ モードの場合に、画面上のテキストをチェックできないことを示します
無効なサブ領域座標 指定されたサブ領域の座標が無効であることを示します
OCR を使ってテキストを分析できません OCR を使ってテキストの分析中にエラーが発生したことを示します
OCR エンジンを作成できません OCR エンジンの作成中にエラーが発生したことを示します
データ パス フォルダーが存在しません 言語データの指定されたフォルダーが存在しないことを示します
選択した Windows 言語パックがコンピューターにインストールされていません 選択した Windows 言語パックがコンピューターにインストールされていないことを示します
OCR エンジンが利用できません OCR エンジンが利用できないことを示します

テキストが画面に表示されるまで待機 (OCR)

画面、フォアグラウンド ウィンドウ、または OCR を使って画面またはフォアグラウンド ウィンドウの画像に対する相対位置に、特定のテキストが表示されるか消えるまで待機

入力パラメーター
引数 省略可能 承認 既定 内容
Wait for text to N/A 表示、非表示 表示される テキストが表示されるか消えるまで待機するかどうかを指定します
OCR engine type 無効 Windows OCR エンジン、Tesseract エンジン、OCR エンジン変数 OCR engine variable 使用する OCR エンジン タイプ。 設定済みの OCR エンジンを選択するか、新しいエンジンを設定します。
OCR engine variable 無効 OCREngineObject OCR 操作に使うエンジン
Text to find 無効 テキスト値 指定されたソース内で検索するテキスト
Is regular expression N/A ブール値 無効 指定されたテキストを検索するために正規表現を使うかどうかを指定します
Search for text on N/A スクリーン全体、前景ウィンドウ 画面全体 指定されたテキストを表示された画面全体で検索するかフォアグラウンド ウィンドウだけで検索するかを指定します
Search mode N/A 特定のソース全体、特定のサブ領域のみ、イメージを基準としたサブ領域 指定されたすべてのソース 画面 (またはウィンドウ) 全体をスキャンするか、そのサブ領域に絞り込むかを指定します
画像 いいえ 画像リスト 指定されたテキストをスキャンするサブ領域 (画像の左上隅に対する相対値) を指定する画像
X1 有効 数値 指定されたテキストをスキャンするサブ領域の開始 X 座標
Tolerance 有効 数値 10 最初に選択した画像に一致するまで、何回検索を繰り返すかを指定します
Y1 有効 数値 指定されたテキストをスキャンするサブ領域の開始 Y 座標
X1 有効 数値 指定されたテキストをスキャンする指定された画像に対するサブ領域の開始相対 X 座標
X2 有効 数値 指定されたテキストをスキャンするサブ領域の終了 X 座標
Y1 有効 数値 指定されたテキストをスキャンする指定された画像に対するサブ領域の開始相対 Y 座標
Y2 有効 数値 指定されたテキストをスキャンするサブ領域の終了 Y 座標
X2 有効 数値 指定されたテキストをスキャンする指定された画像に対するサブ領域の終了相対 X 座標
Y2 有効 数値 指定されたテキストをスキャンする指定された画像に対するサブ領域の終了相対 Y 座標
Windows OCR の言語 N/A 中国語 (簡体字および繁体字)、チェコ語、デンマーク語、オランダ語、英語、フィンランド語、フランス語、ドイツ語、ギリシャ語、ハンガリー語、イタリア語、日本語、韓国語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、セルビア語 (ラテン語)、スロバキア語、スペイン語、スウェーデン語、トルコ語 English Windows OCR エンジンが検出するテキストの言語
Use other language N/A ブール値 [Tesseract 言語] フィールドに指定されていない言語を使用するかどうかを指定します
Tesseract language N/A 英語、ドイツ語、スペイン語、フランス語、イタリア語 English Tesseract エンジンにより検出されるテキストの言語
Language abbreviation 無効 テキスト値 使用する言語の Tesseract 言語コードです。 たとえば、データが 'eng.traineddata' の場合、これを 'eng' に設定します
言語データ パス 無効 テキスト値 指定された言語の Tesseract データを含むフォルダーのパス
Image width multiplier 無効 数値 1 画像の幅の乗数
画像の高さの乗数 番号 数値 1 画像の高さの乗数
画像照合アルゴリズム N/A 基本、上級 基本 画像を検索するときに使用する画像のアルゴリズムです
タイムアウト エラーで失敗しました N/A ブール値 False アクションを無期限に待機するか、設定した期間後にエラーにするかを指定します

Note

作成された変数
引数 タイプ Description
LocationOfTextFoundX 数値 画面上にテキストが表示されるポイントの X 座標。 検索が前景ウィンドウで行われた場合、返される座標はウィンドウの左上隅を基準とした相対座標となります
LocationOfTextFoundY 数値 画面上にテキストが表示されるポイントの X 座標。 検索が前景ウィンドウで行われた場合、返される座標はウィンドウの左上隅を基準とした相対座標となります
例外
例外 内容
非インタラクティブ モードではテキストが存在するかどうかをチェックできません 非インタラクティブ モードの場合に、画面上のテキストをチェックできないことを示します
無効なサブ領域座標 指定されたサブ領域の座標が無効であることを示します
OCR を使ってテキストを分析できません OCR を使ってテキストの分析中にエラーが発生したことを示します
OCR エンジンを作成できません OCR エンジンの作成中にエラーが発生したことを示します
データ パス フォルダーが存在しません 言語データの指定されたフォルダーが存在しないことを示します
選択した Windows 言語パックがコンピューターにインストールされていません 選択した Windows 言語パックがコンピューターにインストールされていないことを示します
OCR エンジンが利用できません OCR エンジンが利用できないことを示します
タイムアウト エラー 設定した時間が経過した後にアクションが失敗したことを示します

OCR を使ってテキストを抽出

指定された OCR エンジンを使って指定されたソースからテキストを抽出

入力パラメーター
引数 任意出席者 承認 既定値 Description
OCR engine 無効 Windows OCR エンジン、Tesseract エンジン、OCR エンジン変数 OCR engine variable 使用する OCR エンジン タイプ。 事前構成済みの OCR エンジンまたは新しい OCR エンジンを選択します
OCR エンジン変数 番号 OCREngineObject OCR 操作に使うエンジン
OCR source N/A スクリーン、前景ウィンドウ、ディスク上のイメージ スクリーン OCR 操作を実行する画像のソース
Image file path 無効 ファイル OCR 操作を実行する画像のパス
Search mode N/A 特定のソース全体、特定のサブ領域のみ、イメージを基準としたサブ領域 指定されたすべてのソース OCR 操作に選択したモード
画像 いいえ 画像リスト 指定した画像に対するサブ領域の相対位置にスキャンを絞り込むために使う画像
Tolerance 有効 数値 10 最初に選択した画像と比較して、画像がどれだけ異なるかを指定します
X1 有効 数値 スキャンを絞り込むサブ領域の開始 X 座標
X2 有効 数値 スキャンを絞り込むサブ領域の終了 X 座標
Y1 有効 数値 スキャンを絞り込むサブ領域の開始 Y 座標
Y2 有効 数値 スキャンを絞り込むサブ領域の終了 Y 座標
Windows OCR の言語 N/A 中国語 (簡体字および繁体字)、チェコ語、デンマーク語、オランダ語、英語、フィンランド語、フランス語、ドイツ語、ギリシャ語、ハンガリー語、イタリア語、日本語、韓国語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、セルビア語 (ラテン語)、スロバキア語、スペイン語、スウェーデン語、トルコ語 English Windows OCR エンジンが検出するテキストの言語
Use other language N/A ブール値 [Tesseract 言語] フィールドに指定されていない言語を使用するかどうかを指定します
Tesseract language N/A 英語、ドイツ語、スペイン語、フランス語、イタリア語 English Tesseract エンジンにより検出されるテキストの言語
Language abbreviation 無効 テキスト値 使用する言語の Tesseract 言語コードです。 たとえば、データが 'eng.traineddata' の場合、これを 'eng' に設定します
言語データ パス 無効 テキスト値 指定された言語の Tesseract データを含むフォルダーのパス
Image width multiplier 無効 数値 1 画像の幅の乗数
Image height multiplier 番号 数値 1 画像の高さの乗数
画像が表示されるまで待機 N/A ブール値 True 画面や前景ウィンドウに画像が表示されるのを待機するかどうかを指定します
タイムアウト 番号 数値 5 アクションが失敗するまで操作の完了を待機する時間を指定します
画像照合アルゴリズム N/A 基本、上級 基本 画像を検索するときに使用する画像のアルゴリズムです

Note

OCR エンジン変数 オプションは非推奨になる予定です。

作成された変数
引数 タイプ Description
OcrText テキスト値 テキスト抽出後の結果
例外
例外 内容
OCR を使ってテキストを抽出できません 指定されたソースから OCR を使ってテキストを抽出しているときにエラーが発生したことを示します
画像ファイルが見つかりません 指定されたパスにファイルが存在しないことを示します
ランドマーク画像が見つかりません ランドマーク画像が存在しないことを示します
非インタラクティブ モードでは画面からテキストを取得できません 非インタラクティブ モードの場合に、画面からテキストを取得できないことを示します
OCR エンジンを作成できません OCR エンジンの作成中にエラーが発生したことを示します
データ パス フォルダーが存在しません 言語データの指定されたフォルダーが存在しないことを示します
選択した Windows 言語パックがコンピューターにインストールされていません 選択した Windows 言語パックがコンピューターにインストールされていないことを示します
OCR エンジンが利用できません OCR エンジンが利用できないことを示します

Note

ドキュメントの言語設定についてお聞かせください。 簡単な調査を行います。 (この調査は英語です)

この調査には約 7 分かかります。 個人データは収集されません (プライバシー ステートメント)。