Share via


Ações de OCR

O Power Automate permite a usuários ler, extrair e gerenciar dados em arquivos por meio do OCR (reconhecimento óptico de caracteres).

Para criar um mecanismo de OCR e extrair texto de imagens e documentos, use a ação Extrair texto com OCR. O exemplo a seguir extrai o texto de toda a imagem especificada.

Captura de tela da ação Extrair texto com OCR.

Todas as ações de OCR podem criar uma nova variável de mecanismo de OCR ou usar uma existente. Você pode usar variáveis existentes do mecanismo de OCR em qualquer ação que ofereça recursos de OCR.

O Power Automate oferece suporte aos mecanismos de OCR e Tesseract do Windows. Para configurar o mecanismo de OCR selecionado, navegue até Configurações do mecanismo de OCR da ação apropriada. As opções disponíveis incluem o idioma, a altura da imagem e os multiplicadores de largura.

Observação

  • Todos os mecanismos de OCR disponíveis são pré-instalados no Power Automate e funcionam localmente sem conexão à nuvem. No entanto, pode ser necessário baixar pacotes de idiomas ou arquivos de dados para extrair textos em idiomas específicos.
  • Os multiplicadores aumentam o tamanho da imagem para tornar a pesquisa e a extração de texto mais eficazes. A definição de valores maiores que 3 pode levar a resultados errôneos.

Use do mecanismo de OCR do Windows

O mecanismo de OCR padrão no Power Automate é o mecanismo de OCR do Windows. Para extrair textos usando o mecanismo de OCR do Windows, você deve instalar o pacote de idiomas apropriado para o idioma a ser extraído.

Se o pacote de idiomas apropriado não estiver instalado, o Power Automate gerará um erro solicitando que você o instale. Para encontrar mais informações sobre como baixar e instalar pacotes de idiomas, vá para Pacotes de idiomas para o Windows.

Depois de instalar o pacote de idiomas apropriado, estenda as Configurações do mecanismo de OCR da ação de OCR e selecione o idioma desejado. O mecanismo de OCR do Windows dá suporte a 25 idiomas, incluindo: chinês (simplificado e tradicional), tcheco, dinamarquês, holandês, inglês, finlandês, francês, alemão, grego, húngaro, italiano, japonês, coreano, norueguês, polonês, português, romeno, russo, sérvio (cirílico e latim), eslovaco, espanhol, sueco e turco.

Usar o mecanismo de OCR do Tesseract

Observação

Para usar o mecanismo de OCR Tesseract, certifique-se de que a CPU do computador seja compatível com o conjunto de instruções AVX2.

Além do mecanismo de OCR do Windows, o Power Automate dá suporte ao mecanismo Tesseract. Esse mecanismo pode extrair texto em cinco idiomas sem configuração adicional: inglês, alemão, espanhol, francês e italiano.

Para extrair texto em um idioma fora da lista mencionada, habilite a opção Usar outros idiomas nas Configurações do mecanismo de OCR da ação de OCR. Quando esta opção estiver habilitada, a ação exibirá mais dois parâmetros: Abreviação do idioma e Caminho de dados do idioma.

O campo Abreviação do idioma indica para o mecanismo qual idioma procurar durante o OCR. O campo Caminho de dados do idioma contém os arquivos de dados do idioma (.traineddata) usado para treinar o mecanismo de OCR. Você pode encontrar os arquivos de dados de idioma para todos os idiomas disponíveis neste repositório do GitHub.

Você também pode usar o mecanismo Tesseract para extrair texto de documentos multilíngues. Para encontrar mais informações sobre como extrair texto de documentos multilíngues, vá para Executar o OCR em documentos multilíngues.

Se existe texto na tela (OCR)

Marca o início de um bloco condicional de ações, dependendo de um determinado texto aparecer ou não na tela, usando o OCR.

Parâmetros de entrada

Argumento Opcional Aceita Valor padrão Description
Se for texto N/D Existe, Não existe Existe Especifica se deve verificar a existência do texto na origem fornecida para ser analisada
Tipo de mecanismo de OCR Não Mecanismo de OCR do Windows, mecanismo Tesseract, variável de mecanismo de OCR Variável de mecanismo de OCR O tipo de mecanismo de OCR a ser usado. Selecione um mecanismo de OCR pré-configurado ou configure um novo.
Variável de mecanismo de OCR Não OCREngineObject O mecanismo a ser usado para a operação de OCR
Text to find Não Valor do texto O texto a ser pesquisado na origem especificada
Is regular expression N/D Valor booliano False Especifica se deve ser usada uma expressão regular para localizar o texto especificado
Search for text on N/D Tela inteira, Janela em primeiro plano Tela inteira Especifica se deve ser pesquisado o texto especificado em toda a tela visível ou apenas na janela de primeiro plano
Search mode N/A Toda a fonte especificada, Somente a sub-região específica, Sub-região relativa à imagem Toda a origem especificada Especifica se deve verificar toda a tela (ou janela) ou uma sub-região reduzida dela
Imagens Não Lista de Imagens As imagens que especificam a sub-região (em relação ao canto superior esquerdo da imagem) a ser verificada para o texto fornecido
X1 Sim Valor numérico A coordenada X inicial da sub-região a ser verificada para o texto fornecido
Tolerance Sim Valor numérico 10 Especifica o quanto as imagens pesquisadas podem ser diferentes da imagem escolhida originalmente
Y1 Sim Valor numérico A coordenada Y inicial da sub-região a ser verificada para o texto fornecido
X1 Sim Valor numérico A coordenada X inicial da sub-região relativa à imagem especificada a ser verificada para o texto fornecido
X2 Sim Valor numérico A coordenada X final da sub-região a ser verificada para o texto fornecido
Y1 Sim Valor numérico A coordenada Y inicial da sub-região relativa à imagem especificada a ser verificada para o texto fornecido
Y2 Sim Valor numérico A coordenada Y final da sub-região a ser verificada para o texto fornecido
X2 Sim Valor numérico A coordenada X final da sub-região relativa à imagem especificada a ser verificada para o texto fornecido
Y2 Sim Valor numérico A coordenada Y final da sub-região relativa à imagem especificada a ser verificada para o texto fornecido
Idioma do OCR do Windows N/A Chinês (simplificado), chinês (tradicional), tcheco, dinamarquês, holandês, inglês, finlandês, francês, alemão, grego, húngaro, italiano, japonês, coreano, norueguês, polonês, português, romeno, russo, sérvio (cirílico), sérvio (latino), eslovaco, espanhol, sueco, turco Inglês O idioma do texto detectado pelo mecanismo de OCR do Windows
Usar outro idioma N/A Valor booliano Falso Especifica se um idioma que não foi fornecido no campo "Idioma do Tesseract" deve ser usado
Idioma do Tesseract N/A Inglês, alemão, espanhol, francês, italiano Inglês O idioma do texto que o mecanismo Tesseract detecta
Abreviação do idioma Não Valor do texto A abreviação Tesseract do idioma a ser usado. Por exemplo, se os dados forem "eng.traineddata", defina este parâmetro como "eng"
Caminho de dados do idioma Não Valor do texto O caminho da pasta que contém os dados do Tesseract do idioma especificado
Multiplicador de largura da imagem Não Valor numérico 1 O multiplicador de largura da imagem
Multiplicador de altura da imagem Não Valor numérico 1 O multiplicador de altura da imagem
Algoritmo de correspondência de imagens N/A Básico, Avançado Básica Qual algoritmo de imagem usar ao pesquisar por imagem

Observação

Variáveis produzidas

Argumento Type Description
LocationOfTextFoundX Valor numérico A coordenada X do ponto em que o texto aparece na tela. Se a pesquisa for realizada na janela em primeiro plano, a coordenada retornada é relativa ao canto superior esquerdo da janela
LocationOfTextFoundY Valor numérico A coordenada X do ponto em que o texto aparece na tela. Se a pesquisa for realizada na janela em primeiro plano, a coordenada retornada é relativa ao canto superior esquerdo da janela

Exceções

Exceção Description
Não é possível verificar se existe texto no modo não interativo Indica que não é possível verificar o texto na tela quando no modo não interativo
Invalid subregion coordinates Indica que as coordenadas especificadas da sub-região são inválidas
Failed to analyze text with OCR Indica que ocorreu um erro ao tentar analisar o texto usando OCR
Falha ao criar o mecanismo de OCR Indica que ocorreu um erro ao tentar criar o mecanismo de OCR
A pasta de caminho de dados não existe Indica que a pasta especificada para os dados do idioma não existe
O pacote de idiomas do Windows selecionado não está instalado no computador O pacote de idiomas do Windows selecionado não está instalado no computador
Mecanismo de OCR não ativo Indica que o mecanismo de OCR não está ativo

Aguardar o texto na tela (OCR)

Aguardar até que um texto específico apareça/desapareça da tela, da janela de primeiro plano ou relativo a uma imagem na tela ou na janela de primeiro plano usando OCR.

Parâmetros de entrada

Argumento Opcional Aceita Valor padrão Description
Wait for text to N/D Aparecer, Desaparecer Aparecer Especifica se deve aguardar o texto aparecer ou desaparecer
Tipo de mecanismo de OCR Não Mecanismo de OCR do Windows, mecanismo Tesseract, variável de mecanismo de OCR Variável de mecanismo de OCR O tipo de mecanismo de OCR a ser usado. Selecione um mecanismo de OCR pré-configurado ou configure um novo.
Variável de mecanismo de OCR Não OCREngineObject O mecanismo a ser usado para a operação de OCR
Text to find Não Valor do texto O texto a ser pesquisado na origem especificada
Is regular expression N/D Valor booliano False Especifica se deve ser usada uma expressão regular para localizar o texto especificado
Search for text on N/D Tela inteira, Janela em primeiro plano Tela inteira Especifica se deve ser pesquisado o texto especificado em toda a tela visível ou apenas na janela de primeiro plano
Search mode N/A Toda a fonte especificada, Somente a sub-região específica, Sub-região relativa à imagem Toda a origem especificada Especifica se deve verificar toda a tela (ou janela) ou uma sub-região reduzida dela
Imagens Não Lista de Imagens As imagens que especificam a sub-região (em relação ao canto superior esquerdo da imagem) a ser verificada para o texto fornecido
X1 Sim Valor numérico A coordenada X inicial da sub-região a ser verificada para o texto fornecido
Tolerance Sim Valor numérico 10 Especifica o quanto as imagens pesquisadas podem ser diferentes da imagem escolhida originalmente
Y1 Sim Valor numérico A coordenada Y inicial da sub-região a ser verificada para o texto fornecido
X1 Sim Valor numérico A coordenada X inicial da sub-região relativa à imagem especificada a ser verificada para o texto fornecido
X2 Sim Valor numérico A coordenada X final da sub-região a ser verificada para o texto fornecido
Y1 Sim Valor numérico A coordenada Y inicial da sub-região relativa à imagem especificada a ser verificada para o texto fornecido
Y2 Sim Valor numérico A coordenada Y final da sub-região a ser verificada para o texto fornecido
X2 Sim Valor numérico A coordenada X final da sub-região relativa à imagem especificada a ser verificada para o texto fornecido
Y2 Sim Valor numérico A coordenada Y final da sub-região relativa à imagem especificada a ser verificada para o texto fornecido
Idioma do OCR do Windows N/A Chinês (simplificado), chinês (tradicional), tcheco, dinamarquês, holandês, inglês, finlandês, francês, alemão, grego, húngaro, italiano, japonês, coreano, norueguês, polonês, português, romeno, russo, sérvio (cirílico), sérvio (latino), eslovaco, espanhol, sueco, turco Inglês O idioma do texto detectado pelo mecanismo de OCR do Windows
Usar outro idioma N/A Valor booliano Falso Especifica se um idioma que não foi fornecido no campo "Idioma do Tesseract" deve ser usado
Idioma do Tesseract N/A Inglês, alemão, espanhol, francês, italiano Inglês O idioma do texto que o mecanismo Tesseract detecta
Abreviação do idioma Não Valor do texto A abreviação Tesseract do idioma a ser usado. Por exemplo, se os dados forem "eng.traineddata", defina este parâmetro como "eng"
Caminho de dados do idioma Não Valor do texto O caminho da pasta que contém os dados do Tesseract do idioma especificado
Multiplicador de largura da imagem Não Valor numérico 1 O multiplicador de largura da imagem
Multiplicador de altura da imagem Não Valor numérico 1 O multiplicador de altura da imagem
Algoritmo de correspondência de imagens N/A Básico, Avançado Básico Qual algoritmo de imagem usar ao pesquisar por imagem
Falha com erro de tempo limite N/A Valor booliano False Especificar se você deseja que a ação aguarde indefinidamente ou haja falha após um período definido

Observação

Variáveis produzidas

Argumento Type Description
LocationOfTextFoundX Valor numérico A coordenada X do ponto em que o texto aparece na tela. Se a pesquisa for realizada na janela em primeiro plano, a coordenada retornada é relativa ao canto superior esquerdo da janela
LocationOfTextFoundY Valor numérico A coordenada X do ponto em que o texto aparece na tela. Se a pesquisa for realizada na janela em primeiro plano, a coordenada retornada é relativa ao canto superior esquerdo da janela

Exceções

Exceção Description
Não é possível verificar se existe texto no modo não interativo Indica que não é possível verificar o texto na tela quando no modo não interativo
Invalid subregion coordinates Indica que as coordenadas especificadas da sub-região são inválidas
Failed to analyze text with OCR Indica que ocorreu um erro ao tentar analisar o texto usando OCR
Falha ao criar o mecanismo de OCR Indica que ocorreu um erro ao tentar criar o mecanismo de OCR
A pasta de caminho de dados não existe Indica que a pasta especificada para os dados do idioma não existe
O pacote de idiomas do Windows selecionado não está instalado no computador O pacote de idiomas do Windows selecionado não está instalado no computador
Mecanismo de OCR não ativo Indica que o mecanismo de OCR não está ativo
Erro de tempo limite Indica que a ação falhou após um determinado período

Extrair texto com OCR

Extrair texto de uma determinada origem usando o mecanismo de OCR fornecido.

Parâmetros de entrada

Argumento Opcional Aceita Valor padrão Description
Mecanismo de OCR Não Mecanismo de OCR do Windows, mecanismo Tesseract, variável de mecanismo de OCR Variável de mecanismo de OCR O tipo de mecanismo de OCR a ser usado. Selecione um mecanismo de OCR pré-configurado ou configure um novo
Variável de mecanismo de OCR Não OCREngineObject O mecanismo a ser usado para a operação de OCR
OCR source N/D Tela, Janela em primeiro plano, Imagem no disco Tela A origem da imagem na qual executar a operação de OCR
Image file path Não Arquivo O caminho da imagem na qual executar a operação de OCR
Search mode N/D Toda a fonte especificada, Somente a sub-região específica, Sub-região relativa à imagem Toda a origem especificada O modo selecionado para a operação de OCR
Imagem Não Lista de Imagens A imagem a ser usada para restringir a verificação a uma sub-região em relação à imagem especificada
Tolerância Sim Valor numérico 10 Especifica o quanto a imagem pode ser diferente da imagem escolhida originalmente
X1 Sim Valor numérico A coordenada X inicial da sub-região para restringir a verificação
X2 Sim Valor numérico A coordenada X final da sub-região para restringir a verificação
Y1 Sim Valor numérico A coordenada Y inicial da sub-região para restringir a verificação
Y2 Sim Valor numérico A coordenada Y final da sub-região para restringir a verificação
Idioma do OCR do Windows N/A Chinês (simplificado), chinês (tradicional), tcheco, dinamarquês, holandês, inglês, finlandês, francês, alemão, grego, húngaro, italiano, japonês, coreano, norueguês, polonês, português, romeno, russo, sérvio (cirílico), sérvio (latino), eslovaco, espanhol, sueco, turco Inglês O idioma do texto detectado pelo mecanismo de OCR do Windows
Usar outro idioma N/A Valor booliano Falso Especifica se um idioma que não foi fornecido no campo "Idioma do Tesseract" deve ser usado
Idioma do Tesseract N/A Inglês, alemão, espanhol, francês, italiano Inglês O idioma do texto que o mecanismo Tesseract detecta
Abreviação do idioma Não Valor do texto A abreviação Tesseract do idioma a ser usado. Por exemplo, se os dados forem "eng.traineddata", defina este parâmetro como "eng"
Caminho de dados do idioma Não Valor do texto O caminho da pasta que contém os dados do Tesseract do idioma especificado
Multiplicador de largura da imagem Não Valor numérico 1 O multiplicador de largura da imagem
Multiplicador de altura da imagem Não Valor numérico 1 O multiplicador de altura da imagem
Aguarde a imagem aparecer N/A Valor booliano Verdadeiro Especifica se é preciso aguardar ou não para que a imagem apareça na tela ou na janela de primeiro plano
Tempo limite Não Valor numérico 5 Especifica o tempo de espera para a operação ser concluída antes de considerar que a ação falhou
Algoritmo de correspondência de imagens N/A Básico, Avançado Básica Qual algoritmo de imagem usar ao pesquisar por imagem

Observação

A opção Variável do mecanismo de OCR será preterida.

Variáveis produzidas

Argumento Type Description
OcrText Valor do texto O resultado após a extração de texto

Exceções

Exceção Descrição
Failed to extract text with OCR Indica que ocorreu um erro ao tentar extrair o texto com OCR da origem fornecida
Arquivo de imagem não encontrado Indica que o arquivo não existe no caminho fornecido
Imagem de marco não encontrada Indica que a imagem de marco não existe
Não é possível obter texto da tela no modo não interativo Indica que não é possível obter o texto da tela quando no modo não interativo
Falha ao criar o mecanismo de OCR Indica que ocorreu um erro ao tentar criar o mecanismo de OCR
A pasta de caminho de dados não existe Indica que a pasta especificada para os dados do idioma não existe
O pacote de idiomas do Windows selecionado não está instalado no computador O pacote de idiomas do Windows selecionado não está instalado no computador
Mecanismo de OCR não ativo Indica que o mecanismo de OCR não está ativo