OCR

OCR-engines initiëren om OCR-gerelateerde activiteiten uit te voeren

Als tekst op scherm (OCR)
Wachten op tekst op het scherm (OCR)
Tekst extraheren met OCR

Aan de slag met OCR-acties

Power Automate stelt gebruikers in staat om gegevens binnen een assortiment van bestanden te lezen, extraheren en beheren via optische tekenherkenning (OCR).

Als u een OCR-engine wilt maken en tekst uit afbeeldingen en documenten wilt extraheren met OCR, gebruikt u de actie Tekst extraheren met OCR. In de onderstaande afbeelding is de engine alleen voor deze actie gemaakt en is de OCR-bron een lokaal opgeslagen afbeelding. De actie is ingesteld om tekst uit de hele afbeelding te extraheren. Power Automate ondersteunt zowel de Windows OCR-engine als de Tesseract-engine.

Schermopname van het dialoogvenster Tekst extraheren met OCR.

De actie waarmee de OCR-engine wordt gemaakt, bevat de engine-instellingen. Deze instellingen omvatten de taal en de vermenigvuldigers voor de afbeeldingsbreedte en -hoogte. De variabele van de OCR-engine kan worden gebruikt in elke actie die OCR-mogelijkheden bevat.

Warning

Met afbeeldingsvermenigvuldigers wordt afbeelding vergroot om zoeken en tekstextractie effectiever te maken. Houd er rekening mee dat het instellen van waarden groter dan 3 tot foutieve resultaten kan leiden.

De Windows OCR-engine gebruiken

De standaardengine van alle OCR-acties in Power Automate is de Windows OCR-engine. Als u tekst wilt extraheren met behulp van de Windows OCR-engine, moet u het juiste taalpakket installeren voor de taal die u wilt extraheren.

Als niet het juiste taalpakket is geïnstalleerd, geeft Power Automate een foutmelding waarin u wordt gevraagd om het te installeren. Meer informatie over het downloaden en installeren van taalpakketten vindt u in Taalpakketten voor Windows.

Na het installeren van het juiste taalpakket, breidt u de instellingen van de OCR-engine van de OCR-actie uit en selecteert u de gewenste taal. De Windows OCR-engine ondersteunt 25 talen: Chinees (vereenvoudigd en traditioneel), Deens, Duits, Engels, Fins, Frans, Grieks, Hongaars, Italiaans, Japans, Koreaans, Nederlands, Noors, Pools, Portugees, Roemeens, Russisch, Servisch (Cyrillisch en Latijn), Slowaaks, Spaans, Tsjechisch, Turks en Zweeds.

De Tesseract OCR-engine gebruiken

Afgezien van de Windows OCR-engine, ondersteunt Power Automate ook de Tesseract-engine. Deze engine kan tekst in vijf talen extraheren zonder verdere configuratie: Duits, Engels, Frans, Italiaans en Spaans.

Als u tekst in een taal buiten de genoemde lijst wilt extraheren, schakelt u de optie Andere talen gebruiken in de instellingen voor OCR-engine van de OCR-actie in. Als deze optie is ingeschakeld, geeft de actie twee extra instellingen weer: de velden Taalafkorting en Pad voor taalgegevens.

De Taalafkorting veld geeft aan de engine aan naar welke taal moet worden gezocht tijdens OCR. Het veld Pad voor taalgegevens bevat de taalgegevensbestanden (.traineddata) die zijn gebruikt om de OCR-engine te trainen. U vindt de taalgegevensbestanden voor alle beschikbare talen in deze GitHub-opslagplaats.

De Tesseract-engine kan ook worden gebruikt om tekst uit meertalige documenten te extraheren. Meer informatie over het extraheren van tekst uit meertalige documenten vindt u in OCR uitvoeren op meertalige documenten.

OCR-acties

Als tekst op scherm (OCR)

Markeert het begin van een voorwaardelijk blok met acties, afhankelijk van of een bepaalde tekst op het scherm verschijnt of niet, met OCR

Invoerparameters
Argument Optioneel Accepteert Standaardwaarde Beschrijving
If text N.v.t. Bestaat, Bestaat niet Bestaat Geeft aan of wordt gecontroleerd of de tekst bestaat of niet in de te analyseren bron
OCR engine type Nee Windows OCR-engine, Tesseract-engine, OCR-enginevariabele OCR-enginevariabele Het type OCR-engine dat moet worden gebruikt. Selecteer een vooraf geconfigureerde OCR-engine of stel een nieuwe in.
OCR engine variable Nee OCREngineObject De engine die moet worden gebruikt voor de OCR-bewerking
Text to find Nee Tekstwaarde De tekst die moet worden gezocht in de opgegeven bron
Is regular expression N.v.t. Booleaanse waarde Onwaar Geeft aan of een reguliere expressie moet worden gebruikt om de opgegeven tekst te vinden
Search for text on N.v.t. Volledig scherm, Voorgrondvenster Volledig scherm Geeft aan of de opgegeven tekst moet worden gezocht in het volledige zichtbare scherm of alleen in het voorgrondvenster
Search mode N.v.t. Geheel van opgegeven bron, Alleen specifiek subgebied, Subgebied relatief ten opzichte van de afbeelding Geheel van opgegeven bron Geeft aan of het hele scherm (of venster) of een kleiner subgebied ervan moet worden gescand
Image(s) Nee Afbeeldingslijst De afbeeldingen die het subgebied (ten opzichte van de linkerbovenhoek van de afbeelding) aangeven, dat moet worden gescand op de opgegeven tekst
X1 Ja Numerieke waarde De eerste X-coördinaat van het subgebied dat wordt gescand op de opgegeven tekst
Tolerance Ja Numerieke waarde 10 Geeft aan hoeveel de doorzochte afbeelding kan verschillen van de oorspronkelijk gekozen afbeelding
Y1 Ja Numerieke waarde De eerste Y-coördinaat van het subgebied dat wordt gescand op de opgegeven tekst
X1 Ja Numerieke waarde De eerste X-coördinaat van het subgebied relatief ten opzichte van de opgegeven afbeelding, dat moet worden gescand op de opgegeven tekst
X2 Ja Numerieke waarde De laatste X-coördinaat van het subgebied dat wordt gescand op de opgegeven tekst
Y1 Ja Numerieke waarde De eerste Y-coördinaat van het subgebied relatief ten opzichte van de opgegeven afbeelding, dat moet worden gescand op de opgegeven tekst
Y2 Ja Numerieke waarde De laatste Y-coördinaat van het subgebied dat wordt gescand op de opgegeven tekst
X2 Ja Numerieke waarde De laatste X-coördinaat van het subgebied relatief ten opzichte van de opgegeven afbeelding, dat moet worden gescand op de opgegeven tekst
Y2 Ja Numerieke waarde De laatste Y-coördinaat van het subgebied relatief ten opzichte van de opgegeven afbeelding, dat moet worden gescand op de opgegeven tekst
Windows OCR language N.v.t. Chinees (vereenvoudigd), Chinees (traditioneel), Deens, Duits, Engels, Fins, Frans, Grieks, Hongaars, Italiaans, Japans, Koreaans, Nederlands, Noors, Pools, Portugees, Roemeens, Russisch, Servisch (Cyrillisch), Servisch (Latijn), Slowaaks, Spaans, Tsjechisch, Turks en Zweeds English De taal van de tekst die door Windows OCR-engine wordt gedetecteerd
Use other language N.v.t. Booleaanse waarde Onwaar Geeft aan of een taal moet worden gebruikt die niet is opgegeven in het veld 'Tesseract-taal'
Tesseract language N.v.t. Engels, Duits, Spaans, Frans, Italiaans Engels De taal van de tekst die door de Tesseract-engine wordt gedetecteerd
Language abbreviation Nee Tekstwaarde De Tesseract-afkorting van de te gebruiken taal. Als de gegevens bijvoorbeeld 'eng.traineddata' zijn, stelt u dit in op 'eng'
Language data path Nee Tekstwaarde Het pad van de map die de Tesseract-gegevens van de opgegeven taal bevat
Image width multiplier Nee Numerieke waarde 1 De vermenigvuldigingsfactor voor de breedte van de afbeelding
Image height multiplier Nee Numerieke waarde 1 De vermenigvuldigingsfactor voor de hoogte van de afbeelding

Note

Gemaakte variabelen
Argument Type Beschrijving
LocationOfTextFoundX Numerieke waarde De X-coördinaat van het punt waar de tekst op het scherm wordt weergegeven. Als de zoekactie wordt uitgevoerd in het voorgrondvenster, is de geretourneerde coördinaat relatief ten opzichte van de linkerbovenhoek van het venster
LocationOfTextFoundY Numerieke waarde De X-coördinaat van het punt waar de tekst op het scherm wordt weergegeven. Als de zoekactie wordt uitgevoerd in het voorgrondvenster, is de geretourneerde coördinaat relatief ten opzichte van de linkerbovenhoek van het venster
Uitzonderingen
Uitzondering Beschrijving
Kan niet controleren of tekst bestaat in de niet-interactieve modus Geeft aan dat het niet mogelijk is op de tekst op het scherm te zoeken in de niet-interactieve modus
Ongeldige coördinaten voor subgebied Geeft aan dat de opgegeven coördinaten van het subgebied ongeldig zijn
Kan geen tekst analyseren met OCR Geeft aan dat er een fout is opgetreden bij het analyseren van de tekst met OCR
De OCR-engine kan niet worden gemaakt Geeft aan dat er een fout is opgetreden bij het maken van de OCR-engine
Map in gegevenspad bestaat niet Geeft aan dat de opgegeven map voor de taalgegevens niet bestaat
Het geselecteerde Windows-taalpakket is niet geïnstalleerd op de computer Geeft aan dat het geselecteerde Windows-taalpakket niet is geïnstalleerd op de computer
OCR-engine niet actief Geeft aan dat de OCR-engine niet actief is

Wachten op tekst op het scherm (OCR)

Wachten totdat een specifieke tekst wordt weergegeven/verdwijnt op het scherm, op het voorgrondvenster of relatief ten opzichte van een afbeelding op het scherm of voorgrondvenster met OCR

Invoerparameters
Argument Optioneel Accepteert Standaardwaarde Beschrijving
Wait for text to N.v.t. Verschijnen, Verdwijnen Verschijnen Geeft aan of wordt gewacht tot de tekst wordt weergegeven of verdwijnt
OCR engine type Nee Windows OCR-engine, Tesseract-engine, OCR-enginevariabele OCR-enginevariabele Het type OCR-engine dat moet worden gebruikt. Selecteer een vooraf geconfigureerde OCR-engine of stel een nieuwe in.
OCR engine variable Nee OCREngineObject De engine die moet worden gebruikt voor de OCR-bewerking
Text to find Nee Tekstwaarde De tekst die moet worden gezocht in de opgegeven bron
Is regular expression N.v.t. Booleaanse waarde Onwaar Geeft aan of een reguliere expressie moet worden gebruikt om de opgegeven tekst te vinden
Search for text on N.v.t. Volledig scherm, Voorgrondvenster Volledig scherm Geeft aan of de opgegeven tekst moet worden gezocht in het volledige zichtbare scherm of alleen in het voorgrondvenster
Search mode N.v.t. Geheel van opgegeven bron, Alleen specifiek subgebied, Subgebied relatief ten opzichte van de afbeelding Geheel van opgegeven bron Geeft aan of het hele scherm (of venster) of een kleiner subgebied ervan moet worden gescand
Image(s) Nee Afbeeldingslijst De afbeeldingen die het subgebied (ten opzichte van de linkerbovenhoek van de afbeelding) aangeven, dat moet worden gescand op de opgegeven tekst
X1 Ja Numerieke waarde De eerste X-coördinaat van het subgebied dat wordt gescand op de opgegeven tekst
Tolerance Ja Numerieke waarde 10 Geeft aan hoeveel de doorzochte afbeelding kan verschillen van de oorspronkelijk gekozen afbeelding
Y1 Ja Numerieke waarde De eerste Y-coördinaat van het subgebied dat wordt gescand op de opgegeven tekst
X1 Ja Numerieke waarde De eerste X-coördinaat van het subgebied relatief ten opzichte van de opgegeven afbeelding, dat moet worden gescand op de opgegeven tekst
X2 Ja Numerieke waarde De laatste X-coördinaat van het subgebied dat wordt gescand op de opgegeven tekst
Y1 Ja Numerieke waarde De eerste Y-coördinaat van het subgebied relatief ten opzichte van de opgegeven afbeelding, dat moet worden gescand op de opgegeven tekst
Y2 Ja Numerieke waarde De laatste Y-coördinaat van het subgebied dat wordt gescand op de opgegeven tekst
X2 Ja Numerieke waarde De laatste X-coördinaat van het subgebied relatief ten opzichte van de opgegeven afbeelding, dat moet worden gescand op de opgegeven tekst
Y2 Ja Numerieke waarde De laatste Y-coördinaat van het subgebied relatief ten opzichte van de opgegeven afbeelding, dat moet worden gescand op de opgegeven tekst
Windows OCR language N.v.t. Chinees (vereenvoudigd), Chinees (traditioneel), Deens, Duits, Engels, Fins, Frans, Grieks, Hongaars, Italiaans, Japans, Koreaans, Nederlands, Noors, Pools, Portugees, Roemeens, Russisch, Servisch (Cyrillisch), Servisch (Latijn), Slowaaks, Spaans, Tsjechisch, Turks en Zweeds English De taal van de tekst die door Windows OCR-engine wordt gedetecteerd
Use other language N.v.t. Booleaanse waarde Onwaar Geeft aan of een taal moet worden gebruikt die niet is opgegeven in het veld 'Tesseract-taal'
Tesseract language N.v.t. Engels, Duits, Spaans, Frans, Italiaans Engels De taal van de tekst die door de Tesseract-engine wordt gedetecteerd
Language abbreviation Nee Tekstwaarde De Tesseract-afkorting van de te gebruiken taal. Als de gegevens bijvoorbeeld 'eng.traineddata' zijn, stelt u dit in op 'eng'
Language data path Nee Tekstwaarde Het pad van de map die de Tesseract-gegevens van de opgegeven taal bevat
Image width multiplier Nee Numerieke waarde 1 De vermenigvuldigingsfactor voor de breedte van de afbeelding
Image height multiplier Nee Numerieke waarde 1 De vermenigvuldigingsfactor voor de hoogte van de afbeelding
Fout vanwege time-out N.v.t. Booleaanse waarde Onwaar Geef op of u de actie onbepaalde tijd wilt laten wachten of dat u wilt stoppen na een ingestelde tijdsperiode

Note

Gemaakte variabelen
Argument Type Beschrijving
LocationOfTextFoundX Numerieke waarde De X-coördinaat van het punt waar de tekst op het scherm wordt weergegeven. Als de zoekactie wordt uitgevoerd in het voorgrondvenster, is de geretourneerde coördinaat relatief ten opzichte van de linkerbovenhoek van het venster
LocationOfTextFoundY Numerieke waarde De X-coördinaat van het punt waar de tekst op het scherm wordt weergegeven. Als de zoekactie wordt uitgevoerd in het voorgrondvenster, is de geretourneerde coördinaat relatief ten opzichte van de linkerbovenhoek van het venster
Uitzonderingen
Uitzondering Beschrijving
Kan niet controleren of tekst bestaat in de niet-interactieve modus Geeft aan dat het niet mogelijk is op de tekst op het scherm te zoeken in de niet-interactieve modus
Ongeldige coördinaten voor subgebied Geeft aan dat de opgegeven coördinaten van het subgebied ongeldig zijn
Kan geen tekst analyseren met OCR Geeft aan dat er een fout is opgetreden bij het analyseren van de tekst met OCR
De OCR-engine kan niet worden gemaakt Geeft aan dat er een fout is opgetreden bij het maken van de OCR-engine
Map in gegevenspad bestaat niet Geeft aan dat de opgegeven map voor de taalgegevens niet bestaat
Het geselecteerde Windows-taalpakket is niet geïnstalleerd op de computer Geeft aan dat het geselecteerde Windows-taalpakket niet is geïnstalleerd op de computer
OCR-engine niet actief Geeft aan dat de OCR-engine niet actief is
Time-outfout Geeft aan dat de actie is mislukt na een ingestelde tijdsperiode

Tekst extraheren met OCR

Tekst uit een bepaalde bron extraheren met de opgegeven OCR-engine

Invoerparameters
Argument Optioneel Accepteert Standaardwaarde Beschrijving
OCR engine Nee Windows OCR-engine, Tesseract-engine, OCR-enginevariabele OCR-enginevariabele Het type OCR-engine dat moet worden gebruikt. Selecteer een vooraf geconfigureerde OCR-engine of stel een nieuwe in.
OCR engine variable Nee OCREngineObject De engine die moet worden gebruikt voor de OCR-bewerking
OCR source N.v.t. Scherm, Voorgrondvenster, Afbeelding op schijf Scherm Het bron van de afbeelding waarop de OCR-bewerking moet worden uitgevoerd
Image file path Nee File Het pad van de afbeelding waarop de OCR-bewerking moet worden uitgevoerd
Search mode N.v.t. Geheel van opgegeven bron, Alleen specifiek subgebied, Subgebied relatief ten opzichte van de afbeelding Geheel van opgegeven bron De geselecteerde modus voor de OCR-bewerking
Image Nee Afbeeldingslijst De afbeelding die moet worden gebruikt voor het beperken van het scannen van een subgebied relatief ten opzichte van de opgegeven afbeelding
Tolerance Ja Numerieke waarde 10 Geeft aan hoeveel de afbeelding kan verschillen van de oorspronkelijk gekozen afbeelding
X1 Ja Numerieke waarde De eerste X-coördinaat van het subgebied om de scan te beperken
X2 Ja Numerieke waarde De laatste X-coördinaat van het subgebied om de scan te beperken
Y1 Ja Numerieke waarde De eerste Y-coördinaat van het subgebied om de scan te beperken
Y2 Ja Numerieke waarde De laatste Y-coördinaat van het subgebied om de scan te beperken
Windows OCR language N.v.t. Chinees (vereenvoudigd), Chinees (traditioneel), Deens, Duits, Engels, Fins, Frans, Grieks, Hongaars, Italiaans, Japans, Koreaans, Nederlands, Noors, Pools, Portugees, Roemeens, Russisch, Servisch (Cyrillisch), Servisch (Latijn), Slowaaks, Spaans, Tsjechisch, Turks en Zweeds English De taal van de tekst die door Windows OCR-engine wordt gedetecteerd
Use other language N.v.t. Booleaanse waarde Onwaar Geeft aan of een taal moet worden gebruikt die niet is opgegeven in het veld 'Tesseract-taal'
Tesseract language N.v.t. Engels, Duits, Spaans, Frans, Italiaans Engels De taal van de tekst die door de Tesseract-engine wordt gedetecteerd
Language abbreviation Nee Tekstwaarde De Tesseract-afkorting van de te gebruiken taal. Als de gegevens bijvoorbeeld 'eng.traineddata' zijn, stelt u dit in op 'eng'
Language data path Nee Tekstwaarde Het pad van de map die de Tesseract-gegevens van de opgegeven taal bevat
Image width multiplier Nee Numerieke waarde 1 De vermenigvuldigingsfactor voor de breedte van de afbeelding
Image height multiplier Nee Numerieke waarde 1 De vermenigvuldigingsfactor voor de hoogte van de afbeelding

Note

De optie OCR engine variable staat gepland voor afschaffing.

Gemaakte variabelen
Argument Type Description
OcrText Tekstwaarde Het resultaat na de extractie van tekst
Uitzonderingen
Uitzondering Beschrijving
Kan geen tekst extraheren met OCR Geeft aan dat er een fout is opgetreden bij het extraheren van tekst met OCR uit de opgegeven bron
Afbeeldingsbestand niet gevonden Geeft aan dat het bestand niet bestaat in het opgegeven pad
Afbeelding van oriëntatiepunt niet gevonden Geeft aan dat de afbeelding van het oriëntatiepunt niet bestaat
Kan tekst niet ophalen van scherm in de niet-interactieve modus Geeft aan dat het niet mogelijk is om tekst van het scherm op te halen in de niet-interactieve modus
De OCR-engine kan niet worden gemaakt Geeft aan dat er een fout is opgetreden bij het maken van de OCR-engine
Map in gegevenspad bestaat niet Geeft aan dat de opgegeven map voor de taalgegevens niet bestaat
Het geselecteerde Windows-taalpakket is niet geïnstalleerd op de computer Geeft aan dat het geselecteerde Windows-taalpakket niet is geïnstalleerd op de computer
OCR-engine niet actief Geeft aan dat de OCR-engine niet actief is