OCR
Käynnistä OCR-moduulit ja suorita OCR:ään liittyvät aktiviteetit
| Jos teksti on näytössä (OCR) |
| Odota, että teksti näkyy näytössä (OCR) |
| Poimi teksti OCR:n avulla |
OCR-toimintojen käytön aloittaminen
Power Automaten avulla käyttäjät voivat lukea, poimia ja hallita tietoja eri tiedostoista optisen merkintunnistuksen (OCR) avulla.
Jos haluat luoda OCR-moduulin ja poimia tekstiä kuvista ja asiakirjoista OCR:n avulla, käytä Poimi teksti OCR:n avulla -toimintoa. Alla olevassa kuvassa moduuli luodaan vain tätä toimintoa varten, ja OCR-lähde on paikallisesti tallennettu kuva. Toiminto poimii tekstiä koko kuvasta. Power Automate tukee sekä Windows OCR -moduulia että Tesseract-moduulia.

Toiminto, jossa OCR-moduuli luodaan, sisältää moduulin asetukset. Näitä ovat kieli sekä kuvan leveyden ja korkeuden kertoimet. OCR-moduulin muuttujaa voi käyttää missä tahansa OCR-ominaisuuksia sisältävässä toiminnossa.
Warning
Kuvan kertoimet suurentavat kuvan kokoa niin, että hakeminen ja tekstin poimiminen on tehokasta. Huomaa, että jos asetuksen arvo on yli 3, tulokset voivat olla virheellisiä.
Windows OCR -moduulin käyttäminen
Kaikkien OCR-toimintojen oletusmoduuli on Power Automate Windows OCR -moduuli. Jos haluat purkaa minkä tahansa tekstin Windows OCR -moduulilla, asenna asianmukainen kielipaketti sen kielen mukaan, jonka haluat purkaa.
Jos sopivaa kielipakettia ei ole asennettu, Power Automaten näyttöön tulee virhe, jossa kehotetaan asentamaan se. Lisätietoja kielipakettien lataamisesta ja asentamisesta on kohdassa Windowsin kielipaketit.
Kun olet asentanut asianmukaisen kielipaketin, laajenna OCR-toiminnon OCR-moduulin asetukset ja valitse haluamasi kieli. Windows OCR -moduuli tukee 25 kieltä: kiina (yksinkertaistettu ja perinteinen), tšekki, tanska, hollanti, englanti, suomi, ranska, saksa, kreikka, unkari, italia, japani, korea, norja, puola, portugali, romania, venäjä, serbia (kyrillinen ja latinalainen), slovakki, espanja, ruotsi ja turkki.
Tesseract OCR -moduulin käyttäminen
Windows OCR -moduulin lisäksi Power Automate tukee Tesseract-moduulia. Tämä moduuli voi purkaa tekstiä viidellä kielellä ilman lisämäärityksiä: englanti, saksa, espanja, ranska ja italia.
Jos haluat poimia tekstiä edellä mainitun luettelon ulkopuolisella kielellä, ota OCR-toiminnon OCR-moduulin asetuksissa käyttöön Muiden kielten käyttö -vaihtoehto. Kun tämä asetus on käytössä, toiminto näyttää kaksi lisäasetusta: kielen lyhenne- ja kielen tietopolku -kentät.
Kielen lyhenne -kenttä osoittaa ytimelle, mitä kieltä OCR:n aikana etsitään. Kielen tietopolku -kenttä sisältää kielen datatiedostot (.traineddata), joita käytetään OCR-moduulin harjoittamiseen. Löydät kielidatatiedostot kaikista käytettävissä olevista kielistä tästä GitHub-säilöstä.
Tesseract-moduulin avulla voidaan myös poimia tekstiä monikielisistä asiakirjoista. Monikielisten asiakirjojen tekstin purkamista koskevat lisätietoja on ohjeaiheessa Monikielisten asiakirjojen tekstintunnistus.
OCR-toiminnot
Jos teksti on näytössä (OCR)
Merkitsee ehdollisen toimintolohkon alun OCR:n avulla sen mukaan, näkyykö tietty teksti näytössä vai ei
Syöteparametrit
| Argumentti | Valinnainen | Hyväksymiset | Oletusarvo | Kuvaus |
|---|---|---|---|---|
| If text | – | On olemassa, Ei ole olemassa | On olemassa | Määrittää, tuleeko analysoitavan tekstin olemassa olo tarkistaa annetussa lähteessä |
| OCR engine type | No | Windows OCR -moduuli, Tesseract-moduuli, OCR-moduulin muuttuja | OCR engine variable | Käytettävä OCR-moduulityyppi. Valitse esimääritetty OCR-moduuli tai määritä uusi. |
| OCR-ytimen muuttuja | Ei | OCREngineObject | Ydin, jota käytetään OCR-toiminnossa | |
| Text to find | Ei | Tekstin arvo | Määritetystä lähteestä haettava teksti | |
| Is regular expression | – | Totuusarvo | Väärin | Määrittää, käytetäänkö säännöllistä lauseketta määritetyn tekstin etsimiseen |
| Search for text on | – | Koko näyttö, Edustaikkuna | Koko näyttö | Määrittää, haetaanko määritettyä tekstiä koko näkyvissä olevasta näytöstä vai vain edustan ikkunasta |
| Search mode | – | Koko määritetty lähde, Vain tietty osa-alue, Osa-alue suhteessa kuvaan | Koko määritetty lähde | Määrittää, tutkitaanko koko näyttö (tai ikkuna) vai rajataanko siitä alialue |
| Image(s) | Ei | Kuvaluettelo | Kuvat, jotka määrittävät alialueen (joka liittyy kuvan vasempaan yläkulmaan), kun toimitettua tekstiä tutkitaan | |
| X1 | Kyllä | Numeerinen arvo | Alialueen aloituksen X-koordinaatti, joka toimitetusta tekstistä tutkitaan | |
| Tolerance | Kyllä | Numeerinen arvo | 10 | Määrittää, miten paljon haetut kuvat voivat poiketa alun perin valitusta kuvasta |
| Y1 | Kyllä | Numeerinen arvo | Alialueen aloituksen Y-koordinaatti, joka toimitetusta tekstistä tutkitaan | |
| X1 | Kyllä | Numeerinen arvo | Määritettyyn kuvaan liittyvän alueen aloituksen X-koordinaatti toimitetun tekstin tutkimista varten | |
| X2 | Kyllä | Numeerinen arvo | Alialueen lopetuksen X-koordinaatti, joka toimitetusta tekstistä tutkitaan | |
| Y1 | Kyllä | Numeerinen arvo | Määritettyyn kuvaan liittyvän alueen aloituksen Y-koordinaatti toimitetun tekstin tutkimista varten | |
| Y2 | Kyllä | Numeerinen arvo | Alialueen lopetuksen Y-koordinaatti, joka toimitetusta tekstistä tutkitaan | |
| X2 | Kyllä | Numeerinen arvo | Määritettyyn kuvaan liittyvän alueen lopetuksen X-koordinaatti toimitetun tekstin tutkimista varten | |
| Y2 | Kyllä | Numeerinen arvo | Määritettyyn kuvaan liittyvän alueen lopetuksen Y-koordinaatti toimitetun tekstin tutkimista varten | |
| Windows OCR -kieli | – | kiina (yksinkertaistettu), kiina (perinteinen), tšekki, tanska, hollanti, englanti, suomi, ranska, saksa, kreikka, unkari, italia, japani, korea, norja, puola, portugali, romania, venäjä, serbia (kyrillinen), serbia (latinalainen), slovakki, espanja, ruotsi, turkki | Englanti | Sen tekstin kieli, jonka Windows OCR -moduuli havaitsee |
| Use other language | – | Totuusarvo | Epätosi | Määrittää, käytetäänkö kieltä, jota ei ole Tesseract-kieli-kentässä |
| Tesseract language | – | englanti, saksa, espanja, ranska, italia | English | Tekstin kieli, jonka Tesseract-moduuli tunnistaa |
| Language abbreviation | Ei | Tekstin arvo | Käytettävän kielen Tesseract-lyhenne. Jos tiedot ovat esimerkiksi "eng.traineddata", aseta arvoksi "eng" | |
| Kielen tietojen polku | No | Tekstin arvo | Sen kansion polku, joka sisältää määritetyn kielen Tesseract-tiedot | |
| Image width multiplier | No | Numeerinen arvo | 1 | Kuvan leveyden kertoja |
| Image height multiplier | No | Numeerinen arvo | 1 | Kuvan korkeuden kertoja |
Note
- Power Automaten säännöllinen lausekeydin on .NET. Lisätietoja on kohdassa Säännöllisen lausekkeen kieli - pikaopas.
- OCR-moduulin muuttuja -asetus on poistumassa.
Tuotetut muuttujat
| Argumentti | Type | Description |
|---|---|---|
| LocationOfTextFoundX | Numeerinen arvo | Sen pisteen X-koordinaatti, jossa teksti näkyy näytössä. Jos haku suoritetaan edustaikkunassa, palautettu koordinaatti on suhteessa ikkunan vasempaan yläkulmaan |
| LocationOfTextFoundY | Numeerinen arvo | Sen pisteen X-koordinaatti, jossa teksti näkyy näytössä. Jos haku suoritetaan edustaikkunassa, palautettu koordinaatti on suhteessa ikkunan vasempaan yläkulmaan |
Poikkeukset
| Poikkeus | Kuvaus |
|---|---|
| Tekstiä ei voi tarkistaa, jos se on muussa kuin interaktiivisessa tilassa | Osoittaa, että tekstiä ei voi tarkistaa näytössä, jos se on muussa kuin interaktiivisessa tilassa |
| Virheelliset alialueen koordinaatit | Osoittaa, että määritetyt alialueen koordinaatit ovat virheellisiä |
| Tekstin analysoiminen OCR:n avulla epäonnistui | Osoittaa, että analysoitaessa tekstiä OCR:n avulla tapahtui virhe |
| OCR-moduulin luominen epäonnistui | Osoittaa, että OCR-moduulin luomisen yhteydessä tapahtui virhe |
| Tietojen polun kansiota ei ole | Osoittaa, että kielen tiedoille määritettyä kansiota ei ole |
| Valittua Windows-kielipakettia ei ole asennettu koneeseen | Ilmaisee, että valittua Windows-kielipakettia ei ole asennettu koneeseen |
| OCR-moduuli ei ole käytössä | Osoittaa, että OCR-moduuli ei ole käytössä |
Odota, että teksti näkyy näytössä (OCR)
Odota, kunnes tietty teksti ilmestyy näyttöön, edustan ikkunaan, näytön liittyvään kuvaan tai edustan ikkunaan OCR:n avulla tai poistuu näistä kohdista
Syöteparametrit
| Argumentti | Valinnainen | Hyväksymiset | Oletusarvo | Kuvaus |
|---|---|---|---|---|
| Wait for text to | – | Tulee näkyviin, Katoaa | Tulee näkyviin | Määrittää, odotetaanko tekstin tulevan näkyviin tai poistuvan näkyvistä |
| OCR engine type | No | Windows OCR -moduuli, Tesseract-moduuli, OCR-moduulin muuttuja | OCR engine variable | Käytettävä OCR-moduulityyppi. Valitse esimääritetty OCR-moduuli tai määritä uusi. |
| OCR-ytimen muuttuja | Ei | OCREngineObject | Ydin, jota käytetään OCR-toiminnossa | |
| Text to find | Ei | Tekstin arvo | Määritetystä lähteestä haettava teksti | |
| Is regular expression | – | Totuusarvo | Väärin | Määrittää, käytetäänkö säännöllistä lauseketta määritetyn tekstin etsimiseen |
| Search for text on | – | Koko näyttö, Edustaikkuna | Koko näyttö | Määrittää, haetaanko määritettyä tekstiä koko näkyvissä olevasta näytöstä vai vain edustan ikkunasta |
| Search mode | – | Koko määritetty lähde, Vain tietty osa-alue, Osa-alue suhteessa kuvaan | Koko määritetty lähde | Määrittää, tutkitaanko koko näyttö (tai ikkuna) vai rajataanko siitä alialue |
| Image(s) | Ei | Kuvaluettelo | Kuvat, jotka määrittävät alialueen (joka liittyy kuvan vasempaan yläkulmaan), kun toimitettua tekstiä tutkitaan | |
| X1 | Kyllä | Numeerinen arvo | Alialueen aloituksen X-koordinaatti, joka toimitetusta tekstistä tutkitaan | |
| Tolerance | Kyllä | Numeerinen arvo | 10 | Määrittää, miten paljon haetut kuvat voivat poiketa alun perin valitusta kuvasta |
| Y1 | Kyllä | Numeerinen arvo | Alialueen aloituksen Y-koordinaatti, joka toimitetusta tekstistä tutkitaan | |
| X1 | Kyllä | Numeerinen arvo | Määritettyyn kuvaan liittyvän alueen aloituksen X-koordinaatti toimitetun tekstin tutkimista varten | |
| X2 | Kyllä | Numeerinen arvo | Alialueen lopetuksen X-koordinaatti, joka toimitetusta tekstistä tutkitaan | |
| Y1 | Kyllä | Numeerinen arvo | Määritettyyn kuvaan liittyvän alueen aloituksen Y-koordinaatti toimitetun tekstin tutkimista varten | |
| Y2 | Kyllä | Numeerinen arvo | Alialueen lopetuksen Y-koordinaatti, joka toimitetusta tekstistä tutkitaan | |
| X2 | Kyllä | Numeerinen arvo | Määritettyyn kuvaan liittyvän alueen lopetuksen X-koordinaatti toimitetun tekstin tutkimista varten | |
| Y2 | Kyllä | Numeerinen arvo | Määritettyyn kuvaan liittyvän alueen lopetuksen Y-koordinaatti toimitetun tekstin tutkimista varten | |
| Windows OCR -kieli | – | kiina (yksinkertaistettu), kiina (perinteinen), tšekki, tanska, hollanti, englanti, suomi, ranska, saksa, kreikka, unkari, italia, japani, korea, norja, puola, portugali, romania, venäjä, serbia (kyrillinen), serbia (latinalainen), slovakki, espanja, ruotsi, turkki | Englanti | Sen tekstin kieli, jonka Windows OCR -moduuli havaitsee |
| Use other language | – | Totuusarvo | Epätosi | Määrittää, käytetäänkö kieltä, jota ei ole Tesseract-kieli-kentässä |
| Tesseract language | – | englanti, saksa, espanja, ranska, italia | English | Tekstin kieli, jonka Tesseract-moduuli tunnistaa |
| Language abbreviation | Ei | Tekstin arvo | Käytettävän kielen Tesseract-lyhenne. Jos tiedot ovat esimerkiksi "eng.traineddata", aseta arvoksi "eng" | |
| Kielen tietojen polku | No | Tekstin arvo | Sen kansion polku, joka sisältää määritetyn kielen Tesseract-tiedot | |
| Image width multiplier | No | Numeerinen arvo | 1 | Kuvan leveyden kertoja |
| Image height multiplier | No | Numeerinen arvo | 1 | Kuvan korkeuden kertoja |
| Aikakatkaisu epäonnistui -virhe | – | Totuusarvo | Epätosi | Määritä, haluatko toiminnon odottavan loputtomiin vai epäonnistuvan määritetyn ajanjakson kuluttua |
Note
- Power Automaten säännöllinen lausekeydin on .NET. Lisätietoja on kohdassa Säännöllisen lausekkeen kieli - pikaopas.
- OCR-moduulin muuttuja -asetus on poistumassa.
Tuotetut muuttujat
| Argumentti | Type | Description |
|---|---|---|
| LocationOfTextFoundX | Numeerinen arvo | Sen pisteen X-koordinaatti, jossa teksti näkyy näytössä. Jos haku suoritetaan edustaikkunassa, palautettu koordinaatti on suhteessa ikkunan vasempaan yläkulmaan |
| LocationOfTextFoundY | Numeerinen arvo | Sen pisteen X-koordinaatti, jossa teksti näkyy näytössä. Jos haku suoritetaan edustaikkunassa, palautettu koordinaatti on suhteessa ikkunan vasempaan yläkulmaan |
Poikkeukset
| Poikkeus | Kuvaus |
|---|---|
| Tekstiä ei voi tarkistaa, jos se on muussa kuin interaktiivisessa tilassa | Osoittaa, että tekstiä ei voi tarkistaa näytössä, jos se on muussa kuin interaktiivisessa tilassa |
| Virheelliset alialueen koordinaatit | Osoittaa, että määritetyt alialueen koordinaatit ovat virheellisiä |
| Tekstin analysoiminen OCR:n avulla epäonnistui | Osoittaa, että analysoitaessa tekstiä OCR:n avulla tapahtui virhe |
| OCR-moduulin luominen epäonnistui | Osoittaa, että OCR-moduulin luomisen yhteydessä tapahtui virhe |
| Tietojen polun kansiota ei ole | Osoittaa, että kielen tiedoille määritettyä kansiota ei ole |
| Valittua Windows-kielipakettia ei ole asennettu koneeseen | Ilmaisee, että valittua Windows-kielipakettia ei ole asennettu koneeseen |
| OCR-moduuli ei ole käytössä | Osoittaa, että OCR-moduuli ei ole käytössä |
| Aikakatkaisuvirhe | Osoittaa, että toiminto epäonnistui tietyn ajanjakson jälkeen |
Poimi teksti OCR:n avulla
Poimi määritetyn lähteen teksti käyttämällä annettua OCR-moduulia
Syöteparametrit
| Argumentti | Valinnainen | Hyväksymiset | Oletusarvo | Description |
|---|---|---|---|---|
| OCR engine | No | Windows OCR -moduuli, Tesseract-moduuli, OCR-moduulin muuttuja | OCR engine variable | Käytettävä OCR-moduulityyppi. Valitse valmiiksi määritetty OCR-moduuli tai määritä uusi moduuli. |
| OCR engine variable | Ei | OCREngineObject | Ydin, jota käytetään OCR-toiminnossa | |
| OCR source | – | Näyttö, Edustaikkuna, Kuva levyllä | Näyttö | Sen kuvan lähde, jolle OCR-toiminto suoritetaan |
| Image file path | Ei | File | Sen kuvan polku, jolle OCR-toiminto suoritetaan | |
| Search mode | – | Koko määritetty lähde, Vain tietty osa-alue, Osa-alue suhteessa kuvaan | Koko määritetty lähde | OCR-toiminnon valittu tila |
| Image | Ei | Kuvaluettelo | Kuva, jota käytetään määritettyyn kuvaan liittyvän alialueen tutkimisen rajaamisessa | |
| Tolerance | Kyllä | Numeerinen arvo | 10 | Määrittää, miten paljon kuva voi poiketa alun perin valitusta kuvasta |
| X1 | Kyllä | Numeerinen arvo | Alialueen aloituksen X-koordinaatti, joka rajaa tutkimista | |
| X2 | Kyllä | Numeerinen arvo | Alialueen lopetuksen X-koordinaatti, joka rajaa tutkimista | |
| Y1 | Kyllä | Numeerinen arvo | Alialueen aloituksen Y-koordinaatti, joka rajaa tutkimista | |
| Y2 | Kyllä | Numeerinen arvo | Alialueen lopetuksen Y-koordinaatti, joka rajaa tutkimista | |
| Windows OCR -kieli | – | kiina (yksinkertaistettu), kiina (perinteinen), tšekki, tanska, hollanti, englanti, suomi, ranska, saksa, kreikka, unkari, italia, japani, korea, norja, puola, portugali, romania, venäjä, serbia (kyrillinen), serbia (latinalainen), slovakki, espanja, ruotsi, turkki | Englanti | Sen tekstin kieli, jonka Windows OCR -moduuli havaitsee |
| Use other language | – | Totuusarvo | Epätosi | Määrittää, käytetäänkö kieltä, jota ei ole Tesseract-kieli-kentässä |
| Tesseract language | – | englanti, saksa, espanja, ranska, italia | English | Tekstin kieli, jonka Tesseract-moduuli tunnistaa |
| Language abbreviation | Ei | Tekstin arvo | Käytettävän kielen Tesseract-lyhenne. Jos tiedot ovat esimerkiksi "eng.traineddata", aseta arvoksi "eng" | |
| Kielen tietojen polku | No | Tekstin arvo | Sen kansion polku, joka sisältää määritetyn kielen Tesseract-tiedot | |
| Image width multiplier | No | Numeerinen arvo | 1 | Kuvan leveyden kertoja |
| Image height multiplier | No | Numeerinen arvo | 1 | Kuvan korkeuden kertoja |
Note
OCR-moduulin muuttuja -asetus on poistumassa.
Tuotetut muuttujat
| Argumentti | Type | Description |
|---|---|---|
| OcrText | Tekstin arvo | Tekstin poiminnan jälkeinen tulos |
Poikkeukset
| Poikkeus | Kuvaus |
|---|---|
| Tekstin poimiminen OCR:n avulla epäonnistui | Osoittaa, että poimittaessa tekstiä OCR:n avulla annetusta lähteestä tapahtui virhe |
| Kuvatiedostoa ei löydy | Osoittaa, että annetun polun sijainnissa ei ole tiedostoa |
| Maamerkin kuvaa ei löydy | Osoittaa, että maamerkin kuvaa ei ole |
| Tekstiä ei voi hakea näytöstä, jos se on muussa kuin interaktiivisessa tilassa | Osoittaa, että tekstiä ei voi hakea näytöstä, jos se on muussa kuin interaktiivisessa tilassa |
| OCR-moduulin luominen epäonnistui | Osoittaa, että OCR-moduulin luomisen yhteydessä tapahtui virhe |
| Tietojen polun kansiota ei ole | Osoittaa, että kielen tiedoille määritettyä kansiota ei ole |
| Valittua Windows-kielipakettia ei ole asennettu koneeseen | Ilmaisee, että valittua Windows-kielipakettia ei ole asennettu koneeseen |
| OCR-moduuli ei ole käytössä | Osoittaa, että OCR-moduuli ei ole käytössä |