Jaa


PDF-toiminnot

PDF-toiminnot mahdollistavat kuvien, tekstin ja taulukoiden poimimisen PDF-tiedostoista sekä uusien asiakirjojen luominen sivujen järjestämällä.

Jos haluat poimia tekstiä PDF-tiedostosta, käytä Poimi teksti PDF-tiedostosta -toimintoa. Seuraavassa esimerkissä poimitaan teksti salasanalla suojatun tiedoston tietyltä sivualueelta. Salasana määritetään lisäasetuksissa.

Taulukkomuotoon järjestettyjä tekstejä poimitaan ottamalla Rakenteisten tietojen optimointi käyttöön. Näin voidaan parantaa tulosten muotoa ja tarkkuutta.

Näyttökuva Poimi teksti PDF-tiedostosta -toiminnosta.

Taulukoita poimitaan PDF-tiedostosta ottamalla Poimi taulukot PDF-tiedostosta -toiminto käyttöön, valitsemalla tiedosto ja määrittämällä sivut, joista poiminta tehdään.

Toiminto tuottaa ExtractedPDFTables-muuttujan, joka sisältää luettelon PDF-taulukon tiedoista. Lisätietoja tästä luettelotyypistä on kohdassa Lisätietotyypit.

Huomautus

  • Poimi taulukoita PDF-tiedostosta -toiminto ei käytä optista merkkien tunnistusta, joten et voi poimia ei-kopioitavaa tekstiä skannatuista PDF-tiedostoista.
  • Toiminnon taustalla oleva kirjasto poimii toisinaan lisää PDF-tietoja, jotka eivät ole taulukoita. Tämä toiminto minimoi todellisen taulukon poisjättämisen riskin.

Näyttökuva Poimi taulukoita PDF-tiedostosta -toiminnosta.

PDF-tiedostojen tietojen poimimisen lisäksi voit luoda uuden PDF-tiedoston olemassa olevasta tiedostosta käyttämällä Poimi PDF-tiedoston sivut uuteen PDF-tiedostoon -toimintoa.

Seuraava esimerkki valitsee tietyt sivut ja sivualueen.

Näyttökuva PDF-tiedostosivujen poimimisesta uuteen PDF-tiedostotoimintoon.

Tekstin poimiminen PDF-tiedostosta

Voit poimia tekstiä PDF-tiedostosta käyttämällä Poimi teksti PDF-tiedostosta -toimintoa. Toiminnon ominaisuuksissa voit määrittää PDF-lähdetiedoston ja sivut, joista teksti puretaan. Lisätoiminto-ominaisuuksissa voit määrittää salasanan, jos PDF-tiedosto on suojattu ja sen, pitäisikö moduuli optimoida rakenteisille tiedoille.

Syöteparametrit

Argumentti Valinnainen Hyväksyy Oletusarvo Description
PDF file Ei Tiedosto PDF-tiedosto, josta teksti poimitaan. Syötä tiedostopolku tai muuttuja, joka sisältää tiedoston tai tekstipolun
Poimittavat sivut Kaikki, Yksittäinen, Alue Kaikki Määrittää, miten monta sivua poimitaan. Esimerkiksi kaikki sivut, yksi sivu tai sivualue
Single page number Ei Numeerinen arvo Sen yhden sivun numero, jolta teksti poimitaan
From page number Ei Numeerinen arvo Ensimmäinen sivunumero sivualueella, jolta teksti poimitaan
To page number Ei Numeerinen arvo Viimeinen sivunumero sivualueella, jolta teksti poimitaan
Password Kyllä Suora salattu syöte tai tekstiarvo PDF-tiedoston salasana. Jätä tämä tyhjäksi, jos PDF-tiedostoa ei ole suojattu salasanalla
Optimoi rakenteisille tiedoille Totuusarvo Epätosi Määritä, tunnistetaanko tiedoston muotoiltu asettelu ja puretaanko teksti vastaavasti

Tuotetut muuttujat

Argumentti Type Description
ExtractedPDFText Tekstiarvo Poimittu teksti

Poikkeukset

Poikkeus Kuvaus
PDF-tiedostoa ei ole Tiedosto ei ole annetun polun sijainnissa
Virheellinen salasana Annettu salasana on virheellinen
Tekstin poimiminen epäonnistui Virhe yritettäessä poimia tekstiä

Poimi taulukot PDF-tiedostosta

Voit purkaa PDF-tiedoston sisältämiä taulukoita Pura taulukoita PDF-tiedostosta -toiminnolla . Toiminnon ominaisuuksissa voit määrittää PDF-lähdetiedoston ja sivualueen, joista taulukot puretaan. Lisätoiminto-ominaisuuksissa voit määrittää salasanan, jos PDF-tiedosto on suojattu, määrittää, onko taulukossa otsikoita, ja lopuksi, onko taulukoiden sivujen väliset marginaalit yhdistettävä.

Syöteparametrit

Argumentti Valinnainen Hyväksyy Oletusarvo Description
PDF-tiedosto Ei Tiedosto PDF-tiedosto, josta taulukot poimitaan. Syötä tiedostopolku tai muuttuja, joka sisältää tiedoston tai tekstipolun
Poimittavat sivut Kaikki, Yksittäinen, Alue Kaikki Määrittää, kuinka monelta sivulta taulukot puretaan; kaikki sivut, yksittäinen sivu tai sivualue
Yksi sivunumero Ei Numeerinen arvo Yksittäisen sivun numero, josta taulukot puretaan
Ensimmäinen sivunumero Ei Numeerinen arvo Ensimmäinen sivunumero sivualueesta, josta taulukot puretaan
Viimeinen sivunumero Ei Numeerinen arvo Viimeinen sivunumero sivualueesta, josta taulukot puretaan
Password Kyllä Suora salattu syöte tai tekstiarvo PDF-tiedoston salasana. Jätä tämä tyhjäksi, jos PDF-tiedostoa ei ole suojattu salasanalla
Yhdistä taulukot, jotka ylittävät sivun marginaalit Totuusarvo Tosi Määrittää, yhdistetäänkö taulukot, jotka ylittävät sivun marginaalit määritetyllä sivualueella
Ensimmäinen rivi sisältää sarakkeiden nimet Totuusarvo Tosi Määrittää, sisältääkö taulukon ensimmäinen rivi sarakkeiden nimet

Tuotetut muuttujat

Argumentti Type Description
ExtractedPDFTables PDF-taulukon tietojen luettelo Poimitut taulukot, joiden tiedot ovat luettelona

Poikkeukset

Poikkeus Kuvaus
PDF-tiedostoa ei ole Tiedosto ei ole annetun polun sijainnissa
Virheellinen salasana Annettu salasana on virheellinen
Taulukoiden poimiminen epäonnistui Virhe yritettäessä poimia taulukoita

Kuvien poimiminen PDF-tiedostosta

Voit poimia kuvia PDF-tiedostosta Poimi kuvat PDF-tiedostosta -toiminnon avulla. Toimintoparametreissa voit määrittää PDF-tiedoston ja sivut, joilta kuvat puretaan, purettujen kuvien nimeämiskäytännön ja tallennettujen kuvien kohdesijainnin. Voit myös määrittää salasanan, jos PDF-tiedosto on suojattu lisäasetuksilla.

Syöteparametrit

Argumentti Valinnainen Hyväksyy Oletusarvo Description
PDF file Ei Tiedosto PDF-tiedosto, josta kuvat poimitaan. Syötä tiedostopolku tai muuttuja, joka sisältää tiedoston tai tekstipolun
Password Kyllä Suora salattu syöte tai tekstiarvo PDF-tiedoston salasana. Jätä tämä tyhjäksi, jos PDF-tiedostoa ei ole suojattu salasanalla
Page(s) to extract Kaikki, Yksittäinen, Alue Kaikki Määrittää, miten monta sivua poimitaan. Esimerkiksi kaikki sivut, yksi sivu tai sivualue
Single page number Ei Numeerinen arvo Sen yhden sivun numero, jolta kuvat poimitaan
From page number Ei Numeerinen arvo Ensimmäinen sivunumero sivualueella, jolta kuvat poimitaan
To page number Ei Numeerinen arvo Viimeinen sivunumero sivualueella, jolta kuvat poimitaan
Image(s) name Ei Tekstin arvo Miten kuvien nimi alkaa. Poimittujen kuvien nimiesimerkki: GivenName_1, GivenName_2
Save image(s) to Ei Kansio Kansio, johon puretut kuvat tallennetaan png-tiedostoina

Tuotetut muuttujat

Tämä toiminto ei tuota muuttujia.

Poikkeukset

Poikkeus Description
Virheellinen salasana Annettu salasana on virheellinen
Kuvien poimiminen epäonnistui Osoittaa, että PDF-tiedoston tiettyjen sivujen kuvien poimimisen aikana tapahtui virhe
Kansiota ei ole Osoittaa, että kansiota ei ole
PDF-tiedostoa ei ole Tiedosto ei ole annetun polun sijainnissa

Poimi PDF-tiedoston sivut uuteen PDF-tiedostoon

Voit luoda uuden PDF-tiedoston erottelemalla sivuja olemassa olevasta PDF-tiedostosta käyttämällä PDF-tiedoston sivut uudeksi PDF-tiedostoksi -toimintoa. Toimintoparametreissa voit määrittää PDF-tiedoston, josta sivut puretaan, purettavat sivut, uuden PDF-tiedoston sijainnin ja mitä tapahtuu, jos tiedosto, jolla on sama nimi ja tunniste, on jo olemassa. Lisäominaisuuksien avulla voit määrittää salasanan, jos PDF-lähde on suojattu.

Syöteparametrit

Argumentti Valinnainen Hyväksyy Oletusarvo Description
PDF file Ei Tiedosto PDF-tiedosto, josta sivut poimitaan. Syötä tiedostopolku tai muuttuja, joka sisältää tiedoston tai tekstipolun
Password Kyllä Suora salattu syöte tai tekstiarvo PDF-tiedoston salasana. Jätä tämä tyhjäksi, jos PDF-tiedostoa ei ole suojattu salasanalla
Page selection Ei Tekstiarvo Säilytettävien sivujen indeksinumerot (esimerkiksi 1, 3, 17–24)
Extracted PDF path Ei Tiedosto Polku poimitun PDF-tiedoston tallennussijaintiin
If file exists Korvaaminen, Älä korvaa, Järjestysliitteen lisääminen Lisää peräkkäinen loppuliite Määrittää, mitä tehdään, jos tuloksen PDF-tiedosto on jo olemassa

Tuotetut muuttujat

Argumentti Type Description
ExtractedPDF Tiedosto Uusi PDF-tiedosto

Poikkeukset

Poikkeus Kuvaus
Virheellinen salasana Annettu salasana on virheellinen
PDF-tiedostoa ei ole Tiedosto ei ole annetun polun sijainnissa
Sivu on rajojen ulkopuolella Osoittaa, että vähintään yksi sivu on PDF-tiedoston rajojen ulkopuolella
Virheellinen sivuvalinta Osoittaa, että annetut sivut eivät ole sallittuja PDF-tiedostolle
Uuden PDF-tiedoston poimiminen epäonnistui Osoittaa, että uuden PDF-tiedoston poimimisen aikana tapahtui virhe

Yhdistä PDF-tiedostot

Yhdistää useita PDF-tiedostoja uuteen tiedostoon.

Voit käyttää Yhdistä PDF-tiedostot -toimintoa yhdistääksesi kaksi tai useampaa PDF-tiedostoa yhdeksi tiedostoksi. Yhdistettävät tiedostot voidaan antaa joko luettelon muodossa tai kokolainausmerkkeissä erotinmerkillä eroteltuna. Voit myös antaa PDF-tiedostojen salasanat, jos tiedostot on suojattu salasanalla.

Syöteparametrit

Argumentti Valinnainen Hyväksyy Oletusarvo Description
PDF files Ei Luettelotiedostoista Yhdistettävät tiedostot. Jos tiedostoja on useita, sulje ne lainausmerkkeihin (") ja erota ne erottimella tai käytä tiedostoluetteloa
Merged PDF path Ei Tiedosto Polku yhdistetyn PDF-tiedoston tallennussijaintiin
If file exists Korvaaminen, Älä korvaa, Järjestysliitteen lisääminen Lisää peräkkäinen loppuliite Määrittää, mitä tehdään, jos kohdetiedosto on jo olemassa
Passwords Kyllä Suora salattu syöte tai tekstiarvo Erotellut salasanat. Tilauksen on oltava sama kuin syötettyjen PDF-tiedostojen järjestys. Jätä tämä tyhjäksi, jos PDFs-tiedostoja ei ole suojattu salasanalla
Erotinmerkki Ei Tekstin arvo , Mukautettu salasanaerotin. Tämän erottimen ei tule olla minkään salasanan osa

Tuotetut muuttujat

Argumentti Type Description
MergedPDF Tiedosto Yhdistetty PDF-tiedosto

Poikkeukset

Poikkeus Kuvaus
PDF-tiedostoa ei ole Tiedosto ei ole annetun polun sijainnissa
Virheellinen salasana Annettu salasana on virheellinen
PDF-tiedostojen yhdistäminen epäonnistui Osoittaa, että tiedostojen yhdistämisessä tapahtui virhe