Tekstin poimiminen Word-asiakirjasta VBScriptin avulla

Vaikka voit käyttää optista merkkien tunnistusta (OCR) tekstin poimintaan Word-asiakirjoista, tämä menettely voi monimutkaistua monisivuisten asiakirjojen, joita täytyy vierittää, kohdalla.

Tehokkaampi tapa poimia tekstiä Word-asiakirjoista on käyttää VBScriptiä. Power Automate sisältää Suorita VBScript -toiminnon, jonka avulla voit suorittaa komentosarjoja työpöydällä.

Voit poimia tekstiä Word-asiakirjasta käyttämällä Suorita VBScript -toimintoa ja liittämällä seuraavan koodin Suoritettava VBScript -kenttään.

Dim Word
Dim WordDoc
Dim var
Set Word = CreateObject("Word.Application")

'Open the document
Set WordDoc = Word.Documents.open("%FilePath%")

'Read the document
NumberOfWords = WordDoc.Sentences.count
For i = 1 to NumberOfWords
WScript.Echo WordDoc.Sentences(i)
Next

'Close the document
WordDoc.Save
Word.Quit

'Release the object variables
Set WordDoc = Nothing
Set Word = Nothing

Täytetty Suorita VBScript-toiminto.

Komentosarja sisältää muuttujan nimeltä FilePath, joka määrittää Word-asiakirjan tiedostopolun. Voit alustaa tämän muuttujan käyttämällä Aseta muuttuja -toiminto ennen Suorita VBScript -toimintoa tai korvaamalla sen pysyvällä arvolla.

Aseta muuttuja -toiminto.

Suorita VBScript -toiminto tallentaa poimitun tekstin oletusarvoisesti muuttujaan nimeltä VBScriptOutput. Voit käyttää tätä muuttujaa syötteenä saatavilla olevissa Teksti-toiminnoissa poimitun tekstin käsittelemiseksi.

Rajattu teksti -toiminto.