Met behulp van VBScript tekst extraheren uit een Word-document
Hoewel u optische tekenherkenning (OCR) kunt gebruiken om tekst uit Word-documenten te extraheren, kan deze aanpak ingewikkeld worden voor documenten met meerdere pagina's waar moet worden gescrold.
Een efficiëntere manier om tekst uit Word-documenten te extraheren, is het gebruik van VBScript. Power Automate biedt de actie VBScript uitvoeren waarmee u scripts op uw bureaublad kunt uitvoeren.
Als u tekst uit een Word-document wilt extraheren, implementeert u de actie VBScript uitvoeren en plakt u de volgende code in het veld VBScript dat moet worden uitgevoerd.
Dim Word
Dim WordDoc
Dim var
Set Word = CreateObject("Word.Application")
'Open the document
Set WordDoc = Word.Documents.open("%FilePath%")
'Read the document
NumberOfWords = WordDoc.Sentences.count
For i = 1 to NumberOfWords
WScript.Echo WordDoc.Sentences(i)
Next
'Close the document
WordDoc.Save
Word.Quit
'Release the object variables
Set WordDoc = Nothing
Set Word = Nothing

Het script bevat een variabele met de naam Bestandspad dat het bestandspad van het Word-document specificeert. U kunt deze variabele initialiseren met een actie Variabele instellen voor de actie VBScript uitvoeren of deze vervangen door een hardgecodeerde waarde.

De actie VBScript uitvoeren slaat de geëxtraheerde tekst standaard op in een variabele met de naam VBScriptOutput. U kunt deze variabele gebruiken als invoer in de beschikbare tekstacties om de opgehaalde tekst te bewerken.
