Jagamisviis:


Üksikasjade toomine veebilehelt

Veebilehtedega seotud teabe hankimine on enamiku veebiga seotud voogude oluline funktsioon. Toiming Hangi veebilehe üksikasjad võimaldab teil veebilehtedelt mitmesuguseid üksikasju tuua ja neid töölauavoogudes käsitleda.

Toimingu kasutamiseks vajate juba loodud brauseri eksemplari, mis määrab veebilehe, millelt soovite üksikasju ekstraktida. Brauseri eksemplari saab luua mis tahes brauseri käivitamise toiminguga.

Pärast sobiva brauseri eksemplari valimist valige teave, mida soovite veebilehelt eraldada. Veebilehe üksikasjade hankimise toiming pakub kuut erinevat võimalust.

  • Veebilehe kirjeldus
  • Veebilehe meta-märksõnad
  • Veebilehe pealkiri
  • Veebilehe tekst
  • Veebilehe lähtekood
  • Veebilehe URL-aadress;

Toodud teave salvestatakse hilisemaks kasutamiseks tekstimuutujas WebPageProperty.

Kuvatõmmis toimingust Veebilehe üksikasjade toomine.

Tõrgete vältimine üksikasjade allalaadimisel

Kuigi enamik atribuute on olemas peaaegu igal veebilehel, on olukordi, kus toiminguga Veebilehe üksikasjade toomine ei õnnestu valitud üksikasja tuua. Näiteks meta-märksõnadeta veebilehed on tavaline nähtus.

Kui te pole kindel, kas atribuut on veebilehel olemas, konfigureerige toimingu Veebileheüksikasjade hankimine tõrkesuvandid Sees, et jätkata voo käitamist pärast nurjumist. Lisateavet toimingutõrgete käsitlemise kohta leiate teemast Töölauavoogude tõrgete käsitlemine.

Kuvatõmmis toimingu Veebilehe üksikasjade hankimine tõrkesuvanditest.

Et teha kindlaks, kas andmete ekstraktimine õnnestub, kasutage If-tingimust , et kontrollida, kas muutuja WebPageProperty on tühi või mitte.

Tingimuslik võimaldab teil eduka ja ebaõnnestunud andmete väljavõtmise korral rakendada erinevaid funktsioone. Lisateavet tingimuste kohta leiate jaotisest Tingimustingimuste kasutamine.

Järgmise näite alamvool toob veebilehelt saadaolevad metamärksõnad ja kuvab need sõnumikastis. Kui ekstraheerimine ebaõnnestub, peatub vool ja tagastab veateate.

Kuvatõmmis näidisvoost, mis ekstraktib veebilehelt metamärksõnu.