Comparteix a través de


Recuperar detalls d'una pàgina web

L'extracció d'informació relativa a pàgines web és una funció essencial en la majoria dels fluxos relacionats amb la web. L'acció Obtén detalls de la pàgina web us permet recuperar diversos detalls de les pàgines web i gestionar-los en els fluxos de l'escriptori.

Per utilitzar l'acció, necessiteu una instància del navegador ja creada que especifiqui la pàgina web de la qual voleu extreure detalls. Es pot crear una instància del navegador amb qualsevol acció d'inici del navegador.

Després de seleccionar la instància del navegador adequada, trieu la informació que voleu extreure de la pàgina web. L'acció Obtén detalls de la pàgina web ofereix sis opcions diferents:

  • La descripció de la pàgina web
  • Les metaparaules clau de la pàgina web
  • El títol de la pàgina web
  • El text de la pàgina web
  • El codi font de la pàgina web
  • L'adreça URL de la pàgina web

La informació recuperada s'emmagatzema per al seu ús posterior en una variable de text anomenada WebPageProperty.

Captura de pantalla de l'acció Obtén detalls de la pàgina web.

Evitar errors en recuperar detalls

Tot i que la majoria de propietats existeixen pràcticament a totes les pàgines web, hi ha escenaris en què l'acció Obtén detalls de la pàgina web no aconsegueix recuperar el detall seleccionat. Per exemple, les pàgines web sense metaparaules clau són habituals.

Si no esteu segur de si hi ha un atribut en una pàgina web, configureu les opcions Activa l'error de l'acció Obtén detalls de la pàgina web per continuar executant el flux després d'un error . Per obtenir més informació sobre la gestió d'errors d'acció, consulteu Gestionar errors en fluxos d'escriptori.

Captura de pantalla de les opcions d'error de l'acció Obtén detalls de la pàgina web.

Per determinar si l'extracció de dades és correcta, utilitzeu un condicional Si per comprovar si la variable WebPageProperty està buida o no.

El condicional permet implementar diferents funcionalitats per als casos d'extracció de dades amb èxit i sense èxit. Podeu trobar més informació sobre els condicionals a Utilitzar condicionals.

El subflux d'exemple següent recupera les metaparaules clau disponibles d'una pàgina web i les mostra en un quadre de missatge. Si l'extracció no té èxit, el flux s'atura i retorna un missatge d'error.

Captura de pantalla d'un flux d'exemple que extreu metaparaules clau d'una pàgina web.