Tutoriales paso a paso para ayudarlo a comenzar con el web scraping

Descargar Octoparse

Elegir ítem en un menú desplegable

Thursday, February 27, 2020

Un menú desplegable es una lista de elementos que aparecen al hacer clic en un botón o selección de texto. Este tutorial le mostrará cómo seleccionar opciones en un menú desplegable en Octoparse. mceclip1.png

 
Es posible que necesite este enlace de ejemplo para seguir:


1) Haga clic en el menú desplegable

web scraping with octoparse - drop-down menus

2) Desde el Panel de acciones, haga clic en "Recorrer las opciones en el menú desplegable"
web scraping with octoparse - drop-down menus

3) Alterne el modo de flujo de trabajo al interruptor de flujo de trabajo en la esquina superior derecha. Cree un elemento de bucle y se agregó al flujo de trabajo automáticamente para recorrer las opciones en el menú desplegable.

web scraping with octoparse - drop-down menus

4) Haga clic en el elemento de bucle para ver el menú desplegable y luego consulte los elementos de bucle en la lista del lado derecho. Compruebe si se deseaban todos los elementos agregados al bucle; De lo contrario, refine la lista utilizando la función XPath: posición ().

web scraping with octoparse - drop-down menus

5) Ahora hemos terminado de configurar el menú desplegable. Continúe para seleccionar otras opciones o haga clic en el botón de confirmación para completar la búsqueda.

web scraping with octoparse - drop-down menus

 

¡Consejos!

 

Cuando se detecta y crea un menú desplegable en Octoparse, todas las opciones disponibles se seleccionarán de manera predeterminada. Sin embargo, si desea modificar la lista agregando o eliminando elementos, puede hacerlo utilizando la posición() de la función XPath para especificar qué opciones se deben mantener en la lista.
En este ejemplo, nuestro XPath para el bucle desplegable es "// SELECT [@ id = 'selTown'] / OPTION", agregando [position () = "x"] al final del XPath, podemos especificar si queremos incluir solo opciones de ciertas posiciones, es decir. posición () = 1posición () = 2, o posición ()> 1, etc. Entonces, suponiendo que deseamos eliminar el primer elemento de la lista, ya que no es una opción real sino un encabezado, usaremos XPath: // SELECCIONA [@ id = 'selTown'] / OPTION [posición ()> 1] para incluir todas las opciones con una posición mayor que 1.

web scraping with octoparse - drop-down menus

 

 

¡Descargue Octoparse para iniciar el web scraping o contáctenos para cualquier
pregunta sobre el extracción de datos!

Contáctenos Descargarse