Tratar AJAX
Actualizado hace más de una semana

Muchos sitios web aplican la técnica AJAX para crear páginas web mejores, más rápidas y más interactivas. Octoparse puede manejar fácilmente páginas con AJAX. En este artículo, te mostraré cómo manejar AJAX en Octoparse.

1. ¿Qué es AJAX?

AJAX significa "JavaScript y XML asíncronos", que permite que una página web actualice información sin recargar toda la página y solicite / reciba datos después de que se cargue la página. Cuando se usa AJAX, solo una parte de la página se actualiza cuando presiona botones como el botón "página siguiente" o "mostrar más" en la página web.

2. ¿Cómo sé si una página web carga contenido usando AJAX?

Cuando tienes una acción de clic para cargar datos web, es bastante sencillo saber si se está utilizando AJAX. Cuando se utiliza AJAX, la página web carga el contenido adicional sin volver a cargar la página. Por lo tanto, el icono de recarga es un buen indicador para diferenciar si se ha utilizado AJAX.

  • Cuando hay AJAX involucrado, la página no debe recargarse cuando se carga contenido adicional. Por lo tanto, NO debería haber ninguna señal de recarga en este caso.

walmart_page_loading.gif
  • Si no hay AJAX involucrado, deberías ver que la página se recarga con el ícono de recarga ejecutándose

    signo.png

    when you click to load more information.

ejemplo_ajax.gif

3. ¿Cómo manejar AJAX en Octoparse?

Octoparse utiliza la recarga como señal al ejecutar el elemento en el que se hizo clic. Si la página se vuelve a cargar después de hacer clic en un elemento, ejecutará la siguiente acción después de que finalice la recarga. Pero como las páginas con AJAX no se recargan, Octoparse no recibe la señal para actuar y se atasca. Por lo tanto, necesitamos configurar un tiempo de espera AJAX para el "Elemento de clic" o "Hacer clic para paginar" para decirle a Octoparse que vaya a la siguiente acción cuando se alcance el tiempo de espera. Hay dos formas de gestionar AJAX en Octoparse.

  • Auto-detección AJAX

Octoparse configuraría el tiempo de espera de AJAX automáticamente cuando se detecta AJAX para la página.

Por ejemplo, el sitio web de Walmart usa AJAX para cargar la página siguiente. Entonces, cuando elegimos hacer clic en el botón de la página siguiente, Octoparse configura automáticamente el tiempo de espera de AJAX para la acción.

Si necesitas un tiempo de espera más largo o más corto, simplemente haz clic en el menú desplegable y elige el que desees.

Auto-detecci_n_AJAX.gif
  • Configurar AJAX manualmente

Cuando una tarea se crea manualmente o si Octoparse no detecta AJAX, también es posible configurarla manualmente haciendo clic en la acción "Hacer clic en elemento" o en la acción "Hacer clic para paginar". Puedes encontrar la configuración de AJAX en las "Opciones" y marcar "Cargar con AJAX" para seleccionar el tiempo de espera que desees.

manualmente.gif

Nota:

El tiempo de espera de AJAX debe ser lo suficientemente largo para que la página cargue la información que necesitamos.

4. Considerar usar el tiempo de espera de AJAX para páginas web sin AJAX

Incluso para las páginas que no usan AJAX, el tiempo de espera de AJAX aún se puede usar para mejorar el tiempo de espera prolongado para algunas páginas. Por ejemplo, si tienes una página que tarda una eternidad en cargarse, mucho después de que se haya cargado la información que necesitas, es posible que desees utilizar el tiempo de espera de AJAX para "forzar" a Octoparse a pasar al siguiente paso en lugar de que Octoparse espere hasta la carga de la página para terminar.


¿Ha quedado contestada tu pregunta?