Resource
Tutoriales paso a paso para ayudarlo a comenzar con el web scraping
Descargar OctoparseDespués de autenticar los datos de destino, aún puede utilizar Octoparse para acceder a los datos. Simplemente ingrese la información de inicio de sesión (nombre de usuario y contraseña) y luego haga clic en el botón "iniciar sesión" para iniciar sesión. En este tutorial, le mostraremos cómo extraer datos detrás de un inicio de sesión, así como también cómo usar cookies para optimizar flujo de trabajo de su tarea.
1) Ingrese la información de inicio de seión para iniciar sesión
2) Use cookies para optimizar el flujo de trabajo
Ingrese la información de inicio de sesión para iniciar sesión
Use cookies para optimizar el flujo de trabajo
1. Guardar cookies
La mayoría de las veces, puede optimizar el flujo de trabajo guardando la cookie en la tarea después de iniciar sesión. De esta forma, Octoparse enviará la cookie guardada al sitio web en el momento de la carga, y existe una buena posibilidad de que el sitio web recuerde "usted" y omita los pasos de inicio de sesión.
¡Consejos! 1. Una cookie guardada solo es efectiva antes de que caduque Las cookies vienen en muchas formas diferentes. Algunos tienen un tiempo de vencimiento específico, otros caducan inmediatamente cuando se cierra el navegador. En Octoparse, la cookie guardada ya no funcionará cuando caduque. Para resolver esto, deberá realizar nuevamente el paso de inicio de sesión agregando la acción adecuada para obtener y guardar la cookie actualizada.
|
2. Borrar las cookies
Como todos los sitios web manejan las cookies de manera diferente, para garantizar que el flujo de trabajo de la tarea funcione de manera consistente, es posible que desee comenzar con los pasos de inicio de sesión cada vez que se ejecuta la tarea. Para hacer esto, puede borrar las cookies guardadas antes de cargar la página de inicio de sesión. De esta manera, el sitio web de destino siempre lo "olvidará" y lo llevará a la página de inicio de sesión en la que puede ingresar toda la información de inicio de sesión.
¡Consejos! Ingresar captcha manualmente mientras se ejecuta la extracción local
|
[La versión en video de este tutorial está disponible aquí]
Artículos relacionados:
¡Descargue Octoparse para iniciar el web scraping o contáctenos para cualquier
pregunta sobre el extracción de datos!
Company
Producto
Recurso
Company
Product
Recurso