Todas las colecciones
Cursos Integrados de Octoparse
Extraer datos con el inicio de sesión
Extraer datos con el inicio de sesión
Actualizado hace más de una semana

Cuando los datos de destino están detrás de la autenticación, aún es posible acceder a los datos con Octoparse. Simplemente ingreses la información de inicio de sesión (nombre de usuario y contraseña) y luego haz clic en el botón "iniciar sesión" para iniciar sesión. En este tutorial, te mostraremos cómo extraer datos detrás de un inicio de sesión, así como cómo utilizar las cookies para optimizar el flujo de trabajo de tu tarea. (Aquí tomamos eBay como ejemplo.)

iniciar_sesi_n.png

1) Ingresar la información de inicio de sesión para iniciar sesión

  • Haz clic en el cuadro de texto para ingresar el nombre de usuario en la página web

flecha.png
  • Selecciona"Ingresar texto" en Tips.

ingresar_texto.png
  • Ingresa el nombre de usuario en el cuadro de texto, haz clic en "Confirmar" y el nombre de usuario ingresado se completará automáticamente en el cuadro de texto del nombre de usuario en la página web.

cuadro.png
  • Haz clic en "Continuar" y selecciona "Hacer clic en el botón" del panel Tips.

hacer_clic_en_el_bot_n.png

(Configura el tiempo de espera AJAX adecuado según sea necesario.)

  • Sigue los mismos pasos para ingresar la contraseña

  • Haz clic en el botón "Iniciar sesión" en la página y selecciona "Hacer clic en el botón" en el panel Tips.

identificarse.png

¡Octoparse ha iniciado sesión con éxito en el sitio web!

ingresar_texto.gif

Tips!

Eliminar cookies

Como todos los sitios web manejan las cookies de manera diferente, para garantizar que el flujo de trabajo de la tarea funcione de manera consistente, es posible que desees comenzar con los pasos de inicio de sesión cada vez que se ejecute la tarea. Para hacer esto, puedes borrar las cookies guardadas antes de que se cargue la página de inicio de sesión. De esta manera, el sitio web de destino siempre lo "olvidará" y lo llevará a la página de inicio de sesión en la que puedes ingresar toda la información de inicio de sesión.

  • Haz clic en la acción "Ir a la página web" y selecciona "Opciones"

  • Selecciona "Limpiar caché antes de cargar la página web".

  • Haz clic en "Aplicar" para guardar

2) Utilizar cookies para optimizar el flujo de trabajo

1. Guardar cookies

La mayoría de las veces, puedes optimizar el flujo de trabajo guardando las cookies en la tarea después de iniciar sesión. De esta manera, Octoparse enviará las cookies guardadas al sitio web durante la carga, y es muy probable que el sitio web lo recuerde y omita los pasos de inicio de sesión.

  • Cambia al modo de navegador haciendo clic

    signo.png

    en la parte superior derecha

NAVEGAR.png
  • Puedes iniciar sesión en el sitio web como lo haces en un navegador normal.

  • Después de iniciar sesión, ve la configuración de "Opciones" de la acción "Ir a la página web", marca "Usar cookie" y haz clic en "Usar cookie de la página actual".

  • Haz clic en "Aplicar" para guardar la configuración

  • Ahora se supone que la página web debe "recordar" el inicio de sesión y omitir los pasos de inicio de sesión cuando el rastreador se esté ejecutando la próxima vez.

Nota:

1. Una cookie guardada solo es efectiva antes de que caduque.

Las cookies vienen en muchas formas diferentes. Algunos tienen un tiempo de caducidad específico, otros caducan inmediatamente cuando se cierra el navegador. En Octoparse, la cookie guardada ya no funcionará cuando caduque. Para resolver esto, deberás seguir los pasos de inicio de sesión una vez más en el modo de navegador para obtener y guardar la cookie actualizada.

2. Tu contraseña está bien protegida

  • En Octoparse, cuando ingresas tu contraseña, solo es accesible desde tu propia cuenta. Cuando se exporta una tarea, la contraseña guardada en la tarea se elimina automáticamente.

  • Cualquier información de inicio de sesión guardada se eliminará de tu cuenta de forma permanente tan pronto como se elimine la tarea.

3. Ingresar captcha manualmente mientras se ejecuta la extracción local

Si encuentras un captcha, puedes ingresarlo manualmente cuando ejecute la tarea localmente. Extracción en la Nube no admite el manejo de Captcha.

¿Ha quedado contestada tu pregunta?