Tutoriales paso a paso para ayudarlo a comenzar con el web scraping

Descargar Octoparse

Ejecute tareas en la máquina local

Wednesday, March 11, 2020

Las tareas de web scraping creadas en Octoparse se pueden ejecutar en su máquina local (Extracción local) o en la nube (Extracción de Nube). Ejecutar tareas localmente puede ayudarlo,

 

1) solucionar problemas/depurar problemas de flujo de trabajo
2) Extraiga los datos sin utilizar recursos en la nube

 
 

¡Consejos! 

La extracción local está disponible para usuarios gratuitos y premium.

Para usuarios gratuitos, está limitado a 10,000 registros de datos exportados cada vez y 2 carreras locales concurrentes  ejecuciones locales concurrentes; para usuarios premium (Standard y Professional), no hay limitación en los registros de datos exportados y ejecuciones locales concurrentes.

  

En este tutorial, veremos las siguientes características:

 

 

Ejecutar tareas en extracción local

En Modo Asistente,cuando Octoparse procede a "completarse", puede hacer clic en "Extracción local" para ejecutar el rastreador en su máquina local.

 

 

En Modo Avanzado , después de completar la configuración de su tarea, haga clic en "Iniciar extracción" y luego seleccione "Extracción local" para ejecutar la tarea localmente.

 

 

Luego puede ver el proceso de ejecución de la tarea y ver los datos extraídos.

 

Configuraciones de extracción local


Cuando la tarea se está ejecutando, puede modificar la "Configuración de extracción" para sus tareas locales. Por defecto, Octoparse deshabilita estas tres funciones. Puede habilitarlos según los requisitos de su tarea.

 

Mostrar mensaje de error: el mensaje de error aparecerá en el navegador incorporado cuando haya un error, como datos faltantes.

Cargando imagen: deshabilite la carga de imágenes para acelerar la apertura de la página web.

Liberación de memoria: la extracción local puede consumir fácilmente la memoria de su computadora. Seleccione "Liberación de memoria" para liberar.

 

¡Consejos!

1. ¿Dónde se ejecuta la tarea local?

Local Extraction está ejecutando el rastreador con su propia IP y algunos sitios web pueden limitar los tiempos de visita de la misma IP. En estas circunstancias, si el rastreador se ejecuta dentro de los límites, es probable que el rastreador se bloquee.

2. ¿Qué afectará a la extracción local?

A medida que el rastreador se ejecuta en la máquina local, se verá afectado por la velocidad de la red local y la configuración del hardware.


  

Artículos relacionados:

Extracción de nubes 

Modo mago 

Modo Avanzado 

Carreras Concurrentes 

¡Descargue Octoparse para iniciar el web scraping o contáctenos para cualquier
pregunta sobre el extracción de datos!

Contáctenos Descargarse