Tutoriales paso a paso para ayudarlo a comenzar con el web scraping

Descargar Octoparse

¿Qué es la ejecución concurrente?

Wednesday, March 11, 2020

 

 

Las tareas que se ejecutan simultáneamente significa que se ejecutan simultáneamente en la nube o en su máquina local. Sin embargo, todavía hay pequeñas diferencias a tener en cuenta.

1. Las ejecuciones concurrentes locales básicamente significan ejecutar más de una tarea en la máquina local. El plan gratuito está limitado a dos ejecuciones locales concurrentes, mientras que todos los demás planes permiten ejecuciones concurrentes ilimitadas.

2. Por las ejecuciones simultáneas en la nube se pueden verificar fácilmente filtrando "Ejecutando" para el estado de la nube.

cloudrunning.png

Pregunta: Cuando un plan viene con 6 servidores en la nube (como el Plan estándar), ¿significa que siempre debe haber 6 tareas simultáneas en ejecución en la nube?

Responder: No exactamente. Cuando se asigna una cuenta con 6 servidores en la nube, es posible tener 6 tareas ejecutándose simultáneamente en la nube. Sin embargo, para lograr la máxima velocidad de extracción, Octoparse siempre intentará dividir la tarea en subtareas más pequeñas. Una vez dividido, cada subtarea se ejecutará en un servidor en la nube separado para una extracción de datos más rápida. En este caso, una tarea puede ocupar más de un servidor en la nube(Obtenga más información sobre la división de tareas ). Por supuesto, si la división de tareas no es necesaria, siempre puede deshabilitar la "división de tareas" de modo que siempre obtenga 6 tareas ejecutándose simultáneamente en la nube.

 

 

¡Consejos!

1. Si no se pretende diverdir tareas, seleccione "Desactivar división de tareas" en "Configuración" (para Extracción de nubes).

2. Considere limitar el número de tareas que se ejecutan simultáneamente para una extracción de datos más rápida. Tener menos tareas ejecutándose en paralelo liberará más servidores en la nube para las tareas limitadas, por lo tanto, acelerará la extracción (para Cloud Extraction). Vaya a Configuración de la Cuenta y seleccione el número máximo de tareas que se ejecutarán en paralelo.

3. Decida qué tarea ejecutar primero y qué tarea ejecutar al final estableciendo diferentes prioridades para cada tarea en la lista de ejecución.

task_priority.png


 

Artículos relacionados:

Tratar con AJAX 

Seleccionar elementos en un menú desplegable 

Usa listas para extraer 

Extraer varias páginas a través de la paginación 

¡Descargue Octoparse para iniciar el web scraping o contáctenos para cualquier
pregunta sobre el extracción de datos!

Contáctenos Descargarse