Tutoriales paso a paso para ayudarlo a comenzar con el web scraping

Descargar Octoparse

¿Qué es una tarea?

Wednesday, March 11, 2020

Para comenzar su propio proyecto de scrape de datos en Octoparse, deberá crear una tarea para rastrear y extraer los datos necesarios.

Tareas en Octoparse se refiere al uso común para el rastreo de varias datos en sitios web y no hay restricciones en el rastreo de páginas / URL.

Octoparse simula la experiencia de navegación real cuando hace clic, busca, paginación, etc. Una tarea de Octoparse que configure determina qué URL se abrirá, cuántas páginas se recuperarán, qué datos necesita recopilar ...

Este tutorial cubre: 

1) "Tarea "Modo avanzado" / Tarea "Modo asistente"

2) Flujo de trabajo

3) Gestión de tareas

 

  

1) Tarea "Modo Avanzado" / Tarea "Modo Asistente"

Al crear una tarea, haga clic en el botón "+ Tarea" de "Modo avanzado" o "Modo asistente".

Recomendamos encarecidamente el "Modo avanzado" para comenzar su proyecto de extracción de datos. El "Modo Avanzado" ofrece más flexibilidad y le permite manejar fácilmente casos complejos de web scraping, como búsqueda de palabras clave, autenticación de inicio de sesión, menús desplegables de apertura ...

 

El "Modo Asistente" le permite crear tareas muy simples con una guía paso a paso. Las tareas creadas por "Modo asistente" se pueden editar con "Modo avanzado".

  

Hay 3 tipos diferentes de asistentes (tipos de extracción) compatibles con el "Modo asistente" de Octoparse:

· Lista o tabla

· Lista y detalles

· Única página

 

 

 

 

2) flujo de trabajo


La parte más crítica de una tarea es el flujo de trabajo para sus requisitos específicos de extracción de datos. Octoparse ejecuta cada paso configurado en el flujo de trabajo para completar su recopilación de datos. En la versión Octoparse 7.X, hemos agregado un botón de encendido y apagado para que los usuarios cambien entre "Seleccionar modo" y "Modo de flujo de trabajo".

¡Consejos!

 

Para una mejor precisión de la tarea, le recomendamos encarecidamente que active el "Modo de Workflow" que le da una mejor idea de lo que está haciendo con su tarea, en caso de los pasos.

 

3) Administración de tareas

    1. Edición de información de tareas

En la versión Octoparse 7.X, el nombre de la tarea se crea automáticamente al guardar la URL ingresada.

      · Para modificar el nombre de la tarea, haga clic en el cuadro de texto sobre el plantilla de flujo de trabajo e ingrese un nuevo nombre.

      · O haga clic  para editar el nombre de una tarea guardada

 

 

      · Haga clic en el siguiente   editar la descripción de la tarea

 

 

 

    2. Tarea de importación / exportación

Haga clic en  el botón para importar una tarea guardada en cualquier lugar de su computadora.

Para exportar una tarea específica:

     · Seleccione el botón "Más acciones"

     · Seleccione "Tarea"

     · Seleccione "Exportar"

·

 

Para realizar tareas de exportación por lotes:

· Seleccione varias tareas (también funciona para seleccionar una tarea).

· Seleccione "Administrar tarea seleccionada"

· Seleccione "Exportar"

 

 3. Más acciones de gestión de tareas

Aquí hay más acciones de gestión de tareas que puede utilizar.

Opciones para la gestión de tareas en "Más acciones"

· "Editar" - Editar tarea (o haga doble clic en el nombre de la tarea en el tablero para editar).

· "Eliminar" - Eliminar tarea (Para eliminar por lotes, seleccione varias tareas y seleccione "Eliminar" en "Administrar tarea seleccionada")

· "Cambiar nombre": cambiar el nombre de la tarea

· "Editar con modo avanzado" - Editar tareas con "Modo avanzado" (solo para tareas creadas mediante el "Modo asistente")

· "Configuración" - Configuración básica (incluyendo grupo de tareas y descripción) y configuración de extracciones

(incluida la tareas división en la nube y la configuración de carga de imágenes y el bloqueo de anuncios; cambio de gent de usuario de navegador; extracción incremental en la nube)

· "Copiar" - Replicar tarea

· "Exportar": tarea de exportación

 

Artículos Relacionados:

¿Qué es la ejecución concurrente? 

Modo avanzado de octoparse 

Modo Asistente de Octoparse  

Octoparse Extracción de la Nube 

Extracción Local Octoparse 

¡Descargue Octoparse para iniciar el web scraping o contáctenos para cualquier
pregunta sobre el extracción de datos!

Contáctenos Descargarse