Octoparse

Indeed es uno de los sitios web de publicación de trabajos más populares. Con web scraping, puedes descubrir el valor de toneladas de información laboral. En este tutorial, te mostraremos cómo usar Octoparse para scrapear los puestos de trabajo de Indeed.com.

Antes de comenzar, necesitamos obtener la URL de la página de resultados de destino buscando una palabra clave y una ubicación.

A continuación se muestra una URL de ejemplo para demostración:

<a href="https://www.indeed.com/jobs?q=devops&amp;l=Dallas-Fort%20Worth%2C%20TX&amp;radius=50" rel="nofollow noopener noreferrer" target="_blank">https://www.indeed.com/jobs?q=devops&amp;l=Dallas-Fort%20Worth%2C%20TX&amp;radius=50</a>

La forma más fácil de scrapear el sitio web es ir a "Plantillas de tarea" en la pantalla principal de Octoparse y comenzar directamente con la Plantilla Indeed para ahorrar tu tiempo. Simplemente ingresa la URL en la plantilla y ya puedes esperar a que salgan los datos. Para más detalles, puedes consultar: <a href="https://helpcenter.octoparse.com/es/articles/8204523">Plantillas de Tarea</a>

Si quieres saber cómo construir la tarea desde cero, puedes continuar leyendo el siguiente tutorial.

Estos son los pasos principales de este tutorial: [Descargar archivo de tareas <a href="https://drive.google.com/file/d/1sU6tzrUsBp4hRokYAapxyxGegJx2jv79/view?usp=sharing" rel="nofollow noopener noreferrer" target="_blank">aquí</a>]

1) Ir a la página web - abrir la página web de destino

Ingresa la URL en la página de inicio y haz clic en "Iniciar"

- Ingresa la URL en la página de inicio y haz clic en "Iniciar"
 
 1.1.png

2) Detectar automáticamente la página web - crear el flujo de trabajo

Haz clic en "Detectar automáticamente los datos de la página web" en el panel de Tips y espera a que se complete la detección.

- Haz clic en "Detectar automáticamente los datos de la página web" en el panel de Tips y espera a que se complete la detección.

Ve a "Vista previa de datos" para ver si estás de acuerdo con la salida actual de datos

- Puedes eliminar los campos de datos innecesarios directamente haciendo clic en el icono
   
  mceclip13.png
- También puedes modificar los nombres de los campos de datos aquí directamente haciendo clic en el icono
   
  mceclip14.png

- Ve a "Vista previa de datos" para ver si estás de acuerdo con la salida actual de datos
 
 - Puedes eliminar los campos de datos innecesarios directamente haciendo clic en el icono
 
 mceclip13.png
 - También puedes modificar los nombres de los campos de datos aquí directamente haciendo clic en el icono
 
 mceclip14.png

Haz clic en "Crear flujo de trabajo".

- Haz clic en "Crear flujo de trabajo".

3) Configurar el tiempo de espera para "Extraer datos" - controlar la velocidad de raspado

Haz clic para abrir la configuración de acción de "Extraer datos"

Marca "<a href="https://helpcenter.octoparse.com/es/articles/8204253">Esperar antes de la acción</a>"

- Haz clic para abrir la configuración de acción de "Extraer datos"
- Marca "<a href="https://helpcenter.octoparse.com/es/articles/8204253">Esperar antes de la acción</a>"
- Configura el tiempo de espera como 1-2 s

4) Iniciar extracción - ejecutar la tarea y obtener datos

Haz clic en "Ejecutar" en la parte superior izquierda

Selecciona "<a href="http://www.octoparse.es/tutorial-7/local-extraction" rel="nofollow noopener noreferrer" target="_blank">Run task on your device</a>" para ejecutar la tarea en tu computadora, o selecciona "<a href="http://www.octoparse.es/tutorial-7/cloud-extraction" rel="nofollow noopener noreferrer" target="_blank">Run task in the cloud</a>" para ejecutar la tarea en la nube (solo para usuarios del plan premium)

- Haz clic en "Guardar"
- Haz clic en "Ejecutar" en la parte superior izquierda
- Selecciona "<a href="http://www.octoparse.es/tutorial-7/local-extraction" rel="nofollow noopener noreferrer" target="_blank">Run task on your device</a>" para ejecutar la tarea en tu computadora, o selecciona "<a href="http://www.octoparse.es/tutorial-7/cloud-extraction" rel="nofollow noopener noreferrer" target="_blank">Run task in the cloud</a>" para ejecutar la tarea en la nube (solo para usuarios del plan premium)

Scrape la información del trabajo de Indeed

Go to Octoparse.com

Octoparse DE

Octoparse FR

Octoparse ES

Octoparse JP

Descarga

Blog

API Docs

Encuentra respuestas y obtén ayuda del servicio de Atención al cliente y de expertos de la comunidad de Intercom

Centro de ayuda vacío

Oh, oh. Esa página no existe.

Decepcionado/a

Imparcial

Sonriente

Título

Haz un seguimiento del progreso de todos los tickets relacionados con tu empresa