Todas las colecciones
Cursos Integrados de Octoparse
Agregar campos de datos predefinidos
Agregar campos de datos predefinidos
Actualizado hace más de una semana

Octoparse ofrece algunos campos de datos predefinidos que son realmente útiles y convenientes para los usuarios.

¿Dónde agregar los campos de datos predefinidos?

Vaya al paso "Extraer datos" y puede encontrar el botón "Agregar campo " en el panel derecho.

¿Qué campos de datos predefinidos puedo agregar?

Hay 5 tipos de campos de datos que puede agregar:

1. Capturar datos en la página

Esta opción te guiará para capturar otros elementos que desees recoger en la pantalla.

2. Fecha y hora actual

Esta será la hora de extracción cuando se raspa una línea de datos. Por ejemplo, si tienes una tarea programada que se ejecuta todos los días y quieres conocer la fecha en que se raspan las líneas de datos, puedes agregar este campo.

8800.png

Nota:

1. Puede reformatear la fecha con Refinar los datos

para cambiar el formato del campo de hora actual.

2. Agregar la hora actual en la extracción en la nube puede ayudar a mantener todos los duplicados: ¿Puedo mantener los duplicados extraídos en la nube?

3. El tiempo en la extracción en la nube se basa en el tiempo UTC.

3. Datos a nivel de la página

  • URL de la página: URL de la página actual

  • Título de la página: título de la página actual, que es una breve descripción de una página web y aparece en la parte superior de una ventana del navegador.

mceclip2.png
  • Descripción meta: etiqueta de descripción meta de la página actual, que contiene un resumen de la página.

mceclip3.png
  • Palabras claves meta: etiqueta de palabras claves meta de la página actual.

mceclip4.png
  • Código fuente HTML: el código HTML completo de la página web.

3. Agregar un valor fijo:

Esta opción te permite crear un valor fijo para cada línea de datos. Puedes configurar el nombre de tu campo personalizado o elegir entre los campos comunes, luego ingresar el valor fijo que deseas agregar (si necesitas agregar un campo en blanco, simplemente deja vacío el cuadro "Ingresar texto").

4. Agregar URL de entrada original:

Si estás raspando una lista de URL, es posible que desees obtener la URL de entrada original como un campo junto con tus datos objetivos para que puedas compararlos y ver si hay alguna URL que no haya sido raspada.

¿Ha quedado contestada tu pregunta?