Todas las colecciones
Herramientas Avanzadas
XPath & Expresión regular
Herramienta de Expresión Regular de Octoparse
Herramienta de Expresión Regular de Octoparse
Actualizado hace más de una semana

La expresión regular (RegEx) es una cadena de texto especial que se puede usar para buscar patrones. Como cualquier cadena se puede convertir en un RegExp, un RegExp puede realizar funciones de coincidencia de patrones y "buscar y reemplazar" en el texto.

Puede obtener algunos conceptos básicos de Expresión regular aquí

¿Qué es la herramienta de expresión regular de Octoparse?

La herramienta Octoparse RegEx es una herramienta integrada que ofrece una forma práctica de generar expresiones regulares automáticamente mediante la configuración de varios criterios. Si saber poco acerca de cómo crear una sintaxis de expresión regular, la herramienta Octoparse RegEx sería especialmente útil.

En Octoparse, hay dos formas de acceder a la herramienta RegEx:

Try RegEx Tool

· Seleccione el campo de datos que desea personalizar

· Haga clic en "Personalizar campo de datos"

· Haga clic en "Refinar datos extraídos"

· Haga clic en "Agregar paso"

· Haga clic en "Reemplazar con expresión regular" / "Coincidir con expresión regular"

- Reemplazar con expresión regular

- Emparejar con expresión regular

Método 2: desde la barra lateral de navegación

· Seleccione "Herramientas" en la barra de navegación lateral

· Haga clic en "Herramienta RegEx"

La interfaz principal de Regular Expression Tool consta de 4 partes:

1. Texto fuente

Si abre la herramienta RegEx dentro de las opciones de reformateo, la cadena de texto extraída se mostrará aquí.

Si lo abre desde la barra de navegación lateral, la cadena de caracteres debe ingresarse directamente en el texto de origen escribiendo o pegando.

2. Configuración de RegEx/Referencia/Muestra

Hay 3 pestañas en esta parte.

En la pestaña "Generar automáticamente", hay casillas de verificación para varias opciones. Puede marcar estas casillas y completar algunos parámetros para que Octoparse genere automáticamente la expresión regular que necesita.
También puede hacer clic en la pestaña "Referencia" para leer los tutoriales de Expresión regular en W3Schools, o hacer clic en la pestaña "Muestra" para ver algunos ejemplos en W3Schools.

3. Expresión regular

La expresión XPath se generará automáticamente en el cuadro "Expresión regular" después de marcar las casillas de opción y completar los parámetros en la pestaña "Generar automáticamente".

Marque "Match all" si desea tener todas las coincidencias. Luego haga clic en el botón "Match" para verificar que la expresión encuentre lo que desea.

4. Coincidencias

Una vez que haya generado una expresión, la primera coincidencia se mostrará en el cuadro Coincidencias.

Si ha marcado "Coincidir con todo", todas las coincidencias se mostrarán ordenadamente en el cuadro.

Cómo usar la herramienta de expresión regular Octoparse?


Simplemente haga clic en 3 botones en orden (Generate-Match-Apply) y podríamos obtener fácilmente el resultado que necesitamos.

Paso 1:

· Verifique las Opciones y complete los parámetros necesarios

Hay 5 opciones proporcionadas:

"Comenzar/Terminar con"
Elija el contenido que comienza o termina con, pero excluye, los caracteres que ingresa en el cuadro.

"Incluir inicio / fin"
Esta opción solo se puede usar con "Iniciar/Finalizar con". Una vez que marque "Incluir inicio/fin", el resultado del partido incluirá la cadena de texto que ha ingresado.

"Contiene uno"
Recoge el contenido que contiene el personaje/personajes que has llenado.

· Haga clic en el botón "Generar"

Paso 2:

· Haga clic en el botón "Hacer coincidir"

Recuerde marcar "Match All" si desea tener todas las coincidencias.

Paso 3:

· Haga clic en el botón "Aplicar" para aplicar el resultado

SIGUIENTE

.

Artículos relacionados:

¿Ha quedado contestada tu pregunta?