¿Qué es Google Sheets?
Google Sheets es una aplicación basada en la web que permite a los usuarios crear, actualizar y modificar hojas de cálculo y compartir los datos en línea en tiempo real. Google sheet también desempeña un papel importante en la raspado de web como herramienta de colaboración que puede utilizarse en el análisis de datos.
El producto de Google ofrece características típicas de las hojas de cálculo, como la capacidad de agregar, eliminar y ordenar filas y columnas. Pero a diferencia de otros programas de hojas de cálculo, Google Sheets también permite a varios usuarios dispersos geográficamente colaborar en una hoja de cálculo al mismo tiempo y chatear a través de un programa de mensajería instantánea integrado. Los usuarios pueden cargar hojas de cálculo directamente desde sus computadoras o dispositivos móviles. La aplicación guarda todos los cambios automáticamente y los usuarios pueden ver los cambios de otros usuarios a medida que se realizan.
Una herramienta de web scraping(Raspardo de web) puede automatizar el proceso de copia y pegado repetitivos. En realidad, las hojas de Google pueden considerarse un web scraping básico. Puedes usar una fórmula especial para extraer datos de una página web, importar los datos directamente a las hojas de Google y compartirlos con tus amigos.
En este artículo, primero te mostraré cómo construir un web scraping simple con Hojas de cálculo de Google. Luego lo compararé con Octoparse web scraping automático. Después de leerlo, tendrás una idea clara sobre qué método funcionaría mejor para tus necesidades específicas de web scraping.
Opción#1: Crear un web scraping sencillo con ImportXML en Google Spreadsheets
Paso 1: Abramos una nueva hoja de Google Sheets.
Paso 2: Abramos un sitio web de destino con Chrome. En este caso, elegimos ’Games sales’. Copiamos y pegamos la URL del sitio web en la hoja: http://steamspy.com/.
Paso 3: Copiamos el Xpath del elemento. Seleccionamos el elemento de precio y hacemos clic con el botón derecho para que aparezca el menú desplegable. Luego seleccionamos “Copiar”, elegimos “Copiar XPath”.
Paso 4: Escribimos la fórmula en la hoja de cálculo.
=IMPORTXML(“URL”, “XPATH expression”)
Tengamos en cuenta que la “expresión Xpath” es la que acabamos de copiar de Chrome. Reemplazamos la comilla doble “” dentro de la expresión Xpath con una comilla simple ”.
También hay otra fórmula que podemos usar:
=IMPORTHTML(“URL”, “QUERY”, Index)
Con esta fórmula, extraemos toda la tabla.
Opción # 2: Herramienta de web scraping sin código: Octoparse
Paso 1: Abramos Octoparse, ingresamos la URL del sitio web de destino en la página de inicio. En este caso: sitio web de Game Sale http://steamspy.com/.
Paso 2: Al hacer clic en Empezar, se nota que el sitio web de Game Sale se muestra en el buscador integtrado interactivo de Octoparse. Necesitamos crear una lista de bucles para que Octoparse revise los listados. Ahora solo necesitamos hacer clic en “Detectar automáticamente los datos de la página web” para activar el modo de detección automática.
Paso 3:Cuando Octoparse termine la detección automática, podremos ver los datos detecctados en el panel para la vista previa de datos. Si esos datos son los que necesitas, ahora es hora de seleccionar “Crear workflow” en el panel de Tips y ejecutar este crawler personalizado.
Paso 4: Al tener datos scrapeados, podremos exportarlos en formato que queramos.
Podemos exportar los datos con Octoparse a Excel, CSV, HTML, Google Sheets, base de datos u otros formatos deseados. Las hojas de cálculo requieren que se copie y pegue, pero Octoparse automatiza el proceso. Además, Octoparse tiene más control sobre sitios web dinámicos con las herramientas de AJAX y de Captcha.
Si quieres extraer datos a Google Sheets, puedes consultar este tutorial: Octoparse: ¿Cómo extraer datos a Google sheet? para conectar tu google sheets con Octoparse.
Si estás buscando un servicio de datos para tu proyecto, el servicio de datos de Octoparse es una buena opción. Trabajamos estrechamente contigo para comprender tus necesidades de datos y asegurarnos de que te ofrecemos lo que deseas. Habla ahora con un experto en datos de Octoparse para discutir cómo los servicios de raspado web pueden ayudarte a maximizar tus esfuerzos.