Te guste o no, las reseñas de los huéspedes se están convirtiendo en un factor importante que afecta las reservas/compras de las personas.
Piensa en tu propia experiencia. Cuando buscas un lugar para quedarte de vacaciones en Expedia / Booking/ TripAdvisor, ¿qué haces? Estoy dispuesto a apostar que estarás desplazándote por la pantalla para ver las reseñas antes de que te des cuenta.
En otras palabras, las opiniones de los huéspedes influyen claramente en la decisión de reserva de las personas, lo que significa que es mejor que prestes atención a lo que la gente dice sobre tu hotel.
No solo desea leer las reseñas, sino analizarlas de una manera que pueda ayudarlo a aprender más sobre sus clientes. Las revisiones pueden decirle si cumple con las expectativas de sus clientes, lo cual es crucial para desarrollar estrategias de marketing basadas en las personas de sus clientes. Las revisiones son importantes y usted, como propietarios de hoteles, debe comenzar a aprovecharlas.
¿Pero cómo?
¿Qué es el análisis de sentimientos?
El análisis de sentimientos, también conocido como minería de opinión, es una técnica de minería de texto que podría extraer emociones de un texto dado, ya sea positivo, negativo o neutral, y devolver un puntaje de sentimiento. Esta técnica se usa generalmente en reseñas o textos de redes sociales.
En este artículo, le mostraré cómo recolectar opiniones de hoteles de manera efectiva utilizando web scraping tool y realizar análisis de sentimientos utilizando Python.
Raspe las revisiones con Octoparse
La herramienta de raspado web que utilicé se llama Octoparse. Es un raspador web de bricolaje creado para personas sin codificar fondos, como yo. Le mostraré cómo usar Octoparse para raspar las críticas del hotel número 1 en la ciudad de Nueva York: Hotel Giraffe de Library Hotel Collection.
Aquí está el enlace a la página web:
Primero, importaremos nuestra URL web objetivo en Octoparse.
Tenga en cuenta que solo hay 5 comentarios en cada página, por lo que si necesitamos recorrer todas los comentarios, debes paginar en todas las Octoparse páginas de comentarios
Cuando miramos cuidadosamente las revisiones, podemos ver que hay un botón “Leer más” en algunas de las revisiones. En este caso, nuestro rastreador deberá hacer clic en el botón para cargar toda la revisión antes de extraerla.
A continuación, revisaremos todos los elementos de revisión y extraeremos cada revisión.
Por último, arrastre el “elemento de bucle” recién creado y colóquelo debajo del primer “elemento de bucle”. Esto se debe a que primero queremos hacer clic en “Leer más” antes de proceder a extraer las revisiones reales.
Una vez que hayamos extraído con éxito todas las reseñas de este hotel, estamos listos para obtener el puntaje de opinión para cada reseña utilizando Python.
Análisis de sentimientos con Python
Primero, importaríamos las bibliotecas. Aquí usaremos dos bibliotecas para este análisis.
El primero se llama pandas, que es una biblioteca de código abierto que proporciona estructuras de datos y funciones de análisis fáciles de usar para Python.
El segundo que usaremos es una biblioteca poderosa en Python llamada NLTK. NLTK significa Natural Language Toolkit, que es una biblioteca NLP de uso común con muchos corpus, modelos y algoritmos.
Avancemos e importemos las reseñas raspadas.
Aquí hemos aplicado una función llamada SentimentIntensityAnalyzer() in nltk.sentiment.vader. SentimentAnalyzer puede implementar y facilitar tareas de análisis de sentimientos con algoritmos y características NLTK, por lo que las puntuaciones de los sentimientos pueden generarse sin una codificación compleja. Antes de usarlo, debemos llamarlo.
Ahora hemos llamado a la función, aplíquela para generar los puntajes de polaridad. Hay cuatro tipos de puntajes: negativo, neutral, positivo y compuesto. Mediante el uso de apply() y lambda, podríamos transformar el resultado y ponerlos en el marco de datos de “revisiones”.
Luego tenemos el puntaje de opinión para cada revisión.
Cada revisión tiene una puntuación negativa, una puntuación neutral, una puntuación positiva y una puntuación compuesta. El puntaje compuesto es una evaluación integral de los primeros tres puntajes. Este puntaje varía de -1 a 1. Normalmente estableceremos un umbral del puntaje compuesto para identificar el sentimiento. Aquí podríamos establecer el umbral como ±0.2. Si el puntaje compuesto de una revisión es mayor que 0.2, entonces la revisión es positiva. Si el puntaje compuesto de una revisión es menor a 0.2, entonces la revisión es negativa. Si el puntaje compuesto está entre -0.2 y 0.2, entonces la revisión es neural.
Como podemos ver, el 97.2% de las revisiones son positivas y solo el 1.22% de las revisiones son negativas. Según el resultado, es seguro decir que el Hotel Giraffe by Library Hotel Collection es un hotel muy querido.
Por supuesto, hay mucho más que podríamos hacer para analizar más a fondo las revisiones:
- Cree una nube de palabras o un modelo de modelado de temas para identificar cuáles son las razones clave por las que la gente ama este hotel.
- Compare los puntajes de opinión con otros hoteles extrayendo las reseñas de otros hoteles y analizando con los pasos anteriores.
- Extraer más información como la fecha de revisión, la contribución del revisor, el voto útil del revisor, revisar el voto útil, el número de acciones, etc., visualizarlos y aplicar enfoques de análisis de negocios.
Ahora sabe lo importantes que son las revisiones para el éxito de su negocio. ¿Por qué no visitar Octoparse y probarlo usted mismo? Octoparse es un raspador web fácil de usar que podría ayudarlo a convertir sitios web en datos estructurados con clics. Mejor aún, hay plantillas listas para usar y versiones gratuitas de por vida. ¡No dude en contactarnos si necesita ayuda con su proyecto relacionado con el raspado web!