Sentiment Analysis de sitios de opiniones

Me gustó mucho este artículo del MIT News: Turning reviews into ratings porque muestra como se puede innovar con tecnologías que por separado son conocidas, la suma de:

a) Opiniones sobre productos y servicios
b) Analisis de estructuras gramaticales y semánticas.
c) Data-mining

Da como resultado un nuevo sistema del Laboratorio de Computer Science e Inteligencia Artificial del laboratorio de Lenguajes se dedica a hacer el data mining de grandes cantidades de datos, para luego pasar a un análisis semántico de las estructuras gramaticas para darte como resultado una calificación en puntaje de mucho texto en forma de opinión.

Básicamente extraen datos útiles para encontrarle sentido a las opiniones de la gente, pero lo interesante es que si uno puede entender la estructura gramatical puede aplicar los adjetivos que la gente usa al “objeto” que se está analizando, por ejemplo:

“Ir a Olsen es ir a probar buena cocina pero un servicio desastroso a un precio que no lo justifica”

El sistema es capaz de diferenciar que la cocina es un 6, el servicio es un 2 y el precio es un 4… hay un par de papers bastante interesantes dando vueltas pero sería bueno ver hasta que punto uno se pueden calibrar estos sistemas para que sean “calificaciones justas” y eso implicaría que pueda hacer búsquedas en lenguaje natural como las de la imagen:

sentiment-analisis