Técnicas para el Análisis de Sentimiento en Twitter : Aprendizaje Automático Supervisado y SentiStrength

Loading...
Thumbnail Image
Publication date
2017
Reading date
Journal Title
Journal ISSN
Volume Title
Publisher
Metrics
Export
Abstract
El análisis del sentimiento en los mensajes publicados en Twitter ofrece posibilidades de gran interés para evaluar las corrientes de opinión difundidas a través de este medio. Los enormes volúmenes de textos requieren de herramientas capaces de procesar automáticamente estos mensajes sin perder abilidad. Este artículo describe dos tipos de técnicas para abordar este problema. La primera estrategia se basa en los procesos de Aprendizaje Automático Supervisado. Su aplicación requiere integrar algunas herramientas del Procesamiento de Lenguajes Naturales y tomar como punto de partida un corpus clasi cado. El segundo enfoque está basado en diccionarios de polaridad. En esta línea se sitúa la herramienta de SentiStrength, la cual se está aplicando cada vez más a los estudios de Twitter en inglés. El artículo evalúa los estudios más avanzados que utilizan cada uno de estos enfoques para el análisis de los tweets en castellano. Por último, se señalan las ventajas y limitaciones de cada uno de estos enfoques para su aplicación a la investigación en comunicación política. Si bien el aprendizaje automático supervisado permite tener en cuenta el contexto, el investigador requiere competencias de analista de datos con el n de a nar mejor el proceso. En cambio, SentiStrength está más orientado al contenido semántico de los términos del mensaje, y se requiere más bien una competencia en lingüística por parte del investigador. La principal conclusión es que ambos métodos automáticos de análisis no pueden prescindir de una exigente codi cación manual si se desea utilizarlos con abilidad en la investigación.
Description
Keywords
Bibliographic reference
Baviera Puig, Tomás. Técnicas para el Análisis de Sentimiento en Twitter : Aprendizaje Automático Supervisado y SentiStrength. En: Dígitos: Revista de Comunicación Digital, 1 3 2017: 33-50